Investigación básica sobre "llegar al fondo de las cosas"
DeepMind, una empresa propiedad de Google, publicó recientemente un artículo en la revista Nature, anunciando que utilizó el programa de inteligencia artificial AlphaFold 2 para predecir el 98,5% de las proteínas humanas y decidió revelar la fuente. código de AlphaFold 2. Conjuntos de datos relevantes de código abierto, gratuitos para investigadores de todo el mundo.
Entonces, ¿AlphaFold cuenta como investigación básica?
En este sentido, Li Guojie, académico de la Academia China de Ingeniería, clasificó AlphaFold como tecnología de ingeniería: "La tecnología de ingeniería no es sólo una herramienta, ni es sólo la aplicación de resultados de investigación básicos, sino una parte importante de la investigación básica, puede desempeñar un papel muy importante en la investigación básica".
El autor conoce especialmente el artículo de Li Guojie. Al mismo tiempo, personalmente tengo las siguientes opiniones sobre la investigación básica y me gustaría ofrecer algunas sugerencias.
La investigación científica tiene sus propias reglas y regulaciones. Si no sigues las reglas, obtendrás el doble de resultado con la mitad de esfuerzo.
Entonces, ¿cuáles son las leyes de la investigación básica? De hecho, diferentes definiciones de investigación básica reflejan diferentes perspectivas y corresponden a diferentes métodos de implementación.
En términos generales, existen dos definiciones principales de investigación básica en las últimas décadas:
Una es la definición de investigación básica de Vannevar Bush bajo el modelo lineal. La definición de investigación e investigación aplicada cree que La investigación básica es la reserva de conocimientos y la fuente del progreso tecnológico.
Según esta definición, el papel de la investigación básica es generar conocimiento independientemente de su relación con tecnologías específicas. Por lo tanto, a nivel de implementación, "lanzar una red amplia" puede ser la forma más efectiva de generarlo. conocimientos diversos.
En segundo lugar, Donald E. Stokes definió diferentes tipos de investigación a través de cuatro cuadrantes. Stokes dividió la investigación básica en investigación puramente básica (cuadrante de Bohr) e investigación básica "impulsada por aplicaciones" (cuadrante de Pasteur).
A nivel de implementación, la investigación básica bajo el cuadrante y el modelo lineal de Bohr es básicamente la misma.
En el Cuadrante Pasteur, la investigación básica de vanguardia se utiliza para resolver necesidades prácticas urgentes, fuertes y enormes; en la práctica, al resolver problemas prácticos, los investigadores se ven "obligados" a aclarar los conceptos básicos de algunos problemas aplicados; principio.
El autor prefiere el modelo de cuatro cuadrantes de Stokes.
En opinión del autor, “aclarar los principios básicos del problema” es investigación básica.
De hecho, en la práctica de la investigación científica específica, el cuadrante de Bohr y el cuadrante de Pasteur son en realidad iguales, ambos "aclaran los principios básicos del problema", pero la fuente del problema es diferente.
Las fuentes de los problemas en el cuadrante de Bohr provienen principalmente de la disciplina misma, como por ejemplo por qué existe el entrelazamiento cuántico, mientras que las fuentes de los problemas en el cuadrante de Pasteur provienen principalmente de aplicaciones prácticas, como cómo mantener fresca la leche; .
Desde la perspectiva de "llegar al fondo de las cosas", siempre que podamos encontrar algunos misterios sin resolver, es posible que hagamos una investigación básica.
Todo el mundo puede tener esta experiencia. En términos de investigación científica y tecnológica, la "primera vez" suele ser particularmente difícil, como el primer avión, la primera bomba atómica, el primer satélite, la primera CPU, la primera. aterrizaje en Marte y más. Incluso si otros países lo han logrado, todavía es muy difícil para otro país lograr el "primero".
¿Por qué? Esto se debe principalmente a que estos "primeros" resultados no son solo un sistema prototipo, sino que también incluyen un conjunto completo de procesos técnicos detrás del desarrollo del sistema prototipo, así como las plataformas, materiales, reactivos, equipos, instrumentos, etc. , que es la base de la instalación de investigación científica.
El papel de estas infraestructuras de investigación científica es precisamente "esclarecer los principios básicos del problema", como los túneles de viento utilizados para desarrollar aviones, los simuladores de alta precisión y los emuladores utilizados para desarrollar CPU.
Incluso la investigación básica en los campos de la física, la química, la astronomía y otros campos es ahora inseparable de diversos equipos e instrumentos de última generación, como el dispositivo EAST Tokamak para estudiar la fusión nuclear y el telescopio FAST para astronomía. investigación espera.
En el campo del diseño de chips de CPU en el que estoy involucrado, mucha gente piensa que se trata de pura tecnología de ingeniería sin ninguna investigación básica.
Pero en opinión del autor, poder aclarar los principios básicos de algunas cuestiones en el campo del diseño de CPU es una investigación básica.
Por ejemplo, el rendimiento del procesador M1 recientemente lanzado por Apple supera incluso al de los procesadores de escritorio de Intel, gracias a que M1 utiliza aproximadamente 600 ROB, lo que subvierte por completo la arquitectura de CPU tradicional, porque. el ROB de CPU anterior generalmente no excedía los 200.
Quizás utilizando el pensamiento de ingeniería inversa, se pueda realizar rápidamente un diseño de arquitectura de CPU con 600 proyectos.
Pero ¿quién sabe por qué Apple se atreve a diseñar de esta manera? ¿Por qué 600 ROB y no 400 u 800? La ingeniería inversa es solo ingeniería, pero comprender completamente los fundamentos de estos problemas sería una investigación fundamental en el campo del diseño de arquitectura de CPU.
No es fácil comprender sus principios básicos, que requieren el soporte de un conjunto completo de infraestructura de diseño de arquitectura de CPU, desde tecnología de análisis de características del programa, tecnología de exploración espacial de diseño, simulador de alta precisión y tecnología de simulación de sistemas. , Tecnología de verificación, etc., también es necesario analizar una gran cantidad de características del programa, recopilar una gran cantidad de datos sin procesar, realizar una gran cantidad de análisis cuantitativos detallados, realizar una gran cantidad de simulaciones ..., todo lo cual es para dejar claros los principios básicos.
Hasta cierto punto, la infraestructura de investigación, como plataformas/materiales/reactivos/equipos/instrumentos, son resultados más importantes que los sistemas prototipo.
Solo con esto podremos continuar explorando los principios básicos de diversos fenómenos, brindar soporte para la optimización iterativa posterior y convertirnos en una base para cultivar talentos.
La investigación básica y la ingeniería no son simplemente antagónicas.
Por el contrario, en muchos campos, la investigación básica y el desarrollo de la ingeniería están entrelazados.
Esta intersección se produce porque gran parte de la infraestructura de investigación necesaria para los esfuerzos de investigación, como nuevas plataformas, equipos y procesos, requiere aportaciones de ingeniería.
Incluso la investigación básica, como la detección de ondas gravitacionales y la partícula de Higgs, requiere inversión en ingeniería para desarrollar instrumentos como LIGO y el Gran Colisionador de Hadrones.
Una vez que este tipo de infraestructura de investigación está en funcionamiento, resulta más fácil para otros aprovecharla.
Una de las razones por las que la investigación básica en Estados Unidos es tan sólida es que hay muchos académicos que construyen estas infraestructuras de investigación en universidades e instituciones de investigación corporativas.
Por ejemplo, en el campo del diseño de chips de CPU, existen simuladores GEM5, modelos CACTI, plataformas de simulación FireSim y una gran cantidad de otras infraestructuras, que facilitan la investigación por parte de académicos de otras universidades.
Por lo tanto, algunos académicos creen que la investigación básica no requiere ingeniería, principalmente porque alguien ya los ha ayudado a construir la infraestructura de investigación subyacente, para que puedan optimizar más fácilmente y publicar artículos más fácilmente.
Muchas empresas de tecnología en los Estados Unidos también han establecido una infraestructura de investigación interna (disfrute del código abierto, autoinvestigación interna) que generalmente está abierta a la comunidad académica.
Al importar las necesidades comerciales y los datos internos a la infraestructura de investigación de la empresa, las nuevas ideas generadas por el mundo académico se pueden digerir e integrar fácilmente en los productos de la empresa.
Por lo tanto, con infraestructura y flujo de talento, la academia y la industria estadounidenses pueden formar una buena situación de "ideas innovadoras - obtener solicitudes - recopilar comentarios - nuevas ideas innovadoras".
Debido a esto, la industria, la academia y los institutos de investigación en los Estados Unidos han formado un circuito cerrado de "ideas innovadoras--obtención de aplicaciones--recopilación de comentarios-nuevas ideas innovadoras--obtención de nuevas aplicaciones".
Sin embargo, la industria, la academia y la investigación de China aún no han formado un circuito cerrado tan eficiente, y la mayoría de las empresas no tienen la infraestructura de investigación científica para conectarse con la academia.
Por lo tanto, para la comunidad académica china, es más necesario participar en la construcción de infraestructura de investigación científica, especialmente cooperar con las empresas para compensar las deficiencias de la infraestructura de investigación científica.
Aunque gran parte de la investigación básica es puramente teórica y puede ser completada por un pequeño equipo de varias personas o incluso de una sola persona, debemos reconocer la necesidad de desarrollar una infraestructura de investigación científica más eficiente y eficaz.
Sin embargo, también hay muchos estudios básicos que requieren grandes equipos, gestión y organización, como la detección de la partícula de Higgs y el desarrollo de LIGO para la observación de ondas gravitacionales.
La Agencia de Proyectos de Investigación Avanzada de Defensa de EE. UU. (DARPA) financia muchos proyectos de innovación disruptiva.
Cuando observamos el proceso de inicio e implementación del proyecto DARPA, podemos encontrar algunas cosas: primero, pensarán en el futuro y establecerán objetivos radicales, descompondrán científicamente los objetivos radicales en una serie de; subtareas; Desarrollar un plan de implementación para subtareas específicas, incluidos objetivos, nodos de tiempo, etc., las subtareas deben finalmente integrarse en un sistema prototipo.
El "Gerente de Proyecto" será responsable de las cuatro tareas anteriores, tiene poder absoluto de decisión del proyecto y también es responsable del proyecto, equivalente al responsable general. Una gran cantidad de práctica ha demostrado que este modelo de organización y gestión de la investigación científica es muy eficiente.
Este modelo también es válido para la investigación básica.
Tomemos como ejemplo el Centro de Investigación en Computación Inspirada en el Cerebro de la Universidad de Tsinghua. El centro se estableció en 2014 y sus miembros provienen de diferentes departamentos de la Universidad de Tsinghua.
Su modelo de investigación es similar al plan DARPA. Todo el equipo lleva a cabo una investigación completa en torno al chip cerebral "Tianji" y lo integra en el sistema de bicicleta autónoma, generando resultados de investigación científica con una mejor presentación. Publicó varios artículos sobre Naturaleza y Ciencia y fue seleccionado entre los diez principales avances científicos y tecnológicos de China, etc., lo que también hizo que la Universidad de Tsinghua progresara en el campo, etc., y también estableció la posición de Tsinghua como una disciplina informática inspirada en el cerebro. .
Volviendo a la pregunta al principio de este artículo: ¿AlphaFold cuenta como investigación básica?
Con base en la discusión de este artículo, podemos sacar las siguientes conclusiones: primero, Alpha Fold enfrenta muchos problemas desconocidos durante el proceso de desarrollo, y aclarar los principios básicos de estos problemas requiere investigación básica; segundo, Alpha; Fold It es una infraestructura de investigación científica en el campo de la predicción de la estructura de proteínas, que a su vez forma parte de la investigación básica en el campo de la predicción de la estructura de proteínas.
(El autor es subdirector e investigador del Instituto de Tecnología Informática de la Academia de Ciencias de China)