Cómo los big data pueden ayudarnos a comprender el cambio climático
Cómo los big data pueden ayudarnos a comprender el cambio climático
El cambio climático es una amenaza real para nuestro planeta y sus devastadoras consecuencias deberían sentirse en todo el mundo. El Dr. Daniel Duffy, jefe de computación de alto rendimiento en el Centro de Modelado Climático (NCCS) de la NASA, presentó la importancia crítica de los macrodatos para la investigación del cambio climático.
NCCS proporciona recursos informáticos, de almacenamiento y de red de alto rendimiento para proyectos científicos de la NASA a gran escala. Muchos de estos proyectos involucran modelos climáticos y meteorológicos globales. Estas simulaciones generan grandes cantidades de datos que los científicos nunca podrán leer. Por lo tanto, es cada vez más necesario proporcionar métodos para analizar y observar los grandes conjuntos de datos generados por estas simulaciones para obtener una comprensión más profunda de importantes cuestiones científicas como el cambio climático.
Big data y cambio climático: ¿Cómo funcionan?
Los macrodatos y la investigación climática están estrechamente relacionados; la investigación climática no puede realizarse sin datos masivos.
NCCS tiene un clúster de computadoras llamado "Discovery Supercomputer". Su principal objetivo es proporcionar el entorno de almacenamiento y computación de alto rendimiento necesario para satisfacer las necesidades de los proyectos científicos de la NASA. Las computadoras de Discovery están trabajando en una variedad de proyectos científicos diferentes, y gran parte de sus recursos informáticos y de almacenamiento se utilizan para la investigación meteorológica y climática.
La computadora Discovery es una computadora de alto rendimiento diseñada para aplicaciones estrechamente acopladas a escala extremadamente grande. Es un sistema en el que el hardware y el software están estrechamente integrados y son interdependientes. Aunque la computadora no se utiliza para recopilar datos de plataformas de detección remota como satélites, muchas de las simulaciones de la atmósfera, la tierra y los océanos realizadas por la computadora requieren datos de observación. Los científicos que utilizan las computadoras de Discovery continúan recopilando datos de observación globales que alimentan sus modelos.
Sin embargo, no tiene sentido proporcionarles cantidades masivas de datos si no pueden observarlos y compararlos de manera efectiva. Un ejemplo de esto es la animación aumentada de la Oficina de Simulación y Modelado Global (GMAO) de la NASA, que utiliza observaciones de múltiples fuentes para impulsar los pronósticos meteorológicos.
El sistema de simulación de datos (DAS) GEOS-5 de GMAO fusiona información de observación con información de modelado para producir las imágenes atmosféricas más precisas y uniformes en cualquier momento. Las observaciones acumuladas superan los 5 millones cada seis horas, y se comparan variables de temperatura del aire, agua, viento, presión superficial y ozono. Hay ocho tipos de observaciones simuladas, cada una de las cuales mide variables de diferentes fuentes.
Procesamiento de datos
Los modelos de cambio climático requieren recursos informáticos con grandes cantidades de almacenamiento y acceso rápido a los datos a medida que los datos continúan creciendo. Para cumplir con este requisito, la computadora Discovery se compone de varios tipos diferentes de procesadores: 79,200 núcleos Intel Xeon, 28,800 núcleos Intel Phi y 103,680 núcleos CUDA de procesador de imágenes (GPU) NVIDIA.
La potencia informática total de las computadoras de Discovery es de 3,36 teraflops, o 3.694.359.069.327.360 operaciones de punto flotante por segundo. Para darle una mejor idea de esta escala de potencia informática, la computadora puede hacer en un segundo lo que le tomaría a cada ser humano vivo multiplicar dos números cada segundo durante casi 140 horas seguidas.
Además de la potencia informática, la computadora Discovery también tiene aproximadamente 33 petabytes de espacio de almacenamiento en disco. Un disco duro doméstico típico tiene una capacidad de un terabyte, por lo que la computadora tiene una capacidad de almacenamiento de 33.000 discos de este tipo. Si lo usas para almacenar música, puedes programar una lista de reproducción que durará más de 67.000 años sin repetición.
NCCS actualiza las computadoras Discovery cada año. A medida que sus servidores y almacenamiento envejecen, reemplazar algunos de los equipos después de cuatro o cinco años en lugar de continuar ejecutándolos puede mejorar la eficiencia. Por ejemplo, desde finales de 2014 hasta principios de 2015, un grupo de computadoras actualizado reemplazó la actualización de 2010 de las computadoras de Discovery. Con el mismo espacio, energía y refrigeración, el NCCS actualizado puede aumentar la potencia informática aproximadamente 7 veces. Los equipos retirados a menudo se reutilizan para soporte interno y otras operaciones o en sitios externos como universidades, incluida la Universidad de Maryland, el condado de Baltimore (UMBC) y la Universidad George Mason (GMU).
Mapeo de datos: cambio climático y pronóstico
Los datos generados por NCCS impulsan la redacción de diferentes documentos importantes de investigación y políticas.
Estos datos permiten conversaciones más informadas sobre los impactos del cambio climático en nuestro planeta y ayudan a los responsables de políticas a desarrollar estrategias y acciones en respuesta a las predicciones climáticas. Por ejemplo, estos datos se han utilizado en informes de evaluación lanzados por el Panel sobre el Cambio Climático (IPCC). Las simulaciones de datos realizadas por el NCCS y las observaciones del Scientific Visualization Studio de la NASA introducen los modelos climáticos propuestos en el Quinto Informe de Evaluación del IPCC para ilustrar cómo se espera que cambien el clima y las precipitaciones a lo largo del siglo XXI.
El huracán Katrina, que azotó la costa del Golfo de Estados Unidos en 2005, destacó la importancia de realizar pronósticos precisos. Aunque causó enormes daños, los daños habrían sido mucho peores si los pronósticos de alerta temprana no hubieran dado tiempo a la gente para prepararse adecuadamente. Hoy en día, la supercomputadora del NCCS es la principal responsable del modelado de la circulación global del GMAO. Su resolución es 10 veces mayor que la del huracán Katrina, por lo que puede observar con mayor precisión el interior del huracán y ayudar a hacer predicciones más precisas de su intensidad y tamaño. Esto significa que los meteorólogos pueden obtener una comprensión más profunda de la dirección de los huracanes y la actividad dentro de ellos, lo cual es fundamental para una planificación y preparación exitosas para eventos climáticos extremos como el huracán Katrina.
Además, el Experimento de simulación del sistema de observación (OSSE) utiliza resultados de modelos climáticos globales para simular la plataforma de detección remota de próxima generación propuesta por la NASA, proporcionando a los científicos e ingenieros una Tierra virtual para usar al construir nuevos sensores. o nuevas ventajas en telemetría atmosférica previamente estudiadas por satélites.
Datos sobre el cambio climático futuro
Los datos son el principal producto de la NASA. Es posible que con frecuencia entren y salgan satélites, instrumentos, computadoras e incluso personal de la NASA, pero los datos, especialmente los de observación de la Tierra, tienen un valor permanente. Por lo tanto, la NASA debe poner los datos que genera a disposición no sólo de otros sitios y científicos de la NASA, sino también del mundo.
La simple cantidad de datos generados todo el tiempo plantea un desafío. Hoy en día, cuando a los científicos que trabajan en sistemas les resulta difícil utilizar conjuntos de datos, es aún más difícil para personas ajenas a la NASA obtener datos utilizables. Entonces, comenzamos a considerar la creación de un análisis climático como servicio (CAaaS) que combinaría computación de alto rendimiento, datos e interfaces de programación de aplicaciones (API) para proporcionar una interfaz para programas analíticos que se ejecutan en el campo junto con los datos. En otras palabras, los usuarios pueden hacer preguntas sobre temas que les interesan, hacer que el sistema de la NASA realice análisis y luego devolver los resultados del análisis al usuario. Debido a que el tamaño de los resultados del análisis es menor que los datos sin procesar que los generaron, este sistema reducirá la cantidad de datos enviados a través de diferentes redes y, lo que es más importante, la API puede reducir en gran medida la fricción entre los usuarios y los datos.
Lo anterior es lo que el editor ha compartido con usted sobre cómo los big data pueden ayudarnos a comprender el cambio climático. Para obtener más información, puede seguir a Global Ivy para compartir más información.