Red de conocimiento informático - Material del sitio web - La informática a gran escala genera una enorme huella de carbono

La informática a gran escala genera una enorme huella de carbono

Simon Portegies Zwart, astrofísico de la Universidad de Leiden (Países Bajos), tiene conciencia ecológica. Ya casi no viaja en avión por motivos de trabajo y prefiere viajar en tren. “Me encanta ser vegetariano y respetuoso con el medio ambiente, minimizar mi huella de carbono y al mismo tiempo decirles a mis hijos que eviten tomar baños prolongados y utilizar recursos renovables cuando sea posible. Cuando decidió hacer estos cambios en su vida, también pensó en la huella de carbono de otros”. aspectos.

"Utilizo mucho ordenadores grandes y consumen tanta energía como una ciudad pequeña", afirma. "Probablemente soy la persona más contaminante de la calle. Si uso un superordenador que consume. energía equivalente a 10.000 hogares, entonces, ¿qué derecho tengo a decirles a mis hijos o a otras personas que no deberían tomar una ducha de 20 minutos

mientras el mundo trabaja duro para resolver el problema del clima? ¿Cambio?, muchos científicos comenzaron a enfrentar la realidad de sus excesivas emisiones de carbono.

El enorme costo de la informática

Además del impacto de los viajes académicos en el cambio climático, muchos físicos han descubierto en los últimos años que la huella de carbono del uso de la computadora es enorme: a veces incluso mayores que los viajes en avión.

Adam Stevens es astrofísico de la Universidad de Australia Occidental. Él y sus colegas analizaron las "actividades de rutina" de los astrónomos australianos de 2018 a 2019 debido a los viajes, el uso de supercomputadoras y el trabajo en grandes observatorios. Se analizaron las emisiones totales de gases de efecto invernadero producidas. Su investigación encontró que el astrónomo australiano promedio produce alrededor de 37 toneladas de dióxido de carbono equivalente, lo que es un 40% más que el australiano promedio y cinco veces el promedio mundial. La razón principal es que los astrónomos necesitan utilizar supercomputadoras para procesar grandes cantidades de datos recopilados por los telescopios y realizar simulaciones cosmológicas. Este trabajo genera aproximadamente 15 toneladas de emisiones por astrónomo, casi cuatro veces las emisiones anuales de los vuelos (Figura 1).

Figura 1 Cuatro fuentes de emisiones de astrónomos australianos, en toneladas (t) de dióxido de carbono (CO2) equivalente (e) por año (yr-1) por persona. Las barras de error están marcadas en la figura y tenga en cuenta que los valores en las estaciones de observación son el límite inferior de emisiones.

Otro ejemplo es el próximo proyecto Large Neutrino Detector Array (GRAND), que planea Utilice matrices de detección de neutrinos a gran escala distribuidas en zonas montañosas de todo el mundo. 200.000 antenas detectan neutrinos de energía ultraalta desde el espacio profundo. En 2021, el equipo detrás del proyecto estimó las emisiones de gases de efecto invernadero en tres fases experimentales diferentes: un experimento prototipo, un experimento a escala media y un experimento a escala real que se llevará a cabo en 2030. Se refieren a la simulación y el análisis de datos, la transmisión y el almacenamiento de datos, y a las computadoras y otros dispositivos electrónicos como "tecnologías digitales" que representarán una gran parte de la huella de carbono.

Se espera que las tecnologías digitales representen el 69% de las emisiones durante la fase de prototipo, en comparación con sólo el 27% de los viajes y el 4% de los "equipos de hardware", como la fabricación de antenas de radio. En la fase experimental de mediano plazo, las tecnologías digitales representarán el 40% de las emisiones totales, y los viajes y el hardware representarán la mitad de las emisiones restantes. Cuando todo el experimento esté completo y operativo, las principales emisiones se repartirán entre el hardware (48%) y la tecnología digital (45%).

El coste medioambiental de los superordenadores depende en gran medida de la fuente de energía que alimenta el dispositivo. En 2020, el Consejo Holandés de Astronomía invitó a Portegies Zwart y a otro equipo de investigación a analizar la huella de carbono de seis de sus instituciones miembros. Se estima que el astrónomo holandés promedio emitió 4,7 toneladas de dióxido de carbono equivalente en 2019, mucho menos que Australia, y solo el 4% de esto provino de la supercomputación.

El astrofísico holandés Florisvander Tak, que dirigió el estudio, cree que los astrónomos holandeses no utilizan menos superordenadores que sus homólogos australianos, por lo que la diferencia puede deberse a diferentes suministros de energía. Debido a que los Países Bajos utilizan 100% energía renovable generada por energía eólica o solar, el centro nacional de supercomputación SURF no produce ninguna emisión de carbono, con pequeñas emisiones generadas por equipos internacionales y pequeñas supercomputadoras en los Países Bajos.

Hoy en día, Portegies Zwart se ha acostumbrado a comprobar si el superordenador que utiliza utiliza energía respetuosa con el medio ambiente. En caso contrario, considerará utilizar otros equipos.

Raíz del problema

Los datos sobre emisiones de gases de efecto invernadero del Instituto Max Planck de Astronomía de Alemania también muestran diferencias en las emisiones de carbono entre países. En 2018, cada investigador del instituto emitió alrededor de 18 toneladas de dióxido de carbono equivalente, más que los astrónomos holandeses, pero solo la mitad que sus homólogos australianos (Figura 2). Esto es un 60% más alto que el residente alemán promedio y tres veces el objetivo de reducción de emisiones de Alemania para 2030, lo que está en línea con el acuerdo climático de París.

Figura 2 Emisiones promedio en 2018 para un astrónomo australiano y un investigador alemán en el Instituto Max Planck de Astronomía, clasificadas por fuente de emisión y comparadas con la configuración de Alemania según el objetivo de emisiones del Acuerdo de París para 2030. Las emisiones relacionadas con la electricidad incluyen el consumo calculado y no calculado, y la gran mayoría de las emisiones se generan mediante cálculo, tanto en Alemania como en Australia

En las Emisiones de Carbono de 2018 del Instituto Max Planck, alrededor del 29% proviene de la electricidad. consumo, del cual la informática (especialmente la supercomputación) representa entre el 75% y el 90%. La clave de la diferencia en las emisiones de carbono entre Alemania y Australia reside en la fuente de electricidad. En 2018, aproximadamente la mitad de la electricidad de Alemania provino de energía solar y eólica, mientras que en Australia la gran mayoría de la electricidad provino de combustibles fósiles, principalmente carbón. Esto significa que en Australia la electricidad utilizada para los cálculos produce 0,905 kg de dióxido de carbono por kilovatio hora, mientras que en el Instituto Max Planck sólo 0,23 kg.

van der Tak también señaló que estas encuestas se realizaron hace unos años y ahora el mundo ha avanzado, como que cada vez más instituciones utilizan energía renovable. Un estudio holandés encontró que menos de un tercio (29%) de la huella de carbono de la comunidad astronómica holandesa en 2019 provino del uso de electricidad, incluida la alimentación de computadoras locales en seis instituciones de investigación. En aquel momento, la mitad de los institutos utilizaban electricidad verde. Desde entonces, dos institutos más han cambiado a energía 100% renovable y van der Tak espera que el sexto instituto haga el cambio en los próximos dos años.

Las cosas también están cambiando en Australia. La supercomputadora OzSTAR, una de las tres instalaciones informáticas nacionales de alto rendimiento del país, ha cambiado a energía 100% renovable comprada en un parque eólico cercano desde julio de 2020. La Universidad Tecnológica de Swinburne, donde se encuentra la supercomputadora, afirma que esto reducirá significativamente su huella de carbono, ya que la electricidad representa más del 70% de las emisiones totales.

Ubicación, ubicación, ubicación

Pero, ¿cómo se puede calcular con precisión la huella de carbono del uso de supercomputadoras? Lo?c Lannelongue, matemático y físico de la Universidad de Cambridge en Inglaterra, no pudo encontrar una manera fácil, por lo que desarrolló una herramienta en línea llamada Algoritmos Verdes (green-algorithms.org) para estimar la huella de carbono de un investigador.

Lannelongue reiteró que la ubicación es clave. Por ejemplo, al ejecutar las mismas tareas en el mismo hardware, Australia emite alrededor de 70 veces más dióxido de carbono que Suiza, que genera la mayor parte de su electricidad a partir de energía hidroeléctrica. Si bien la estimación de la huella de carbono de cualquier algoritmo se basa en factores clave como el hardware, el tiempo requerido para la tarea y la ubicación del centro de datos o supercomputadora, Green Algorithms también tiene un "Factor de escala de práctica" (PSF) que estima el número computacional real. muchas veces, esto tiene un impacto directo en las emisiones.

De hecho, la mayoría de los algoritmos se ejecutan varias veces, a veces cientos de veces con diferentes parámetros, y el número de ejecuciones puede variar mucho según la tarea y el área de investigación (Figura 3). El estudio también encontró que Sudáfrica y ciertos estados de EE. UU. tienen emisiones calculadas similares a las de Australia, mientras que Islandia, Noruega y Suecia tienen emisiones de carbono por electricidad particularmente bajas.

Figura 3 Green Algorithm es una herramienta gratuita que se utiliza para estimar la huella de carbono de un algoritmo. El proceso de estimación implica una serie de factores, incluidos los requisitos de hardware, el tiempo de ejecución y la ubicación del centro de datos.

Los usuarios pueden evaluar el rendimiento informático o estimar el ahorro o el consumo de carbono al volver a implementar algoritmos en otras arquitecturas. Este gráfico compara la huella de carbono de algoritmos en diferentes campos científicos, desde simulaciones de física de partículas y daños por radiación en el ADN hasta ciencias atmosféricas y aprendizaje automático, y compara los resultados de ejecutar cada algoritmo solo una vez versus cálculos repetidos de la misma tarea (PSF). Los resultados se expresan en gramos (g) de dióxido de carbono (CO2) equivalente (e) y se comparan con la cantidad de carbono secuestrado por los árboles y las emisiones de carbono de actividades diarias como conducir un automóvil.

Hoy en día, Con la llegada de la computación en la nube, los investigadores pueden elegir más fácilmente la supercomputadora que utilizan. Pero incluso si no pueden reemplazar las máquinas, hay otras formas de reducir sus emisiones de carbono. Lannelongue dijo que si no puede cambiar su ubicación, puede utilizar las últimas versiones y el software optimizado, ya que esto reducirá los requisitos informáticos.

Mejor codificación

El código eficiente también es fundamental para hacer que la informática sea más ecológica. Como dijo Portegies Zwart, si dedica más tiempo a optimizar su código, se ejecutará más rápido y producirá menos emisiones. Además, cambiar el lenguaje de codificación es una buena idea.

Para probar esta idea, Portegies Zwart realizó experimentos en los que ejecutó el mismo algoritmo en una docena de lenguajes de codificación diferentes. El código de ningún idioma está particularmente optimizado y cada código requiere una cantidad de tiempo similar para escribirse. Python, comúnmente utilizado por los físicos, tarda mucho más en ejecutar algoritmos que otros lenguajes de codificación como C++ o Fortran y, por lo tanto, genera más emisiones de carbono. El problema es que Python es fácil de usar pero difícil de optimizar, mientras que otros lenguajes son difíciles de codificar pero más fáciles de optimizar.

Sin embargo, mantenerse alejado de Python puede no resolver el problema. Pierre Augier, investigador de la Universidad de Grenoble-Alpes en Francia, dijo que una mejor educación y el uso de compiladores Python son igualmente efectivos. Realizó experimentos similares con código más optimizado y cinco implementaciones diferentes de Python, cuatro de las cuales eran más rápidas que C++ y Fortran, producían menos emisiones y eran más fáciles de entender y usar.

Portegies Zwart está de acuerdo en que Python puede ser eficiente, pero no refleja la situación real. Él cree que los astrónomos no optimizan su código en alto grado, y en lugar de pedirles que aprendan más conocimientos informáticos, las instituciones de investigación física probablemente deberían contratar más expertos en informática. "Somos buenos en física, pero los científicos en informática dedicamos todo el tiempo que dedicamos a estudiar física aprendiendo computadoras", dijo. "No hay duda de que 'ellos' son mejores en programación". /p>

El trabajo intensivo en carbono va más allá de las simulaciones en supercomputadoras. Como co-iniciadora del proyecto GRAND neutrino, Kumiko Kotera de la Universidad Sorbona de Francia y sus colegas descubrieron que el almacenamiento y la transmisión de datos representarán aproximadamente la mitad del total de las emisiones anuales durante la fase de prototipo del experimento y una cuarta parte en la fase intermedia. Primero, la etapa experimental integral representa más de un tercio. En comparación, la proporción de emisiones de carbono generadas por el análisis de datos y la simulación en las tres etapas es del 16%, 13% y 7% respectivamente.

La huella de carbono del almacenamiento y la transmisión de datos depende de las necesidades energéticas del centro de datos, y el uso de centros de datos con menores emisiones puede resolver el problema hasta cierto punto. Sin embargo, reducir la cantidad de datos todavía tiene su importancia y los científicos serán más cautelosos con lo que se transmite. Kotera dijo que el proyecto GRAND estudiará cómo reducir la cantidad de datos y encontrar formas de limpiarlos de manera efectiva.

Figura 4 Para reducir las emisiones generales de carbono, el CERN ha contratado a un ingeniero ambiental para supervisar la construcción de proyectos futuros.

Los físicos de partículas también deberán contribuir. El CERN genera aproximadamente 100 petabytes de datos cada año. Global LHC Computing Grid (WLCG) integra recursos informáticos de aproximadamente 170 centros informáticos en más de 40 países de todo el mundo y almacena, distribuye y analiza estos datos.

El CERN ha comenzado a publicar informes medioambientales en los últimos años. El segundo informe publicado en 2021 presenta las medidas de mejora de la eficiencia energética implementadas en el LHC (Figura 4). Después de la actualización, el LHC será 10 veces más eficiente energéticamente durante su vida útil de 20 años que cuando se puso en servicio por primera vez. Sin embargo, el informe también admitió que no cubría realmente todas las emisiones de WLCG y solo detallaba el consumo de energía de los equipos WLCG propiedad del CERN o operados por él.

Cambiando la mentalidad

Lannelongue espera que cada vez más investigadores comiencen a considerar el cálculo de las emisiones de carbono y las tengan en cuenta en la toma de decisiones. Un ejemplo típico es el de los investigadores que solían ejecutar códigos y software ineficientes toda la noche. Cuando se les dijo que mejorar la eficiencia informática reduciría su huella de carbono, se sintieron motivados a cambiar.

Hablando sobre el proyecto GRAND, Kotera dijo que planean construir una biblioteca de simulación que permita a los usuarios reutilizar simulaciones de uso común sin tener que crearlas ellos mismos. Esto puede evitar que los mismos datos se copien continuamente. Incluso en grandes colaboraciones, al no haber un almacenamiento central, es común que diferentes usuarios ejecuten la misma simulación una y otra vez. "Es muy común simplemente presionar un botón y ejecutar una simulación de una semana, obtener los resultados y decir: 'Oh, no necesitaba eso'", dijo Kotera. "Nuestro objetivo es alentar a los usuarios a pensar si quieren hacerlo". Realmente necesito esta simulación antes de ejecutarla”