¿Qué opinas de la actualización del superordenador Tianhe-2 utilizando la tarjeta aceleradora doméstica Matrix-2000?
La semana pasada, TOP500 anunció la lista de las 500 mejores supercomputadoras para la primera mitad de 2018. La supercomputadora American Summit cumplió su deseo y ganó el primer lugar, recuperando el campeonato TOP500 perdido hace mucho tiempo para los estadounidenses. y ganarlo todo de una sola vez. Clasificado primero y tercero entre el TOP3. Sunway TaihuLight, la supercomputadora más poderosa de China, ocupa el segundo lugar y no ha sido mejorada en los últimos dos años. Sin embargo, la supercomputadora Tianhe 2A que ocupa el cuarto lugar ya no es lo que solía ser. Una vez encabezó el TOP500 durante seis años consecutivos. pero se utilizó anteriormente Después de que los Estados Unidos prohibieran su exportación, el Centro de Supercomputación de Guangzhou utilizó la tarjeta aceleradora nacional Matrix-2000 para actualizar la supercomputadora Tianhe 2A, y el rendimiento aumentó de 54,9 PFLOPS a 97,9 PFLOPS.
Tianhe-2 es un superordenador ubicado en el Centro de Supercomputación de Guangzhou en China. Utiliza un procesador Intel Xeon E5-2692 de 12 núcleos y una tarjeta aceleradora Xeon Phi 31S1P. En total, 3,12 millones de núcleos y una potencia total de 17.808 kilovatios. El rendimiento teórico sigue siendo 54,9 PFLOPS (petaflops), y el rendimiento máximo de Linpack es 33,86 PTFLOPS. Su rendimiento no ha cambiado desde junio de 2013 hasta junio de 2016, y ha sido elegido campeón del TOP500 seis veces.
Tianhe 2 estaba originalmente planeado para actualizaciones posteriores, pero en 2015 el gobierno de EE. UU. emitió una prohibición que prohibía a Intel y otras empresas exportar chips informáticos de alto rendimiento a los cuatro centros de supercomputación de China. Tarjetas aceleradoras Intel Xeon Phi El día 2, ya no podremos utilizar chips de alto rendimiento de empresas estadounidenses.
En septiembre de 2017, el Centro de Supercomputación de Guangzhou anunció que actualizaría el sistema de supercomputación Tianhe-2 antes de fin de año, utilizando el acelerador nacional Matrix 2000 para reemplazar el acelerador Intel Xeon Phi original. Tianhe-2 se llamará Tianhe 2A, el nombre Tianhe 2A también se usó en informes anteriores en el país y en el extranjero, pero su verdadera actualización fue a fines del año pasado. Este es el verdadero Tianhe 2A. Se ha mejorado el rendimiento del punto flotante. de los 54,9 PFLOPS anteriores a 94,97 PFLOPS.
A juzgar por la situación después de la actualización, Tianhe 2A no es tan simple como reemplazar el acelerador Intel con un acelerador doméstico, la estructura de la red también se ha actualizado desde los 10 Gbps originales. a 14 Gbps, y el retraso se ha incrementado de 1,57 us a 1 us, la capacidad de memoria se ha actualizado de 1,4 PB a 3,4 PB, la capacidad de almacenamiento se ha actualizado de 12,4 PB a 19 PB, el ancho de banda se ha duplicado a 1 TB/s, y el consumo de energía se ha reducido de 17,8 MW a 16,9 MW, y la eficiencia energética ha mejorado considerablemente.
La clave para la actualización de Tianhe 2A es el acelerador Matrix 2000 anterior. Utiliza chips nacionales. Su arquitectura y fuente son tan misteriosas como siempre. Según la Universidad Nacional de Tecnología de Defensa, puede encontrar esto en línea. Los datos dicen que este chip es producido por Tianjin Maichuang Company. Cada tarjeta aceleradora utiliza 4 chips Matrix 2000. Cada Matrix 2000 consta de 128 núcleos con una frecuencia de 1,2 GHz. Puede realizar 16 operaciones de doble precisión por ciclo. El rendimiento máximo del procesador es de 2,45 TFLOPS.
La arquitectura de muchos núcleos del procesador Matrix 2000 recuerda al procesador Sunway utilizado por TaihuLight, pero este último se basa en la arquitectura Alpha. La arquitectura Matrix 2000 no es necesariamente ARM, considerando el procesador. En la hoja de ruta anunciada previamente por la Universidad Nacional de Tecnología de Defensa, la arquitectura entera debería ser ARM, pero la unidad vectorial sigue siendo una modificación nacional. La información oficial menciona que se trata de una unidad vectorial VFU personalizada de 256 bits.
Además, el consumo de energía TDP del procesador Matrix 2000 es de 240 W, el área de empaque es de 66x66 mm y se desconoce la tecnología del proceso, pero a juzgar por el tiempo de lanzamiento, probablemente se produzca en el nodo de 28 nm. ,
Este incidente puede considerarse una bendición disfrazada para China: es precisamente debido al bloqueo estadounidense lo que ha provocado un fuerte aumento de los chips aceleradores desarrollados en el país. Por el contrario, Intel ahora se ve más afectada.
En 2015, el Departamento de Comercio de Estados Unidos emitió un anuncio que restringía a Intel la venta de chips de procesador "Xeon" al Centro Nacional de Supercomputación en Guangzhou, Changsha, Tianjin y a la Universidad Nacional de Tecnología de Defensa. En ese momento, nuestra supercomputadora Tianhe-2 usaba la tarjeta aceleradora Xeon Phi de Intel y el plan para actualizarla se vio obstaculizada.
Sin embargo, después de que se anunció la orden de restricción de ventas, Lu Yutong, diseñador jefe del sistema Tianhe-2 y profesor de la Universidad Nacional de Tecnología de Defensa, respondió: "Según el plan original, Tianhe-2 Se planea actualizar este año. Aunque Estados Unidos ha impuesto restricciones a Tianhe esta vez, las ventas limitadas de los procesadores Intel Xeon necesarios para la actualización Tianhe-2 tendrán un cierto impacto en el plan de actualización original, pero estamos preparados. para ello y no afectará el objetivo establecido de actualizar Tianhe-2 de 55PFLOPS a 100PFLOPS
Efectivamente, poco después, la Universidad Nacional de Tecnología de Defensa anunció la tarjeta aceleradora informática china Matrix-2000 desarrollada de forma independiente. Adoptó la solución de procesador de señal digital de computación general (GPDSP), que no solo reemplazó por completo la tarjeta aceleradora Xeon Phi de Intel, sino que también actualizó la última supercomputadora "Tianhe 2A" ¡casi no aumentó el consumo de energía y su rendimiento se mejoró a 100P!
Para Intel, sin China, un gran país dispuesto a gastar dinero para invertir en supercomputadoras, Xeon Phi El destino de las tarjetas aceleradoras también inevitablemente declinó. Tianhe 2 una vez invirtió 3 mil millones de yuanes y utilizó 32.000 procesadores Xeon y 48.000. Más tarde se lanzó la tarjeta aceleradora Sunway-TaihuLight con un rendimiento 3 veces mayor. Cuesta 1.800 millones. La razón principal fue el uso de su propio procesador de muchos núcleos Sunway 260. Puede imaginarse cuántas ganancias ha generado Tianhe 2. Intel
No hace mucho, 7. El 23 de marzo, Intel anunció la descontinuación de ocho procesadores Xeon Phi 7200, lo que significó que la línea de productos se estaba abandonando gradualmente. Intel también planeaba utilizar el proceso de 10 nm. fabricar una nueva generación de Xeon Phi con el nombre en código Kinight Hill, pero finalmente se dio por vencido debido a la débil demanda del mercado.
Para nosotros, este es un caso clásico de intentar deshacernos de los "atascados". cuello"; pero para los Estados Unidos, ¿a esto se le llama pegarse un tiro en el pie?