Red de conocimiento informático - Conocimiento sistemático - Interpretación en profundidad de la nueva arquitectura de ARM: ¿los núcleos grandes son agresivos, los núcleos pequeños fallan?

Interpretación en profundidad de la nueva arquitectura de ARM: ¿los núcleos grandes son agresivos, los núcleos pequeños fallan?

Como todos sabemos, se puede decir que ARM es la "fuente de todo" para la gran mayoría de los teléfonos inteligentes, tabletas y algunos productos portátiles actuales. Los SoC de Qualcomm y Samsung han estado utilizando la versión pública del diseño de CPU de ARM en los últimos años, mientras que MediaTek, que se reconoce que ha "dado un giro", confía en la versión pública de la arquitectura de CPU y GPU de ARM incluso los SoC que siempre han sido. Apple, anunciado como "de desarrollo propio", en realidad es inseparable de la autorización del conjunto de instrucciones básicas de ARM.

Debido a esto, cuando ARM lanzó repentinamente una solución de arquitectura de nueva generación sin previo aviso en la noche del 28 de junio de 2022, naturalmente vale la pena analizarla más a fondo.

Descripción general del rendimiento: los núcleos grandes son más potentes, los núcleos medianos son más económicos y la GPU agrega seguimiento ligero del hardware.

Vayamos directamente al grano. Primero, vayamos directamente al tema relacionado con el rendimiento. información sobre la arquitectura de nueva generación de ARM. Y lo que es muy sorprendente es que ARM ya no "juega malas pasadas" al anunciar los datos de comparación de rendimiento de las arquitecturas nuevas y antiguas. De hecho, dieron los que pueden ser los parámetros de comparación de rendimiento más detallados de la historia.

En primer lugar, se trata del nuevo núcleo grande Cortex-X3. Bajo la premisa de utilizar el mismo proceso de semiconductor, frecuencia principal y diseño de caché, el rendimiento de Cortex-X3 se puede mejorar en un 11% en comparación con Cortex-X2.

Al utilizar el mismo proceso de semiconductores, pero comparando la frecuencia principal y el diseño de caché según diferentes valores típicos de las arquitecturas antiguas y nuevas, el rendimiento de Cortex-X3 se puede mejorar en un 22%. en comparación con Cortex-X2.

Si consideramos los factores del proceso, por ejemplo, asumiendo que el Cortex-X3 usa el nuevo proceso TSMC de 3 nm, compárelo con el Cortex-X3 que usa el proceso TSMC de 4 nm y usa el diseño existente para principales. frecuencia y caché X2, el rendimiento de la nueva arquitectura alcanzará el 25%.

En segundo lugar, está el núcleo medio Cortex-A715 mejorado. Bajo la premisa de utilizar el mismo proceso de semiconductores, la misma frecuencia principal y diseño de caché, el rendimiento del nuevo núcleo medio es sólo del 5%. mejorado en comparación con el diseño anterior, pero tenga en cuenta que la eficiencia energética en este momento será un 20% mayor que la arquitectura anterior. En otras palabras, su consumo de energía real es ahora del 87,5% del Cortex-A710, lo que ahorra un 12,5% de energía y al mismo tiempo mejora ligeramente el rendimiento, lo cual es una mejora relativamente significativa.

En comparación con las mejoras significativas en los núcleos grandes y medianos, las mejoras en el núcleo pequeño Cortex-A510 en la nueva arquitectura son más sutiles. Por un lado, como su nombre indica, esta nueva versión del pequeño núcleo todavía se llama "Cortex-A510", e incluso el nombre no ha cambiado. Pero, por otro lado, sería un error decir que no ha cambiado en absoluto, porque el consumo de energía de la nueva versión del núcleo pequeño se ha reducido en un 5% en comparación con la versión anterior. Al mismo tiempo, lo que es más importante. , ha agregado compatibilidad con aplicaciones sexuales de 32 bits.

Sin embargo, tenga en cuenta que esta función de compatibilidad es opcional y no estándar. Después de la selección, puede tener un impacto negativo en el rendimiento, pero ARM no ha dejado claro el impacto específico.

Además de la nueva versión de CPU, ARM también lanzó al mismo tiempo una solución GPU actualizada. Esta vez, el nuevo diseño de GPU se divide en tres niveles: el Immortalis-G715 de "nivel superior", el Mali-G715 de rango medio y el Mali-G615 de nivel básico.

En comparación con la generación actual de Mali-G710 y Mali-G610, la nueva arquitectura ofrece, en primer lugar, un aumento del 15 % en la eficiencia básica (y esto sin considerar la ganancia del proceso) y, en segundo lugar, admite VRS variable. La tecnología de tasa de sombreado puede reducir significativamente la carga de renderizado en algunos juegos con mucha pincelada y también es de gran importancia para las aplicaciones XR.

No solo eso, como nuevo producto GPU insignia de ARM, Immortalis-G715 presenta por primera vez una unidad de trazado de rayos de hardware. Según ARM, la unidad de seguimiento de luz de hardware solo ocupa el 4% del área central de la GPU, pero en comparación con el diseño de seguimiento de luz de software utilizado en el Mali-G710, puede aportar una mejora de rendimiento de más del 300%.

Teniendo en cuenta que aún no se han lanzado juegos que realmente admitan el efecto de seguimiento de luz Mali-G710, la declaración de ARM es realmente una puñalada por la espalda.

Análisis de arquitectura: el núcleo grande es más grande, el núcleo mediano se resta y el núcleo pequeño se queda.

Después de hablar de los cambios en los parámetros de rendimiento de la nueva arquitectura, analizaremos luego ingrese al análisis de la arquitectura convencional. En esta sección, echemos un vistazo a cómo ARM logra estas mejoras.

El primero es el nuevo Cortex-X3 de gran núcleo, cuyos cambios son sin duda los mayores en esta nueva arquitectura. Incluye un BTB L0 (búfer de destino de rama) que es 10 veces mayor que la generación anterior y un BTB L1 un 50% más grande, lo que significa un rendimiento de predicción de rama significativamente mejorado. Según declaraciones oficiales, el retraso de predicción de rama de Cortex-X3 se redujo en un 12,2%, la tasa de error de predicción se redujo en un 6% y las pausas frontales se redujeron en un 3%. Debido al rendimiento de predicción de bifurcaciones muy mejorado, el caché de microoperación de Cortex-X3 ahora se puede hacer más pequeño y la longitud de la tubería se ha reducido aún más.

Esto aún no ha terminado. En comparación con Cortex-X2, el ancho de búsqueda de caché de instrucciones de Cortex-X3 ahora ha aumentado de 5 a 6, las unidades lógicas aritméticas han aumentado de 4 a 6 y la salida. La ventana de pedido también se ha mejorado aún más. En la parte de back-end, el ancho de carga/almacenamiento de la nueva arquitectura también se incrementó en un 50% y se incrementó el número de motores de captación previa de datos.

Rendimiento de predicción de ramas más sólido, ventana de ejecución más amplia, nivel de canalización más corto, velocidad de acceso más rápida, ¿crees que te resulta familiar? Sí, esta dirección de mejora es en realidad el camino eficaz probado por Intel hace muchos años cuando revolucionó del Pentium 4 al Core, pero ahora ARM lo ha "reproducido" en procesadores RISC.

En comparación con el avance de Cortex-X3, los cambios en Cortex-A715 y (nueva versión) Cortex-A510 no son relativamente tan grandes. Entre ellos, la mejora de Cortex-A715 proviene principalmente de renunciar al soporte para el conjunto de instrucciones de 32 bits, lo que simplifica enormemente el diseño del decodificador de instrucciones y libera más posiciones de transistores para aumentar el tamaño de la caché. Los cambios de Cortex-A510 son aún menos claros. Ahora sólo sabemos que tiene soporte opcional de 32 bits y una ligera reducción en el consumo de energía.

En comparación con los cambios en la parte de la CPU (especialmente el núcleo grande), los cambios en la nueva GPU de ARM no son tan significativos. Por un lado, ya sea Immortalis-G715, Mali-G715 o Mali-G615, todos comparten el mismo diseño arquitectónico (sólo que Immortalis-G715 tiene un circuito de seguimiento de luz de hardware adicional en su interior). radica en la cantidad de núcleos. Existen restricciones claras al respecto.

Por otro lado, en comparación con el Mali-G710 existente, la nueva GPU duplica el número de unidades de multiplicación y suma FMA en la arquitectura básica y diseña una nueva unidad informática FP16 para anti-aliasing. Al mismo tiempo, según ARM, la tasa de generación de triángulos de la nueva GPU "bajo escenarios de carga pesada" es tres veces mayor que la existente, y su velocidad de mapeo de texturas es dos veces mayor que la existente. Sin embargo, aún no está claro si este múltiplo proviene de mejoras en la arquitectura subyacente o de un aumento en el número de núcleos o frecuencias, por lo que es sólo una referencia. La mejora real en el rendimiento de la GPU no se puede determinar hasta que se lance el producto real.

Análisis de mercado: las computadoras portátiles ARM pueden aumentar y también se espera que regresen los teléfonos móviles de nivel básico

Vale la pena mencionar que, si bien lanza una nueva generación de líneas de productos, ARM también proporciona su propio software y hardware. El plan tiene un nuevo nombre, llamado "Arm Total Compute Solutions (traducido literalmente como solución informática general ARM) 2022", abreviado como ARM TCS22. Al mismo tiempo, ARM también "integró" la arquitectura de la generación anterior lanzada el año pasado en ARM TCS21, y también anticipó el nombre del producto para el próximo año (TCS23) y el año siguiente (TCS24).

¿Qué significa esto? De este movimiento, podemos extraer al menos dos datos.

En primer lugar, ARM no parece tener la intención de reemplazar completamente la línea de productos de la generación anterior con la nueva arquitectura. El "cambio de nombre" de Cortex-X2, A710 y A510 puede significar que su autorización continuará.

Pero yendo más allá, no es difícil encontrar los cambios de ARM de TCS21 a TCS22, así como los “spoilers” oficiales de TCS23 y TCS24. Arriba) Se eliminó el soporte para computación de 32 bits de mediados de año. core (Cortex-A715), y agregó capacidades informáticas "opcionales" de 32 bits a la "nueva versión" del núcleo pequeño Cortex-A510.

Por otro lado, en las imágenes previas de TCS23 y TCS24 se puede ver claramente que en los próximos dos años, ARM actualizará los diseños de núcleo grande y medio cada año, pero los pequeños Core solo se lanzará en 2023. Habrá un cambio de generación en 2024, pero no se actualizará en 2024 y se utilizará directamente.

Al mismo tiempo, en este "diseño de modelo" oficial de TCS22, ARM no solo amplió el número máximo de núcleos admitidos por la nueva arquitectura de 8 núcleos a 12 núcleos, sino que también proporcionó múltiples núcleos con núcleos grandes. , soluciones combinadas de núcleo medio e incluso "diseños de rendimiento ultraalto" que no utilizan el núcleo pequeño A510 en absoluto y solo constan de núcleos grandes y núcleos medios.

Esto puede significar que ARM está "confiando" en la nueva arquitectura, especialmente en la mejora significativa en el ratio de rendimiento y eficiencia energética del núcleo grande (Cortex-X3) y el núcleo mediano (Cortex-A715) , y obviamente tiene la intención de utilizarlo en el futuro. Un mayor posicionamiento en el mercado empuja hacia arriba. Quizás en el futuro veamos más soluciones SoC para portátiles basadas en la nueva arquitectura de ARM.

De hecho, mirando hacia atrás en la historia, no es difícil encontrar que la arquitectura Cortex-A53 anterior tardó cuatro años (2014-2017) en ser reemplazada, mientras que la arquitectura Cortex-A55 ha sido "fuerte " durante al menos cinco años (2018-2022) durante mucho tiempo. Por el contrario, la arquitectura Cortex-A510 de la "primera versión" del año pasado no es adecuada para dispositivos básicos y otros dispositivos de bajo consumo porque es completamente incompatible con el código de 32 bits.

De esta manera, la “nueva versión” Cortex-A510 de este año es en realidad el primer diseño de arquitectura de CPU de bajo consumo bajo el conjunto de instrucciones ARM v9 que se puede utilizar para dispositivos de nivel básico. Y tan pronto como el próximo año, será reemplazada por una arquitectura actualizada.

En otras palabras, ante la situación actual del mercado de smartphones donde los productos de alta gama brillan con fuerza, mientras las ventas de dispositivos de gama básica se reducen, ARM ha inyectado nueva potencia al nuevo buque insignia. a través de nuevos núcleos grandes y medianos experimente el poder del progreso continuo y, por otro lado, también ha creado un "remedio" sin precedentes para el mercado de gama baja.

Quizás en un futuro próximo veamos un controlador básico basado en la (nueva versión) de la arquitectura Cortex-A510 con una experiencia significativamente más confiable, o con una relación de rendimiento y eficiencia energética muy mejorada, finalmente capaz de competir con Apple se hace con la plataforma de reloj inteligente Android.