Red de conocimiento informático - Conocimiento sistemático - El texto de la mentira sobre el rendimiento de la consola de juegos

El texto de la mentira sobre el rendimiento de la consola de juegos

El efecto visual de un juego en realidad está determinado por el motor del juego y la tarjeta gráfica. La división del trabajo y la colaboración entre los dos son muy importantes en la era en la que las PC y las consolas de juegos domésticas son "incompatibles". " En esa época, la relación entre los motores de juegos y las tarjetas gráficas era relativamente simple. Con la ayuda de DirectX, los motores de juegos podían aprovechar al máximo el rendimiento de las tarjetas gráficas. Sin embargo, a medida que el modelo de desarrollo de juegos de plataforma completa se hizo popular, el La relación entre los motores de juego y las tarjetas gráficas se volvió más complicada. Un juego también tiene que lidiar con diferentes interfaces API y tarjetas gráficas en diferentes plataformas. Es muy difícil mantener gráficos excelentes y efectos sorprendentes en diferentes plataformas.

La era de NVIDIA - La tecnología CAPCOM y el complejo G80 de Sony

Para hablar de la relación entre la tecnología de tarjetas gráficas y los juegos multiplataforma, tenemos que mirar hacia atrás, a un período de la historia. En 2004, basándose en la tendencia de los gráficos de juegos, después de un análisis exhaustivo, el grupo de expertos internos de CAPCOM comenzó a desarrollar una nueva generación de motores de juegos. Al mismo tiempo, el núcleo G80, que NVIDIA pasó tres años desarrollando, está en el "Die". Out" (Die Out, que significa que el chip está a punto de entrar en producción formal). Para fortalecer su propia competitividad en el mercado, NVIDIA decidió llevar a cabo una cooperación profunda con desarrolladores de juegos de todo el mundo para acelerar la El cambio en la tecnología de gráficos y la reputación de CAPCOM entre los jugadores y su amor por las películas animadas CG hicieron que se llevaran bien. La unión de NVIDIA también hizo que CAPCOM La tecnología del motor del juego (es decir, MT Framework) haya mejorado enormemente y gradualmente haya dominado la tecnología de desarrollo. bajo DirectX 9.0c.

En ese momento, el Departamento de Entretenimiento Informático de Sony también codiciaba el chip G80 y la tecnología gráfica correspondiente (Sony Computer Entertainment, en adelante SCE), y eligieron un método más directo: incorporarlo. el núcleo G80 en el sistema de hardware de PS3 (el propósito de SCE con este movimiento es hacer que el "rendimiento" de la PS3 esté significativamente por delante de la Xbox360 de Microsoft, en términos de precisión de imagen. Producto que suprimió firmemente a sus oponentes aunque la PS3 aún no había sido lanzada). En ese momento, una vez que se anunció la noticia, inmediatamente tuvo un gran impacto. Las expectativas de los jugadores para la PS3 se elevaron a la cima y la Xbox 360 fue ridiculizada como "Xbox 1.5". , las cosas resultaron contraproducentes, dado que NVIDIA aún no había diseñado una solución simplificada para el núcleo G80 adecuada para consolas de juegos domésticas, SCE sólo después de perder mucho tiempo en la mesa de negociaciones se dio cuenta de que 1. la autorización del diseño del núcleo G80. Los gastos y los costos de corte de chips superarán con creces lo que puede pagar. 2. Los productos pequeños, como las consolas de juegos domésticas, no pueden cumplir con los requisitos del núcleo G80 en términos de suministro de energía y disipación de calor.

Debido a la presión del tiempo, SCE no tuvo más remedio que hacer lo mejor que podía hacer y comprar la licencia para el núcleo G70 de la generación anterior de NVIDIA.

Lo que es aún más desafortunado es que, debido a la situación financiera de la empresa matriz. La empresa Sony Group empeora, SCE tiene que recortar nuevamente los costos de fabricación del chip, el bus de 256 bits del núcleo G70 se ha reducido a la mitad y el ROP (procesador de trama) y la TMU (unidad de mapeo de texturas) también se han reducido. Para mejorar el rendimiento, SCE sólo puede intentar aumentar la frecuencia del chip, lo que no sólo retrasa significativamente el ciclo de lanzamiento de la PS3 sino que también provoca que la temperatura de la PS3 alcance hasta 97,6 °C a plena carga. ¡Al mismo tiempo, la PS3 también! perdió la capacidad de ejecutar renderizado en tiempo real con una resolución de 1920x1080. El rendimiento real solo era equivalente al de la GeForce 7900GS, que era solo la mitad de bueno que el de Xbox360. Ahora miramos hacia atrás, NVIDIA pasó más tarde a la G92-400 (GeForce8800GS). Los núcleos G92-150 (GeForce 9600GSO) obtenidos optimizando el núcleo G80 son los más adecuados para las consolas de juegos domésticas: la agresividad de CAPCOM y la "NVIDIAización" de las consolas de desarrollo de juegos

Hay un fenómeno interesante en el juego. círculo de desarrollo. Los desarrolladores de juegos multiplataforma rara vez consultan al grupo de expertos de Microsoft Games para Windows sobre problemas técnicos de DirectX 10. La mayoría de ellos se comunican con el departamento de Xbox Mountain View, una organización independiente de Microsoft, y continúan usándolo obstinadamente. Con la experiencia acumulada en el desarrollo de juegos de computadora en el pasado, lanzamos directamente la versión Direct 9.0c en la plataforma de PC con mejores gráficos que las consolas de juegos. Los desarrolladores de juegos en la plataforma de PC a menudo consultaban al grupo de expertos de Juegos para Windows y desarrollaban los juegos Empire-Famous. con gráficos magníficos e impactantes como Total War y Crysis.

Una de las razones de este fenómeno es que el núcleo de visualización de las consolas de juegos domésticas actuales todavía está estancado en el nivel DirectX 9. Los resultados se reflejan en el. Los juegos son La versión DirectX 910 de los juegos para todas las plataformas tiene muy poca diferencia de pantalla en la configuración normal. Por ejemplo, la versión DirectX 10 de Gears of War desarrollada por EPIC solo proporciona otra interfaz de programa de aplicación opcional y no tiene muchas ventajas en términos de. Calidad de imagen. ¿Por qué? ¿Qué? Debido a que DirectX 10 actualmente solo se usa para resolver el conflicto entre HDR y AA en DirectX 9, por lo que se puede usar o no. no hay modo DirectX 10 en la versión para PC de UT3. En resoluciones como 1280×800, la tecnología Anti-aliasing no se puede implementar a baja velocidad. CAPCOM, que ha recibido asistencia de NVIDIA, ha tenido un rendimiento mucho mejor en la mayoría de sus juegos. tiene versiones DirectX 10 y se han realizado algunas mejoras en los gráficos del juego.

NVIDIA proporciona a CAPCOM La ayuda no se limita al desarrollo de software A finales de 2006, se actualizó el equipo de hardware del departamento de desarrollo de CAPCOM. En todos los aspectos, las tarjetas gráficas profesionales Quadro FX basadas en el núcleo G80 y las mejores tarjetas gráficas GeForce de la época se utilizaron ampliamente, proporcionando un entorno de oficina estable para el departamento de desarrollo y un rendimiento de aplicaciones gráficas "locas". Framework Direct 9.0c también se lanzó recientemente en este momento. Los juegos diseñados en base a este motor pueden, en teoría, ejercer el rendimiento completo de las computadoras con nivel Intel Core 2 E67002GB GeForce 8800GTX (768 MB), pero el rendimiento real del juego final está lejos de alcanzar el nivel. nivel de "plena potencia" de la tarjeta gráfica GeForce 8800GTX. Por eso, como dijo el director de producción de Devil May Cry 4, Kobayashi Yuki,

Para desarrollar un juego, el primer paso es crear. una versión Alpha en una computadora de alto rendimiento y luego reduzca los gráficos en consecuencia y simplifique los cálculos en función de las diferentes arquitecturas de PS3 y Xbox360 para cumplir con los requisitos de los marcos de fotos. Por lo tanto, la versión para PC del juego es en realidad solo. la versión básica y primera completa del juego, pero debido a la estrategia de ventas del desarrollador, se convirtió en la última versión en ser lanzada. 1. Núcleo de gráficos de Microsoft Xbox360

Diseñado y fabricado por ATI

.

Nombre del código del chip:

Hay 100 millones de transistores, pero lo que realmente diseña y fabrica ATI es sólo el chip principal: Xenos con 232 millones de transistores, que es aproximadamente equivalente en tamaño al RADEON X800. Entonces, ¿qué está pasando con el otro chip?

Tenemos que seguir mirando hacia atrás en la historia. Cuando ATI diseñó el chip Xenos, adoptó la inmadura "arquitectura de renderizado unificado" bajo la presión de Microsoft. Aunque mejoró la eficiencia de ejecución, no pudo cumplir con los requisitos. Requisitos de combinación Alpha y almacenamiento en búfer del eje Z y otros requisitos de tecnología anti-aliasing. Las dos partes tuvieron que buscar otras soluciones y finalmente eligieron el eDRAM (chip de memoria dinámica de acceso aleatorio integrado con una capacidad de solo 10 MB) proporcionado por NEC. y los dos chips se denominan colectivamente procesamiento de gráficos C1. Debido a la pequeña capacidad del chip eDRAM, solo puede almacenar datos de muestreo AA, lo que no ayuda al rendimiento del subsistema de gráficos. Un subproducto de esta solución es el famoso ". Problema "3 rojo": para controlar los costos, Microsoft separó estos dos chips. Soldados en una PCB de 4 capas, Xenos causará deformación a altas temperaturas, lo que provocará desoldadura.

En comparación con el núcleo de la pantalla de la PC, Xenos es demasiado pequeño, con 232 millones de transistores. Sólo puede albergar 48 unidades de sombreado unificado (USU) y 16 unidades de textura (TMU). Muchos consumidores piensan que Xenos se basa en el diseño del núcleo R500 (RADEON X1950XT) de nueva generación. de hecho, solo es equivalente al núcleo R420. La versión modificada de 24 tuberías solo puede funcionar a 500 MHz debido a la limitación del sistema de disipación de calor, que es muy ineficiente. Según información oficial publicada por Microsoft, la potencia informática teórica del. El procesador de gráficos C1 tiene una representación de 48 mil millones de píxeles por segundo, mientras que la tarjeta gráfica de nivel GeForce 9800GTX + convencional actual puede alcanzar 236,5 mil millones de operaciones por segundo. La brecha de rendimiento es de aproximadamente 5 veces y limita severamente el rendimiento de la pantalla de los juegos en todas las plataformas.

En cuanto al ancho de banda de la memoria de video, la brecha es aún mayor. Los 256 GB/s reclamados por Microsoft son solo el ancho de banda del circuito lógico en el chip eDRAM al circuito de almacenamiento temporal, mientras que el ancho de banda de datos de eDRAM a Xenos. es de solo 32 GB/s. Dado que el bus de datos de Xenos es de solo 128 bits, aunque usa memoria DDR3 con una frecuencia de 1400 MHz, el ancho de banda real es de solo 22,4 GB/s, este es el ancho de banda de memoria de video máximo teórico de Xbox360. En aplicaciones, este ancho de banda de 22,4 GB/s debe compartirse con el procesador y la memoria de vídeo también se comparte con la memoria principal, lo que provoca un grave deterioro del rendimiento. La Xbox360 utiliza memoria de vídeo DDR3 con una frecuencia de 1400 MHz de ancho del bus de datos. de Xenos es sólo de 128 bits, por lo que el ancho de banda de la memoria de vídeo de la Xbox360 es 1400x8000 × 128 = 22,4 GB/s, y el ancho de banda disponible de la GPU durante los juegos reales sólo puede ser mucho menor que esto, debido a Para reducir el tiempo de fabricación costo de las consolas de juegos, las desventajas de adoptar un "sistema de memoria unificada" son que la Xbox 360 no tiene memoria GPU independiente y solo puede competir con el procesador por 512 MB de capacidad de memoria, por lo que el procesador también debe ocupar casi la mitad de la misma. Un ancho de banda tan bajo desde la GPU a la memoria de video limitará en gran medida la resolución del juego y la precisión de la representación de los efectos especiales, por lo que la Xbox360 no puede lograr una verdadera imagen Full HD de 1080P (1920 × 1080). desglosado más adelante, echemos un vistazo a la situación de PS3.

2 GPU de PS3

Diseño y fabricación: NVIDIASCE

Código de chip: RSX

Integración de transistores: 302 millones

p>

SCE nombra el núcleo GPU de la PS3 RSX (Procesador de Síntesis Real), que está diseñado por NVIDIA y "fabricado" por Sony. Esta GPU basada en el núcleo G70 integra 302 millones de tubos integrados. La información oficial de Sony indica que su frecuencia de funcionamiento es de 550 MHz. Sin embargo, la PS3 vendida oficialmente la ha bajado silenciosamente a 500 MHz. Tiene 24 canales de sombreado de píxeles y 8 canales de sombreado Vertex. unidades de textura. En términos de especificaciones, Xenos es superior a la Xbox 360. Ésta es una de las razones por las que SCE acusa a menudo a los desarrolladores de juegos de no utilizar la "función" de la PS3.

Pero este no es el caso. Aunque las capacidades de renderizado central de RSX son aceptables, las "instalaciones de soporte" son muy pobres. No sólo el ancho del bus se redujo a 128 bits, sino que la memoria de video también es DDR3. con una frecuencia de 1400MHz, por lo que su ancho de banda de memoria es el mismo que el de Xenos, ambos 22,4GB/s. Aunque tiene 256 MB de memoria de vídeo independiente, no es mucho mejor que la Xbox360. Echemos un vistazo a la potencia informática de punto flotante en la que se centra SCE. RSX afirma tener una potencia informática de punto flotante de 1800GFlops (1800 mil millones de operaciones por segundo), pero está lejos de los 7096GFlops de GeForce 9800GTX+. Es una quimera que la PS3 pueda igualar a las PC convencionales en términos de rendimiento, y también es difícil cumplir con los requisitos de juegos como "Resident Evil 5" para ejecutarse a 1080P. Como se analizó anteriormente desde el punto de vista del hardware, ni Xbox360 ni PS3 tienen las condiciones para lograr imágenes de 1080P en juegos 3D a gran escala, por lo que deben adoptar algunas soluciones flexibles.

1 La fórmula de cálculo de diferencia de PS3 es pseudo-1080P

Screen SCE utiliza el concepto de sustitución en la promoción de PS3. Es cierto que PS3 tiene la capacidad de decodificación de Blu-ray 1080P. archivos de películas, pero esto es diferente de la representación en tiempo real de 1080P de imágenes de juegos. La pantalla del juego 1080P de PS3 es en realidad una imagen ampliada de 1280 × 720 calculada mediante la diferencia de píxeles. En este simple proceso de "estiramiento", RSX solo necesita completar los subpíxeles medios de color de los píxeles muestreados, sin necesidad de cálculos de sombreado de píxeles. , se puede lograr una imagen de 1080P incluso con el antiguo chip NV40.

Existe una diferencia esencial en la cantidad de píxeles entre este pseudo 1080P y el 1080P real: el modelo geométrico de los objetos en el juego no será más refinado y fluido; al contrario, es un juego que debido al nivel de representación de píxeles de 720P, el marco de la imagen y el área de píxeles irregulares también se amplificarán 2,25 veces, el efecto de distorsión geométrica del modelo del objeto será muy grave y el efecto de la imagen no será tan bueno como 720P. .

2 1080P falso de Xbox360

Xbox360 y PS3, solo puedes ajustar el recuento de píxeles en el escritorio en la configuración, pero no hay un menú de ajuste de resolución en la Xbox real. Versión 360 del juego. Cuando se anunció por primera vez la Xbox 360, el equipo de desarrollo marcó su resolución más alta como 1080i. Pero en ese momento, Microsoft no sabía que el rendimiento de la PS3 era en realidad tan limitado. Dado que SCE siempre había mantenido estrictamente confidenciales los detalles técnicos del RSX, Microsoft tenía mucho miedo del rendimiento del RSX, por lo que lo dejó claro. Al comienzo de la promoción, la capacidad de representación de píxeles del juego de Xbox 360 era óptima para 720P.

Pero en 2006, después de que Microsoft obtuviera la tercera versión de la máquina de prueba de depuración del kit de desarrollo de PS3 para su desmontaje y análisis, su actitud comenzó a cambiar: dado que otros pueden trabajar en 1080P, ¿por qué nosotros no? No dispuesto a admitir la derrota, el equipo de desarrollo de Xbox inmediatamente hizo correr la voz y dijo que las herramientas de desarrollo de Xbox 360 también pueden renderizar juegos de 1080P después de la optimización. RSX no es nada especial, pero la capacidad de llenado de píxeles de Xenos en juegos Shader a gran escala es demasiado baja. , entonces el diseño del chip se modificó temporalmente. Es demasiado tarde, ¿qué debo hacer?

Los ingenieros descubrieron que el simple chip eDRAM en C1 era inútil cuando la resolución era superior a 1280×720, siempre que cada cuadro tuviera más de 1 millón de píxeles, no se podía utilizar la tecnología anti-aliasing, por lo que. simplemente podrían usarlo para el procesamiento de píxeles y ampliar proporcionalmente la imagen de 720P. Aunque esto formará un alias obvio en el borde del modelo, puede obtener una pantalla de juego "1080P" con una velocidad de cuadros más alta que la de PS3, por lo que Xbox360 tiene la capacidad de renderizado de 1080P. De 2005 a 2006, los desarrolladores de juegos todavía usaban P4 3.6 y GF7900 o R.

A los ojos de los desarrolladores, el rendimiento real de estas dos consolas de juegos es muy diferente al de las PC que ahora se consideran "autos clásicos". Lo que está particularmente descontento con las CPU de estas dos consolas de juegos es que tienen problemas con la GPU. La solución es reducir la resolución de la pantalla y la precisión de los efectos especiales de la consola de juegos. Los jugadores básicos de PC de tercera categoría también pueden realizar este tipo de trabajo, pero los problemas con la potencia informática del procesador pueden ser graves. ser reconstruido, lo que provocó que una gran cantidad de programadores de Dedug se quejaran.

De hecho, es gracias a Dios que se pueda garantizar 720P en los juegos de Xbox360. Según la encuesta de EPIC, muchos otros productores ni siquiera pueden garantizar 700P para lograr una velocidad de fotogramas que no haga vomitar a la gente. Por supuesto, EPIC tuvo problemas al final. La escala de renderizado final de la versión XBOX360 de GOW se fijó en 1244X700 píxeles por cuadro, que solo podía mantener 27 fps, que era menos de 1/1 de su velocidad de renderizado en AthlonX2 640. y PC GF8800GTX 4! Hay demasiados desarrolladores desafortunados Debido a engaños irrazonables en los primeros días, muchos desarrolladores sobreestimaron seriamente el rendimiento de la consola de juegos. Incluso la segunda versión del kit de desarrollo Xbox360 utilizó dos Power Mac G5 de alta frecuencia y dijo que esto El desarrollo. kit es solo 2/3 del nivel de la versión final de la consola, basado en el hecho de que el procesador de Xbox 360 tiene tres núcleos... El resultado no sorprendente del proceso de desarrollo es que el juego final en Xbox 360 generalmente se ejecuta menos de la mitad de la velocidad de fotogramas esperada. Hizo vomitar a los probadores del juego. ¡No queda más remedio que recurrir al método de reducción de píxeles! Las dos versiones de consola de GTA4 solo tienen 1138X640 por cuadro, la distancia de escena optimizada mediante el relleno de píxeles de la GPU es solo del 20% y las dos consolas solo tienen 24-26 fps. Después de que salió la versión para PC, una gran cantidad de personas que no sabían la verdad sobre las consolas de juegos llamaron al equipo de desarrollo de RockStar y se regodearon con GTA4 con 1920X1200 píxeles renderizados por GTX28E8200, efectos especiales completos y una distancia de renderizado de escena del 100 %. y gritó: "Son sólo 29 fps. ¡Ah! La mejor tarjeta gráfica no es tan buena como una consola de juegos".

La respuesta de los desarrolladores de primera línea de RockStar en la entrevista fue muy simple:

"Luego reduzca la tarjeta gráfica. Dependiendo de la distancia de visualización, debe reducir la resolución y el efecto de textura de la versión para PC también se ha mejorado completamente. De hecho, la clave es la resolución. De hecho, El volumen de datos de la versión para PC a 1680X1050 ya es muchas veces mayor que el de GTA en la consola de juegos. Olvidé lo alto que era". Obviamente, el desarrollador no lo dijo claramente por vergüenza del fabricante de la consola de juegos. . ”

El juego que destruyó el truco falso de 1080P de la Xbox 360 no lo hizo nadie, sino la propia gente de Microsoft: Bungie y su “Halo 3” antes de la continuación del juego. El marco del programa en Xbox 360 se diseñó en base a las capacidades reales de Xbox 360. El tamaño de la escena, la precisión geométrica y otros datos básicamente solo se duplicaron. Este enfoque pragmático hizo que la velocidad de fotogramas del juego fuera mucho mejor que la de GTA4, pero lo peor es. La resolución de "Halo 3" es sólo 1138X640. El trabajo del procesador es ejecutar todas las aplicaciones en todo el juego y asignar subprocesos de trabajo de representación de gráficos a la GPU para su ejecución. La fidelidad de la imagen depende de las operaciones de sombreado y el relleno de texturas de la GPU. capacidad, entonces la velocidad de ejecución del juego depende del rendimiento tanto del procesador como de la GPU.

Algunas personas pueden no entender por qué el procesador de 3 núcleos de Xbox360 y el procesador de "9 núcleos" de PS3 se utilizan en "Biochemical". ". "Crisis 5" se carga a plena carga y la temperatura sube rápidamente a 7 u 80 grados centígrados. ¿Es realmente tan grande la brecha entre las videoconsolas y las PC? Después de leer el siguiente análisis de los procesadores de Xbox360 y PS3, te entenderás las videoconsolas ¿Qué pasa con su procesador?

1 El falso procesador Cell de “9 núcleos” de PS3

A diferencia del procesador Cell de IBM para servidores, el de la consola. PS3 Cell tiene sólo 230 millones de transistores, con una frecuencia de 3,2 GHz, y está fabricado en un proceso de 65 nm. Utiliza el mismo hyper-threading que el Pentium 4 y no se puede comparar con la calidad de los chips de IBM con al menos 250 millones de transistores y con una frecuencia de reloj. 4,6 GHz. La tasa de uso de los procesadores Cell basados ​​en Power PC en servidores es muy baja y no hay otra razón por la que no puedan venderse: las capacidades informáticas complejas reales de los procesadores Cell son demasiado bajas.

La versión PS3 del circuito lógico del procesador Cell consta de un pequeño núcleo informático de propósito general (PPE) con arquitectura Power PC y ocho micronúcleos informáticos de precisión simple (SPE). Uno de los SPE se utiliza en. el producto real está protegido, así que para ser precisos, el procesador de PS3 debería ser un "núcleo pseudo-9". Además, para ahorrar dinero, el sistema no tiene un chip de efectos de sonido de hardware, por lo que también ocupa un SPE específicamente para procesar efectos de sonido.

Debido a que el núcleo informático de uso general (PPE) para todo uso es demasiado pequeño, incluso si corresponde a dos subprocesos de trabajo para maximizar la eficiencia del circuito lógico, su potencia informática es muy limitada, por lo que Solo está equipado con caché de nivel 2 de alta velocidad de 0,5 MB. Los otros siete coprocesadores (SPE) tienen un rango muy estrecho de instrucciones de operación, incluso inferior al rango de instrucciones de la Unidad de Procesador de Transmisión (SPU) en la GPU de NVIDIA. Esto es lo que PS3 llama física de juegos y equipos de PC de "próxima generación". Los efectos físicos del hardware PhysX de las tarjetas gráficas GeForce GTX simplemente no son comparables a la causa raíz. De hecho, es "sustancial", de lo contrario, la versión para PC de "Mirror's Edge" tiene efectos realistas ultracomplejos de rotura, desgarro y colisión de objetos. ¿Por qué la PS3 no utilizaría el SPE inútil del procesador Cell para realizar cálculos? Básicamente, solo son capaces de procesar video. Los SPE para decodificar archivos tienen cada uno un caché de baja velocidad de 0,25 MB, por lo que las personas que están familiarizadas con el diseño de la arquitectura del procesador ahora verán serios problemas en la planificación de transistores del procesador Cell; no es un Programa de uso general adecuado para procesadores de juegos ¡Chip informático!

El procesador celular asigna más del 70% de los transistores a SPE y su caché de baja velocidad. Una cantidad tan grande de SPE no tiene capacidades de computación de programas independientes y solo puede ayudar a RSX en operaciones de punto flotante. Se dice que son operaciones de sombreado de punto flotante: todo relleno de píxeles de nivel de instrucción de sombreado de procedimiento simple y no largo. Esto es muy pobre para ayudar a efectos especiales de coloración complejos en juegos reales; de lo contrario, la versión para PS3 de GTA4 apenas podría alcanzar los 24 FPS con una resolución de 1138×640. Por otro lado, hay muy pocos transistores centrales PPE que realmente puedan convertirse en un procesador y tener capacidades informáticas para todo el programa, y ​​todavía utilizan una arquitectura de ejecución de instrucciones secuencial ineficiente. Una vez que esos 6 SPE (uno para enmascaramiento y otro para procesamiento de efectos de sonido) ayuden al RSX a llenar los píxeles a máxima velocidad, el ancho de banda de 25,6 GB/s de la única memoria XDR de 256 MB de capacidad de PS3 se reducirá en más de 18 GB/s, y el real datos disponibles para operaciones lógicas de PPE El ancho de banda es inferior a 7 GB y, junto con la eficiencia de ejecución de la secuencia de instrucciones dogmáticas, el tráfico de datos de la memoria puede paralizarse en cualquier momento.

Procesador Xenon de 2 núcleos en Xbox360

El procesador Xenon diseñado por IBM para el equipo de desarrollo de Mountain View (el equipo de desarrollo de Xbox360), una división independiente de Microsoft (y el Xenon El procesador diseñado por ATI Xenons (los núcleos de pantalla son dos cosas diferentes) El tamaño del transistor es de 165 millones, la frecuencia de funcionamiento es de 3,25 GHz y está fabricado con un proceso de 65 nm. Parece ser mucho más pequeño que el procesador de PS3, pero de hecho, Xenon no tiene el SPE de cálculo de píxeles simple de Cell, que es solo de nombre. El circuito de operación lógica del PPE es de mayor escala. Xenon, al igual que Cell, utiliza procesadores de arquitectura Power PC, que son mucho menos eficientes que Core2, Athlon y Phonem en las PC.

El circuito lógico de Xenon consta de 3 pequeños núcleos de computación de propósito general (PPE), cada núcleo tiene dos hilos de trabajo, para un total de 6 hilos. En comparación con los EPI de Cell, los tres EPI de Xenon son, en promedio, más pequeños. En los juegos reales, generalmente solo se usan de uno a tres subprocesos. Esto también se debe a que no hay un chip de procesamiento de sonido de hardware como PS3, y Xenon debe ocupar un subproceso para el procesamiento suave de 5.1 canales. La razón más importante por la que los programadores de juegos ignoran 6 subprocesos es el sistema de memoria unificada y memoria de video que utiliza Xbox 360 para ahorrar dinero.

Porque una vez que los 6 subprocesos de trabajo del procesador están activados, independientemente de cuántos juegos puedan tener un rendimiento informático efectivo, simplemente leer y transmitir datos desde la memoria consumirá 20 GB de ancho de banda por segundo.

La velocidad DDR3 de la Xbox360, que sólo tiene una frecuencia operativa de 1400MHz, puede proporcionar un ancho de banda máximo de sólo 22,4GB por segundo. Por lo tanto, al encender los 6 hilos del procesador, puedes apagar directamente el Xenon que está computando. instrucciones de sombreado largas De todos modos, los efectos gráficos de la GPU después del cálculo, el ancho de banda de la memoria de video de poco más de 2 GB por segundo no se puede transmitir a la memoria de 512 MB y a la memoria de video y se puede ahorrar algo de energía girándola. apagado directamente.

Además, el tráfico de datos de Xbox360 está extremadamente congestionado en la memoria, cualquier hilo de trabajo de ejecución de instrucciones secuenciales de Xenon puede detener el flujo de datos. Un retraso de datos tan grave hará que el juego de Xbox360 sea AI. Regrese directamente a la era DX7, por lo que es más inteligente utilizar dos o tres subprocesos de trabajo. Por la misma razón que Cell, debido a la baja potencia informática del PPE y al método dogmático de ejecución de instrucciones, Xenon solo tiene un total de 1 MB de caché L2 de alta velocidad, que mantiene una proporción de caché de circuito lógico similar a la del PPE de Cell. En resumen, combinados con la potencia informática lógica del procesador, el rendimiento de sombreado y renderizado de la GPU, y la capacidad y el ancho de banda de la memoria y la memoria de video, todos los factores que determinan el rendimiento del juego son enormes diferencias, razón por la cual la PC La versión de "Resident Evil 5" tiene gráficos y precisión peores que la versión de consola. La velocidad de ejecución es rápida y potente para varias épocas de hardware.

Los fanáticos acérrimos de las consolas de juegos saltarán y dirán que las cosas de 2005 y 2006 no se pueden comparar con las PC de 2008. Entonces, si lo comparamos con el Aehlon×2 y el Core2 de 2005 y 2006, y los juntamos con el Pentium 4 de un solo núcleo y el Athlon 64 de gama más baja de 2005 y 2006, ¿pueden los pseudo-multinúcleos Cell y Xenon ¿Superar los dos primeros? No sirve de nada entre los programadores de juegos. Además de las enormes diferencias en el diseño de los chips de los procesadores, los costos de fabricación y la escala de los transistores, los fatales defectos arquitectónicos de los procesadores de las consolas de juegos también son un factor decisivo. Ya sea un pequeño núcleo de computación lógica o tres, cuál es más fuerte y cuál es más débil es un debate interminable entre el hardware de nivel más bajo que es "inútil", como los chips de consolas de juegos (a los ojos de los ingenieros de arquitectura de procesadores, Xenon Mejor), que es de 5 a 10 niveles diferente del nivel de procesador del gran núcleo informático lógico de Intel en una computadora personal real.

La parte más "retrasada mental" del PPE para procesadores de gama baja como Cell y Xenon para consolas de juegos es la arquitectura de ejecución de instrucciones secuencial subyacente, mientras que todas las operaciones lógicas avanzadas del procesador en PC utilizan la arquitectura de ejecución de instrucciones. ¿Cuánta pérdida de rendimiento provocará esta arquitectura de la videoconsola? Tomemos como ejemplo "Resident Evil": antes de que un hermano africano apunte una ballesta de fuego a la pata de un cerdo y la dispare, el procesador debe calcular la probabilidad de impacto y los valores de detección de la superficie de impacto de acuerdo con diferentes instrucciones de antemano, y luego el hermano se disparará, pero en PS3, en la versión Xbox 360 de "Resident Evil", una vez que no se puede completar la detección de impactos, Cell y Xenon seguirán intentando completar el cálculo en la profundidad de las instrucciones, mientras que otras instrucciones del programa en La parte posterior de la tubería solo puede esperar a que los hermanos de enfrente completen el "disparo" y pierdan el tiempo. Cientos de ciclos de operación del reloj son un desperdicio de energía. Este tipo de arquitectura de procesador "retrasada" provocará atascos en la red de transmisión y cálculo de datos (pausa en la representación del cuadro), e incluso "parálisis del tráfico" (caída). La situación más afortunada es que a menudo podemos ver la ballesta de llamas en ". Resident Evil" El héroe sigue apuntando... apuntando... siempre apuntando a cosas como esta.

Sin embargo, el procesador del PC no sólo tiene potentes capacidades informáticas de alta precisión, rara vez se producen comportamientos de bajo nivel, como errores de detección de aciertos, sino que además, por decir lo menos, no se perderán datos ni siquiera si la instrucción no se completa. Se detiene el tráfico. Debido al alto costo del ancho de banda del procesador y la planificación de transistores de la PC, el circuito de operación lógica tiene una gran cantidad de canales de instrucciones paralelos y utiliza una arquitectura de ejecución desordenada. Las instrucciones del programa anterior no se completan, otras instrucciones se cuentan primero y se llamará a un conjunto de instrucciones más potente en el siguiente ciclo de reloj para capturarlas sin cesar. Por lo tanto, este "valioso" EPI de gran tamaño en el PC siempre mantendrá una red informática libre de obstáculos.

Los principales expertos en gráficos de juegos, como Tim Sweeney de EPIC y John Carmack de id, creen que Mountain View todavía escuchó con humildad las opiniones de los programadores de juegos sobre la Xbox original y adoptó el procesador X86 de Intel. Pero cuando llegó el proyecto Xbox 360, me volví completamente indiferente a las opiniones de todos. Estaba decidido a minimizar los costos de fabricación de chips y ahorrar dinero, e insistí en comprar la pequeña licencia de arquitectura PPE de IBM.

Los expertos en programación están muy descontentos con el rendimiento real de los procesadores de estas consolas de juegos de la "próxima" era. El futuro requerirá procesadores multinúcleo, pero de ninguna manera se trata de un pseudo-núcleo múltiple a cambio de una regresión arquitectónica. sin sentido.

Y Cevat Yerli de Crytek ni siquiera miró estas cosas en ese momento. Aparentemente, la versión para PC de Crysis que estaban produciendo tenía un nivel de tecnología gráfica que ni siquiera 8 PS3 y Xbox360 combinados podían renderizar, y El motor CE3 multiconsola reescrito de Crytek actual se ha simplificado enormemente y la precisión de representación de gráficos es solo 18 veces mayor que la de CE2. Puede ver que la velocidad de representación del programa de demostración CE3 para Xbox360 y PS3 en los últimos meses fue. menos de 25FPS, enorme distorsión de aliasing de gráficos y 512×. La espantosa precisión de textura de 512 y la iluminación volumétrica dinámica panorámica también han desaparecido, lo que parece ser un paso atrás a la era DX9.0a, pero afortunadamente Cevat Yerli asegura que la versión para PC no se verá afectado.

A excepción de Japón, varias empresas de juegos de pared en zonas remotas de Europa no prestan mucha atención al rendimiento del hardware. Los desarrolladores de juegos de todo el mundo generalmente prestan mucha menos atención a Xbox 360 y PS3 que a Xbox 360 y PS3. el mismo período en 2005 y 2006. Cuando uso Pentium 4 y Athlon64 con 7900GT, estoy muy insatisfecho con el rendimiento de PC convencional de X1900pro, lo que agrava enormemente la dificultad de programación. Quiero que estas dos consolas de juegos tengan un rendimiento gráfico real muy bajo. Mostrar una calidad de imagen y una velocidad de cuadros aceptables fue extremadamente laborioso, al igual que el MTFramework de "Resident Evil", tuvo que usar lenguaje ensamblador de bajo nivel a gran escala nuevamente como cazar furtivamente la PS2, lo que requirió 4 años completos de investigación. y desarrollo, y debido a que PPE y ShaderCore terminaron siendo demasiado altos en Chengdu, las consolas de juegos tienen muchos problemas de hardware, como temperatura anormal del chip, rendimiento eléctrico inestable y fallas fáciles durante el juego.

Los desarrolladores se inclinan cada vez más a centrarse en producir versiones completas de juegos para PC y luego reducir la estrategia a probar en máquinas de depuración Xbox360 y PS3 para garantizar el funcionamiento, al igual que la producción de CAPCOM de "Devil May Cry 4" y "Resident Evil" 5》 De esta manera, básicamente la gran mayoría de los editores multiplataforma han elegido esta sabia ruta. Cuando se les preguntó a estos desarrolladores si pensaban que la próxima generación X720 y PS4 podrían alcanzar el nivel de hardware de las PC de "clase de rendimiento" en el mismo período, los desarrolladores básicamente tenían expectativas, pero sintieron que la posibilidad real de implementación era muy baja.

Basándose en la experiencia de varias campañas publicitarias de alto nivel y experiencias "altruistas pero humildes", los desarrolladores maduros ya han visto a través de las limitaciones de los costos de fabricación de las consolas de juegos que es imposible ofrecer mejores rendimiento que los PC de la misma época. Después de comprender a fondo la arquitectura del hardware del chip, los programadores descubrieron que el rendimiento del juego Xenon era en realidad sólo el doble que el del Pentium III 733MHz de la primera generación de Xbox. En los próximos 4 a 5 años, Xbox 360 usará este procesador y solo se puede describir. como decepcionado. En la situación más ideal, lo cual es imposible que suceda en el juego real, el amplificador de punto flotante de Xenon es tan rápido como el 13 de Ben 4. El rendimiento general de PS3 es en realidad 6 veces mayor que el de PS2, que es mucho mayor que el de Xbox360, pero todo esto se debe al rendimiento limitado de PS2.

La única verdad eterna del mundo es que obtienes lo que pagas. Para núcleos tan pequeños como Cell y Xenon, el rendimiento óptimo es similar al de Athlon 64 y Ben 4. Después de analizar exhaustivamente la mejora del rendimiento de esta generación de consolas de juegos en un promedio de 4 veces en comparación con su predecesora, los principales expertos en programas de juegos como Tim Sweeney y John Carmack no creen que los llamados X720 y X720 todavía estén bajo fabricación local. Las limitaciones de costos de PS4 pueden igualar el rendimiento de las computadoras Core i7 y GeForce GTX actuales.