Características de NVIDIA GeForce GTX480
Modularidad
En la era DirectX 11, para mejorar aún más la programabilidad universal, NVIDIA dividió la GPU en múltiples módulos GPC, además de la falta de controlador de memoria de pantalla independiente y L2. cache, cada módulo es en realidad casi una mini-GPU completa.
En una matriz/unidad multiprocesador, la unidad SM contiene un caché de instrucciones, dos programadores warp y dos unidades de programación cada uno, registros, 32/48 procesadores de flujo (núcleos CUDA), 16 unidades de carga/almacenamiento, 4 unidades de funciones especiales, caché de nivel 1, 4 unidades de textura, caché de texturas y motor PolyMorph.
Al agregar o eliminar celdas GPC o matrices SM, el rendimiento aumenta o disminuye de forma casi lineal, lo que permite la creación rápida de múltiples líneas de productos de GPU diferentes. En la GeForce GTX 480 superior, el código central de la pantalla es "GF100", ****, hay 4 grupos de unidades GPC, cada grupo tiene 4 matrices SM y cada matriz SM tiene 32 procesadores de flujo, pero uno de los SM las matrices están desactivadas. La GeForce GTX 460 de gama media a alta con el nombre clave "GF104" tiene 2 conjuntos de unidades GPC, cada una con 4 matrices SM, pero cada matriz SM tiene 48 procesadores de flujo y una matriz SM también está apagada.
Teselación
La tecnología de teselación se ha codificado en el estándar DirectX 11. Su rival AMD ha respaldado la tecnología desde la era Radeon 8500. Sin embargo, el nivel de teselación en ese momento no se podía controlar de manera efectiva, lo que fácilmente resultaba en una disminución en la calidad de la imagen. La tecnología de teselación ahora es totalmente programable. Los usuarios pueden agregar vértices adicionales mediante diferentes algoritmos.
Direct Compute 11
Direct Compute permite gráficos mejorados. Por ejemplo, efectos de translucidez y efectos de profundidad de campo en diferentes objetos.
Motor de rasterización
El núcleo de visualización anterior tenía solo un motor de rasterización. La GTX 480, por otro lado, tiene cuatro para mejorar el rendimiento anti-aliasing.
Motor PolyMorph
Debido a la tecnología de teselación, el número de polígonos en una escena se puede aumentar significativamente y el motor PolyMorph se puede utilizar para mejorar la geometría de escenas de múltiples polígonos.
Procesador de flujo
También conocido como núcleo CUDA de NVIDIA, el núcleo CUDA utilizado en la GTX 480 es la versión de tercera generación etiquetada por NVIDIA. Todas las instrucciones se dividen en instrucciones unidimensionales. Mejorar la utilización del núcleo CUDA. Para el procesamiento de punto flotante, la GTX 480 utiliza el estándar IEEE754-2008. Los datos sólo se redondean en la salida. El enfoque anterior consistía en redondear cada paso y los errores se acumularían. La precisión de las instrucciones de números enteros admite 32 bits, mientras que su rival AMD solo admite 24 bits. Los núcleos de gráficos de AMD todavía utilizan procesadores de flujo para los cálculos cuando se ejecutan operaciones de funciones especiales. El núcleo de gráficos de Nvidia, por otro lado, utiliza componentes especializados.
Unidades de textura
El número de unidades de textura se ha reducido, y NVIDIA afirma haber compensado esto mejorando la eficiencia de las unidades. Las unidades de textura también están integradas en el procesador de flujo para reducir la latencia.
Unidad ráster
La unidad ráster ha sido rediseñada para mantenerse al día con el rendimiento antialiasing de la competencia. La precisión de CSAA se ha mejorado a 32x.
Computación general
C y ECC son compatibles por primera vez.