Red de conocimiento informático - Aprendizaje de código fuente - ¿Qué significa la unidad de procesamiento de flujo de tarjeta gráfica?

¿Qué significa la unidad de procesamiento de flujo de tarjeta gráfica?

La unidad de procesamiento de flujo es parte del canal de renderizado. Un canal de renderizado completo incluye un procesador de flujo y un procesador de mapa de textura. El procesador de flujo es la combinación del sombreador de vértices y el sombreador de píxeles anteriores. Una nueva característica de DX10 aún no se puede instalar en XP. Pero algunos programas tienen esta función. El procesador de flujo asigna directamente el flujo de datos de gráficos multimedia al procesador de flujo para su procesamiento. Hay dos tipos: programables y no programables. El procesador de flujo en Cheops anunciado el año pasado es un procesador de flujo no programable diseñado para una función de procesamiento de video específica. Pero para mayor flexibilidad, el sistema también incluye un procesador programable de uso general. De 1996 a 2001, el MIT y Standford desarrollaron un procesador de flujo programable llamado Imagine para aplicaciones de procesamiento de imágenes. El procesador de flujo Imagine no usa caché, pero usa un archivo de registro de flujo SRF (archivo de registro de flujo) como memoria intermedia entre la memoria de flujo (principal) y el registro del procesador para resolver el problema del ancho de banda de la memoria. El ancho de banda entre la memoria de flujo y el SRF es 2 GB/s, el ancho de banda entre el SRF y el registro del procesador es 32 GB/s, el ancho de banda entre los registros en el ALU Cluster y el ALU es 544 GB/s, los tres anchos de banda El proporcional La relación es 1:16:272.

Unidad de procesador de flujo

Antes de que apareciera la tarjeta gráfica DX10, no existía el "procesador de flujo". La GPU se compone internamente de "canalizaciones", divididas en canalizaciones de píxeles y canalizaciones de vértices, y sus números son fijos. En pocas palabras, el canal de vértices es el principal responsable del modelado 3D y el canal de píxeles es responsable de la representación 3D. Dado que su número es fijo, surge un problema cuando una escena de juego requiere una gran cantidad de modelado 3D pero no requiere demasiado procesamiento de píxeles, lo que hará que los recursos de la canalización de vértices sean escasos y la canalización de píxeles esté inactiva en grandes cantidades. Por supuesto, también existen situaciones completamente opuestas. Esto resultará en la escasez de algunos recursos y el desperdicio de otros recursos. En tales circunstancias, la gente propuso por primera vez la "arquitectura de renderizado unificada" en la era DX10. La tarjeta gráfica canceló la "canalización de píxeles" y la "canalización de vértices" tradicionales y las unificó en una unidad de procesador de flujo, que puede realizar operaciones de vértice y realizar. operaciones de píxeles, de modo que en diferentes escenarios, la tarjeta gráfica pueda asignar dinámicamente la cantidad de procesadores de flujo para operaciones de punto fijo y operaciones de píxeles para lograr la utilización completa de los recursos. Ahora, la cantidad de procesadores de flujo se ha convertido en un indicador muy importante para determinar el rendimiento de las tarjetas gráficas. Nvidia y AMD-ATI también están aumentando constantemente la cantidad de procesadores de flujo en las tarjetas gráficas para hacer que el rendimiento de las tarjetas gráficas alcance pasos agigantados. Por ejemplo, la tarjeta gráfica HD3870 de AMD -ATI tiene 320 procesadores de flujo, la HD4870 tiene 800 y la HD5870 tiene 1600. Vale la pena mencionar que las arquitecturas de GPU de la tarjeta N y la tarjeta A son diferentes, y la asignación de la cantidad de procesadores de flujo también es diferente. Cada unidad de procesador de flujo de la tarjeta N solo contiene 1 procesador de flujo, mientras que la tarjeta A contiene 5 procesadores de flujo por unidad de procesador de flujo. Por ejemplo, aunque el HD4850 ​​tiene 800 procesadores de flujo, en realidad solo equivale a 160 procesadores de flujo. Una unidad de procesador de flujo y la frecuencia del procesador de flujo de la tarjeta A son consistentes con la frecuencia del núcleo. Es por eso que el 9800GTX solo tiene 128 procesadores de flujo, pero su rendimiento es equivalente al del HD4850 ​​(la frecuencia del procesador de flujo de la tarjeta N es de aproximadamente 2,16). veces la frecuencia central).