Rendimiento del Kepler GK110
NVIDIA describe K20 como "rendimiento de punto flotante de doble precisión 3 veces" y es compatible con múltiples tecnologías de computación paralela como Hyper-Q y Dynamic Parallelism, que no están disponibles en la arquitectura GK104 existente.
Excluyendo otras unidades funcionales, el núcleo GK110 tiene un total de 15 conjuntos de unidades SMX y 2880 núcleos CUDA, pero Heise afirma que no todas las unidades están habilitadas y, de hecho, puede que solo haya 13-14 agrupaciones. Unidades SMX, los núcleos CUDA reales son 2496 o 2688.
El ancho de bits de la memoria de vídeo es de 384 bits, lo cual ha sido confirmado por Huang Renxun y el CTO de NVIDIA. Dado que el número de núcleos CUDA ha sido menor que en informes anteriores, es natural que el ancho de bits de memoria se reduzca a 384 bits. Si se mantiene la velocidad de memoria de 6 Gbps del GK104, el ancho de banda del GK110 alcanzará los 288 GB/s, superando finalmente el. 260 GB/s de arquitectura AMD GCN.
No sé si el rendimiento de punto flotante de doble precisión 3 veces proporcionado por NVIDIA se compara con la tarjeta gráfica GF110 o la tarjeta aceleradora Tesla con núcleo GF110 de punto flotante de precisión simple. La capacidad de la GF110 es 1,58 TFLOPS. La precisión es 1/4 de precisión simple, que es 0,4 TFLOPS, pero la capacidad de doble precisión de la tarjeta Tesla con núcleo GF110 puede alcanzar la 1/2 de precisión simple, que es aproximadamente 0,8 TFLOPS.
De esta manera, si se utiliza la tarjeta gráfica como base, el rendimiento de punto flotante de doble precisión del GK110 es de aproximadamente 1,2 TFLOPS o más. Si es 3 veces mayor que el de la tarjeta Tesla, es. más de 2.4TFLOPS En vista del hecho de que este último ha superado el anterior. Según la rumoreada capacidad de 2TFLOPS, la capacidad de punto flotante de doble precisión del GK110 debería ser 1.2TFLOPS o superior.