Red de conocimiento informático - Conocimiento del nombre de dominio - ¿Cómo evaluar la calidad de la CPU en función de estos parámetros? ¿Y luego clasificar las marcas de CPU?

¿Cómo evaluar la calidad de la CPU en función de estos parámetros? ¿Y luego clasificar las marcas de CPU?

Explicación detallada de la calidad de la CPU

Frecuencia principal

La frecuencia principal también se llama frecuencia de reloj y la unidad es MHz, que se utiliza para indicar la velocidad de cálculo de la CPU. Frecuencia principal de la CPU = FSB × factor de multiplicación. Mucha gente cree que la frecuencia principal determina la velocidad de funcionamiento de la CPU. Esto no sólo es unilateral, sino que también parece sesgado para los servidores. Hasta el momento, no existe una fórmula definitiva para determinar la relación numérica entre la frecuencia principal y la velocidad de cálculo real. Incluso los dos principales fabricantes de procesadores, Intel y AMD, tienen una gran controversia sobre este punto. Se puede ver en la tendencia de desarrollo. de los productos Intel que Intel concede gran importancia al fortalecimiento del desarrollo de su propia frecuencia principal. Al igual que otros fabricantes de procesadores, alguien comparó una vez el Allmax con una velocidad de 1G y su eficiencia operativa es equivalente a la de un procesador Intel 2G.

Por lo tanto, la frecuencia principal de la CPU no tiene relación directa con la potencia informática real de la CPU. La frecuencia principal representa la velocidad de oscilación de la señal de pulso digital dentro de la CPU. También podemos ver ejemplos de esto en la línea de procesadores de Intel: un chip Itanium de 1 GHz que funciona casi tan rápido como un Xeon/Opteron de 2,66 GHz, o un Itanium 2 de 1,5 GHz tan rápido como un Xeon/Opteron de 4 GHz.

Por supuesto, existe una correlación entre la frecuencia de la CPU y la velocidad de procesamiento real, pero la frecuencia es solo un aspecto del rendimiento de la CPU, no el rendimiento general de la CPU.

2. Frecuencia externa

La frecuencia externa es la frecuencia básica de la CPU, y la unidad también es MHz. El FSB de la CPU determina la velocidad de funcionamiento de toda la placa base. Para decirlo sin rodeos, en las computadoras de escritorio, lo que llamamos overclocking es overclockear el FSB de la CPU (por supuesto, en circunstancias normales, el multiplicador de la CPU está bloqueado). Pero para las CPU de servidores, el overclocking es un no-no. Como se mencionó anteriormente, la CPU determina la velocidad de funcionamiento de la placa base y las dos se ejecutan simultáneamente. Si se overclockea la CPU del servidor y se cambia la frecuencia externa, se producirá una operación asincrónica (muchas placas base de escritorio admiten la operación asincrónica), lo que resultará en la inestabilidad de todo el sistema del servidor.

En la actualidad, el FSB en la mayoría de los sistemas informáticos es la velocidad a la que la memoria y la placa base se ejecutan sincrónicamente. De esta manera, el FSB puede entenderse como la CPU que se conecta directamente a la memoria para realizar la conexión. entre los dos. La frecuencia externa y la frecuencia del bus frontal (FSB) se confunden fácilmente. Hablemos de la diferencia entre las dos mediante la introducción del bus frontal.

3. Frecuencia del bus frontal (FSB)

La frecuencia del bus frontal (FSB) (es decir, la frecuencia del bus) afecta directamente la velocidad del intercambio directo de datos entre la CPU y memoria. Existe una fórmula de cálculo, es decir, ancho de banda de datos = (frecuencia del bus × ancho de banda de datos) / 8. El ancho de banda máximo de transmisión de datos depende del ancho y la frecuencia de transmisión de todos los datos transmitidos simultáneamente. Suponiendo que la frecuencia del bus frontal del actual Xeon Nocona de 64 bits es de 800 MHz, según la fórmula, el ancho de banda máximo de su transmisión de datos es de 6,4 GB/segundo.

La diferencia entre frecuencias FSB y FSB: La velocidad de FSB se refiere a la velocidad de transmisión de datos, mientras que FSB se refiere a la velocidad a la que la CPU y la placa base funcionan sincrónicamente.

Intel® Advanced Vector Extensions (AVX) acelera el rendimiento de aplicaciones de punto flotante y de uso intensivo de vectores con un consumo mínimo de energía.

De hecho, con la llegada de la arquitectura "HyperTransport", esta frecuencia real del bus frontal (FSB) ha cambiado.

Sabemos que la arquitectura IA-32 debe tener tres bloques de construcción importantes: concentrador de controlador de memoria (MCH), concentrador de controlador de E/S y concentrador PCI, como los conjuntos de chips muy típicos de Intel, los conjuntos de chips Intel 7501 e Intel 7505, que están diseñados para Xeon dual. En los procesadores, el MCH que contienen proporciona un bus frontal con una frecuencia de 533 MHz para la CPU. Con DDR, el MCH en estos conjuntos de chips puede proporcionar un bus frontal de 533 MHz para la CPU. El ancho de banda del bus puede alcanzar los 4,3 GB/segundo. Sin embargo, la mejora continua del rendimiento del procesador también ha traído muchos problemas a la arquitectura del sistema. La arquitectura "HyperTransport" no solo resuelve este problema, sino que también mejora el ancho de banda del bus de manera más efectiva, como los procesadores AMD Opteron. La arquitectura flexible del bus HyperTransport I/O integra el controlador de memoria para que el procesador no tenga que pasar por el sistema. bus al chipset, en lugar de utilizar el bus interno directamente. El procesador puede comunicarse directamente con el controlador de memoria interna en lugar de comunicarse con el chipset a través del bus del sistema. El procesador no pasa por el bus del sistema hasta el chipset, sino que está conectado directamente a la frecuencia del bus de memoria interna (FSB).

4. Bits de CPU y longitud de palabra

Bits: Binario utilizado en circuitos digitales y tecnología informática, sus códigos son solo "0" y "1", ya sea "Cualquiera" 0" o "1" es un "bit" en la CPU.

Longitud de palabra: en tecnología informática, el número de dígitos binarios que la CPU puede procesar a la vez por unidad de tiempo (simultáneamente) se denomina longitud de palabra. Por lo tanto, una CPU que puede procesar datos de longitud de palabra de 8 bits a menudo se denomina CPU de 8 bits y, de manera similar, una CPU de 32 bits puede procesar datos binarios de 32 bits por unidad de tiempo. La diferencia entre longitud de byte y longitud de palabra: dado que los caracteres ingleses de uso común se pueden representar en binario de 8 bits, los 8 bits a menudo se denominan bytes. La longitud de la palabra no es fija. Para diferentes CPU, la longitud de la palabra también es diferente. Una CPU de 8 bits solo puede procesar un byte a la vez, mientras que una CPU de 32 bits puede procesar 4 bytes a la vez y una CPU de 64 bits con la misma longitud de palabra puede procesar 8 bytes a la vez.

5. Factor de multiplicación

El factor de multiplicación es la relación relativa entre la frecuencia principal de la CPU y la frecuencia externa. A la misma frecuencia externa, cuanto mayor sea el multiplicador, mayor será la frecuencia de la CPU. Pero, de hecho, cuando la frecuencia externa es la misma, cuanto mayor es el multiplicador, menor es la frecuencia de la CPU. Esto se debe a que la velocidad de transmisión de datos entre la CPU y el sistema es limitada. La búsqueda de multiplicadores altos para obtener CPU de alta frecuencia tendrá un efecto de "cuello de botella" obvio: la velocidad máxima a la que la CPU obtiene datos del sistema no puede alcanzar la velocidad de computación de la CPU. velocidad. . En términos generales, a excepción de los prototipos de ingeniería, las CPU de Intel tienen multiplicadores bloqueados, mientras que AMD no lo hacía anteriormente.

6. Caché

El tamaño del caché también es uno de los indicadores importantes de la CPU. La estructura y el tamaño del caché tienen un gran impacto en la velocidad de la CPU. La alta velocidad de la CPU La caché se ejecuta a una frecuencia muy alta, generalmente la misma frecuencia que el procesador, y la memoria del sistema y el disco duro funcionan de manera mucho más eficiente. En el trabajo real, la CPU a menudo necesita leer el mismo dato repetidamente, y el aumento en la capacidad de la caché puede mejorar significativamente la tasa de aciertos de lectura de datos dentro de la CPU sin tener que buscar en la memoria o el disco duro, mejorando así el rendimiento del sistema. Sin embargo, debido al tamaño del chip de la CPU y a consideraciones de costo, la capacidad de la caché es muy pequeña.

La caché L1 es la caché de primer nivel de la CPU y se divide en caché de datos y caché de instrucciones. La capacidad y la estructura del caché L1 incorporado tienen un gran impacto en el rendimiento de la CPU. Sin embargo, la memoria caché se compone de RAM estática y la estructura es relativamente compleja. Cuando el área del núcleo de la CPU no puede ser demasiado grande, La capacidad de la caché L1 es imposible hacerla demasiado grande. La capacidad de caché L1 de una CPU de servidor típica suele ser de 32 a 256 KB.

La caché L2 (L2 Cache) es la caché de segundo nivel de la CPU y se divide en dos chips: interno y externo.

La caché L2 interna en el chip funciona a la misma velocidad que la velocidad del reloj, mientras que la caché L2 externa funciona a la mitad de la velocidad del reloj. La capacidad del caché de segundo nivel también afecta el rendimiento de la CPU. El principio es que cuanto más grande, mejor, la capacidad máxima de la CPU doméstica actual es de 512 KB, mientras que la caché de segundo nivel de la CPU en servidores y estaciones de trabajo es. superiores a 256-1 MB, y algunos llegan hasta 2 MB o 3 MB.

Hay dos tipos de caché L3. Al principio eran externos, pero ahora están todos integrados. La función real de la caché L3 es reducir aún más la latencia de la memoria y mejorar el rendimiento del procesador al procesar grandes cantidades de datos. Reducir la latencia de la memoria y mejorar las capacidades informáticas de grandes cantidades de datos son útiles para los juegos. En el mundo de los servidores, agregar caché L3 aún puede mejorar significativamente el rendimiento. Por ejemplo, una configuración con una caché L3 más grande utiliza la memoria física de manera más eficiente, por lo que un subsistema de E/S de disco más lento puede manejar más solicitudes de datos. Los procesadores con cachés L3 más grandes proporcionan un comportamiento de almacenamiento en caché del sistema de archivos más eficiente y reducen la longitud de las colas de mensajes y procesadores.

De hecho, la primera caché L3 se utilizó en el procesador K6-III de AMD. En ese momento, la caché L3 estaba limitada por el proceso de fabricación y no estaba integrada en el chip, sino que se instalaba en la placa base. . superior. En ese momento, debido a limitaciones del proceso de fabricación, la caché L3 no estaba integrada en el chip, sino en la placa base. La caché L3 sólo se puede sincronizar con la frecuencia del bus del sistema y en realidad no es tan diferente de la memoria principal. La caché L3 se utilizó posteriormente en los procesadores Itanium de Intel para el mercado de servidores. Intel también planea lanzar procesadores Itanium2 con caché L3 de 9 MB, seguidos de procesadores Itanium2 de doble núcleo con caché L3 de 24 MB y, posteriormente, los modelos convencionales y de gama alta del K8L también incluirán caché L3.

Pero básicamente, la caché L3 no es muy importante para el rendimiento del procesador. Por ejemplo, el procesador Xeon MP con 1 MB de caché L3 aún no está a la par del Opteron, lo que sugiere que agregar un bus frontal es más efectivo para mejorar el rendimiento que agregar caché.

7. Conjunto de instrucciones extendido de la CPU

La CPU se basa en instrucciones para calcular y controlar el sistema. Cada CPU está diseñada con una serie de instrucciones que coinciden con el circuito de hardware. La potencia de las instrucciones también es un indicador importante de la CPU, y el conjunto de instrucciones es una de las herramientas más eficaces para mejorar la eficiencia de los microprocesadores. Desde la arquitectura convencional actual, el conjunto de instrucciones se puede dividir en conjunto de instrucciones complejo y conjunto de instrucciones simplificado. Desde la perspectiva de aplicaciones específicas, como Intel MMX (Multi Media Extended), SSE, SSE2 (Streaming-Instrucción única, múltiples datos-Extensiones). 2), SEE3 y 3DNow! de AMD. etc. son conjuntos de instrucciones ampliados de la CPU, que mejoran las capacidades de procesamiento multimedia, gráficos e Internet de la CPU. Generalmente nos referimos al conjunto de instrucciones extendidas de la CPU como "conjunto de instrucciones de la CPU". SSE3 también es el conjunto de instrucciones más pequeño actualmente, detrás de las 57 instrucciones de MMX, las 50 instrucciones de SSE, las 144 instrucciones de SSE2 y las 13 instrucciones de SSE3. SSE3 es también el conjunto de instrucciones más avanzado. Los procesadores Intel Prescott ya son compatibles con SSE3. AMD agregará compatibilidad con SSE3 en futuros procesadores de doble núcleo que también admitirán este conjunto de instrucciones.

8. Núcleo de la CPU y voltaje de E/S

A partir de la CPU 586, el voltaje de funcionamiento de la CPU se divide en dos tipos: voltaje del núcleo y voltaje de E/S. El voltaje del núcleo es menor o igual al voltaje de E/S. El tamaño del voltaje del núcleo depende del proceso de producción de la CPU. Generalmente, cuanto más pequeño es el proceso de producción, menor es el voltaje de funcionamiento del núcleo; generalmente está entre 1,6 y 5 V. El bajo voltaje puede resolver los problemas de consumo excesivo de energía y generación excesiva de calor.

9. Proceso de fabricación

La micra del proceso de fabricación se refiere a la distancia entre los circuitos internos del circuito integrado.

La tendencia de desarrollo de la tecnología de fabricación es hacia la alta densidad. El diseño de circuitos integrados de alta densidad significa que se pueden llevar a cabo diseños de circuitos con mayor densidad y funciones más complejas en la misma área de circuitos integrados. Ahora hay principalmente 180 nm, 130 nm y 90 nm. Recientemente se ha demostrado oficialmente el proceso de fabricación de 65 nm.

10. Conjunto de instrucciones

(1) Conjunto de instrucciones CISC

El conjunto de instrucciones CISC también se denomina conjunto de instrucciones complejo y su nombre en inglés es CISC (Complex Conjunto de instrucciones (abreviatura de computadora). En un microprocesador CISC, las instrucciones individuales del programa se ejecutan en serie en orden, y las operaciones individuales dentro de cada instrucción también se ejecutan en serie en orden. La ventaja de la ejecución secuencial es el control simple, pero la tasa de utilización de los componentes de la computadora no es alta y la velocidad de ejecución es lenta. En realidad, se trata de las CPU de la serie x86 (también conocida como arquitectura IA-32) producidas por Intel Corporation y sus CPU compatibles, como AMD y VIA. Incluso el nuevo X86-64 (también conocido como AMD64) entra en la categoría CISC.

Para saber qué es un conjunto de instrucciones debemos empezar por la CPU de arquitectura X86 actual. El conjunto de instrucciones X86 fue desarrollado especialmente por Intel para su primera CPU de 16 bits (i8086). La CPU-i8088 (versión simplificada de i8086) en la primera PC del mundo lanzada por IBM en 1981 adoptó instrucciones X86. Para mejorar la capacidad de instrucción flotante de punto flotante de la computadora, se agregó un chip X87 a la computadora para mejorar las capacidades de procesamiento de datos de punto flotante. Más tarde, el conjunto de instrucciones X86 y el conjunto de instrucciones X87 se denominaron colectivamente conjunto de instrucciones X86.

Aunque con el desarrollo continuo de la tecnología de CPU, Intel ha desarrollado los i80386 e i80486 más nuevos, hasta los pasados ​​PII Xtreme, PIII Xtreme, Pentium 3 y, finalmente, hasta la actual serie Pentium 4, Xtreme (no (incluido Utiliza el conjunto de instrucciones X86, por lo que su CPU todavía pertenece a la serie X86. Dado que la serie Intel X86 y sus CPU compatibles (como AMD Athlon MP) utilizan el conjunto de instrucciones X86, se ha formado la enorme línea actual de series X86 y CPU compatibles. Actualmente, existen dos categorías principales de CPU x86: CPU de servidor Intel y CPU de servidor AMD.

(2) Conjunto de instrucciones RISC

RISC es la abreviatura de "Computación del conjunto de instrucciones reducido" en inglés, que significa "conjunto de instrucciones reducido" en chino. Fue desarrollado sobre la base del sistema de instrucciones CISC. Alguien probó la máquina CISC y demostró que la frecuencia de uso de varias instrucciones varía mucho. Las instrucciones más utilizadas son algunas instrucciones relativamente simples, que solo representan el 20% del total. cantidad de instrucciones, pero la frecuencia de uso en el programa representa el 80%. Un sistema de instrucción complejo inevitablemente aumentará la complejidad del microprocesador, haciendo que el tiempo de desarrollo del procesador sea largo y costoso. Además, las instrucciones complejas requieren operaciones complejas, lo que inevitablemente reducirá la velocidad de cálculo de la computadora. Por las razones anteriores, las CPU RISC nacieron en la década de 1980. En comparación con las CPU de tipo CISC, las CPU de tipo RISC no solo simplifican el sistema de instrucciones, sino que también adoptan una estructura superescalar y de supercanalización, lo que mejora en gran medida las capacidades de procesamiento paralelo. El conjunto de instrucciones RISC es la dirección de desarrollo de las CPU de alto rendimiento. En comparación con el CISC (conjunto de instrucciones complejo) tradicional, el conjunto de instrucciones RISC es la dirección de desarrollo de las CPU de alto rendimiento. En términos relativos, RISC tiene un formato de instrucción unificado, menos tipos de instrucciones y modos de direccionamiento que conjuntos de instrucciones complejos. Por supuesto, la velocidad de procesamiento es mucho mayor. En la actualidad, los servidores de gama media a alta generalmente utilizan CPU con este sistema de instrucciones, especialmente los servidores de gama alta utilizan CPU con sistemas de instrucciones RISC.

El sistema de instrucciones RISC es más adecuado para sistemas operativos de servidores de alta gama UNIX, y ahora Linux también es un sistema operativo similar a UNIX. Las CPU basadas en RISC son software y hardware incompatibles con las CPU de Intel y AMD.

Actualmente existen principalmente los siguientes tipos de CPU que utilizan instrucciones RISC en servidores de gama media y alta: procesadores PowerPC, procesadores SPARC, procesadores PA-RISC, procesadores MIPS y procesadores Alpha.

(3) IA-64

Ha habido un debate continuo sobre si EPIC (Explicit Parallel Instrucción Computadora) es el sucesor de los sistemas RISC y CISC en lo que respecta al sistema EPIC. En lo que respecta, se trata más bien de un paso importante hacia los sistemas RISC para procesadores Intel. En teoría, el sistema EPIC está diseñado con una CPU que es mucho más capaz de manejar aplicaciones de Windows que aplicaciones basadas en Unix bajo la misma configuración de host. La CPU del servidor Intel que utiliza tecnología EPIC es Anthem Itanium (nombre en clave de desarrollo Merced). Es un procesador de 64 bits y el primero de la serie IA-64. Microsoft también desarrolló un sistema operativo con nombre en código Win64 para admitirlo en software. Intel adoptó el conjunto de instrucciones X86 y pasó a microprocesadores de 64 bits más avanzados. Intel hizo esto porque TPIC podía brindar un conjunto de instrucciones potente y enérgico, por lo que nació la arquitectura IA-64 que utiliza el conjunto de instrucciones EPIC. En muchos sentidos, IA-64 es una mejora importante con respecto a x86. Supera muchas limitaciones de la arquitectura tradicional IA32 y logra avances en capacidades de procesamiento de datos, estabilidad del sistema, seguridad, usabilidad y visualización.

El mayor defecto del microprocesador IA-64 es la falta de compatibilidad con x86. Para que el procesador IA-64 ejecute mejor el software de las dos dinastías, Intel desarrolló el procesador IA-64 (. Itanium, se introdujo un decodificador x86 a IA-64 en Itanium2...) para convertir instrucciones x86 en instrucciones IA-64. Este decodificador no es el más eficiente, ni es la mejor manera de ejecutar código x86 (la mejor manera es ejecutar código x86 directamente en el procesador x86), por lo que Itanium e Itanium2 funcionan muy mal cuando ejecutan aplicaciones x86. Esta es la causa raíz de X86-64.

(4) X86-64 (AMD64/EM64T)

Diseñado por AMD para manejar operaciones enteras de 64 bits de forma simultánea y compatible con la arquitectura X86-32. Admite direccionamiento lógico de 64 bits y ofrece la opción de convertir a direccionamiento de 32 bits; pero las instrucciones de operación de datos son de forma predeterminada de 32 bits y 8 bits, y también ofrece la opción de convertir a 64 bits y 16 bits; admite registros de propósito general, donde las operaciones de 32 bits extienden el resultado a 64 bits completos. De esta manera, existe una diferencia entre la "ejecución directa" y la "ejecución por conversión" de instrucciones. El campo de instrucción es de 8 bits o de 32 bits, evitando así campos demasiado largos.

x86-64 (también conocido como AMD64) no surgió de la nada. Los procesadores x86 están limitados a 4 GB de memoria direccionable de 32 bits y los procesadores IA-64 no son compatibles con x86. Teniendo en cuenta las necesidades de los clientes, AMD ha mejorado las capacidades del conjunto de instrucciones x86 para admitir modos operativos de 64 bits, razón por la cual AMD llama a su arquitectura x86-64. Técnicamente hablando, AMD introdujo nuevos registros de uso general R8-R15 como una extensión de los registros del procesador X86 original para operaciones de 64 bits en la arquitectura x86-64, pero estos registros no se utilizan por completo en el entorno de 32 bits. Los registros primitivos como EAX y EBX también se ampliaron de 32 a 64 bits. Se han agregado ocho nuevos registros a la unidad SSE para respaldar SSE2.

El aumento en el número de registros conducirá a mejoras en el rendimiento. Al mismo tiempo, para admitir códigos y registros de 32 y 64 bits, la arquitectura x86-64 permite que el procesador se ejecute en los dos modos siguientes: modo largo y modo heredado, de los cuales el modo largo se divide en dos modos Seed (modo de 64 bits y modo de compatibilidad). Este estándar se introdujo con los procesadores de servidor Opteron de AMD.

Este año también se lanzó la tecnología EM64T que admite 64 bits. En ese momento, IA32E, que no se llamaba oficialmente EM64T, era el nombre de la tecnología de extensión de 64 bits de Intel para distinguir el conjunto de instrucciones X86. . El EM64T de Intel admite el submodo de 64 bits, que es similar a la tecnología X86-64 de AMD. También tiene direccionamiento en plano lineal de 64 bits y agrega 8 nuevos registros de uso general. El EM64T de Intel admite el submodo de 64 bits, que es similar a la tecnología X86-64 de AMD, utiliza direccionamiento de plano lineal de 64 bits, agrega 8 nuevos registros de propósito general (GPR) y 8 registros adicionales que admiten instrucciones SSE. Al igual que AMD, la tecnología de 64 bits de Intel será compatible tanto con IA32 como con IA32E, y IA32E solo se utilizará cuando se ejecute en un sistema operativo de 64 bits. IA32E incluirá 2 submodos: submodo de 64 bits y submodo de 32 bits, y será compatible con versiones anteriores de AMD64. Actualmente, los procesadores Nocona incluyen alguna tecnología de 64 bits y los procesadores Pentium 4E de Intel también admiten tecnología de 64 bits.

Cabe señalar que ambas son arquitecturas de microprocesadores de 64 bits compatibles con el conjunto de instrucciones x86, pero aún existen algunas diferencias entre EM64T y AMD64. El bit NX en el procesador AMD64 no podrá hacerlo. utilizado en los procesadores Intel.

'

11. Superpipes y superescalares

Antes de explicar los superpipes y los superescalares, primero comprenda los pipelines. Intel utilizó por primera vez la canalización en su chip 486. El principio de funcionamiento de la línea de montaje es como el de la línea de montaje en la producción industrial. En la CPU, 5 o 6 unidades de circuito con diferentes funciones forman una tubería de procesamiento de instrucciones y luego dividen una instrucción X86 en 5 o 6 pasos, que luego son ejecutados por estas unidades de circuito respectivamente, de modo que una instrucción se puede completar dentro de una CPU. ciclo de reloj, aumentando así la velocidad de ejecución de la CPU. Cada canal de enteros clásico de Pentium se divide en procesos de cuatro niveles, a saber, captación previa de instrucciones, decodificación, ejecución y reescritura de resultados, y el canal de punto flotante se divide en procesos de ocho niveles. Las condiciones necesarias para construir un sistema SMP son hardware que admita SMP (incluidas placas base y CPU), una plataforma de sistema que admita SMP y software de aplicación que admita SMP.

Para que los sistemas SMP funcionen de manera eficiente, el sistema operativo debe admitir sistemas SMP, como sistemas operativos de 32 bits como WINNT, LINUX y UNIX. Esto significa poder realizar múltiples tareas y múltiples subprocesos. La multitarea se refiere a la capacidad del sistema operativo para permitir que diferentes CPU completen diferentes tareas al mismo tiempo. El multiproceso se refiere a la capacidad del sistema operativo para permitir que diferentes CPU completen la misma tarea en paralelo.

Para construir un sistema SMP, los requisitos para la CPU seleccionada son muy altos. En primer lugar, la CPU debe tener una unidad APIC (Controlador de interrupción programable avanzado) incorporada. El núcleo de la especificación de multiprocesamiento de Intel es el uso del Controlador de interrupción programable avanzado (APIC); en tercer lugar, es necesario tener el mismo modelo de producto, el mismo tipo de núcleo de CPU y exactamente la misma frecuencia de funcionamiento; El número de serie debe mantenerse tanto como sea posible, porque cuando las CPU de dos lotes de producción se ejecutan como procesadores duales, es posible que una CPU esté sobrecargada y la otra esté subcargada. 15. La CPU está sobrecargada y la otra está subcargada. Como resultado, no se puede alcanzar el máximo rendimiento e incluso puede provocar un accidente.

16. Tecnología NUMA

NUMA es una tecnología de almacenamiento compartido de distribución de acceso no uniforme***. Es un sistema compuesto por múltiples nodos independientes conectados por múltiples redes dedicadas de alta velocidad. Cada nodo puede ser una única CPU o un sistema SMP. En NUMA existen múltiples soluciones para la coherencia de la caché, que requieren soporte del sistema operativo y software especial. En la Figura 2 se muestra un ejemplo del sistema NUMA de Sequent. Aquí se conectan tres módulos SMP a través de una red privada de alta velocidad para formar un nodo, cada uno con hasta 12 CPU. Sistemas como Sequent pueden tener hasta 64 CPU, o incluso 256 CPU. Obviamente, se trata de una combinación de dos tecnologías, basada en SMP y ampliada con tecnología NUMA.

17. Tecnología de ejecución fuera de orden

La ejecución fuera de orden significa que la CPU permite que se envíen múltiples instrucciones a las unidades de circuito correspondientes en el orden del programa. . La tecnología utilizada para realizar el procesamiento. Después de analizar el estado de cada unidad de circuito y si cada instrucción se puede ejecutar por adelantado, las instrucciones que se pueden ejecutar por adelantado se envían inmediatamente a la unidad de circuito correspondiente para su ejecución. Durante el proceso de ejecución, las instrucciones no se ejecutan en la forma especificada. orden, y luego la unidad de reorganización Reorganice los resultados de cada unidad de ejecución en el orden de las instrucciones. El propósito de utilizar tecnología de ejecución fuera de orden es hacer que los circuitos internos de la CPU funcionen a plena capacidad y, en consecuencia, aumentar la velocidad a la que la CPU ejecuta los programas. Tecnología de rama: las instrucciones (ramificación) deben esperar el resultado de la operación. Generalmente, las ramas incondicionales solo deben ejecutarse en el orden de las instrucciones, mientras que las ramas condicionales deben decidir si se ejecutan en el orden original en función de los resultados del procesamiento.

18. Controlador de memoria interna de la CPU

Muchas aplicaciones tienen patrones de lectura complejos (casi aleatorios, especialmente cuando los accesos al caché son impredecibles) y no pueden utilizar el ancho de banda de manera efectiva. Ejemplos típicos de este tipo de aplicaciones son el software de procesamiento empresarial, que estará limitado por la latencia de la memoria incluso si la CPU tiene características como la ejecución fuera de orden. La CPU debe esperar hasta que el divisor se cargue con los datos necesarios para la operación antes de poder ejecutar la instrucción (ya sea que los datos provengan del caché de la CPU o del sistema de memoria principal). Actualmente, la latencia de la memoria en sistemas de segmento bajo es de aproximadamente 120-150 ns y las velocidades de la CPU son de 3 GHz o más, por lo que una sola solicitud de memoria desperdicia entre 200 y 300 ciclos de CPU. Incluso con una tasa de aciertos de caché del 99 %, la CPU aún puede pasar el 50 % de su tiempo esperando que se completen las solicitudes de memoria, por ejemplo, debido a la latencia de la memoria.

Puedes ver que el controlador de memoria integrado de Opteron tiene una latencia mucho menor en comparación con el soporte del controlador de memoria DDR de doble canal del chipset. Intel también está en camino de integrar el controlador de memoria en el procesador, lo que hará que Northbridge sea menos importante. Pero cambiar la forma en que el procesador accede a la memoria principal puede ayudar a aumentar el ancho de banda, reducir la latencia de la memoria y mejorar el rendimiento del procesador.

La calidad de las tarjetas gráficas

El 9550 se refiere a uno de los primeros chips gráficos de gama media a baja de ATI.

La característica principal de una tarjeta gráfica general es el chip de visualización. Los mejores ahora incluyen NTVIA 6600, 6200 y 6800 superiores, así como ATI X700, X800, etc. El mismo chip de visualización tiene diferentes frecuencias. El mismo chip de visualización tiene diferentes frecuencias; cuanto mayor sea la frecuencia, mejor.

En segundo lugar, debemos fijarnos en la memoria de vídeo. En primer lugar, debe observar la memoria de la computadora para ver si existen diferencias como DDR, DDRII, DDR3, etc. Lo segundo es mirar la memoria de tu computadora.

En tercer lugar, observe el ancho de banda de la pantalla. Hoy en día suelen existir 128 y 256 bits, siendo mejor 256.

Finalmente, las grandes marcas son mejores que las pequeñas marcas de segundo y tercer nivel.