Red de conocimiento informático - Material del sitio web - ¿Cómo comparar la mejor CPU y tarjeta gráfica? (Quiero vender computadoras, por favor dame detalles) 3T

¿Cómo comparar la mejor CPU y tarjeta gráfica? (Quiero vender computadoras, por favor dame detalles) 3T

Explicación detallada de las CPU buenas y malas

Frecuencia principal

La frecuencia principal también se llama frecuencia de reloj y la unidad es MHz, que se utiliza para expresar la velocidad de computación de la CPU. Frecuencia principal de la CPU = FSB × coeficiente de multiplicación. Mucha gente cree que la frecuencia principal determina la velocidad de funcionamiento de la CPU. Esto no sólo es unilateral, sino que también parece sesgado para los servidores. Hasta el momento, no existe una fórmula definitiva para determinar la relación numérica entre la frecuencia principal y la velocidad de cálculo real. Incluso los dos principales fabricantes de procesadores, Intel y AMD, tienen una gran controversia sobre este punto. Se puede ver en la tendencia de desarrollo. de los productos Intel que Intel concede gran importancia al fortalecimiento del desarrollo de su propia frecuencia principal. Al igual que otros fabricantes de procesadores, alguien comparó una vez Allmax con una velocidad de 1G y su eficiencia operativa es equivalente a la de un procesador Intel 2G.

Por lo tanto, la frecuencia principal de la CPU no está directamente relacionada con la potencia informática real de la CPU. La frecuencia principal representa la velocidad de oscilación de la señal de pulso digital dentro de la CPU. En los productos de procesador de Intel también podemos ver ejemplos de este tipo: el rendimiento del chip Itanium de 1 GHz es casi equivalente al del chip Xeon/Opteron de 2,66 GHz, o el Itanium 2 de 1,5 GHz es tan bueno como el del Xeon/Opteron de 4 GHz. El rendimiento del chip es aproximadamente el mismo. La velocidad de cálculo de la CPU también depende del índice de rendimiento de la CPU.

Por supuesto, la frecuencia de la CPU está relacionada con la velocidad de computación real, pero solo se puede decir que la frecuencia es solo un aspecto del rendimiento de la CPU y no representa el rendimiento general de la CPU.

2. Frecuencia externa

La frecuencia externa es la frecuencia base de la CPU, y la unidad también es MHz. La frecuencia externa de la CPU determina la velocidad de funcionamiento de toda la placa base. Para decirlo sin rodeos, en las computadoras de escritorio, lo que llamamos overclocking es overclockear el FSB de la CPU (por supuesto, en circunstancias normales, el multiplicador de la CPU está bloqueado). Pero para las CPU de servidores, el overclocking es un no-no. Como se mencionó anteriormente, la CPU determina la velocidad de funcionamiento de la placa base, y las dos son sincrónicas. Si se overclockea la CPU del servidor y se cambia el FSB, se producirá una operación asincrónica (muchas placas base de escritorio admiten la operación asincrónica), lo que provocará que todo el sistema funcione. sistema del servidor a inestable.

En la actualidad, el FSB en la mayoría de los sistemas informáticos es la velocidad a la que la memoria y la placa base funcionan sincrónicamente. De esta forma, se puede entender que el FSB de la CPU está conectado directamente a la memoria, realizando la operación. Dos estados de funcionamiento sincronizados. La frecuencia externa y la frecuencia del bus frontal (FSB) se confunden fácilmente. En la siguiente introducción al bus frontal, hablaremos sobre la diferencia entre las dos.

3. Frecuencia del bus frontal (FSB)

La frecuencia del FSB (es decir, la frecuencia del bus) afecta directamente la velocidad del intercambio directo de datos entre la CPU y la memoria. Existe una fórmula de cálculo, es decir, ancho de banda de datos = (frecuencia del bus x ancho de banda de datos)/8. El ancho de banda máximo de transmisión de datos depende del ancho y la frecuencia de transmisión de todos los datos transmitidos simultáneamente. Por ejemplo, la frecuencia del bus frontal del actual Xeon Nocona de 64 bits es de 800MHz. Según la fórmula, su ancho de banda máximo para transmisión de datos es de 6,4GB/segundo.

La diferencia entre FSB y frecuencia FSB: La velocidad de FSB se refiere a la velocidad de transmisión de datos, mientras que FSB se refiere a la velocidad de operación sincrónica entre la CPU y la placa base. El surgimiento de la arquitectura HyperTransport ha cambiado esta frecuencia real del bus frontal (FSB). Antes de comprender la arquitectura IA-32, primero debemos comprender tres bloques de construcción importantes: concentrador de controlador de memoria (MCH), concentradores de controlador de E/S y Los concentradores PCI, como los típicos chipsets Intel 7501 e Intel 7505, están hechos a medida para procesadores Xeon duales. El MCH que contienen proporciona un bus frontal con una frecuencia de 533 MHz para la CPU y coopera con DDR. El MCH en estos conjuntos de chips puede proporcionar un bus frontal de 533 MHz para la CPU. Con memoria DDR, el ancho de banda del bus frontal puede alcanzar 4,3 GB/segundo.

Sin embargo, la mejora continua del rendimiento del procesador también ha traído muchos problemas a la arquitectura del sistema. La arquitectura "HyperTransport" no solo resuelve este problema, sino que también mejora el ancho de banda del bus de manera más efectiva, como los procesadores AMD Opteron. La arquitectura flexible del bus HyperTransport I/O integra el controlador de memoria para que el procesador no tenga que pasar por el sistema. bus al chipset, en lugar de utilizar el bus interno directamente. El procesador no está conectado al chipset a través del bus del sistema, sino directamente al controlador de memoria interno. El procesador no pasa por el bus del sistema hasta el chipset, sino que está conectado directamente al bus de memoria interna.

4. Bits de CPU y longitud de palabra

Bit: el binario utilizado en circuitos digitales y tecnología informática, su código es solo "0" y "1", ya sea "Cualquiera". "0" o "1" es un "bit" en la CPU.

Longitud de palabra: en tecnología informática, el número de dígitos binarios que la CPU puede procesar a la vez por unidad de tiempo (simultáneamente) se denomina longitud de palabra. Por lo tanto, una CPU que puede procesar datos de 8 bits a menudo se denomina CPU de 8 bits, mientras que una CPU de 32 bits puede procesar datos binarios de 32 bits por unidad de tiempo. La diferencia entre longitud de byte y longitud de palabra: dado que los caracteres ingleses de uso común se pueden representar en binario de 8 bits, los 8 bits a menudo se denominan bytes. La longitud de la palabra no es fija. Para diferentes CPU, la longitud de la palabra también es diferente. Una CPU de 8 bits solo puede procesar un byte a la vez, mientras que una CPU de 32 bits puede procesar 4 bytes a la vez y una CPU de 64 bits con la misma longitud de palabra puede procesar 8 bytes a la vez.

5. Factor de multiplicación

El factor de multiplicación se refiere a la relación relativa entre la frecuencia principal de la CPU y la frecuencia externa. A la misma frecuencia externa, cuanto mayor sea el multiplicador, mayor será la frecuencia de la CPU. Pero, de hecho, bajo la premisa del mismo FSB, la CPU de alto multiplicador en sí misma tiene poca importancia. Esto se debe a que la velocidad de transmisión de datos entre la CPU y el sistema es limitada. Buscar ciegamente un gran aumento y obtener una CPU de alta frecuencia tendrá un efecto de "cuello de botella" obvio: la velocidad límite de la CPU para obtener datos del sistema no puede satisfacer la velocidad de la CPU. cálculos de velocidad. En términos generales, a excepción de los prototipos de ingeniería, las CPU de Intel tienen multiplicadores bloqueados, mientras que AMD no lo hacía anteriormente.

6. Caché

El tamaño del caché también es uno de los indicadores importantes de la CPU. La estructura y el tamaño del caché tienen un gran impacto en la velocidad de la CPU. La alta velocidad en la CPU La caché se ejecuta a una frecuencia muy alta, generalmente la misma que la del procesador, y la memoria del sistema funciona mucho más eficientemente que el disco duro. En el trabajo real, la CPU a menudo necesita leer el mismo dato repetidamente, y el aumento en la capacidad de la caché puede mejorar significativamente la tasa de aciertos de lectura de datos dentro de la CPU sin tener que buscar en la memoria o el disco duro, mejorando así el rendimiento del sistema. Sin embargo, debido al tamaño del chip de la CPU y a consideraciones de costo, la capacidad de la caché es muy pequeña.

La caché L1 es la caché de primer nivel de la CPU y se divide en caché de datos y caché de instrucciones. La capacidad y la estructura del caché L1 incorporado tienen un mayor impacto en el rendimiento de la CPU. Sin embargo, la memoria caché se compone de RAM estática y la estructura es relativamente compleja. Cuando el área del núcleo de la CPU no puede ser demasiado grande, La capacidad de la caché L1 no se puede aumentar demasiado. La capacidad de caché L1 de una CPU de servidor típica suele ser de 32 a 256 KB.

La caché L2 (L2 Cache) es la caché de segundo nivel de la CPU y se divide en dos chips: interno y externo. La caché L2 interna en el chip funciona a la misma velocidad que la velocidad del reloj, mientras que la caché L2 externa funciona a la mitad de la velocidad del reloj.

La capacidad del caché de segundo nivel también afecta el rendimiento de la CPU. El principio es que cuanto más grande, mejor, la capacidad máxima actual de las CPU domésticas es de 512 KB y el caché de segundo nivel del servidor. y las CPU de las estaciones de trabajo superan incluso los 256-1 MB. Algunas llegan hasta 2 MB o 3 MB.

La caché L3 es la segunda capa de la CPU. Tiene la mayor capacidad y también es la segunda capa de la CPU.

Hay dos tipos de caché L3. Al principio eran externos, pero ahora están todos integrados. La función real de la caché L3 es reducir aún más la latencia de la memoria y mejorar el rendimiento del procesador al procesar grandes cantidades de datos.

Reducir la latencia de la memoria y mejorar las capacidades informáticas de grandes cantidades de datos son útiles para los juegos. En el mundo de los servidores, agregar caché L3 aún puede mejorar significativamente el rendimiento. Por ejemplo, una configuración con una caché L3 más grande utiliza la memoria física de manera más eficiente, por lo que un subsistema de E/S de disco más lento puede manejar más solicitudes de datos. Los procesadores con cachés L3 más grandes proporcionan un comportamiento de almacenamiento en caché del sistema de archivos más eficiente y longitudes de cola de mensajes y procesadores más cortas.

De hecho, la primera caché L3 se utilizó en el procesador K6-III de AMD. En ese momento, la caché L3 estaba limitada por el proceso de fabricación y no estaba integrada en el chip, sino en la placa base. . superior. En ese momento, debido a limitaciones del proceso de fabricación, la caché L3 no estaba integrada en el chip, sino en la placa base. La caché L3 sólo se puede sincronizar con la frecuencia del bus del sistema y en realidad no es tan diferente de la memoria principal. La caché L3 se utilizó posteriormente en los procesadores Itanium de Intel para el mercado de servidores. Intel también planea lanzar procesadores Itanium2 con caché L3 de 9 MB, seguidos de procesadores Itanium2 de doble núcleo con caché L3 de 24 MB y, posteriormente, los modelos convencionales y de gama alta del K8L también incluirán caché L3.

Pero básicamente, la caché L3 no es muy importante para mejorar el rendimiento del procesador. Por ejemplo, el procesador Xeon MP con 1 MB de caché L3 aún no está a la par del Opteron, lo que sugiere que agregar un bus frontal mejora el rendimiento más que agregar caché.

7. Conjunto de instrucciones extendido de la CPU

La CPU se basa en instrucciones para calcular y controlar el sistema. Cada CPU está diseñada con un conjunto de instrucciones que coincide con su circuito de hardware. La potencia de las instrucciones también es un indicador importante de la CPU, y el conjunto de instrucciones es una de las herramientas más eficaces para mejorar la eficiencia de los microprocesadores. A juzgar por la arquitectura convencional actual, el conjunto de instrucciones se puede dividir en dos partes: conjunto de instrucciones complejo y conjunto de instrucciones simplificado. Desde la perspectiva de usos específicos, como MMX (Multi Media Extended), SSE y SSE2 (Streaming-Single) de Intel. múltiples datos: Extensiones 2), SEE3 y 3DNow de AMD. etc. son conjuntos de instrucciones ampliados de la CPU, que mejoran las capacidades de procesamiento multimedia, gráficos e Internet de la CPU. Generalmente nos referimos al conjunto de instrucciones extendidas de la CPU como "conjunto de instrucciones de la CPU". SSE3 también es el conjunto de instrucciones más pequeño actualmente, detrás de las 57 instrucciones de MMX, las 50 instrucciones de SSE, las 144 instrucciones de SSE2 y las 13 instrucciones de SSE3. SSE3 es también el conjunto de instrucciones más avanzado. Los procesadores Intel Prescott ya son compatibles con SSE3. AMD agregará compatibilidad con SSE3 en futuros procesadores de doble núcleo que también admitirán este conjunto de instrucciones.

8. Núcleo de la CPU y voltaje de E/S

A partir de la CPU 586, el voltaje de funcionamiento de la CPU se divide en dos tipos: voltaje del núcleo y voltaje de E/S. El voltaje del núcleo es menor o igual al voltaje de E/S. El tamaño del voltaje del núcleo depende del proceso de producción de la CPU. Generalmente, cuanto más pequeño es el proceso de producción, menor es el voltaje de funcionamiento del núcleo; generalmente está entre 1,6 y 5 V. El bajo voltaje puede resolver los problemas de consumo excesivo de energía y alta generación de calor.

9. Proceso de fabricación

La micra del proceso de fabricación se refiere a la distancia entre los circuitos internos del circuito integrado. La tendencia de desarrollo de la tecnología de fabricación es hacia la alta densidad. El diseño de circuitos integrados de alta densidad significa que los diseños de circuitos con mayor densidad y funciones más complejas se pueden realizar en el mismo tamaño de área de circuito integrado. Ahora hay principalmente 180 nanómetros, 130 nanómetros y 90 nanómetros. Recientemente se ha demostrado oficialmente el proceso de fabricación de 65 nm.

10. Conjunto de instrucciones

(1) Conjunto de instrucciones CISC

El conjunto de instrucciones CISC también se denomina conjunto de instrucciones complejo y su nombre en inglés es CISC (Complex Conjunto de instrucciones (abreviatura de computadora).

En un microprocesador CISC, las instrucciones del programa se ejecutan en serie en orden y las operaciones de cada instrucción también se ejecutan en serie en orden. La ventaja de la ejecución secuencial es el control simple, pero la tasa de utilización de los componentes de la computadora no es alta y la velocidad de ejecución es lenta. En realidad, se trata de las CPU de la serie x86 (también conocida como arquitectura IA-32) producidas por Intel Corporation y sus CPU compatibles, como AMD y VIA. Incluso el X86-64 más reciente (también incluido en AMD64) entra en la categoría CISC.

Si quieres saber cuál es el conjunto de instrucciones de la CPU con arquitectura X86 actual, puedes decir esto. El conjunto de instrucciones X86 fue desarrollado especialmente por Intel para su primera CPU de 16 bits (i8086). La CPU-i8088 (versión simplificada de i8086) en la primera PC del mundo lanzada por IBM en 1981 adoptó instrucciones X86 y se utilizó en instrucciones de punto flotante. Se mejoraron en la computadora y se agregó un chip X87 a la computadora para mejorar las capacidades de procesamiento de datos de punto flotante. Más tarde, el conjunto de instrucciones X86 y el conjunto de instrucciones X87 se denominaron colectivamente conjunto de instrucciones X86.

Aunque con el desarrollo continuo de la tecnología de CPU, Intel ha desarrollado los i80386 e i80486 más nuevos, hasta los pasados ​​PII Xtreme, PIII Xtreme, Pentium 3 y, finalmente, hasta la actual serie Pentium 4, Xtreme (no (incluido Utiliza el conjunto de instrucciones X86, por lo que su CPU todavía pertenece a la serie X86. Dado que la serie Intel X86 y sus CPU compatibles (como AMD Athlon MP) utilizan el conjunto de instrucciones X86, se ha formado la enorme línea actual de series X86 y CPU compatibles. Actualmente, existen dos categorías principales de CPU x86: CPU de servidor Intel y CPU de servidor AMD.

(2) Conjunto de instrucciones RISC

RISC es la abreviatura de "Computación de conjunto de instrucciones reducido", que significa "conjunto de instrucciones reducido" en chino. Fue desarrollado sobre la base del sistema de instrucciones CISC. Alguien probó la máquina CISC y demostró que la frecuencia de uso de varias instrucciones varía mucho. Las instrucciones más utilizadas son algunas instrucciones relativamente simples, que solo representan el 20% del total. cantidad de instrucciones, pero la frecuencia de uso en el programa representa el 80%. Un sistema de instrucción complejo inevitablemente aumentará la complejidad del microprocesador, haciendo que el tiempo de desarrollo del procesador sea largo y costoso. Además, las instrucciones complejas requieren operaciones complejas, lo que inevitablemente reducirá la velocidad de cálculo de la computadora. Por las razones anteriores, las CPU RISC nacieron en la década de 1980. En comparación con las CPU de tipo CISC, las CPU de tipo RISC no solo simplifican el sistema de instrucciones, sino que también adoptan una estructura superescalar y de supercanalización, lo que mejora en gran medida las capacidades de procesamiento paralelo. El conjunto de instrucciones RISC es la dirección de desarrollo de las CPU de alto rendimiento. En comparación con el CISC (conjunto de instrucciones complejo) tradicional, el conjunto de instrucciones RISC es la dirección de desarrollo de las CPU de alto rendimiento. En términos relativos, RISC tiene un formato de instrucción unificado, menos tipos de instrucciones y menos modos de direccionamiento que los conjuntos de instrucciones complejos. Por supuesto, la velocidad de procesamiento es mucho mayor. En la actualidad, los servidores de gama media a alta generalmente utilizan CPU con este sistema de instrucciones, especialmente los servidores de gama alta, que utilizan CPU con sistema de instrucciones RISC. El sistema de instrucciones RISC es más adecuado para sistemas operativos de servidores de alta gama UNIX, y ahora Linux también es un sistema operativo similar a UNIX. Las CPU de tipo RISC son software y hardware incompatibles con las CPU Intel y AMD.

Actualmente existen principalmente los siguientes tipos de CPU que utilizan instrucciones RISC en servidores de gama media y alta: procesadores PowerPC, procesadores SPARC, procesadores PA-RISC, procesadores MIPS y procesadores Alpha.

(3) IA-64

Ha habido un debate continuo sobre si EPIC (Computadora de instrucción paralela explícita) es el sucesor de los sistemas RISC y CISC en lo que respecta al sistema EPIC. En lo que respecta, se trata más bien de un paso importante hacia los sistemas RISC para procesadores Intel. En teoría, el sistema EPIC está diseñado con una CPU que es mucho más capaz de manejar aplicaciones de Windows que aplicaciones basadas en Unix bajo la misma configuración de host. La CPU del servidor Intel que utiliza tecnología EPIC es Anthem Itanium (nombre en clave de desarrollo Merced). Es un procesador de 64 bits y el primero de la serie IA-64. Microsoft también desarrolló un sistema operativo con nombre en código Win64 para admitirlo en software. Intel adoptó el conjunto de instrucciones X86 y pasó a microprocesadores de 64 bits más avanzados. Intel hizo esto porque TPIC podía ofrecer un conjunto de instrucciones vibrante y potente, por lo que nació la arquitectura IA-64 que utiliza el conjunto de instrucciones EPIC. En muchos sentidos, IA-64 es una mejora importante con respecto a x86. Supera muchas limitaciones de la arquitectura tradicional IA32 y logra mejoras revolucionarias en las capacidades de procesamiento de datos, estabilidad del sistema, seguridad, usabilidad y visualización.

El mayor defecto del microprocesador IA-64 es que es incompatible con x86. Para permitir que el procesador IA-64 ejecute mejor el software de las dos dinastías, Intel desarrolló el procesador IA-64. (Itanium, Itanium2...) para convertir instrucciones x86 en instrucciones IA-64. Este decodificador no es el más eficiente, ni es la mejor manera de ejecutar código x86 (la mejor manera es ejecutar código x86 directamente en el procesador x86), por lo que Itanium e Itanium2 funcionan muy mal cuando ejecutan aplicaciones x86. Esta se convirtió en la causa raíz de X86-64.

(4) X86-64 (AMD64/EM64T)

Está diseñado por AMD para manejar operaciones enteras de 64 bits simultáneamente y es compatible con la arquitectura X86-32. Admite direccionamiento lógico de 64 bits y ofrece la opción de convertir a direccionamiento de 32 bits; sin embargo, las instrucciones de manipulación de datos son de forma predeterminada de 32 bits y 8 bits y ofrece la opción de convertir a 64 bits y 16 bits; registros de propósito general, por lo que en el caso de operaciones aritméticas de 32 bits, el resultado se expande a 64 bits completos. De esta forma, se distingue entre "ejecución directa" y "ejecución por conversión" de instrucciones, y el campo de instrucción puede ser de 8 o 32 bits, evitando así campos demasiado largos.

El nacimiento de x86-64 (también conocido como AMD64) no surgió de la nada. El espacio de direccionamiento de 32 bits de los procesadores x86 está limitado a 4 GB de memoria y los procesadores IA-64 no son compatibles con x86. Teniendo en cuenta las necesidades de los clientes, AMD mejoró las capacidades del conjunto de instrucciones x86 para admitir modos operativos de 64 bits, por lo que AMD llama a su arquitectura x86-64. Técnicamente hablando, AMD introdujo nuevos registros de uso general R8-R15 en la arquitectura x86-64 como una extensión de los registros del procesador X86 original para operaciones de 64 bits, pero estos registros no se utilizan por completo en el entorno de 32 bits. Los registros primitivos como EAX y EBX también se ampliaron de 32 a 64 bits. Se han agregado ocho nuevos registros a la unidad SSE para respaldar SSE2. El aumento en el número de registros conducirá a mejoras en el rendimiento. Al mismo tiempo, para admitir códigos y registros de 32 y 64 bits, la arquitectura x86-64 permite que el procesador se ejecute en los dos modos siguientes: modo largo y modo heredado, de los cuales el modo largo se divide en Dos modos Seed (modo de 64 bits y modo de compatibilidad). El estándar se ha introducido en los procesadores de servidor Opteron de AMD.

Este año también se introdujo la compatibilidad con la tecnología EM64T de 64 bits, y el IA32E, que antes no se había denominado oficialmente EM64T, recibió el nombre de tecnología de extensión Intel de 64 bits para distinguir el conjunto de instrucciones X86. El EM64T de Intel admite el submodo de 64 bits, que es similar a la tecnología X86-64 de AMD. También tiene direccionamiento en plano lineal de 64 bits y agrega 8 nuevos registros de uso general. El EM64T de Intel admite el submodo de 64 bits, que es similar a la tecnología X86-64 de AMD, utiliza direccionamiento de plano lineal de 64 bits, agrega 8 nuevos registros de propósito general (GPR) y 8 registros adicionales que admiten instrucciones SSE. Al igual que AMD, la tecnología de 64 bits de Intel será compatible tanto con IA32 como con IA32E, y IA32E solo se utilizará cuando se ejecute en un sistema operativo de 64 bits. IA32E constará de 2 submodos: submodo de 64 bits y submodo de 32 bits, y será compatible con versiones anteriores como AMD64. El EM64T de Intel será totalmente compatible con la tecnología X86-64 de AMD. Actualmente, se ha agregado tecnología de 64 bits a los procesadores Nocona y el procesador Pentium 4E de Intel también admite tecnología de 64 bits.

Cabe señalar que ambas son arquitecturas de microprocesadores de 64 bits compatibles con el conjunto de instrucciones x86, pero aún existen algunas diferencias entre EM64T y AMD64, y el bit NX en los procesadores AMD64 no se podrá utilizar. en procesadores Intel.

'

11. Superpipes y superescalares

Antes de explicar los superpipes y los superescalares, primero comprenda los pipelines. Intel utilizó por primera vez la canalización en su chip 486. El principio de funcionamiento de la línea de montaje es como el de la línea de montaje en la producción industrial. En la CPU, 5 o 6 unidades de circuito con diferentes funciones forman una tubería de procesamiento de instrucciones y luego dividen una instrucción X86 en 5 o 6 pasos, que luego son ejecutados por estas unidades de circuito respectivamente, de modo que una instrucción se puede completar dentro de una CPU. ciclo de reloj, aumentando así la velocidad de ejecución de la CPU. Cada canal de enteros clásico de Pentium se divide en procesos de cuatro niveles, a saber, captación previa de instrucciones, decodificación, ejecución y reescritura de resultados, y el canal de punto flotante se divide en procesos de ocho niveles. Las condiciones necesarias para construir un sistema SMP son hardware que admita SMP, incluidas placas base y CPU, plataformas de sistema que admitan SMP y software de aplicación que admita SMP.

Para que los sistemas SMP funcionen de manera eficiente, el sistema operativo debe admitir sistemas SMP, como sistemas operativos de 32 bits como WINNT, LINUX y UNIX. Multitarea y multihilo. Multitarea significa que el sistema operativo permite que diferentes CPU completen diferentes tareas al mismo tiempo; multiproceso significa que el sistema operativo permite que diferentes CPU completen la misma tarea en paralelo.

Para formar un sistema SMP, los requisitos para la CPU seleccionada son muy altos. En primer lugar, la CPU debe tener una unidad APIC (Controlador de interrupción programable avanzado) incorporada. El núcleo de la especificación de multiprocesamiento de Intel es el Controlador de interrupción programable avanzado (Avanzado). El núcleo de la especificación de multiprocesamiento de Intel es el uso del Controlador de interrupción programable avanzado (APIC); nuevamente, el mismo modelo de producto, el mismo tipo de núcleo de CPU, exactamente la misma frecuencia de operación y, finalmente, mantenga el mismo número de serie del producto; posible, porque cuando dos lotes de CPU de producción se ejecutan como procesadores duales, es posible que una CPU esté sobrecargada y la otra subcargada, lo que imposibilita el máximo rendimiento, provocando incluso fallos.

16. Tecnología NUMA

NUMA es una tecnología de almacenamiento compartido de distribución de acceso no uniforme***. Es un sistema compuesto por múltiples nodos independientes conectados por múltiples redes dedicadas de alta velocidad. Cada nodo puede ser una única CPU o un sistema SMP. En NUMA existen múltiples soluciones para la coherencia de la caché, que requieren soporte del sistema operativo y software especial. En la Figura 2 se muestra un ejemplo del sistema NUMA de Sequent.

Aquí se conectan tres módulos SMP a través de una red privada de alta velocidad para formar un nodo, cada uno con hasta 12 CPU. Sistemas como Sequent pueden tener hasta 64 CPU, o incluso 256 CPU. Obviamente, se trata de una combinación de dos tecnologías, basada en SMP y ampliada con tecnología NUMA.

17. Tecnología de ejecución fuera de orden

La ejecución fuera de orden significa que la CPU permite que algunas instrucciones que no se ejecutan en el orden del programa se asignen a las unidades de circuito correspondientes. para el procesamiento. Después de analizar el estado de cada unidad de circuito y si cada instrucción se puede ejecutar por adelantado, las instrucciones que se pueden ejecutar por adelantado se envían inmediatamente a la unidad de circuito correspondiente para su ejecución. Durante el proceso de ejecución, las instrucciones no se ejecutan en la forma especificada. orden, y luego las instrucciones son ejecutadas por la unidad de reordenamiento. Reorganice los resultados de ejecución de cada unidad de ejecución en el orden de las instrucciones. El propósito de utilizar tecnología de ejecución desordenada es hacer que los circuitos internos de la CPU funcionen a plena capacidad y, en consecuencia, aumentar la velocidad de los programas en ejecución de la CPU. Tecnología de rama: las instrucciones (de rama) deben esperar el resultado de la operación. Generalmente, las ramas incondicionales solo deben ejecutarse en el orden de las instrucciones, mientras que las ramas condicionales deben decidir si continuar en el orden original en función de los resultados del procesamiento.

18. Controlador de memoria dentro de la CPU

Muchas aplicaciones tienen patrones de lectura complejos (lecturas casi aleatorias, especialmente cuando los accesos al caché son impredecibles), el ancho de banda no se puede utilizar de manera eficiente. Ejemplos típicos de este tipo de aplicaciones son el software de procesamiento empresarial, que estará limitado por la latencia de la memoria incluso si la CPU tiene características como la ejecución fuera de orden. La CPU debe esperar hasta que el divisor se cargue con los datos necesarios para la operación antes de poder ejecutar la instrucción (ya sea que los datos provengan del caché de la CPU o del sistema de memoria principal). Actualmente, la latencia de la memoria en sistemas de segmento bajo es de aproximadamente 120-150 ns, y con velocidades de CPU de 3 GHz o superiores, una solicitud de memoria puede desperdiciar entre 200 y 300 ciclos de CPU. Incluso con una tasa de aciertos de caché del 99 %, la CPU aún puede pasar el 50 % de su tiempo esperando que se completen las solicitudes de memoria, por ejemplo, debido a la latencia de la memoria.

Puedes ver que la latencia del controlador de memoria integrado Opteron es mucho menor en comparación con el controlador de memoria DDR de doble canal compatible con el chipset. Intel también está en camino de integrar el controlador de memoria en el procesador, lo que hará que Northbridge sea menos importante. Pero cambiar la forma en que el procesador accede a la memoria principal puede ayudar a aumentar el ancho de banda, reducir la latencia de la memoria y mejorar el rendimiento del procesador.

La calidad de las tarjetas gráficas

El 9550 se refiere a uno de los primeros chips gráficos de gama media a baja de ATI.

La característica principal de una tarjeta gráfica general es el chip de visualización. Los mejores ahora incluyen el 6600, 6200 de NTVIA o incluso el 6800 superior, así como el X700, X800 de ATI, etc. El mismo chip de visualización tiene diferentes frecuencias. El mismo chip de visualización tiene diferentes frecuencias; cuanto mayor sea la frecuencia, mejor.

En segundo lugar, depende de la memoria de vídeo. En primer lugar, debe observar la memoria de la computadora para ver si existen diferencias como DDR, DDRII y DDR3. Lo segundo es mirar la memoria de tu computadora.

En tercer lugar, observe el ancho de banda de la pantalla. Hoy en día suele ser de 128 bits y 256 bits, 256 bits es mejor.

Finalmente, las grandes marcas son mejores que las pequeñas marcas de segundo y tercer nivel.