¿Qué es la CPU?
La Unidad Central de Procesamiento (CPU) es el núcleo informático y el núcleo de control de una computadora. La CPU, la memoria interna y los dispositivos de entrada/salida son los tres componentes principales de las computadoras electrónicas. Para todas las operaciones en la computadora, la CPU es responsable de leer las instrucciones, decodificarlas y ejecutar los componentes principales de las instrucciones. Su función es principalmente interpretar instrucciones de computadora y procesar datos en software de computadora. La denominada programabilidad informática se refiere principalmente a la programación de la CPU. La CPU está compuesta por unidades aritméticas, controladores y registros, así como buses de datos, control y estado que implementan las conexiones entre ellos. El principio operativo de casi todas las CPU se puede dividir en cuatro etapas: recuperación, decodificación, ejecución y reescritura.
Directorio
Cómo funciona Extracción
Decodificación
Ejecución
Reescritura
Componente de lógica aritmética de estructura básica
Componente de registro
Componente de control
El nacimiento de la historia del desarrollo
Competición inicial
El advenimiento de la era de las microcomputadoras
El despegue de la era de las CPU de alta velocidad
Indicadores de rendimiento Frecuencia principal
FSB
Frecuencia del bus frontal (FSB)
Bit de CPU y longitud de palabra
Factor de multiplicación
Caché
Conjunto de instrucciones extendido de CPU p>
Núcleo de CPU y voltaje de funcionamiento de E/S
Arquitectura técnica y proceso de fabricación
Conjunto de instrucciones
Supercanalización y superescalar
Formulario de paquete
Multiproceso
Multinúcleo
SMP
Tecnología NUMA
Out- tecnología de ejecución de órdenes
Tecnología de ramificación
Controlador de memoria dentro de la CPU
Fabricante Intel Corporation
AMD Corporation
IBM y Cyrix
Compañía IDT
Compañía VIA VIA
Loongson nacional
ARM Ltd
Freescale Semiconductor
Método de empaquetado
Extracción del principio de funcionamiento del reconocimiento original
Decodificación
Ejecución
Reescritura
Componente de lógica de operación de estructura básica
Componente de registro
Componente de control
El nacimiento de la historia del desarrollo
La competencia por el comienzo
El advenimiento de la era de las microcomputadoras
El despegue de la era de las CPU de alta velocidad
Indicadores de rendimiento Frecuencia principal
FSB
Frecuencia del bus frontal (FSB)
Bits de CPU y longitud de palabra
Factor de multiplicación
Caché
Conjunto de instrucciones extendidas de CPU
Núcleo de CPU y voltaje de trabajo de E/S
Arquitectura técnica Proceso de fabricación
Conjunto de instrucciones
Supercanalización y superescalar
Formularios de empaquetado
Muchos subprocesos
Multinúcleo
SMP
Tecnología NUMA
Tecnología de ejecución fuera de orden
Tecnología de ramificación
p>
Controlador de memoria dentro de la CPU
Fabricante Intel Corporation
AMD Corporation
IBM y Cyrix
IDT Corporation
VIA Weisheng Company
Loongson nacional
ARM Ltd
Freescale Semiconductor
Método de embalaje
Identificación original
Amplíe y edite el principio de funcionamiento de este párrafo
Extracción
La primera etapa, extracción, recupera instrucciones (como numéricas o una serie de valores).
La ubicación de la memoria del programa la especifica el contador de programa (Contador de programa), que almacena un valor utilizado para identificar la ubicación del programa actual. En otras palabras, el contador del programa registra los rastros de la CPU en el programa actual. Una vez recuperada la instrucción, el contador del programa se incrementa en unidades de memoria según la longitud de la instrucción. A menudo las instrucciones deben obtenerse de una memoria relativamente lenta, lo que hace que la CPU espere a que lleguen las instrucciones. Este problema se aborda principalmente en la arquitectura canalizada y de almacenamiento en caché de los procesadores modernos.
Decodificación
La CPU determina su comportamiento de ejecución en función de las instrucciones obtenidas de la memoria. Durante la fase de decodificación, las instrucciones se dividen en partes significativas. Los valores se interpretan en instrucciones de acuerdo con la definición de la arquitectura del conjunto de instrucciones (ISA) de la CPU. Parte del valor de la instrucción es el código de operación (Opcode), que indica qué operaciones se deben realizar. Otros valores suelen proporcionar información necesaria para la instrucción, como el objetivo de una operación de suma. Un objetivo de operación de este tipo puede proporcionar un valor constante (es decir, un valor inmediato) o un valor de dirección de un espacio: un registro o una dirección de memoria, según el modo de direccionamiento. En el diseño antiguo, la parte de decodificación de instrucciones de la CPU era un dispositivo de hardware que no se podía cambiar. Sin embargo, en muchas arquitecturas de conjuntos de instrucciones y CPU abstractas y complejas, a menudo se utiliza un microprograma para ayudar a convertir instrucciones en diversas formas de señales. Estos microprogramas a menudo se pueden reescribir en CPU terminadas para facilitar los cambios en las instrucciones de decodificación.
Ejecución
Después de las fases de extracción y decodificación, sigue la fase de ejecución. En esta etapa se conectan varios componentes de la CPU que pueden realizar las operaciones requeridas. Por ejemplo, para solicitar una operación de suma, la Unidad Aritmético Lógica (ALU) se conectará a un conjunto de entradas y a un conjunto de salidas. Las entradas proporcionan los valores a sumar y la salida contendrá el resultado de la suma. La ALU tiene un sistema de circuito incorporado que facilita que la salida complete operaciones comunes simples y operaciones lógicas (como operaciones de suma y bits). Si la operación de suma produce un resultado que es demasiado grande para que la CPU lo procese, se puede establecer el indicador de desbordamiento aritmético en el registro de indicadores.
Reescritura
La etapa final, reescritura, simplemente vuelve a escribir los resultados de la etapa de ejecución en un formato determinado. Los resultados de las operaciones a menudo se escriben en el registro interno de la CPU para un acceso rápido mediante instrucciones posteriores. En otros casos, los resultados pueden escribirse en una memoria principal más lenta, más grande y más barata. Ciertos tipos de instrucciones operan en el contador del programa sin producir un resultado directo. Generalmente se denominan "saltos" y provocan un comportamiento de bucle, ejecución condicional (mediante saltos condicionales) y funciones en el programa. Muchas instrucciones también cambian los bits de estado del registro de bandera. Estos indicadores se pueden utilizar para afectar el comportamiento del programa porque a menudo muestran los resultados de varias operaciones. Por ejemplo, se utiliza una instrucción de "comparación" para determinar el tamaño de dos valores y se establece un valor en el registro de bandera según el resultado de la comparación. Este indicador se puede utilizar para determinar el comportamiento del programa mediante instrucciones de salto posteriores. Después de ejecutar la instrucción y volver a escribir el resultado, el valor del contador del programa se incrementará, se repetirá todo el proceso y la siguiente instrucción secuencial se recuperará normalmente en el siguiente ciclo de instrucción. Si se completa una instrucción de salto, el contador del programa se modificará a la dirección de la instrucción de salto y el programa continuará ejecutándose normalmente. Muchas CPU complejas pueden recuperar varias instrucciones a la vez, decodificarlas y ejecutarlas simultáneamente. Esta sección generalmente trata sobre las "canalizaciones RISC clásicas", que en realidad se están volviendo comunes rápidamente en muchos dispositivos electrónicos que utilizan CPU simples (a menudo llamadas microcontroladores).
Edite la estructura básica de este párrafo
La CPU incluye componentes de lógica aritmética, componentes de registro y componentes de control. La CPU recupera instrucciones de la memoria o caché, las coloca en el registro de instrucciones y las decodifica. Descompone las instrucciones en una serie de microoperaciones y luego emite varios comandos de control para ejecutar la serie de microoperaciones para completar la ejecución de una instrucción. Las instrucciones son comandos básicos para computadoras que especifican el tipo y operandos de las operaciones a realizar. Una instrucción se compone de uno o más bytes, incluido un campo de código de operación, uno o más campos relacionados con la dirección del operando y algunas palabras de estado y códigos de característica que representan el estado de la máquina. Algunas instrucciones también incluyen directamente los propios operandos.
Componente de lógica aritmética
El componente de lógica aritmética puede realizar operaciones aritméticas de punto fijo o punto flotante, operaciones de desplazamiento y operaciones lógicas, y también puede realizar operaciones de direcciones y conversiones.
Componente de registro
El componente de registro incluye registros de propósito general, registros de propósito especial y registros de control. Registros de CPU de 32 bits
Los registros de uso general se pueden dividir en números de punto fijo y números de punto flotante. Se utilizan para almacenar operandos de registro y resultados de operaciones en instrucciones. El registro de propósito general es una parte importante de la CPU y la mayoría de las instrucciones acceden al registro de propósito general. El ancho del registro de uso general determina el ancho de la ruta de datos dentro de la computadora y el número de sus puertos a menudo puede afectar el paralelismo de las operaciones internas. Los registros especiales son registros necesarios para realizar algunas operaciones especiales. Los registros de control se utilizan generalmente para indicar el estado de ejecución de la máquina o para mantener ciertos punteros. Incluyen registros de estado de procesamiento, registros de direcciones base de directorios de traducción de direcciones, registros de estado de privilegios, registros de códigos de condición, registros de procesamiento de excepciones y registros de detección de errores. A veces, hay algunos cachés en el procesador central para almacenar temporalmente algunas instrucciones de datos. Cuanto más grande es el caché, más rápida es la velocidad de procesamiento de la CPU. Actualmente, los procesadores centrales de gama media y alta en el mercado tienen un caché secundario de aproximadamente 2 M. , las unidades centrales de procesamiento de alta gama tienen un caché de nivel 2 de aproximadamente 4 M.
Componente de control
El componente de control es el principal responsable de decodificar instrucciones y emitir señales de control para cada operación a realizar para completar cada instrucción. Hay dos estructuras: una es un método de control de microprogramas con microalmacenamiento como núcleo; la otra es un método de control basado en una estructura lógica de cableado. El microcódigo se mantiene en un microalmacenamiento y cada microcódigo corresponde a una microoperación más básica, también conocida como microinstrucción. Cada instrucción se compone de una secuencia diferente de microcódigos, y esta secuencia de microcódigo constituye un microprograma. Después de que el procesador central decodifica la instrucción, envía una determinada secuencia de señales de control y ejecuta varias microoperaciones determinadas por estos microcódigos en una secuencia determinada y en microciclos para completar la ejecución de una instrucción. Las instrucciones simples se componen de (3 a 5) microoperaciones, mientras que las instrucciones complejas se componen de docenas o incluso cientos de microoperaciones. Los controladores lógicos cableados están compuestos enteramente de lógica aleatoria. Una vez decodificada la instrucción, el controlador envía diferentes secuencias de señales de temporización de control a través de una combinación de diferentes puertas lógicas para ejecutar directamente cada operación en una instrucción.
Edite este historial de desarrollo
El nombre CPU era originalmente una descripción de una serie de máquinas lógicas que pueden ejecutar programas informáticos complejos o programas informáticos. Esta vaga definición podría haber incluido fácilmente la computadora misma antes de que el nombre "CPU" se hiciera de uso común.
Nacimiento
Unidad Central de Procesamiento (Intel)
Sin embargo, a partir de la década de 1970, debido al uso a gran escala de circuitos integrados, la necesidad original de varios Cuando una CPU compuesta por unidades independientes se integra en un microprocesador diminuto pero de una potencia sin precedentes. Este nombre y su abreviatura son realmente muy utilizados en la industria informática electrónica. Aunque las CPU han evolucionado dramáticamente en términos de forma física, diseño y fabricación, y ejecución de tareas específicas en comparación con sus inicios, sus principios operativos básicos se han mantenido sin cambios. En 1971, Intel, que en ese momento todavía estaba en su etapa de desarrollo, lanzó el primer microprocesador real del mundo, el 4004. Este no sólo fue el primer microprocesador de 4 bits utilizado en calculadoras, sino que también fue el primer procesador de computadora que las personas podían permitirse. El 4004 contenía 2.300 transistores, sus funciones eran bastante limitadas y su velocidad aún era muy lenta. Fue descartado por IBM, el gigante azul de la época, y por la mayoría de los usuarios comerciales. Sin embargo, después de todo, fue un producto que hizo época. A partir de entonces, Intel y los microprocesadores se formó un vínculo indisoluble. Se puede decir que el proceso de desarrollo histórico de la CPU es en realidad el proceso de desarrollo de la CPU de la serie X86 de Intel, y es el "viaje histórico de la CPU" que se desarrolla a través de él.
Competición inicial
Unidad central de procesamiento (Intel)
En 1978, Intel volvió a liderar la tendencia y produjo por primera vez un microprocesador de 16 bits. Llamado i8086, también se produjo un coprocesador matemático coincidente, el i8087. Los dos chips usan conjuntos de instrucciones mutuamente compatibles, pero algunas adiciones al conjunto de instrucciones i8087 se usan específicamente para matemáticas como logaritmos, funciones exponenciales y trigonométricas. Dado que estos conjuntos de instrucciones se utilizan en i8086 e i8087, la gente también los llama conjunto de instrucciones X86. Aunque Intel ha producido sucesivamente CPU de segunda y tercera generación y otras nuevas más avanzadas y rápidas en el futuro, siguen siendo compatibles con las instrucciones X86 originales, e Intel ha seguido utilizando la secuencia X86 original en la denominación de CPU posteriores. Sólo más tarde, debido a problemas con el registro de marcas, dejamos de utilizar números arábigos para los nombres. En cuanto a otras empresas que se desarrollaron y expandieron posteriormente, como AMD y Cyrix, las CPU anteriores a 486 (incluida la 486) nombraron sus CPU de la serie X86 según el método de nomenclatura de Intel. Sin embargo, en la era 586, la competencia en el mercado se volvió cada vez más feroz. Debido a cuestiones de registro de marcas, ya no pueden usar nombres iguales o similares a los de la serie X86 de Intel, por lo que deben nombrar sus propias CPU compatibles con 586 y 686. En 1979, Intel lanzó el chip 8088, que todavía era un microprocesador de 16 bits con 29.000 transistores, una frecuencia de reloj de 4,77 MHz, un bus de direcciones de 20 bits y 1 MB de memoria. El bus de datos interno del 8088 es de 16 bits, el bus de datos externo es de 8 bits y su hermano 8086 es de 16 bits.
El advenimiento de la era de las microcomputadoras
Unidad central de procesamiento (diagrama conceptual)
En 1981, el chip 8088 se utilizó por primera vez en la PC (Computadora personal) de IBM. máquina, marcó el comienzo de una nueva era de microcomputadoras. Fue a partir del 8088 que el concepto de PC comenzó a desarrollarse en todo el mundo. Las primeras CPU generalmente se personalizaban para computadoras de gran escala y con aplicaciones específicas. Sin embargo, este costoso enfoque de personalizar las CPU para aplicaciones específicas ha dado paso en gran medida al desarrollo de clases de procesadores estandarizados y baratos que son adecuados para uno o más propósitos. Esta tendencia a la estandarización comenzó con la época de las mainframes y microcomputadoras construidas a partir de transistores individuales y se aceleró con la llegada de los circuitos integrados. Los circuitos integrados permiten diseñar y fabricar CPU más complejas en un espacio muy pequeño (del orden de micras). En 1982, cuando muchos lectores jóvenes aún estaban en su infancia, Intel lanzó su último producto histórico, el chip Zao 80286, que supuso un gran avance en desarrollo en comparación con 8086 y 8088. Aunque todavía era una estructura de 16 bits. Hay 134.000 transistores dentro de la CPU y la frecuencia del reloj aumenta gradualmente desde los 6MHz iniciales a 20MHz. Sus buses de datos internos y externos son de 16 bits, el bus de direcciones es de 24 bits y puede direccionar 16 MB de memoria. A partir de 80286, la CPU ha evolucionado a dos modos de trabajo: modo real y modo protegido. Unidad central de procesamiento (imagen conceptual de AMD Athlon 64FX)
En 1985, Intel lanzó el chip 80386, que fue el primer microprocesador de 32 bits de la serie 80X86, y el proceso de fabricación también mejoró enormemente en comparación con el 80286. , 80386 contiene 275.000 transistores y una frecuencia de reloj de 12,5 MHz, que luego se aumentó a 20 MHz, 25 MHz y 33 MHz. Los buses de datos internos y externos del 80386 son de 32 bits, y el bus de direcciones también es de 32 bits, que puede direccionar hasta 4 GB de memoria. Además del modo real y el modo protegido, también agrega un modo de trabajo llamado virtual 86, que puede proporcionar capacidades multitarea simulando múltiples procesadores 8086 al mismo tiempo. Además del chip estándar 80386, que a menudo se denomina 80386DX, debido a diferentes consideraciones de mercado y aplicaciones, Intel ha lanzado sucesivamente otros tipos de chips 80386: 80386SX, 80386SL, 80386DL, etc.
En 1988, Intel lanzó el 80386SX, un chip ubicado entre el 80286 y el 80386DX. La diferencia con el 80386DX es que el bus de datos externo y el bus de direcciones son los mismos que los del 80286, que son de 16 y 24 bits respectivamente (. es decir, la capacidad de direccionamiento es de 16 MB).
El despegue de la era de las CPU de alta velocidad
En 1990, Intel lanzó el 80386 SL y el 80386 DL, ambos chips de bajo consumo y ahorro de energía, utilizados principalmente en ordenadores portátiles. y máquinas de escritorio que ahorran energía. La diferencia entre 80386 SL y 80386 DL es que el primero se basa en 80386SX y el segundo en 80386DX, pero ambos añaden un nuevo método de trabajo: el método de gestión del sistema. Al ingresar al modo de administración del sistema, la CPU reduce automáticamente la velocidad de operación, controla otros componentes como la pantalla y el disco duro para suspender el trabajo, o incluso deja de funcionar y entra en estado de "suspensión" para lograr ahorro de energía. En 1989, Intel lanzó el conocido chip 80486. Lo bueno de este chip es que rompió el límite de 1 millón de transistores e integró 1,2 millones de transistores. La frecuencia de reloj del 80486 se ha incrementado gradualmente de 25MHz a 33MHz y 50MHz. 80486 integra 80386, el coprocesador matemático 80387 y un caché de 8 KB en un chip. Utiliza tecnología RISC (conjunto de instrucciones reducido) por primera vez en la serie 80X86, que puede ejecutar una instrucción en un ciclo de reloj. También utiliza un método de bus de ráfaga, que mejora en gran medida la velocidad del intercambio de datos con la memoria. Debido a estas mejoras, el rendimiento del 80486 mejora 4 veces respecto al 80386DX con el coprocesador matemático 80387. Al igual que 80386, han aparecido varios tipos de 80486 uno tras otro. El tipo original presentado anteriormente es 80486DX. En 1990, Intel lanzó el 80486 SX, que era un modelo económico del tipo 486. Su diferencia con el 80486DX era que no tenía coprocesador matemático. 80486 DX2 utiliza tecnología de multiplicación de reloj, lo que significa que la velocidad de funcionamiento interno del chip es el doble de la velocidad de funcionamiento del bus externo, es decir, el chip interno funciona a 2 veces la velocidad del reloj del sistema, pero aún se comunica con el exterior. mundo a la velocidad del reloj original. Las frecuencias de reloj interno del 80486 DX2 incluyen principalmente 40MHz, 50MHz, 66MHz, etc. El 80486 DX4 también es un chip que utiliza tecnología de multiplicación de reloj, que permite que sus unidades internas funcionen a 2 o 3 veces la velocidad del bus externo. Para admitir esta mayor frecuencia operativa interna, su caché en el chip se ha ampliado a 16 KB. El 80486 DX4 tiene una frecuencia de 100 MHz y funciona un 40 % más rápido que el 80486 DX2 de 66 MHz. 80486 también tiene un tipo mejorado SL, que tiene un modo de administración del sistema y se usa en computadoras portátiles o computadoras de escritorio que ahorran energía. La estandarización y miniaturización de las CPU ha hecho que este tipo de equipos digitales (traducidos como "piezas electrónicas" en Hong Kong) aparezcan con más frecuencia en la vida moderna. Las unidades centrales de procesamiento (Intel)
son mucho más comunes que los ordenadores. dedicado a aplicaciones limitadas. Los microprocesadores modernos se encuentran en todo, desde automóviles hasta teléfonos móviles y juguetes para niños.
Edite los indicadores de rendimiento de este párrafo
Frecuencia principal
La frecuencia principal también se llama frecuencia de reloj. La unidad es megahercios (MHz) o gigahercios (. GHz). Se utiliza para indicar la velocidad de funcionamiento de la CPU y el procesamiento de datos. Frecuencia principal de la CPU = FSB × factor de multiplicación de frecuencia. Existe una cierta relación entre la frecuencia principal y la velocidad de computación real, pero no es una relación lineal simple. Por lo tanto, la frecuencia principal de la CPU no está directamente relacionada con la potencia de computación real de la CPU. Oscilación de la señal de pulso digital en la velocidad de la CPU. También puede ver ejemplos de esto en los productos de procesador de Intel: los chips Itanium de 1 GHz pueden funcionar casi tan rápido como los Xeon/Opteron de 2,66 GHz, o los Itanium 2 de 1,5 GHz son tan rápidos como los Xeon/Opteron de 4 GHz. Igual de rápido. La velocidad de cálculo de la CPU también depende de los indicadores de rendimiento de la tubería, bus, etc. de la CPU.
FSB
El FSB es la frecuencia base de la CPU, en MHz. El FSB de la CPU determina la velocidad de funcionamiento de toda la placa base.
En términos sencillos, en las computadoras de escritorio, el llamado overclocking se refiere al overclocking del FSB de la CPU (por supuesto, en circunstancias normales, el multiplicador de la CPU está bloqueado, creo que esto se entiende bien). Pero para las CPU de servidor, el overclocking no está permitido en absoluto. Como se mencionó anteriormente, la CPU determina la velocidad de funcionamiento de la placa base. Las dos se ejecutan sincrónicamente. Si se overclockea la CPU del servidor y se cambia el FSB, se producirá una operación asincrónica (muchas placas base de escritorio admiten la operación asincrónica). servidor para ejecutarse de forma asincrónica. Inestabilidad del sistema. En la mayoría de los sistemas informáticos actuales, el FSB y el bus frontal de la placa base no están a la misma velocidad, y las frecuencias del FSB y del FSB se confunden fácilmente.
Frecuencia del bus frontal (FSB)
La frecuencia del bus frontal (FSB) (es decir, la frecuencia del bus) afecta directamente la velocidad del intercambio directo de datos entre la CPU y la memoria. Existe una fórmula que se puede calcular, es decir, ancho de banda de datos = (frecuencia del bus × ancho de bits de datos) / 8. El ancho de banda máximo de transmisión de datos depende del ancho y la frecuencia de transmisión de todos los datos transmitidos simultáneamente. Por ejemplo, el Xeon Nocona actual que admite 64 bits tiene un bus frontal de 800 MHz. Según la fórmula, su ancho de banda máximo de transmisión de datos es de 6,4 GB/segundo. Unidad Central de Procesamiento (Intel)
La diferencia entre FSB y frecuencia FSB: la velocidad de FSB se refiere a la velocidad de transmisión de datos, y FSB es la velocidad de operación sincrónica entre la CPU y la placa base. En otras palabras, el FSB de 100MHz se refiere específicamente a la señal de pulso digital que oscila 100 millones de veces por segundo, mientras que el bus frontal de 100MHz se refiere a la cantidad de transmisión de datos que la CPU puede aceptar por segundo, que es 100MHz×64bit÷8bit; /Byte=800MB/s . De hecho, la aparición de la arquitectura "HyperTransport" ha cambiado la frecuencia real del bus frontal (FSB). La arquitectura IA-32 debe tener tres componentes importantes: concentrador de controlador de memoria (MCH), concentrador de controlador de E/S y concentrador PCI, como los conjuntos de chips típicos de Intel, los conjuntos de chips Intel 7501 e Intel7505, que son procesadores Xeon duales hechos a medida, los MCH. contiene proporciona un bus frontal con una frecuencia de 533 MHz para la CPU. Con memoria DDR, el ancho de banda del bus frontal puede alcanzar 4,3 GB/segundo. Sin embargo, a medida que el rendimiento del procesador continúa mejorando, también trae muchos problemas a la arquitectura del sistema. La arquitectura "HyperTransport" no solo resuelve el problema, sino que también mejora el ancho de banda del bus de manera más efectiva, como en los procesadores AMD Opteron. La arquitectura flexible del bus HyperTransport I/O le permite integrar el controlador de memoria, de modo que el procesador no transmite datos. a través del bus del sistema. El chipset intercambia datos directamente con la memoria. En este caso, la frecuencia del bus frontal (FSB) no sabe por dónde empezar a hablar de los procesadores AMD Opteron.
Bits de CPU y longitudes de palabras
Unidad Central de Procesamiento (Texas Instruments)
Bits: el binario se utiliza en circuitos digitales y tecnología informática, y el código es solo "0" " y "1", de los cuales "0" o "1" son un "bit" en la CPU. Longitud de palabra: en tecnología informática, la cantidad de dígitos binarios que la CPU puede procesar a la vez por unidad de tiempo (al mismo tiempo) se denomina longitud de palabra. Por lo tanto, una CPU que puede procesar datos con una longitud de palabra de 8 bits suele denominarse CPU de 8 bits. De la misma manera, una CPU de 32 bits puede procesar datos binarios con una longitud de palabra de 32 bits por unidad de tiempo. La diferencia entre longitud de byte y palabra: dado que los caracteres ingleses de uso común se pueden representar mediante binario de 8 bits, los 8 bits generalmente se denominan byte. La longitud de la palabra no es fija y la longitud de la palabra es diferente para diferentes CPU. Una CPU de 8 bits solo puede procesar un byte a la vez, mientras que una CPU de 32 bits puede procesar 4 bytes a la vez. De manera similar, una CPU de 64 bits puede procesar 8 bytes a la vez.
Factor de multiplicación
El factor de multiplicación se refiere a la relación proporcional relativa entre la frecuencia principal de la CPU y el FSB. Bajo el mismo FSB, cuanto mayor sea el multiplicador de frecuencia, mayor será la frecuencia de la CPU. Pero, de hecho, bajo la premisa del mismo FSB, una CPU con alto multiplicador en sí misma tiene poca importancia. Esto se debe a que la velocidad de transmisión de datos entre la CPU y el sistema es limitada. Una CPU que persigue ciegamente una frecuencia principal alta y obtiene un multiplicador alto tendrá un efecto de "cuello de botella" obvio: la velocidad máxima a la que la CPU obtiene datos del sistema. El sistema no puede satisfacer los requisitos de velocidad de procesamiento de la CPU.
Generalmente, a excepción de las muestras de ingeniería, las CPU Intel tienen multiplicadores bloqueados. Un pequeño número de ellas, como el Intel Core 2 core Pentium Dual-Core E6500K y algunas CPU Extreme Edition, no bloquean los multiplicadores. el multiplicador antes. Ahora AMD ha lanzado la versión de caja negra de la CPU (es decir, la versión del multiplicador no está bloqueada, el usuario puede ajustar el multiplicador libremente y el método de overclocking para ajustar el multiplicador es mucho más estable que ajustar el FSB). .
Caché
El tamaño de la caché también es uno de los indicadores importantes de la CPU, y la estructura y el tamaño de la caché tienen un gran impacto en la velocidad de ejecución de la CPU. El caché en la CPU es extremadamente alto, generalmente funciona a la misma frecuencia que el procesador y su eficiencia de trabajo es mucho mayor que la de la memoria del sistema y el disco duro. En el trabajo real, la CPU a menudo necesita leer el mismo bloque de datos repetidamente, y el aumento en la capacidad de la caché puede mejorar en gran medida la tasa de aciertos de lectura de datos dentro de la CPU sin tener que buscarlos en la memoria o el disco duro, mejorando así el sistema. actuación. . Sin embargo, debido a factores como el costo y el área del chip de la CPU, el caché es muy pequeño. La caché L1 (caché de nivel uno) es la caché de primer nivel de la CPU, que se divide en caché de datos y caché de instrucciones. La capacidad y la estructura del caché L1 incorporado tienen un mayor impacto en el rendimiento de la CPU. Sin embargo, la memoria caché está compuesta de RAM estática y tiene una estructura complicada. Cuando el área de la CPU no puede ser demasiado grande, la capacidad. del caché L1 no es suficiente. Probablemente sea demasiado grande. La capacidad de la caché L1 de una CPU de servidor general suele ser de 32 a 256 KB. La caché L2 (caché de segundo nivel) es la caché de segundo nivel de la CPU, que se divide en chips internos y externos. La caché L2 interna en el chip se ejecuta a la misma velocidad que la frecuencia principal, mientras que la caché L2 externa solo se ejecuta a la mitad de la frecuencia principal. La capacidad de la caché L2 también afectará el rendimiento de la CPU. El principio es que cuanto más grande, mejor. En el pasado, la capacidad más grande de las CPU domésticas era de 512 KB. Ahora también puede alcanzar los 2 M en las CPU. servidores y estaciones de trabajo es mayor. Puede alcanzar más de 8M. La caché L3 (caché de nivel 3) se divide en dos tipos: la anterior era externa y las actuales están integradas. Su efecto real es que la aplicación de caché L3 puede reducir aún más la latencia de la memoria y mejorar el rendimiento del procesador al calcular grandes cantidades de datos. Reducir la latencia de la memoria y mejorar las capacidades informáticas de grandes cantidades de datos son muy útiles para los juegos. En el campo del servidor, agregar caché L3 todavía tiene una mejora significativa en el rendimiento. Por ejemplo, una configuración con una caché L3 más grande utilizará la memoria física de manera más eficiente, por lo que puede manejar más solicitudes de datos que un subsistema de E/S de disco más lento. Los procesadores con cachés L3 más grandes proporcionan un comportamiento de caché del sistema de archivos más eficiente y longitudes de cola de mensajes y procesadores más cortas. De hecho, el primer caché L3 se aplicó al procesador K6-III lanzado por AMD. El caché L3 en ese momento estaba limitado por el proceso de fabricación y no estaba integrado en el chip, sino en la placa base. La caché L3, que sólo se puede sincronizar con la frecuencia del bus del sistema, en realidad no es muy diferente de la memoria principal. Posteriormente, el procesador Intel Itanium utilizó la caché L3 para el mercado de servidores. Luego están el P4EE y el Xeon MP. Intel también planea lanzar un procesador Itanium2 con 9 MB de caché L3 y, más adelante, un procesador Itanium2 de doble núcleo con 24 MB de caché L3. Pero básicamente la caché L3 no es muy importante para mejorar el rendimiento del procesador. Por ejemplo, el procesador Xeon MP equipado con 1 MB de caché L3 todavía no es el oponente de Opteron. Se puede ver que el aumento del bus frontal. Es más efectivo que el aumento de la caché. Mejoras de rendimiento.
Conjunto de instrucciones extendido de la CPU
La CPU se basa en instrucciones del sistema informático y de control. Cada CPU está diseñada con una serie de sistemas de instrucciones que coinciden con su circuito de hardware. La solidez de las instrucciones también es un indicador importante de la CPU. El conjunto de instrucciones es una de las herramientas más eficaces para mejorar la eficiencia de los microprocesadores.
Desde la arquitectura convencional actual, el conjunto de instrucciones se puede dividir en dos partes: conjunto de instrucciones complejo y conjunto de instrucciones reducido (hay cuatro tipos de conjuntos de instrucciones desde la perspectiva de aplicaciones específicas, como MMX (Multi Media Extended) de Intel). es el nombre completo adivinado por AMD, Intel no explicó la etimología), SSE, SSE2 (Streaming-Instrucción única datos múltiples-Extensiones 2), las series SSE3, SSE4 y 3DNow de AMD son conjuntos de instrucciones extendidas de la CPU, respectivamente mejoradas. Mejora las capacidades de procesamiento multimedia, gráficos e Internet de la CPU. El conjunto de instrucciones ampliado de la CPU suele denominarse "conjunto de instrucciones de la CPU". El conjunto de instrucciones SSE3 es también el conjunto de instrucciones más pequeño actualmente. Anteriormente, MMX contenía 57 comandos, SSE contenía 50 comandos, SSE2 contenía 144 comandos y SSE3 contenía 13 comandos.
Núcleo de la CPU y voltaje de trabajo de E/S
A partir del 586CPU, el voltaje de trabajo de la CPU se divide en dos tipos: voltaje del núcleo y voltaje de E/S. Generalmente el voltaje del núcleo. El voltaje de la CPU es menor o igual que el voltaje de E/S. El tamaño del voltaje del núcleo está determinado por el proceso de producción de la CPU. Generalmente, cuanto más pequeño es el proceso de producción, menor es el voltaje de funcionamiento del núcleo; generalmente es de 1,6 ~ 5 V. El bajo voltaje puede resolver los problemas de consumo excesivo de energía y generación excesiva de calor.
Editar la arquitectura técnica de este párrafo
Proceso de fabricación
La micra del proceso de fabricación se refiere a la distancia entre los circuitos del IC. La tendencia en los procesos de fabricación es hacia una mayor densidad. Los diseños de circuitos IC de mayor densidad significan que los circuitos integrados del mismo tamaño pueden tener diseños de circuitos con mayor densidad y funciones más complejas. Ahora los principales son 180 nm, 130 nm, 90 nm, 65 nm y 45 nm. Recientemente, Inter lanzó la serie Core i3/i5 con proceso de fabricación de 32 nm. AMD declaró que sus productos se saltarán directamente el proceso de 32 nm (algunos productos de 32 nm se producirán en el tercer trimestre de 2010, como Orochi y Llano), y los productos de 28 nm se lanzarán a mediados de principios de 2011 (nombre indeciso) p>
Conjunto de instrucciones
(1) Conjunto de instrucciones CISC Conjunto de instrucciones CISC, también conocido como conjunto de instrucciones complejas, el nombre en inglés es CISC, (abreviatura de Computadora con conjunto de instrucciones complejas). En un microprocesador CISC, cada instrucción del programa se ejecuta en serie en orden y las operaciones de cada instrucción también se ejecutan en serie en orden. La ventaja de la ejecución secuencial es el control simple, pero la tasa de utilización de varias partes de la computadora no es alta y la velocidad de ejecución es lenta. De hecho, es la CPU de la serie x86 (es decir, arquitectura IA-32) producida por Intel y sus CPU compatibles, como AMD y VIA. Incluso el nuevo X86-64 (también llamado AMD64) pertenece a la categoría CISC.