Explicación detallada: Diez parámetros de procesador de productos de procesador de servidor

  
                  

Para muchas personas, quizás sepa más sobre los procesadores de PC, incluso los parámetros, la estructura de diseño y el rendimiento de la aplicación, pero en términos de CPU de servidor empresarial, debido a las diferentes plataformas, parámetros y consumo. La CPU tiene una diferencia muy obvia. En este sentido, el autor recopila la CPU del servidor, presenta brevemente los parámetros de los diez procesadores del servidor, ayuda a comprender mejor el papel de la aplicación de producto del procesador del servidor y puede mejorar la tecnología relacionada de los productos empresariales. Investigacion

1, la frecuencia del procesador del servidor

La frecuencia del procesador del servidor también se denomina frecuencia de reloj, la unidad es MHz, utilizada para indicar la velocidad de operación de la CPU. La frecuencia principal de la CPU = FSB × multiplicador. Mucha gente piensa que la velocidad del reloj determina la velocidad de la CPU, que no solo es unilateral, sino que también para el servidor, este entendimiento también se ha desviado. Hasta ahora, no existe una fórmula definitiva para lograr la relación numérica entre la frecuencia principal y la velocidad de computación real. Incluso los dos principales fabricantes de procesadores Intel y AMD tienen una gran controversia en este momento. Somos de Intel. La tendencia de desarrollo de los productos, se puede ver que Intel está muy enfocado en fortalecer su propio desarrollo de frecuencia. Al igual que otros fabricantes de procesadores, algunas personas han usado una Transmeta 1G rápida para comparar, su eficiencia operativa es equivalente al procesador Intel 2G.

Por lo tanto, la frecuencia principal de la CPU no está directamente relacionada con la potencia de cálculo real de la CPU. La frecuencia principal indica la velocidad a la que la señal de pulso digital oscila en la CPU. En los productos de procesadores de Intel, también podemos ver ejemplos de esto: el chip Itanium de 1 GHz puede comportarse casi tan rápido como el Xeon /Opteron a 2.66 GHz, o el Itanium 2 a 1.5 GHz es tan rápido como el Xeon /Opteron a 4 GHz. La velocidad de funcionamiento de la CPU depende del rendimiento de todos los aspectos de la tubería de la CPU.

Por supuesto, la frecuencia principal está relacionada con la velocidad de cómputo real. Solo se puede decir que la frecuencia principal es solo un aspecto del rendimiento de la CPU y no representa el rendimiento general de la CPU.

2. Frecuencia del bus frontal del servidor (FSB)

La frecuencia del bus frontal (FSB) (es decir, la frecuencia del bus) afecta directamente la velocidad de intercambio directo de datos entre la CPU y la memoria. Existe una fórmula que se puede calcular, es decir, ancho de banda de datos = (ancho de banda de datos x frecuencia de bus) /8, el ancho de banda máximo de transmisión de datos depende del ancho y la frecuencia de transmisión de todos los datos transmitidos simultáneamente. Por ejemplo, el soporte actual para Xeon Nocona de 64 bits, el bus frontal es de 800MHz, según la fórmula, su ancho de banda máximo de transmisión de datos es de 6.4GB /seg.

La diferencia entre el FSB y la frecuencia del bus frontal (FSB): la velocidad del bus frontal se refiere a la velocidad de transmisión de datos, y el FSB es la velocidad de operación síncrona entre la CPU y la placa principal. Es decir, el FSB de 100MHz se refiere específicamente a la señal de pulso digital que oscila 10 millones de veces por segundo, y el bus frontal de 100MHz se refiere a la cantidad de transmisión de datos aceptable por segundo. La CPU es de 100MHz × 64bit ÷ 8Byte /bit = 800MB /s.

De hecho, la aparición de la arquitectura "HyperTransport" ha cambiado la frecuencia del bus frontal (FSB) en este sentido práctico. Antes de que supiéramos que la arquitectura IA-32 debe tener tres componentes importantes: el controlador de memoria Hub (MCH), el controlador de E /S Hub y el PCI Hub, y el chipset Intel 7501 e Intel7505, que son de doble potencia. El procesador está hecho a medida, y el MCH que contiene proporciona un bus frontal con una frecuencia de 533 MHz para la CPU. Con la memoria DDR, el ancho de banda del bus frontal puede alcanzar los 4,3 GB /seg. Sin embargo, a medida que el rendimiento del procesador continúa aumentando, trae muchos problemas a la arquitectura del sistema.

La arquitectura "HyperTransport" no solo resuelve el problema, sino que también aumenta el ancho de banda del bus de manera más efectiva. Por ejemplo, el procesador AMD Opteron, la arquitectura flexible del bus de E /S HyperTransport, le permite integrar el controlador de memoria para el procesamiento. El dispositivo no pasa el bus del sistema al conjunto de chips e intercambia datos directamente con la memoria. En este caso, la frecuencia del bus frontal (FSB) no se conoce en el procesador AMD Opteron.

3, procesador FSB

FSB es la frecuencia de referencia de la CPU, la unidad también es MHz. El FSB de la CPU determina la velocidad de toda la placa. Para decirlo sin rodeos, en el escritorio, lo que llamamos overclocking es el FSB del FSB (por supuesto, el multiplicador de la CPU está bloqueado). Creo que esto se entiende bien. Pero para las CPU del servidor, el overclocking no está permitido. Como se mencionó anteriormente, la CPU determina la velocidad de funcionamiento de la placa base. Las dos se ejecutan de manera síncrona. Si la CPU del servidor está overclockeada y se cambia el FSB, se producirá una operación asíncrona.
(Muchas placas base del escritorio admiten la operación asíncrona) Esto causará que todo el servidor. El sistema es inestable.

En la mayoría de los sistemas informáticos, el FSB es también la velocidad de operación síncrona entre la memoria y la placa base. De esta manera, se puede entender que el FSB de la CPU está conectado directamente a la memoria para lograr la conexión entre los dos. Estado de funcionamiento síncrono. Las frecuencias FSB y Front Side Bus (FSB) se confunden fácilmente. El siguiente bus frontal nos introduce en la diferencia entre los dos. //Este artículo se transfirió desde www.45it.com.cn a la red de aplicaciones de hardware y software de computadora

4, bit de CPU y longitud de palabra

Bit: binario en circuitos digitales y tecnología informática, solo código “0” y “1”, donde “0” o “1” es un “bit” en la CPU.

Longitud de palabra: la cantidad de bits en una tecnología informática que puede procesarse una vez por tiempo de CPU (al mismo tiempo) por la CPU se denomina longitud de palabra. Por lo tanto, una CPU que puede procesar datos de 8 bits generalmente se denomina CPU de 8 bits. De manera similar, una CPU de 32 bits puede procesar datos binarios con una longitud de palabra de 32 bits por unidad de tiempo. La diferencia entre el byte y la longitud de la palabra: dado que los caracteres en inglés que se usan comúnmente se pueden representar mediante un binario de 8 bits, los 8 bits generalmente se llaman un byte. La longitud de la palabra no es fija, y la longitud de la palabra es diferente para diferentes CPU. Una CPU de 8 bits solo puede procesar un byte a la vez, mientras que una CPU de 32 bits puede procesar 4 bytes a la vez. Una CPU con la misma longitud de 64 bits puede procesar 8 bytes a la vez.

5, coeficiente multiplicador

El coeficiente multiplicador se refiere a la relación proporcional relativa entre la frecuencia principal de la CPU y la frecuencia externa. En el mismo FSB, cuanto mayor sea el multiplicador, mayor será la frecuencia de la CPU. Pero, de hecho, bajo la premisa del mismo FSB, la CPU de alta frecuencia en sí no significa mucho. Esto se debe a que la velocidad de transmisión de datos entre la CPU y el sistema es limitada. La CPU que logra la multiplicación de alta frecuencia y la alta frecuencia tendrá un efecto obvio de "cuello de botella". La velocidad límite de la CPU para obtener datos del sistema no puede satisfacer la operación de la CPU. La velocidad En general, a excepción de la versión de ingeniería de la CPU de Intel, el multiplicador está bloqueado y AMD no tiene bloqueo antes.

6, caché de CPU

El tamaño del caché también es uno de los indicadores importantes del CPU, y la estructura y el tamaño del caché en la velocidad del CPU es muy grande, la frecuencia de ejecución del caché del CPU es muy alta, generalmente Funciona a la misma frecuencia que el procesador y su eficiencia de trabajo es mucho mayor que la memoria del sistema y el disco duro. En el trabajo real, la CPU a menudo necesita leer repetidamente el mismo bloque de datos, y el aumento de la capacidad de la memoria caché puede mejorar en gran medida la tasa de aciertos de los datos de lectura internos de la CPU, en lugar de mirar la memoria o el disco duro, mejorando así el rendimiento del sistema. . Sin embargo, debido al factor de costo y al área del chip de la CPU, el caché es muy pequeño.

L1 Cache es la primera capa de CPU cache, dividida en caché de datos y caché de instrucciones. La capacidad y la estructura de la memoria caché L1 incorporada tienen un gran impacto en el rendimiento de la CPU. Sin embargo, la memoria caché se compone de RAM estática. La estructura es más complicada. La capacidad de la memoria caché L1 no es grande cuando el área de troquel de la CPU no es demasiado grande. Puede ser demasiado grande. La capacidad de la memoria caché L1 de una CPU de servidor general suele ser de 32 a 256 KB.

L2 Cache (L2 Cache) es la segunda capa del CPU cache, dividida en chips internos y externos. La memoria caché interna del chip L2 se ejecuta a la misma velocidad que la frecuencia principal, mientras que la memoria caché externa L2 es solo la mitad de la frecuencia principal. La capacidad de la memoria caché L2 también afecta el rendimiento de la CPU. El principio es que cuanto más grande, mejor, la mayor capacidad de la CPU para uso doméstico es de 512 KB, y la memoria caché L2 para las CPU en servidores y estaciones de trabajo tiene una capacidad de hasta 256-1 MB, y algunas de ellas son de hasta 2 MB o 3 MB. .

Caché L3 (caché de tres niveles), dividido en dos, el primero es externo y ahora está integrado. El efecto práctico de esto es que las aplicaciones de caché L3 pueden reducir aún más la latencia de la memoria y mejorar el rendimiento de los procesadores en grandes volúmenes de datos. Reducir la latencia de la memoria y aumentar la cantidad de potencia de cómputo puede ser muy útil para los juegos. El aumento en la memoria caché L3 en el espacio del servidor sigue siendo una mejora significativa en el rendimiento. Por ejemplo, una configuración con un caché L3 más grande puede ser más eficiente con la memoria física, por lo que su subsistema de E /S de disco más lento puede manejar más solicitudes de datos. Los procesadores con cachés L3 más grandes proporcionan un comportamiento de almacenamiento en caché del sistema de archivos más eficiente y una menor cola de mensajes y procesadores.

De hecho, la primera caché L3 se aplicó al procesador K6-III lanzado por AMD. En ese momento, la caché L3 estaba limitada por el proceso de fabricación y no estaba integrada en el chip, sino que estaba integrada en la placa base. El caché L3, que solo puede sincronizarse con la frecuencia del bus del sistema, no es muy diferente de la memoria principal. Más tarde, el uso del caché L3 fue el procesador Itanium de Intel para el mercado de servidores. Luego está P4EE y Xeon MP. Intel también planea introducir un procesador Itanium2 en caché de 9MB L3 y un procesador Itanium2 de doble núcleo con caché de 24MB L3.

Pero básicamente el caché L3 no es muy importante para mejorar el rendimiento del procesador. Por ejemplo, el procesador Xeon MP con 1 MB de caché L3 aún no es el oponente de Opteron. Se puede ver que el bus frontal es más caro que el caché. Los aumentos traen ganancias de rendimiento más efectivas.

7, conjunto de instrucciones extendidas de la CPU

La CPU se basa en instrucciones para calcular y controlar el sistema, cada CPU está diseñada para especificar una serie de sistemas de instrucción que coinciden con su circuito de hardware. La fuerza de la instrucción también es un indicador importante de la CPU. El conjunto de instrucciones es una de las herramientas más efectivas para mejorar la eficiencia del microprocesador. A partir de la arquitectura general actual, el conjunto de instrucciones se puede dividir en dos partes: conjunto de instrucciones complejo y conjunto de instrucciones reducido. Desde la aplicación específica, como MMX de Intel (multimedios extendidos), SSE, SSE2 (instrucción múltiple de transmisión única) -Las extensiones 2), SEE3 y 3DNow! De AMD son todos conjuntos de instrucciones extendidas de CPU, que mejoran las capacidades de procesamiento multimedia, gráficos e Internet de la CPU.

Por lo general, nos referimos al conjunto de instrucciones extendidas de la CPU como el "conjunto de instrucciones de la CPU". El conjunto de instrucciones SSE3 es también el conjunto de instrucciones más pequeño en la actualidad. Anteriormente, MMX contenía 57 comandos, SSE contenía 50 comandos, SSE2 contenía 144 comandos y SSE3 contenía 13 comandos. SSE3 es también el conjunto de instrucciones más avanzado. El procesador Intel Prescott ya es compatible con el conjunto de instrucciones SSE3. AMD agregará soporte para el conjunto de instrucciones SSE3 en futuros procesadores de doble núcleo. Los procesadores de Transmeta también admitirán este conjunto de instrucciones.

8, el núcleo de la CPU y el voltaje de funcionamiento de E /S

A partir de 586CPU, el voltaje de funcionamiento de la CPU se divide en voltaje de núcleo y voltaje de E /S, por lo general, el voltaje de núcleo de la CPU es menor o igual a I /O voltaje. El tamaño del voltaje del núcleo se determina de acuerdo con el proceso de producción de la CPU. Cuanto menor sea el proceso general de fabricación, menor será el voltaje de funcionamiento del núcleo; el voltaje de E /S es generalmente de 1.6 a 5V. La baja tensión puede resolver el problema del consumo excesivo de energía y el calor excesivo.

9. Proceso de fabricación

El proceso de fabricación de micras se refiere a la distancia entre el circuito y el circuito dentro del IC. La tendencia en los procesos de fabricación es avanzar hacia concentraciones más altas. Cuanto mayor sea la densidad del diseño del circuito de IC, significa que en el mismo tamaño de área del IC, puede tener un diseño de circuito de mayor densidad y más complejo. Ahora los principales 180nm, 130nm, 90nm. Recientemente, el funcionario ha indicado que hay un proceso de fabricación de 65nm.

10, paquete de paquete

El paquete de la CPU es un material específico para reparar el chip de la CPU o el módulo de la CPU para evitar daños, generalmente debe empaquetarse después de que la CPU pueda ser entregada al usuario. La forma en que se empaqueta la CPU depende de la instalación de la CPU y el diseño de integración del dispositivo. De una clasificación grande, las CPU que normalmente se instalan con zócalos se empaquetan en el modo PGA (Grid Array), mientras que las CPU que se instalan en las ranuras Slot x usan SEC. En la forma de un paquete (caja de conector de un solo lado). También existen tecnologías de embalaje como PLGA (Plastic Land Grid Array) y OLGA (Organic Land Grid Array). Debido a la competencia cada vez más feroz del mercado, la dirección de desarrollo actual de la tecnología de empaquetado de la CPU se basa principalmente en el ahorro de costos.

Copyright © Conocimiento de Windows All Rights Reserved