3 principales fallas de hardware del servidor han encontrado

  

Hoy en día, cuando se habla de la CPU de la plataforma del servidor X86, muchas personas pueden tener una gran cantidad de productos de Intel y de los dos gigantes de chip de AMD, desde el Xeon 5400 anterior hasta el mainstream. Strong 5600, Xeon 7500 y el potente procesador x86 de AMD de 12 núcleos "Magny-Cours" (Manicourt) y así sucesivamente. Al mismo tiempo, los otros dos núcleos del servidor no se pueden subestimar en función de la CPU. Los componentes con ECC, ChipKill, tecnología de intercambio en caliente y discos duros RAID que evitan la pérdida de datos se crean conjuntamente para crear un servidor X86 sólido.

Pero debido a las muchas similitudes entre los servidores X86 y los equipos de escritorio, existen muchas similitudes, desde la implementación previa hasta el mantenimiento a mediano plazo y la administración posterior. Por lo tanto, aunque el servidor X86 tiene una arquitectura madura y estable, inevitablemente parecerá "atacar". En particular, la aplicación de carga empresarial es mucho más, y las fallas encontradas son muy comunes. Compartir las fallas de los tres componentes principales y compartirlas con todos puede evitar que todos aparezcan en las plataformas de negocios futuras.

Server Core - CPU

Nivel de riesgo: ★

Reproducción defectuosa: un amigo que ha probado sabe que uno se basa en el servidor Intel Xeon, no se muestra en el arranque, el sistema La luz indicadora se encendió de forma desenfrenada. La sospecha más directa era que la CPU estaba en mal contacto con la placa base, pero fue reemplazada por otro zócalo de CPU en la placa base de varios servidores.

Solución: En esta condición, el voltaje de la CPU es anormal. El VRM original (Módulo del regulador de voltaje) de la CPU ha fallado y la conversión del circuito de CC en la placa base no se puede realizar. La CPU se suministra con un voltaje de operación estable, de modo que solo la CPU puede ser reemplazada.

El autor cree que este fallo es relativamente fatal, el daño de la CPU provocará directamente la falta de disponibilidad de todo el servidor, pero la seguridad de la CPU en sí es muy alta y la tasa de fallas es extremadamente baja. Por lo tanto, en las tareas de mantenimiento diario, la interrupción del servicio causada por el daño de la CPU es relativamente rara y su grado de daño no es demasiado alto. Si se trata de un servidor multidireccional, no es necesario preocuparse por la falla del servidor causada por el daño de la CPU.

Los otros dos núcleos de la plataforma del servidor son la memoria y el disco duro. La elección específica de la memoria, la memoria del servidor y la memoria de escritorio ordinaria aún tienen algunas diferencias. Los usuarios que observaron cuidadosamente la memoria del servidor encontrarán que la memoria del servidor generalmente tiene 9 chips en un lado en comparación con el diseño de 8 partículas de una sola cara de la memoria normal. Esto es lo que a menudo llamamos memoria ECC.

Rendimiento de lectura del servidor - Memoria

Nivel de riesgo: ★★ ☆

Reproducción de fallas: Anteriormente en un servidor con 2 2GB de RAM instalada, debido a su propio portador Demasiados servicios, el servidor procesa los datos más rápido y más lento, así que actualice el servidor agregando dos módulos de memoria del mismo modelo. Después de insertar todas estas memorias en la placa base, el sistema detecta solo 6 GB y los otros 2 GB de memoria desaparecen misteriosamente. La nueva memoria aún no se puede detectar normalmente.

Solución: A través del sitio web oficial del producto servidor, esta situación se debe a que la ranura de memoria del servidor está emparejada, 1-4, 2-5, 3-6, 7-10, 8-11 9-12, la nueva memoria se inserta en 2, 3 ranuras, no puede formar un emparejamiento, naturalmente solo se puede detectar una memoria, la memoria se inserta en 5 ranuras, la memoria de 8GB se detecta con éxito.

Se puede ver que la ventaja de la memoria del servidor no solo se refleja en el rendimiento, sino que también pone mucho esfuerzo en la tolerancia a fallas. El propósito es proporcionar un entorno altamente estable para toda la plataforma. La memoria mencionada anteriormente usa ECC (verificación y corrección de errores) Tecnología, registro, Chipkill son para mejorar la estabilidad de la memoria, de modo que la integración entre los distintos módulos de memoria y ranuras.

Como terminal de almacenamiento del servidor, el funcionamiento estable del disco duro está relacionado con la seguridad de los datos empresariales. El disco duro del servidor es el almacén de datos principal. Aquí se almacenan todos los programas y datos, por lo que la confiabilidad y la estabilidad del disco duro del servidor son: Tiene requisitos muy altos.

Además, el servidor generalmente necesita 24 * 7 horas de operación sin interrupción, y su disco duro también debe funcionar 24 horas. Por lo tanto, los discos duros del servidor tienen altos requisitos de estabilidad y confiabilidad. Existen tres tipos de discos duros utilizados en el mercado de servidores, incluidos los discos duros SATA, los discos duros SCSI y los discos duros SAS. Entre ellos, los discos duros SATA se utilizan principalmente en servidores de gama baja, mientras que los discos duros SCSI y SAS están dirigidos a servidores de gama media y alta.

Core de almacenamiento del servidor - Disco duro

Nivel de riesgo: ★★ ☆

Reproducción defectuosa: cada servidor se bloqueará y se reiniciará sin previo aviso. Si ocurre con frecuencia, Después de las pruebas realizadas por el personal de operaciones y mantenimiento de TI del centro de datos, se encuentra que el tiempo de trabajo del disco duro es demasiado largo y aparecen sectores físicos defectuosos. Por lo tanto, es la mejor solución para hacer una copia de seguridad y reemplazar el disco duro inmediatamente. Los datos en el disco duro se exportan. Como resultado, durante el proceso de transferencia de datos, los errores de E /S aparecen continuamente, lo que hace que la velocidad de transferencia de datos sea muy lenta y se pierda. Una gran cantidad de datos importantes.

Solución: La mayoría de los casos son errores en la cabeza o en el disco. Si el disco duro está rayado, pero el área no es grande, la empresa profesional puede restaurar los datos al reemplazar la cabeza magnética y recuperar más del 95% de los datos. Esta situación es relativamente afortunada.

Pero generalmente se dice que la prevención no es posible. Si se encuentra la falla a tiempo, se resolverá antes de que el disco no tenga más daño físico. Una vez que el disco está dañado seriamente, los datos se perderán permanentemente. Para evitar esto. Se recomienda hacer lo siguiente:

En la elección del disco duro, necesita un disco duro de servidor profesional, como por ejemplo: el tiempo promedio entre fallas es más de 160,000 horas, la tasa anual de fallas es menor al 0.55% y la resistencia al terremoto es de 300G /Más de 2 ms de resistencia al impacto, etc., además de la aplicación de la tecnología RAID array del servidor, como: RAID5, que consta de al menos tres unidades de disco duro, mientras escribe información de datos en el disco duro, también escribe información de verificación, cuando hay Cuando falla un disco duro, los datos del disco duro defectuoso se pueden obtener de los otros dos discos duros según el algoritmo, y la seguridad se mejora considerablemente.

Las fallas de los tres componentes anteriores son solo una breve introducción. De hecho, la falla del servidor no se limita a estos puntos. Hay problemas similares en la fuente de alimentación, el módulo de administración y la tarjeta de red. Espero que los usuarios tengan más aplicaciones. Acumule la experiencia, minimice la incidencia de fallas y proporcione un entorno de aplicaciones de TI estable y flexible.

Copyright © Conocimiento de Windows All Rights Reserved