El análisis de fallas de los tres componentes principales del servidor

  
Pero debido a las muchas similitudes entre el servidor X86 y el escritorio, existen muchas similitudes entre el pre-despliegue, el mantenimiento a medio plazo y el post-management. Por lo tanto, aunque el servidor X86 tiene una arquitectura madura y estable, inevitablemente parecerá "atacar". En particular, la aplicación de carga empresarial es mucho más, y las fallas encontradas son muy comunes. Compartir las fallas de los tres componentes principales y compartirlas con todos puede evitar que todos aparezcan en las plataformas de negocios futuras.
Server Core --cpu
grado de daño: ★
culpa
reproducción: Pruebas realizadas amigos saben, una basada en servidor Intel Xeon, arrancar sin pantalla, la locura de indicadores del sistema El parpadeo, la sospecha más directa, es que la CPU y la placa base no están bien conectadas, pero reemplazarlo con otro zócalo de CPU en la placa base de varios servidores todavía no responde.
Solución
: En esta situación la medida, la tensión realmente CPU anormal, la CPU es el VRM original (VoltageRegulatorModule, un módulo regulador de tensión) falla, no puede ser realizado en el circuito convertidor DC placa base, no la CPU Proporciona una tensión de funcionamiento estable, por lo que solo puede reemplazar la CPU.
creo que este fracaso es más grave, el daño a la CPU conducirá directamente a todo el servidor no está disponible, pero la seguridad de la CPU en sí es muy alta tasa de fracaso, muy bajo. Por lo tanto, en las tareas de mantenimiento diario, la interrupción del servicio causada por el daño de la CPU es relativamente rara y su grado de daño no es demasiado alto. Si se trata de un servidor multidireccional, no es necesario preocuparse por la falla del servidor causada por el daño de la CPU. Además
plataforma de servidor de dos núcleos, que la memoria y el disco duro, específico a la memoria seleccionada, la memoria del servidor y la memoria de escritorio en general, hay algunas diferencias. Los usuarios que observaron cuidadosamente la memoria del servidor encontrarán que la memoria del servidor generalmente tiene 9 chips en un lado en comparación con el diseño de 8 partículas de una sola cara de la memoria normal. Esto es lo que a menudo llamamos memoria ECC. servidor
el rendimiento de lectura - memoria
grado de daño: ★★ ☆
culpa de reproducción: Antes de que un servidor en dos instalado 2 GB de RAM, debido a que el servicio en sí lleva demasiado Más aún, los datos de procesamiento del servidor se vuelven cada vez más lentos, por lo que el servidor se actualiza agregando dos tarjetas de memoria del mismo modelo. Después de insertar todas estas memorias en la placa base, el sistema detecta solo 6 GB y los otros 2 GB de memoria desaparecen misteriosamente. La nueva memoria aún no se puede detectar normalmente.
Solución
: sitio oficial del producto de servidor, el caso se debe a que las ranuras de memoria del servidor están emparejados, 1-4,2-5,3-6,7-10,8-11 9-12, la nueva memoria se inserta en 2, 3 ranuras, no puede formar un emparejamiento, naturalmente solo se puede detectar una memoria, la memoria se inserta en 5 ranuras, la memoria de 8GB se detecta con éxito.
ventaja de memoria visible, el servidor no sólo se refleja en el rendimiento, también puso mucho esfuerzo en la tolerancia a fallos, el propósito es proporcionar un entorno de alto y estable para toda la plataforma, la memoria se ha mencionado anteriormente utiliza ECC (comprobación y corrección de errores Tecnología, registro, Chipkill son para mejorar la estabilidad de la memoria, de modo que la integración entre los distintos módulos de memoria y ranuras.
como una terminal de almacenamiento de servidor, relación de trabajo estable duro para asegurar los datos corporativos, el disco duro del servidor es el núcleo del almacén de datos, todo el software y los datos se almacenan aquí, por lo que la estabilidad del disco duro del servidor y la fiabilidad Tiene requisitos muy altos. Además
, el servidor requiere generalmente 24/7 funcionamiento continuo, el disco duro tiene 24 horas de funcionamiento sin parar. Por lo tanto, los discos duros del servidor tienen altos requisitos de estabilidad y confiabilidad. Existen tres tipos de discos duros utilizados en el mercado de servidores, incluidos los discos duros SATA, los discos duros SCSI y los discos duros SAS. Entre ellos, los discos duros SATA se utilizan principalmente en servidores de gama baja, mientras que los discos duros SCSI y SAS están dirigidos a servidores de gama media y alta. núcleo de la memoria del servidor
- dura
grado de daño: ★★ ☆
culpa de reproducción: Cada servidor se bloqueará, no hay signos de reinicio, si es frecuente, lo hará por los datos Después de que el personal central de operaciones y mantenimiento de TI realizó la prueba, se encontró que el disco duro funcionó durante demasiado tiempo y que había una mala pista física. Por lo tanto, es la mejor solución para hacer una copia de seguridad y reemplazar el disco duro inmediatamente. Los datos en el disco duro se exportan. Como resultado, durante el proceso de transferencia de datos, los errores de E /S aparecen continuamente, lo que hace que la velocidad de transferencia de datos sea muy lenta y se pierda. Una gran cantidad de datos importantes.
Solución
: La mayoría de estos casos se ha producido el error cabeza o disco. Si el disco duro está rayado, pero el área no es grande, la empresa profesional puede restaurar los datos al reemplazar la cabeza magnética y recuperar más del 95% de los datos. Esta situación es relativamente afortunada.
pero por lo general dice que tomar medidas preventivas de manera oportuna si los defectos encontrados, que resolverse antes de que nadie es más daño físico en el disco aparecerá tan pronto moderada a daño del disco severa, pérdida permanente de datos, con el fin de evitar este tipo de situación se produjo recomienda hacer lo siguiente:
de la elección difícil de disco duro del servidor profesional, por ejemplo: MTBF más de 1,6 millones de horas, la tasa de fracaso anual de menos del 0,55%, aspectos sísmicos tienen 300G /Más de 2 ms de resistencia al impacto, etc., además de la aplicación de la tecnología RAID array del servidor, como: RAID5, que consta de al menos tres unidades de disco duro, mientras escribe información de datos en el disco duro, también escribe información de verificación, cuando hay Cuando falla un disco duro, los datos del disco duro defectuoso se pueden obtener de los otros dos discos duros según el algoritmo, y la seguridad se mejora considerablemente.
fallo por encima de tres componentes
sólo un breve iniciar una discusión, de hecho, no se limita a estos puntos en términos de fallo del servidor, el módulo de gestión de energía y la tarjeta también tiene un problema similar, espero una gran cantidad de usuarios en la aplicación Acumule la experiencia, minimice la incidencia de fallas y proporcione un entorno de aplicaciones de TI estable y flexible.
Copyright © Conocimiento de Windows All Rights Reserved