La resolución de fallas blandas comunes del servidor

  

La falla del software del servidor es la proporción más alta de fallas del servidor, representando alrededor del 70%, y el proceso de resolución debe ser más reflexivo. Las causas de la falla ocurre software de servidor, hay muchos, la más común es la versión del BIOS del servidor es demasiado bajo, los conductores, los servidores de software de gestión o servidores tienen ERROR, fallo de software conflictos entre aplicaciones y el hombre. El siguiente es un ejemplo de cómo reparar varios tipos de fallas de software.

Hay un servidor HP LH6000R configurado como un PIII XEON 700 dual con 2M CPU caché y 512M memoria. Después de arranque, el sistema registra un mensaje de error de excepción módulo regulador de voltaje (VRM), se da la información: "Regulador de voltaje Módulo (VRM) sobre /bajo voltaje 2.88V /0V". En la superficie, es muy probable que el módulo de regulación de voltaje del servidor u otro hardware haya fallado, lo que probablemente haga que el personal de mantenimiento piense que se trata de una falla de hardware. El personal de mantenimiento probó de inmediato el hardware en otros LH6000R y descubrió que, incluso con nuevos accesorios, el servidor seguía reportando errores de VRM. Después simplemente no hacer nada cuando los ingenieros de mantenimiento lleva la última consejo de administración de la CPU (Control de Gestión de la CPU) del firmware (firmware), a continuación, actualizar sector de gestión de firmware de la CPU, el servidor volvió a la normalidad inmediatamente.

método de actualización de firmware es para extraer el NAVIGATOR servidor (CD de navegación) en el consejo de administración de la CPU programa de firmware de actualización (CMC), el programa es Flash.exe, a continuación, descargar desde el LH6KC.BIN de Internet (Gestión de la CPU Copie el FIRMWARE de la placa en un disco de arranque de DOS y use este disco para iniciar el servidor. Luego ejecute "FLASH /CMC A: LH6KC.BIN" en DOS y reinicie el servidor una vez que se complete la actualización. Este método de actualización es también adecuado para el BIOS del sistema, etc., pero con diferentes parámetros y actualizar los comandos de actualización del firmware y nombres de archivo diferentes parámetros del BIOS ver la descripción del servidor.

Firmware y cualquier servidor tendrán un ERROR BIOS diferente, porque ERROR inevitable, por lo que puede no creen erróneamente que el programa BIOS del servidor es muy sólida, y deben actualizar periódicamente el BIOS y el firmware del servidor, Solo tenga cuidado antes de actualizar, la forma incorrecta de actualizar puede llevar a consecuencias graves.

popular en servidores de gama alta tienen procedimientos de gestión fuertes, para proporcionar a los clientes una manera conveniente de manejar; servidor también tiene una variedad de controladores del sistema operativo, para facilitar a los clientes en una variedad de sistemas operativos Utilizar. Sin embargo, cualquier programa en el mundo tendrá algunos errores, estos errores afectarán al usuario. Sin embargo, los proveedores de servidores siempre desarrollarán nuevos programas en primer lugar, y los clientes solo necesitan actualizar estos programas a tiempo para evitar tales fallas.

Cuando la falla del software del servidor es tal, el fenómeno del rendimiento no es el mismo. En general, el programa de gestión ERROR dará lugar a la lentitud del sistema, la tasa de ocupación de la CPU es, no uso normal alto ciertas funciones; ERROR conductor puede conducir a accidentes, conflictos con cierto tipo de software, tales como inestabilidad del disco. La mejor manera de ver si el hipervisor es incorrecto es deshabilitar primero dichas herramientas de administración en el sistema y luego observar si el servidor todavía es anormal. Dado que la herramienta de administración se inicia al arrancar el sistema, debe evitarse primero. Tome WINDOWS NT4 como ejemplo, primero deshabilite algunos servicios de software del servidor en el servicio de herramientas de administración y luego modifique los elementos de inicio en el registro. Si hay un problema con el controlador, ingrese el sistema en modo seguro para ver si es normal. Sin embargo, se debe tener en cuenta que en el modo seguro, es normal que el sistema se ralentice (especialmente para la E /S del disco).

Los administradores del servidor siempre deben descargar las últimas herramientas y controladores de administración en el sitio web del servidor. Esto reducirá la ocurrencia de una gran parte de la falla del software.

Por el contrario, el diagnóstico de fallas causado por conflictos de software es difícil y requiere que los gerentes tengan una experiencia rica y una observación aguda.

Había un amigo que me dijo que tenía un servidor Inspur que no podía instalar SQL SERVER 2000. Había reinstalado NT NT veces y el sistema estaba defectuoso. Y este único servidor será un servidor de base de datos muy importante, por lo que es muy urgente. Así que acompañé a mi amigo a su compañía para comprobarlo. La sala de servidores donde se ubica este servidor es una sala de computadoras muy estándar y completa. Comprobé la situación de este servidor y descubrí que no hay fallas de hardware, lo que elimina la posibilidad de una mala lectura de la unidad de disco óptico. Sin embargo, el CD de SQL SERVER 2000 grabado de mi amigo me hizo sospechar, le pedí que sacara la instalación original del SERVIDOR SQL, pero el resultado sigue sin ser. En el proceso de instalación, no hay ningún error leve, pero se cerrará automáticamente cuando se ejecute, sin ningún aviso. Sin embargo, encontré un mensaje en el registro del sistema del Visor de eventos en la herramienta de administración: windata.exe provocó un desbordamiento de datos no válido. Windata es un programa escrito por un amigo, y es un programa que se inicia cuando se inicia el sistema operativo. Inmediatamente terminé este proceso, y luego ejecutando SQL todo funciona bien.

Para tales fallas de software, el operador debe primero verificar los registros relevantes para ver si hay procesos sospechosos en el sistema. El servidor actual es de gama alta o baja, y el soporte para programas estándar como SQL es bastante confiable, por lo que el objetivo de la eliminación es terminar el proceso sospechoso.

También hay un fallo de software causado por factores humanos, es generalmente el error humano (sin incluir la operación por el flujo de la operación), apagado inesperado (no incluyendo la fuente de alimentación brusco) o una normalmente cerrada debido a la aplicación .

Los factores de error humano se pueden evitar fortaleciendo la gestión. Aquí hay una descripción detallada del método de apagado accidental o procedimientos de apagado anormales causados ​​por fallas.

Es muy importante cerrar el programa del sistema normalmente, especialmente el servidor WEB. Uno de mis amigos experimentó una experiencia de corrupción de datos o incluso pérdida porque no cerraron el programa del sistema correctamente. Mi amigo está usando el servidor de alojamiento web HP, por lo que le proporcioné algunas reglas de uso.

Estos métodos son muy efectivos para el mantenimiento del servidor, incluido el cierre correcto del programa del sistema, cómo evitar la pérdida de datos y el método de recuperación después de un cierre anormal del sistema. Tomemos como ejemplo el dispositivo del servidor de alojamiento web HP de mi amigo (usando UNIX, pero la idea es válida para otros sistemas operativos).
El proceso de apagado correcto incluye apagar el sistema presionando el botón de Encendido. Debe mantener presionado el interruptor de encendido durante unos segundos para que el sistema se apague normalmente.

Además, con el fin de evitar la pérdida de datos, debe seguir los siguientes pasos:

· copias de seguridad de datos de Web Hosting Server Appliance se puede hacer a través de la interfaz de gestión de red.

· Instalación y provisto de una segunda unidad de disco duro con la imagen original,

Una vez Apliance servidor no se cierra correctamente, y no se restablece, restaurar las siguientes operaciones:

1. Cuando el dispositivo se haya apagado, conecte un cable serie sin módem (que se encuentra en la caja) al puerto de control en la parte posterior.

2. Conecte el otro extremo del cable serie al puerto serie de una PC con Windows.

3. Ejecute el HyperTerminal y configure los parámetros del puerto en 19200, n-8-1, Control de flujo - Ninguno. Puede ver el indicador de control del dispositivo y pedirle que ingrese al administrador. Contraseña

4. Reinicie el dispositivo y espere hasta que aparezca el mensaje "LILO boot:", mantenga presionada la tecla Tab durante 5 segundos hasta que el mensaje cambie a "boot:".

5. Escriba " emergencia " y presione Entrar. En este punto, debe esperar pacientemente unos minutos. Luego, volverá a aparecer el mensaje de inicio de sesión. En este punto, la pantalla LCD volverá a funcionar.

6. Seleccione una contraseña aleatoria en la pantalla LCD (esta contraseña solo se usa para la recuperación de emergencia)

Vaya a Predeterminados ... y presione la tecla de flecha derecha para seleccionarla.
Vaya a Contraseña de raíz ... y presione la tecla de flecha derecha para seleccionarla.
Gire a Aleatorio y presione la tecla de flecha hacia la derecha para seleccionar, lo que solicitará una contraseña generada aleatoriamente.
Anote esta contraseña.
Gire a Sí y presione la tecla de la flecha hacia la derecha para seleccionar, la contraseña del sistema se cambiará de inmediato.
7. Regrese a la pantalla de control del hipervínculo, inicie sesión en el dispositivo, use el " root " nombre de usuario y la contraseña ahora mismo, y aparecerá el símbolo "#".

8. Para fijar la partición, proceder como sigue:

para SA1100, la secuencia de entrada:
[...] #: fsck /dev /hda5

[...] #: fsck /dev /hda6

[...] #: fsck /dev /hda7

para sa1120, la secuencia de entrada:
[...] #: fsck /dev /sda5

[...] #: fsck /dev /sda6

[...] #: fsck /dev /sda7

cuando se han reparado todas las particiones, debe Vuelva al indicador "#".

9. Introduzca "reiniciar" para reiniciar el sistema.

Si el sistema aún no se inicia, registre el contenido del panel de control y solicite asistencia técnica.

Por la falla del software del servidor, siempre que el administrador preste atención al mantenimiento, debe evitarse.

Copyright © Conocimiento de Windows All Rights Reserved