Tenga cuidado con los conflictos de dispositivos SCSI: Dispositivo \\ Dispositivo \\ Scsi \\ *** no responde dentro del tiempo de espera de transferencia

  

Ejemplo de posprocesamiento de la tarjeta SCSI extrapolable:

Acabo de llegar al cliente, es la administración de red del cliente. El miembro Xiao Liu irrumpió en la sala de máquinas. Resulta que el cliente es una cadena de supermercados con financiación extranjera relativamente grande en el área local y ha estado confiando en este sistema de back-office para comercio, contabilidad y liquidación. Una mañana, el personal de negocios dijo repentinamente que no se podía usar el sistema de verificación de la terminal. Xiao Liu descubrió que no se podía acceder a la base de datos del lado del servidor, por lo que se vio obligado a habilitar un conjunto de servicios de soporte de servidor en espera.

Pero el rendimiento del servidor en espera está lejos de satisfacer la demanda de carga de lectura frecuente de datos. Cuando el negocio de los supermercados está más ocupado, también es el momento en el que el servidor falla con mayor frecuencia, y los datos recién generados necesitan tiempo extra financiero. Ingrese manualmente el sistema original para completar la liquidación del día actual y del mes actual. Todos los empresarios se quejaron de Xiao Liu, e incluso el gerente siempre conocido vio el rostro sombrío de Xiao Liu en los últimos dos días.

Después de escuchar las quejas de Xiao Liu, examiné el entorno del usuario en detalle. El supermercado utilizó dos servidores basados ​​en IA para montar una matriz de discos SCSI como un sistema de dos nodos. El host adopta el sistema operativo de servidor avanzado Windows2000 y utiliza un sistema de contabilidad específico del supermercado. El fondo es SQLServer2000.


Los dos servidores utilizan el MSCS que viene con el sistema Windows para trabajar en el modo activo-pasivo maestro-esclavo. MSCS detecta, administra y cambia los grupos de recursos de la máquina dual para garantizar el SQL. El servicio siempre está funcionando. Debido a las largas horas de funcionamiento del supermercado, el servidor ha estado funcionando desde las 8:30 de la mañana, brindando a toda la base de datos y otros servicios de software para acceder a los datos; a las 20:00, el cliente se cierra y la solicitud de servicio se detiene; las 22:00 se utilizan para SQL La herramienta de administración integrada realiza una copia de seguridad de los datos del host y realiza una copia de seguridad de los datos del servidor en el disco.

Cuando se produjo el fallo de base de datos inaccesibles, Liu puso en marcha el primer conjunto de servidores de copia de seguridad como los sistemas de contabilidad, a continuación, ver el anfitrión del visor de sucesos y se encontró el host y máquinas de copia de seguridad son ID2, 5, 14 error, la hora es 22:01 la noche anterior (la hora de iniciar la copia de seguridad). El administrador de la red reinicia la matriz de discos y la base de datos se puede revisar. Originalmente, Xiao Liu volvió a cambiar el sistema de negocios y pensó que estaba bien, pero el mismo día ocurrió el mismo error. Después de reiniciar la matriz de discos, se pudo acceder nuevamente a la base de datos. El mismo fallo ocurrió en unos pocos días consecutivos.

Después de un juicio preliminar, creo que el problema debería estar en la conexión de datos, por lo que el método de exclusión se usa para reemplazar el servidor por los cables internos y externos de la matriz, los terminadores SCSI, los controladores de la matriz de discos y toda la matriz de discos, pero El problema sigue existiendo y finalmente cambié a una tarjeta SCSI extrapolada, que está en buenas condiciones. Finalmente puedo volver a Beijing para cruzar el Jefe.

Prueba, ¿dónde está la raíz del problema? El problema debería ser un párrafo, pero nunca lo pensé en el camino de regreso a Beijing. ¿Por qué reemplazar el SCSI incorporado por un SCSI externo solucionó el problema? Ahora parece que el juicio en ese momento era más como hacerlo intuitivamente.

Después de regresar a Beijing, simulé el entorno real en el laboratorio. Se asignaron cuatro segmentos en la matriz de discos a LUN1, LUN2, LUN3, LUN4 y SQL SERVER2000. 1, cambio de servicio, big data (alrededor de 2 GB) entre diferentes particiones, a través de la red de la carpeta compartida del vecindario. 2. Ejecute IOmeter durante 24 horas en cada partición. 3. Use los medios obligatorios para desactivar la red privada. La red pública utiliza la comunicación mixta para enviar señales de latido al mismo tiempo que los servicios externos. 4. Si el cable SCSI del Servidor1 se retira a la fuerza, el servidor conectado está básicamente cerrado y el servicio de conmutación de clústeres es normal.

---------------------------------------------- -------------------------------------------------- ----------- El controlador detectó un error del controlador en \\ Device \\ Scsi \\ adpu160m2. Datos: 0000: 0f 00 10 00 01 00 6a 00 ...... j. 0008: 00 00 00 00 0b 00 04 c0 ....... À 0010: 50 50 00 c1 00 00 00 00 PP . Á .... 0018: 49 00 00 00 00 00 00 00 I ....... 0020: 00 00 00 00 00 00 00 00...... 0028: 00 00 00 00 00 00 00 00 ...... 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0; × × - × × - × × Time: × ×: ×: ×: × × User: N /A Computadora: NT2 Descripción: Durante la paginación, en device \\ Device \\ Harddisk3 \\ Se detectó un error en DR3. Datos: 0000: 04 00 22 00 01 00 72 00 .. " ... r. 0008: 00 00 00 00 33 00 04 80 .... 3 .. 0010: 2d 01 00 00 00 00 00 00 -. ...... 0018: 00 00 00 00 00 00 00 ........ -------------------------- -------------------------------------------------- -----------------------------

Device \\ Device \\ Scsi \\ adpu160m2 no respondió dentro del tiempo de espera de la transferencia. El controlador detectó un error del controlador en \\ Device \\ Scsi \\ adpu160m2. Estos dos mensajes indican que el comando de solicitud emitido desde Windows no llegó al disco externo especificado y que el sistema de Windows comenzó a no responder debido a la interrupción de la conexión.

Análisis de resultados, cuidado con los conflictos de dispositivos SCSI Los resultados de la prueba determinaron que no hubo problemas con el servidor y la matriz de discos. El problema se concentró en la conexión de la matriz de servidores a discos. Esto es exactamente lo mismo que mi juicio en la escena.

Entonces, ¿qué está mal con la línea de conexión?

Desde el principio del bus SCSI, la capa física SCSI transmite señales SCSI y ayuda a protegerlas de interferencias. La capa física contiene terminadores, cables, tarjetas adaptadoras mejoradas y trazados de la placa base, conectores y otras especificaciones como valores de impedancia del conductor de señal, espacio del conector, longitud del cable y más.

Cuando cada sistema se inicia o el bus SCSI se reinicia, el bus SCSI que recibe la señal comienza a actualizarse. Al mismo tiempo, todos los iniciadores de bus SCSI recibidos comienzan a localizar y negociar con todos los dispositivos de destino en el bus SCSI. Estas negociaciones establecen un mecanismo preciso para realizar transferencias de datos posteriores. El terminador de bus le dice al controlador de host SCSI dónde termina todo el bus y envía una señal reflejada al controlador. Se debe hacer una señal de terminación en ambos terminales físicos para usar el bus SCSI.

El terminador de bus físico es un tipo de conector de hardware, que se divide en tipo activo y tipo pasivo. El tipo activo usa el regulador de voltaje para operar, y el tipo pasivo usa la señal de energía en el bus para operar. Tipo pasivo Más preciso que el tipo activo: el cable de terminación automática puede reemplazar el terminador de bus físico, y también es un tipo de hardware, que a menudo se usa para conectar dos hosts al mismo dispositivo físico. La mayoría de los dispositivos SCSI tienen terminadores incorporados y usan un puente para controlar ON /OFF.

El terminador parece ser muy simple, pero el problema se debe principalmente a esto en el proceso de aplicación real. Aunque el terminal pasivo se puede usar en las especificaciones SCSI-I y SCSI-II, antes de SCSI-II, debido a que su tasa de transferencia de datos no es muy rápida (5Mbytes /seg o menos), puede experimentar En algunos casos, no parece suceder sin el Terminator. Sin embargo, después de Fast SCSI, ya que su velocidad de transferencia de datos aumenta rápidamente, se debe prestar especial atención a la configuración del terminador en ambos extremos del bus SCSI, y se debe usar el terminador activo. De lo contrario, el error de transmisión de datos es incorrecto, e incluso el Iniciador no puede reconocer el Dispositivo SCSI (es decir, no se puede encontrar el dispositivo SCSI). En nuestra experiencia real, muchos discos duros SCSI no se pueden instalar sin problemas, no el disco duro en sí, pero la calidad del cable no es buena, o el error de posicionamiento del terminador, y la señal resultante no es correcta.

marcando la identificación SCSI y el terminador de bus, podemos encontrar soluciones a la mayor parte del fenómeno de conflicto, este es un dispositivo SCSI usuarios deben prestar atención a eso. Vemos que en el bus SCSI, los controladores, las interfaces y los cables pueden causar problemas en cualquier punto. Durante el servicio del cliente, se reemplazaron el cable, la terminación, el host de la matriz de discos y la controladora integrada. A menos que el fabricante de la placa base lo recomiende, no debe usarse en un entorno de clúster donde se conectan dispositivos de disco externos porque está integrado en los componentes de la placa base. Parte de ella, afectada por otros componentes, será inevitablemente enfocada o sacrificada, lo que resultará en la inestabilidad del bus SCSI en este entorno. Por lo tanto, cuando la interfaz SCSI se cambia a externa, se resuelve el problema del conflicto de dispositivos SCSI del usuario.
Reimpresión en red:

Copyright © Conocimiento de Windows All Rights Reserved