Alta disponibilidad de clusters de sistemas operativos Linux

  

La disponibilidad del sistema se puede mejorar en gran medida mediante la redundancia del hardware o el software. La redundancia de hardware garantiza principalmente que los componentes redundantes puedan seguir utilizándose para proporcionar servicios mediante el mantenimiento de múltiples componentes redundantes, como discos duros y cables de red en el sistema. El método de software es utilizar el software en varias máquinas del clúster. El estado operativo se monitorea para iniciar la máquina de respaldo para que se haga cargo del trabajo de la máquina fallida cuando una máquina no puede continuar prestando servicio.

En general, debe garantizar una alta disponibilidad del administrador de clústeres y una alta disponibilidad de nodos. Eddie, Linux Virtual Server, Turbolinux, Piranha y Ultramonkey utilizan una solución de alta disponibilidad similar a la de la Figura 1.

1 un diagrama esquemático de soluciones de alta disponibilidad

Alta disponibilidad Cluster Manager

Administrador de clústeres para blindar el fracaso, se necesita establecer una máquina de copia de seguridad. El programa Heartbeat se ejecuta tanto en el administrador principal como en el administrador de copia de seguridad para controlar la salud de la otra parte mediante el envío de mensajes como "Estoy vivo". Cuando la máquina de respaldo no puede recibir dicha información dentro de un cierto período de tiempo, activa el programa falso, lo que le permite al administrador de respaldo hacerse cargo del administrador principal para continuar brindando servicios; cuando el administrador de respaldo la recibe del administrador principal " Estoy vivo " dicha información, invalida el programa falso, liberando así la dirección IP, por lo que el administrador principal comienza de nuevo el trabajo de administración del clúster.

Alta disponibilidad para nodos

La alta disponibilidad de nodos se puede lograr al monitorear constantemente el estado de los nodos y el estado de ejecución de las aplicaciones en los nodos. Cuando se detecte que los nodos han fallado, el sistema puede reconfigurarse. Y la carga de trabajo se entrega a los nodos que se ejecutan normalmente. Como se muestra en la Figura 1, el sistema supervisa el estado de los programas de servicio en los servidores reales del clúster ejecutando el Mon Wizard en el administrador del clúster. Por ejemplo, use fping.monitor para monitorear si el servidor real aún se está ejecutando a intervalos regulares, use http.monitor para monitorear los servicios http, ftp.monitor para monitorear los servicios ftp, etc. Si se encuentra que un servidor real está inactivo, o si el servicio en él ha fallado, todas las reglas para este servidor real se eliminan en el administrador del clúster. A la inversa, si pronto se descubre que el sistema ha podido proporcionar servicios nuevamente, se agregarán todas las reglas correspondientes. De esta manera, el administrador del clúster puede enmascarar automáticamente el servidor y la falla de los programas de servicio que se ejecutan en él, y puede volver a unirse al sistema del clúster cuando el servidor real está funcionando.

Copyright © Conocimiento de Windows All Rights Reserved