Diseño e implementación de un sistema de gestión de clústeres basado en Linux

  

Noticias de Computer Shop Con el desarrollo continuo de redes de alta velocidad, los usuarios de la red y varias aplicaciones de red están creciendo rápidamente, lo que hace que la capacidad de carga de los servidores de red se convierta gradualmente en un cuello de botella y un enlace débil en las redes de alta velocidad. Un solo servidor requiere altos costos de hardware. Por lo tanto, se utilizan más los requisitos de carga de alta disponibilidad y, a veces, incluso son difíciles de cumplir. Por lo tanto, una variedad de sistemas de clústeres de alta disponibilidad relativamente económicos y estables se utilizan más ampliamente, y varios sistemas de clústeres comerciales y no comerciales se están desarrollando rápidamente. El sistema de clúster de equilibrio de carga LV S (servidor virtual de Luxux) se usa ampliamente debido a su apertura, alta disponibilidad y alta escalabilidad. Sin embargo, el clúster de LV S carece de un sistema de administración integral para monitorear y administrar el clúster y garantizar el sistema. Operación estable. Cuando el tamaño del clúster es grande, es muy incómodo administrar un solo nodo o un sistema de clúster en el clúster. Este documento diseña un sistema de administración más completo para el clúster LV S, a fin de ampliar el tamaño del clúster y mejorar el clúster LV S. Disponibilidad y versatilidad, e implementación parcial del grupo de servidores de servidores de sistemas.
1 General El diseño de este sistema se refiere a la idea de diseño de algunos sistemas de administración de clústeres maduros, sin cambiar el sistema de clúster LV S. El diseño modular, las diferentes funciones son independientes en los módulos, cada módulo no se afecta entre sí, por separado. Intercambie información con una interfaz de administración unificada para una fácil modificación y expansión. El sistema se divide en cuatro partes: monitoreo del estado del nodo del clúster, instalación y recuperación rápida de los nodos del clúster, programación dinámica de los clústeres y la interfaz de administración. El monitoreo del estado del nodo del clúster incluye el clúster interno El estado del hardware y el software de cada nodo se monitorea y alarma de acuerdo con el valor de peligro establecido. La rápida instalación y recuperación del nodo se refiere a la instalación rápida y conveniente del sistema operativo y el software del nodo de clúster, y puede volver rápidamente al estado de prueba inicial cuando falla el nodo. La configuración del hardware de cada nodo en el clúster debe ser consistente. La programación dinámica del clúster requiere un cambio rápido y suave cuando la cantidad de nodos en el clúster aumenta o disminuye, y no afecta el funcionamiento del clúster. La interfaz de administración es el canal para que el administrador del clúster interactúe con el sistema de administración. Y las distintas partes del sistema se combinan a través de la interfaz de gestión para formar un orgánico En general, la implementación de todo el sistema no es todo desde cero. Hay muchos proyectos de administración de red de OpenSou rce como referencia. Al mismo tiempo, hay algunos programas simples de administración de código abierto para clusters de LV S. También puede consultar la modificación del código abierto anterior. Sobre esta base, el código de desarrollo propio se agrega para formar un sistema de administración completo. La capa inferior del sistema utiliza principalmente el protocolo estándar internacional SNM P Protocolo de administración de red simple para administrar el clúster y facilitar la expansión. 2 Diseño específico de cada parte 2. 1 Monitoreo de nodos del clúster Los objetos monitoreados incluyen principalmente la memoria del nodo, el uso de la CPU, el estado de carga del nodo y el estado del proceso de servicio. Cuando el objeto anterior es anormal, el sistema emitirá una alarma, de forma manual o automática a la resolución de problemas. La parte de monitoreo es el proyecto de código abierto MRTG (mu lt i2rou tert Basado en raff ic grapher) y MON. MRTG es una herramienta de monitoreo de tráfico de red. También puede monitorear el flujo de hardware y servicios específicos como CPU, memoria, I ö O y monitorear gráficamente los resultados a través de W EB. Se muestra el modo. MRTG utiliza el protocolo SNM P para configurar la red. Monitoreo, y MRTG proporciona una interfaz para dibujar varios gráficos de pantalla con herramientas de terceros. Este sistema utiliza RRDToo ls para dibujar los gráficos requeridos por la interfaz de administración del sistema. MON es una herramienta de monitoreo de disponibilidad del servicio que puede alertar cuando falla el servicio. El proceso de monitoreo se puede dividir en dos partes separadas: condiciones de monitoreo, acciones que se activan cuando las condiciones fallan. MON monitorea el proceso o dispositivo monitoreado en forma de monitor (mon ito r), activa el correspondiente Programa de alarma (alerta); El programa de alarma puede procesarse automáticamente de acuerdo con la configuración y notificarse al administrador por medio de ma il. Las dos partes se pueden configurar de manera independiente y muy flexible. MON es responsable de monitorear la disponibilidad del servicio de nodo y emitir una alarma cuando se produce una anomalía. Y el procesamiento correspondiente, y MRTG, es responsable de la recopilación del sistema y muestra el estado de ejecución del nodo, proporcionando datos intuitivos y detallados para analizar el rendimiento del clúster y juzgar la causa del error. 2. 2 Instalación y recuperación rápidas de nodos del clúster Con el número de nodos en el clúster Además, la instalación del software y del sistema operativo del nodo se convertirá en una tarea muy complicada. El equilibrio de carga y las mismas funciones se implementan en cada nodo del clúster. El sistema operativo y el software instalados también son los mismos. Bajo la premisa de la misma configuración de hardware, el software se puede instalar de manera automática y rápida. Al mismo tiempo, el nodo de falla se puede restaurar rápidamente. El sistema utiliza el estándar de arranque remoto PXE (p reboo texecu Environment Ent) y la herramienta de imagen del sistema System Imager definida por Intel. PXE es una tecnología de reemplazo de RPL (remo te p rogram load), que puede arrancar remotamente la serie W indow s, Linux Una variedad de sistemas operativos. La herramienta de creación de reflejo de System Imager puede reflejar el sistema de la máquina de muestra, el servidor reflejado a través de la red será completamente compatible con el sistema de software de la máquina de muestra instalado en otras máquinas, y puede ser la IP del cliente, el nombre del host, etc. Realice una configuración simple. El servidor reflejado también es un servidor PXE. Primero, se instala el nodo de muestra y luego se genera la imagen en el servidor reflejado. PXE inicia el nodo en el clúster que instalará el sistema para instalar la imagen del nodo de muestra, que permite una instalación rápida y automática. Simplemente cambie la configuración de la máquina de muestra y actualice la imagen. Es posible actualizar todo el sistema de clústeres. Cuando hay una falla importante en los nodos del clúster, el sistema de nodos puede reinstalarse de esta manera para recuperar. 2. 3 Programación dinámica del clúster Es relativamente fácil agregar o reducir nodos en el clúster de LV S. Solo necesita usar ipvsadm para configurar el nodo de balanceo de carga, y la transición es muy suave. Esta parte se interconecta principalmente con otras partes como la interfaz, monitoreo, etc. y se debe extender a la programación dinámica de balanceo de carga basada en contenido. Buena preparación. 2. 4 Interfaz de administración Todo el sistema de administración forma un conjunto orgánico a través de la interfaz de administración. El administrador interactúa con el sistema de administración a través de la interfaz de administración para llevar a cabo la administración del sistema de clúster. La interfaz de administración adopta el modo C ö S, por razones de seguridad. La interfaz de administración se desarrollará de forma independiente. Puede consultar algunas herramientas gráficas de administración de LV S, como lvs2gu i, lvsm, etc. 3 El sistema de clúster LV S de expansión futura aún se está desarrollando y soportará la carga basada en contenido Equilibrio. El LV S actual solo tiene carga equilibrada en la capa de red Layer 3, y el clúster solo puede proporcionar un servicio único. El balanceo de carga basado en contenido permitirá que el mismo clúster proporcione múltiples servicios. Esto está en preparación para la expansión del sistema cuando se diseña el sistema de administración. Principalmente en la instalación del nodo, la programación dinámica de dos partes. Para poder pasar el sistema de instalación del nodo Preconfigurado para instalar software diferente para nodos que brindan diferentes servicios. Esto se puede modificar consultando la herramienta de instalación de scripts o realizando varias imágenes para la selección. En la parte de programación dinámica, se requiere programar dinámicamente el clúster de acuerdo con el estado de carga de cada servicio. La cantidad de nodos que brindan servicios diferentes. Cuando la carga de un servicio es demasiado pesada, el nodo con carga ligera se convierte en el nodo que proporciona el servicio. La shell distribuida (shell rib r ted dist) se puede usar para implementar esta programación. Herramientas tales como Cfengine. 4 Implementación del sistema El sistema se implementó parcialmente en el clúster de servidores de servidores reales del sistema de video bajo demanda VOD de la Universidad de Tecnología de Dalian. Se implementó la supervisión y la instalación automática, y los nodos del clúster se pueden programar fácilmente. × trabajo estable las 24 h, una vez implementada la interfaz de administración unificada Li será más conveniente, se mejorará aún más la eficiencia operativa del sistema.

Copyright © Conocimiento de Windows All Rights Reserved