Introducción a la tecnología de clúster de Linux

  
 

1 Definición de clúster Clúster es un conjunto de servicios que trabajan juntos para proporcionar una plataforma de servicio más estable, eficiente y escalable que un solo servicio. Desde el exterior, el clúster es una entidad de servicio independiente. Pero, de hecho, dentro del grupo, hay dos o más entidades de servicio que coordinan y cooperan para completar una serie de tareas complejas. Un clúster generalmente consta de dos o más servidores. Cada servidor se denomina nodo de clúster. Los nodos del clúster se pueden comunicar entre sí. Hay dos formas de comunicarse. Una se basa en el monitoreo de latidos de línea RS232. La otra es usar una tarjeta de red separada para ejecutar el latido del corazón. Por lo tanto, el clúster tiene la función de monitoreo de estado de servicio entre nodos y también debe tener la función extendida de la entidad de servicio, que puede agregar y eliminar de manera flexible una entidad de servicio. En un clúster, el mismo servicio puede ser proporcionado por varias entidades de servicio. Por lo tanto, cuando un nodo falla, otro nodo del clúster puede asumir automáticamente los recursos del nodo fallido, lo que garantiza un servicio continuo e ininterrumpido. Por lo tanto, el clúster tiene una función de conmutación por error automática. Un sistema de clúster debe tener almacenamiento de datos compartido, ya que los servicios proporcionados por el clúster son consistentes. Cuando cualquier nodo del clúster ejecuta una aplicación, los datos de la aplicación se almacenan de manera central en el espacio compartido del nodo y se realiza la operación de cada nodo. En el sistema, solo se ejecutan los servicios de la aplicación y se almacenan los archivos de la aplicación. En resumen, la construcción de un sistema de clúster requiere al menos dos servidores, así como líneas en serie, software de clúster y dispositivos de almacenamiento compartido (como matrices de discos). Los clústeres basados ​​en Linux se destacan en una variedad de aplicaciones empresariales con su alto poder informático, escalabilidad, disponibilidad y precio /rendimiento optimizado. Conviértase en un punto de acceso de las aplicaciones de Linux que a todos les importa, domine el conocimiento de los clústeres de Linux y cree aplicaciones de alto rendimiento a precios bajos. Ahorre costos para empresas y particulares. Los sitios web nacionales a gran escala Sina, NetEase, etc., utilizan el sistema de clúster Linux para crear aplicaciones web de alto rendimiento. El famoso motor de búsqueda google utiliza decenas de miles de servidores linux para formar un clúster grande. Estos ejemplos ilustran el estado y la importancia de los clústeres en las aplicaciones linux. El sexo 2 Características y funciones del clúster 2.1 Alta disponibilidad y escalabilidad 1. Alta disponibilidad Para algunas aplicaciones en tiempo real, el servicio debe garantizarse durante 24 horas de funcionamiento continuo. Debido a diversos motivos, como software, hardware, red y humanos, es difícil que un solo entorno de operación de servicio cumpla con este requisito. La creación de un sistema de clúster es una buena opción. Una de las mayores ventajas de la creación de un clúster es que el clúster está altamente disponible. En caso de que se produzca una falla en el servicio, el sistema de clúster puede cambiar automáticamente los servicios del nodo fallido a otro nodo en espera, proporcionando un servicio ininterrumpido. Asegura el funcionamiento continuo del negocio. 2. Escalabilidad Con el aumento del volumen de negocios, cuando la entidad de servicio de clúster existente no puede satisfacer la demanda, uno o más nodos de servicio pueden agregarse dinámicamente al clúster para satisfacer las necesidades de la aplicación y mejorar el rendimiento general del clúster. Esta es la escalabilidad del cluster. 2.2 Equilibrio de carga y recuperación de errores 1. La característica más importante del sistema de clústeres de equilibrio de carga es que puede compartir la carga del sistema de manera flexible y efectiva. La política de uso compartido de carga definida por el clúster se utiliza para asignar el acceso del cliente a cada uno de los siguientes nodos de servicio. Por ejemplo, la política de asignación de sondeo se puede definir y la solicitud puede promediarse. La asignación a cada nodo de servicio también puede definir una política de asignación de carga mínima. Cuando llega una solicitud, el sistema de clúster determina qué nodo de servicio es relativamente libre y distribuye la solicitud a este nodo. 2. Recuperación de errores Cuando una tarea no se ha completado en un nodo, por alguna razón, la ejecución falla. En este momento, otro nodo de servicio debería poder completar esta tarea. Esta es la función de recuperación de errores proporcionada por el clúster, a través de una redirección incorrecta. , para asegurar que cada tarea de ejecución pueda ser completada efectivamente. 2.3 Detección de latidos del corazón y deriva IP1. Monitoreo de latidos cardíacos Para lograr el equilibrio de carga, brindar servicios de alta disponibilidad y realizar una recuperación de errores, el sistema de clúster ofrece tecnología de monitoreo de latidos cardíacos. El monitoreo de latidos cardíacos se implementa mediante latidos cardíacos. Los dispositivos que se pueden usar para latidos cardíacos tienen un cable serial RS 232 o pueden ser independientes. Una tarjeta de red para ejecutar el latido del corazón, también puede ser una matriz de discos compartida, etc., el número de latidos del corazón debe reducirse en 1 para el número de nodos del clúster. Se debe tener en cuenta que si la tarjeta de red se utiliza para hacer un latido del corazón, cada nodo necesita dos tarjetas de red, de las cuales Una parte de la red privada está conectada directamente a la tarjeta de red correspondiente de la otra máquina para monitorear el latido del corazón de la otra parte. El otro está conectado a la red pública para proporcionar servicios externos, y no se permite que las direcciones IP de la tarjeta de red de latido y la tarjeta de red de servicio estén en un segmento de red. La eficiencia de la monitorización de los latidos del corazón afecta directamente la duración del tiempo de conmutación por error. El sistema de clústeres mantiene una comunicación interna efectiva entre los nodos a través de la tecnología de latidos del corazón. 2. La dirección IP de la deriva está en el sistema del clúster. Además de la dirección IP real de cada nodo de servicio, también hay una dirección IP de la deriva. ¿Por qué es la dirección IP de la deriva? Porque esta dirección IP no está fija, por ejemplo, dos nodos en dos nodos. En espera activa, en estado normal, la dirección IP de deriva se encuentra en el nodo primario. Cuando el nodo primario falla, la dirección IP de la deriva se cambia automáticamente al nodo de espera. Por lo tanto, para garantizar el servicio ininterrumpido, los servicios provistos externamente se proporcionan en el sistema de clúster. La IP debe ser esta dirección IP de deriva, aunque la IP del propio nodo puede proporcionar servicios externos, pero cuando este nodo falla, el servicio cambia a otro nodo, pero la IP del servicio sigue siendo la dirección IP del nodo defectuoso. En este momento, se sigue el servicio. Interrumpido

3 Clasificación de los clusters 3.1 Clusters de alta disponibilidad 1. Concepto de alta disponibilidad El nombre completo del clúster de alta disponibilidad es Clúster de alta disponibilidad (clúster de alta disponibilidad). El significado de alta disponibilidad es que se puede usar al máximo. Desde el nombre del clúster, la función implementada por dicho clúster es proteger la aplicación del usuario. El programa proporciona un servicio ininterrumpido y duradero. Cuando la aplicación falla, o el hardware del sistema o la red falla, la aplicación puede cambiar automática y rápidamente de un nodo a otro, asegurando así la entrega de servicios externos continua e ininterrumpida. Esta es la función realizada por el clúster de alta disponibilidad. 2. Clusters de HA comunes A menudo decimos que los sistemas de alta disponibilidad en espera, en espera mutua de dos máquinas y en espera de múltiples máquinas se encuentran en la categoría de clusters de alta disponibilidad. Estos clusters generalmente tienen dos o más nodos. La estructura típica de espera en caliente de doble sistema

La espera en caliente de dos nodos es el modo de aplicación más simple, que a menudo se denomina modo de espera /activo. Utiliza dos servidores y uno como el servidor principal (acción) para ejecutar la aplicación. El programa proporciona servicios externos, y el otro sirve como modo de espera, instala la misma aplicación que el servidor primario, pero no inicia el servicio y está en modo de espera. El host y el dispositivo de respaldo son monitoreados por la tecnología Heartbeat. Los recursos monitoreados pueden ser la red, el sistema operativo o el servicio. El usuario puede seleccionar los recursos a monitorear de acuerdo con sus propias necesidades. Cuando el dispositivo en espera monitorea un recurso del host. En el caso de una falla, de acuerdo con una estrategia preestablecida, la IP se cambia primero y luego se retoma el servicio de la aplicación, y luego la máquina en espera proporciona servicios externos. Dado que el proceso de conmutación es muy tarde, el usuario no siente el programa en absoluto. El problema, y ​​también se cambió, para garantizar un servicio duradero e ininterrumpido para la aplicación. La copia de seguridad mutua de dos máquinas se basa en una copia de seguridad en caliente del sistema dual. Dos aplicaciones independientes se ejecutan simultáneamente en dos máquinas, que están mutuamente activas y en espera. Es decir, dos servidores son tanto un host como un servidor en espera. El otro servidor puede asumir la aplicación de la máquina defectuosa en poco tiempo, lo que garantiza un funcionamiento continuo e ininterrumpido del servicio. La ventaja de la copia de seguridad mutua de dos máquinas es que los recursos del dispositivo se guardan. La copia de seguridad en caliente del sistema dual de las dos aplicaciones requiere al menos cuatro servidores, y la copia de seguridad mutua de la máquina dual requiere solo dos servidores para completar la función de clúster de alta disponibilidad, pero la copia de seguridad mutua de dos máquinas también tiene Desventajas propias: después de que un nodo falla, los servicios de las dos aplicaciones se ejecutan en el otro nodo al mismo tiempo, y la carga puede ser demasiado grande.

Copyright © Conocimiento de Windows All Rights Reserved