Análisis de los principales puntos de la tecnología de clúster de Linux

  

Hoy en día, muchas empresas y sitios web utilizan el sistema operativo Linux. Las ventajas de Linux han hecho que las personas abandonen a Microsoft. Hoy hablaré sobre la tecnología de clúster de Linux, le haré saber más sobre Linux y conocer las potentes funciones de la tecnología de clúster de Linux. Darte una referencia al sistema.

Una de las razones por las que Linux es muy competitivo es que puede ejecutarse en PC muy populares sin la necesidad de comprar hardware dedicado costoso. En varias PC que ejecutan Linux, siempre que se agregue el software de clúster correspondiente, se puede formar un clúster de Linux con una confiabilidad superior, capacidad de carga y potencia de cómputo. Cada servidor en el clúster se llama un nodo.

Según el enfoque, los clústeres de Linux se pueden dividir en tres categorías. Un tipo es un clúster de alta disponibilidad que se ejecuta en dos o más nodos para continuar prestando servicios en caso de que se produzca una falla en el sistema. La filosofía de diseño de los clústeres de alta disponibilidad es minimizar el tiempo de inactividad del servicio. Los más famosos de estos grupos son Turbolinux TurboHA, Heartbeat, Kimberlite, etc. El segundo tipo es un clúster de equilibrio de carga, cuyo objetivo es proporcionar una capacidad de carga proporcional al número de nodos. Este clúster es adecuado para proporcionar servicios web de gran acceso. Los clústeres de equilibrio de carga a menudo tienen ciertas características de alta disponibilidad. Turbolinux Cluster Server y Linux Virtual Server son clústeres de equilibrio de carga. El otro tipo son los grupos de supercomputación, que se pueden dividir en dos tipos según el grado de asociación de computación. Una es la forma de realización hoja de tareas, la tarea calculado en la hoja de tarea, a continuación, asignar tareas a cada nodo hoja, cada nodo es separado y luego se resumen los resultados, para producir los resultados finales. El otro es el método de cálculo paralelo, en el que los nodos intercambian datos en gran cantidad durante el proceso de cálculo, y se puede realizar el cálculo con una fuerte relación de acoplamiento. Estos dos clústeres de supercomputación son adecuados para diferentes tipos de trabajo de procesamiento de datos. Con el software de clúster de supercomputación, las empresas pueden usar algunas PC para completar tareas informáticas que generalmente solo son posibles con los supercomputadores. Dicho software incluye Turbolinux EnFusion, SCore, etc.

Los clústeres de alta disponibilidad y los clústeres de equilibrio de carga funcionan de manera diferente y son adecuados para diferentes tipos de servicios. Típicamente, clúster de carga equilibrada aplica a los servicios proporcionados datos estáticos, como el servicio HTTP; y clúster de alta disponibilidad se aplica tanto al proveedor de servicios de datos estáticos, como el servicio HTTP, pero también para servir datos dinámicos, tales como bases de datos. Servicio de clúster de alta disponibilidad ha sido capaz de aplicar para proporcionar datos dinámicos se debe nodos comparten el mismo medio de almacenamiento, como RAIDBox. Es decir, en un clúster de alta disponibilidad, cada uno de los datos de usuario de servicio sólo una copia se almacena en el dispositivo de almacenamiento compartido Por otro lado, solo un nodo puede leer y escribir estos datos en cualquier momento.

Turbolinux TurboHA a un ejemplo, hay dos nodos de clúster A y B, a condición de que sólo proporciona servicio de clúster Oracle, los datos de usuario se almacena en la partición de dispositivo de almacenamiento común /dev /sdb3. En el estado normal, el nodo A proporciona el servicio de base de datos Oracle y la partición /dev /sdb3 se carga por el nodo A en /mnt /oracle. Cuando se produce una falla en el sistema y es detectada por el software TurboHA, TurboHA detendrá el servicio de Oracle y desinstalará la partición /dev /sdb3. Después de eso, el software TurboHA en el nodo B cargará la partición en el nodo B e iniciará el servicio de Oracle. Para el servicio de Oracle tiene una dirección IP virtual, cuando el servicio de conmutación de Oracle desde el nodo A a un nodo B, una dirección IP virtual estará obligado al Nodo B, el usuario puede acceder al servicio.

Como puede verse a partir del análisis anterior, clúster de alta disponibilidad para un servicio que no tiene la característica de equilibrio de carga, que puede mejorar la fiabilidad de todo el sistema, pero no puede aumentar la capacidad de carga. Por supuesto, clúster de alta disponibilidad puede ejecutar una variedad de servicios, y la asignación apropiada en diferentes nodos, tales como el nodo A proporciona servicios de Oracle, mientras que el nodo B proporciona servicios de Sybase, que también se pueden ver como un sentido de equilibrio de carga, pero esto es Para la distribución de servicios múltiples.

Un clúster de equilibrio de carga es adecuado para servicios que proporcionan datos relativamente estáticos, como servicios HTTP. Debido a que los medios de almacenamiento entre los nodos son típicamente no el equilibrio de carga de clúster es compartida generalmente, los datos de usuario se copia en una pluralidad de partes, almacenados en cada nodo para proporcionar el servicio. La siguiente es una breve introducción al mecanismo de trabajo del clúster de equilibrio de carga utilizando Turbolinux Cluster Server como ejemplo. Hay un nodo maestro en el clúster llamado Advanced Traffic Manager (ATM). Suponga que este clúster solo se usa para proporcionar un servicio HTTP, y que los nodos restantes están todos configurados en nodos de servicio HTTP. La solicitud del usuario para la página se envía al cajero automático, porque la dirección IP externa del servicio está vinculada al cajero automático. El cajero automático envía la solicitud recibida a los nodos de servicio de manera uniforme. Después de recibir la solicitud, el nodo de servicio envía directamente la página web correspondiente al usuario. De esta manera, si hay 1000 solicitudes de página HTTP en 1 segundo y hay 10 nodos de servicio en el clúster, cada nodo procesará 100 solicitudes. Por lo tanto, desde el mundo exterior, parece que hay una computadora de alta velocidad de 10x que maneja el acceso de los usuarios. Este es el verdadero sentido del equilibrio de carga.

Pero ATM tiene que lidiar con todas las solicitudes de 1000 páginas, ¿se convertirá en el cuello de botella de la velocidad de procesamiento del clúster? Dado que la cantidad de datos solicitados para una página es relativamente pequeña, la cantidad de datos devueltos al contenido de la página es relativamente grande, por lo que este método sigue siendo muy eficiente. La falla del cajero automático no hará que todo el sistema falle. Turbolinux Cluster Server puede proporcionar uno o más equipos de nodo ATM de reserva cuando el nodo ATM principal falla, el cajero automático de copia de seguridad producirá un nuevo maestro ATM, hacerse cargo de la obra. Se puede ver que este clúster de equilibrio de carga también tiene una cierta alta disponibilidad.

Las páginas HTTP son relativamente estáticas, pero a veces necesitan ser cambiadas. Turbolinux Cluster Server proporciona una herramienta de sincronización de datos que facilita la sincronización de los cambios en la página a todos los nodos que proporcionan el servicio.

A continuación se describe la combinación de clústeres de alta disponibilidad y clústeres de equilibrio de carga. Si el usuario tiene un grupo mínimo de dos nodos, ¿es posible obtener los beneficios de los clústeres de alta disponibilidad y los clústeres de equilibrio de carga? La respuesta es sí. Debido al clúster de alta disponibilidad adecuada para servir datos dinámicos, y el equilibrio de carga de clúster aplica a los servicios prestados datos estáticos, por lo que bien podría asumir el mismo tiempo para proporcionar servicios de Oracle y HTTP. Los usuarios deben instalar el software TurbolinuxTurboHA y TurbolinuxClusterServer en los nodos A y B. El nodo A es el nodo en el que Oracle funciona normalmente y el nodo B es el nodo de respaldo del servicio de Oracle. Esto es para el software TurboHA. Para el software ClusterServer, el Nodo B para configurar nodo basado en ATM, el nodo A de respaldo nodo ATM, mientras que los nodos A y B al mismo tiempo son nodo de servicio HTTP.

De esta manera, tanto el Nodo A como el Nodo B son roles, y el usuario obtiene un servicio Oracle de alta disponibilidad y un servicio HTTP de equilibrio de carga. Incluso si un nodo falla, ni el servicio Oracle ni el servicio HTTP se interrumpirán.

Pero para el mismo servicio, no puede obtener alta disponibilidad y equilibrio de carga al mismo tiempo. Para un servicio, ya sea sólo una copia de los datos del dispositivo de almacenamiento compartido, se accede a un nodo de una vez, para una alta disponibilidad, ya sea múltiples copias de los datos duplicados almacenados en cada nodo en el disco duro local, el usuario Las solicitudes se envían a varios nodos simultáneamente para equilibrar la carga.

Para los clústeres de alta disponibilidad, debido a su tiempo de diseño para minimizar el tiempo de interrupción del servicio, el cambio de servicio ha recibido mucha atención. Cuando falla un servicio en un nodo, se detecta rápidamente y se cambia a otro nodo. Sin embargo, la protección de la integridad de los datos no se puede ignorar al cambiar.

¿En qué circunstancias se destruirá la integridad de los datos? Debido a la clúster de alta disponibilidad que tiene al menos dos nodos conectados a un dispositivo de almacenamiento compartido, para la partición no desnudo, si dos nodos se leen simultáneamente, que hará que el sistema de archivos está dañado. Por lo tanto, necesito usar la barrera de E /S para evitar que ocurra este evento.

objeto de E /S es para asegurar que el nodo que falla barrera no puede continuar a leer y escribir una partición común servicio, hay una variedad de maneras. Kimberlita implementa mediante un interruptor de hardware, cuando un nodo falla, otro nodo puede detectar si, va a emitir comandos a través del puerto serie, el hardware de control de interruptor conectado a la fuente de alimentación del nodo fallido de forma temporal desenergizada, y luego La forma en que se enciende la alimentación hace que se reinicie el nodo fallido.

Las barreras de E /S vienen en muchas formas. Para los dispositivos de almacenamiento que admiten el comando SCSI Reserve /Release, el comando SG también se puede usar para implementar la barrera de E /S. Los nodos normales deben usar el comando de reserva SCSI " bloquear " dispositivo de almacenamiento compartido para asegurarse de que el nodo fallado no lea ni escriba. Si el software del clúster todavía se está ejecutando en el nodo que ha fallado, tal como se encuentra en un dispositivo de almacenamiento compartido ha sido bloqueada entre sí, se deben poner su peso comienza a volver a condiciones normales de trabajo.

Lo anterior presenta los principios básicos de la tecnología de clúster de Linux, y también presenta varios programas conocidos. En resumen, la tecnología de clúster de Linux maximiza las ventajas de las PC y las redes, puede ofrecer un rendimiento considerable y es una tecnología prometedora. Espero que pueda aprender más sobre la tecnología de clúster de Linux a través de este artículo.

Copyright © Conocimiento de Windows All Rights Reserved