Le enseñará cómo calcular la carga máxima del servidor WEB

  
                  

El algoritmo de equilibrio de carga de retroalimentación dinámica considera la carga y respuesta en tiempo real del servidor, y ajusta constantemente la proporción de solicitudes procesadas entre servidores para evitar que algunos servidores sigan recibiendo una gran cantidad de solicitudes cuando están sobrecargados, lo que mejora el rendimiento del sistema completo. La Figura 1 muestra el entorno de trabajo del algoritmo, ejecutando el proceso Monitor Daemon en el programador de carga, Monitor Daemon para monitorear y recopilar la información de carga de cada servidor. El Monitor Daemon calcula un valor de carga compuesto basado en información de carga múltiple.

Monitor Daemon calcula un nuevo conjunto de pesos para el valor de carga y el peso actual de cada servidor. Si la diferencia entre el nuevo peso y el peso actual es mayor que el umbral establecido, Monitor Daemon utilizará el servidor. La ponderación se establece en la programación de IPVS en el kernel, y la programación de la conexión en el kernel generalmente utiliza un algoritmo de programación de turno rotativo ponderado o un algoritmo de programación de conexión mínima ponderado.


Figura 1: Entorno de trabajo del algoritmo de equilibrio de carga de retroalimentación dinámica

Programación de la conexión

Cuando un cliente accede al acceso a la red a través de una conexión TCP, el servicio necesita El tiempo y los recursos informáticos que se consumen varían ampliamente y dependen de muchos factores. Por ejemplo, depende del tipo de servicio que se solicita, el ancho de banda actual de la red y la utilización actual de los recursos del servidor. Algunas solicitudes muy cargadas requieren consultas de computación intensiva, acceso a la base de datos y flujos de datos de respuesta larga, mientras que las solicitudes con poca carga a menudo requieren solo una página HTML para leer o un cálculo muy simple.

La diferencia en el tiempo de procesamiento de la solicitud puede hacer que el servidor use el sesgo (sesgo), que es el desequilibrio de carga entre los servidores. Por ejemplo, hay una página WEB con archivos A, B, C y D, donde D es un archivo de imagen grande, y el navegador necesita establecer cuatro conexiones para recuperar esos archivos. Cuando varios usuarios acceden a la página simultáneamente a través del navegador, el caso más extremo es que todas las solicitudes de archivos D se envían al mismo servidor.

Por lo tanto, puede haber situaciones en las que algunos servidores ya estén sobrecargados, mientras que otros están básicamente inactivos. Al mismo tiempo, algunos servidores están demasiado ocupados para tener una larga cola de solicitudes y reciben constantemente nuevas solicitudes. Por el contrario, esto hará que el cliente espere un largo tiempo y sienta que la calidad del servicio del sistema es deficiente.

Programación de conexión simple

Programación de conexión simple puede hacer que el servidor se desvíe. En el ejemplo anterior, si se usa un algoritmo de programación de turno rotativo y hay exactamente cuatro servidores en el clúster, un servidor siempre debe recibir una solicitud de archivo D. Esta estrategia de planificación da como resultado una baja utilización de todos los recursos del sistema, ya que algunos recursos se agotan y el cliente espera durante mucho tiempo mientras que otros recursos están inactivos.

Características del tráfico TCP /IP real

La literatura muestra que el tráfico de red es ondulado. Después de un largo período de tráfico pequeño, habrá una gran cantidad de acceso de tráfico, luego Pequeño flujo, que ocurre periódicamente como una ola. La literatura revela que la auto-similitud existe en el tráfico de red en WAN y LAN, y también hay auto-similitud en el flujo de acceso WEB. Esto requiere un mecanismo de retroalimentación dinámico que aproveche el estado del grupo de servidores para manejar la auto-similitud de la secuencia de acceso.

Copyright © Conocimiento de Windows All Rights Reserved