Computer Room Collection: ¿Cómo resolver el fallo de refrigeración del servidor?

  

El diseño de la infraestructura de red es un proceso complejo. Cada pequeña decisión puede afectar al servidor en el centro de datos. La más ignorada es la demanda de enfriamiento del servidor. No es un juicio erróneo ni una subestimación seria. Todo sucede en todo tipo de entornos. La experiencia histórica ha demostrado que los presupuestos limitados de TI están obligando a los centros de datos a ignorar las necesidades críticas de refrigeración y control de temperatura, incluso en grandes centros de datos. Solo al prevenir efectivamente los fallos de enfriamiento del servidor, la aplicación que se ejecuta en el servidor nunca se desconectará, y la empresa realmente puede ahorrar dinero. Entonces, ¿cómo hacer el trabajo de enfriamiento del servidor, cómo lidiar con él cuando ocurre la falla?

Capacidad de enfriamiento del servidor

Antes de lidiar con fallas en la infraestructura de enfriamiento del servidor, es importante comprender cómo funciona el sistema de enfriamiento y cuánta capacidad de enfriamiento se necesita, el enfriamiento y la ubicación del centro de datos. El número de equipos eléctricos está estrechamente relacionado y el consumo de energía esperado se puede calcular en función del número de amperaje marcado en el equipo. Cuanto mayor sea el amperaje, mayor será la capacidad de refrigeración necesaria. La forma más fácil de calcular esto es conocer el consumo de energía del servidor (por servidor o todos los servidores). Por lo general, un servidor con una sola CPU requiere 1 amp o 120 vatios (1 amp x 120 voltios = 120 vatios), CPU dual (como Los servidores fuertes o AMD necesitan 2 amperios o 240 vatios y, finalmente, multiplican la capacidad de enfriamiento requerida por vatio (aproximadamente 3.4 BTU) para calcular la cantidad de enfriamiento que necesita el servidor.

Por ejemplo, un servidor de 120 vatios requiere 408 BTU de capacidad de enfriamiento (120x3.4), use este método para calcular la cantidad de enfriamiento requerido por todos los servidores y consulte a un consultor HVAC certificado para ver si el cálculo es factible. .

Cómo lidiar con las fallas del sistema de refrigeración del servidor

Cuando falla un sistema de refrigeración del servidor, lo más importante es tomar decisiones rápidas y tomar medidas. La acción correcta hará que el sistema funcione durante más tiempo. Y evitar más fallas graves. Se pueden consultar las siguientes pautas en caso de falla del sistema de refrigeración:

1. Sepa quién es la persona de mantenimiento y cómo llevarlo al lugar lo antes posible.

La primera llamada debe dirigirse al ingeniero de HVAC para describir el problema con el mayor detalle posible. Esto ayudará al ingeniero a determinar si es necesario traer las piezas. En la primera vez de la falla, debe contarse cada segundo.

2. Comprenda y prediga lo que sucederá si falla una unidad de refrigeración.

Por ejemplo, cuánto tiempo puede durar el servidor antes de que la temperatura ambiente aumente a un valor crítico (> 120 ° F) Puede calcular el tiempo máximo que le queda a la persona de servicio y si necesita iniciar el sistema de respaldo.

3. Firmar acuerdos de nivel de servicio con compañías relevantes en entornos clave

Si no ha firmado, es mejor preparar un sistema de refrigeración portátil. Por ejemplo, el SRCOOL12K de Tripp Lite está diseñado específicamente para enfriamiento de emergencia, que brinda una capacidad de enfriamiento de aproximadamente 12K BTU. En algunos lugares, el equipo de enfriamiento de emergencia es muy costoso y se puede alquilar por un corto período de tiempo. Si la temperatura de la habitación alcanza un valor crítico solo unas horas antes, puede enfrentar pérdidas financieras.

4, apague los servidores no esenciales

Los servidores de desarrollo suelen ser grandes consumidores, no necesitan ejecutarse durante la producción, los servidores de prueba, y todos los servidores no esenciales deben estar cerrados Suéltalo

5. Si la temperatura de la sala de equipos aumenta a un valor crítico, lo mejor es abrir las puertas y ventanas. En resumen, la idea es bajar la temperatura de la sala de equipos. Si la temperatura exterior es más baja que la temperatura interior, puede usar un ventilador para expulsar el aire caliente. .

6. El último es el más importante para hacer frente a la falla del sistema de refrigeración: asegúrese de que todos los datos estén respaldados por adelantado.

Si el plan de emergencia para la solución de problemas del sistema de refrigeración se completa de antemano, jugará un papel muy importante cuando ocurra la falla real. Si sabe que su servidor no podrá apagarse si la falla no se resuelve, lo mejor es iniciar el centro de datos en espera remota con anticipación y prepararse para la transferencia. El plan de contingencia de la compañía debe garantizar que el negocio funcione correctamente en todas las circunstancias, incluso en situaciones muy urgentes. Además, se debe desarrollar un plan de recuperación de desastres para transferir los servicios a través del centro de datos al centro de datos alternativo en una emergencia como una emergencia.

Redundancia de enfriamiento del servidor

Un fallo de la unidad de enfriamiento no debe atrapar todo el centro de datos en el horno. Si el sistema de enfriamiento es redundante y tiene un plan de conmutación por error correspondiente, puede reducir la velocidad Lentamente espere a que el ingeniero de mantenimiento llegue a la puerta.

El método de enfriamiento redundante más básico es n + 1, pero una gran parte depende de las necesidades de enfriamiento y del presupuesto de la compañía. Para un centro de datos de tamaño mediano (aproximadamente 1000 pies cuadrados), una solución de enfriamiento opcional Hay una variedad de cosas, por ejemplo, puede implementar un dispositivo de CA de 1.5 toneladas en la sala de servidores, además de un dispositivo de una tonelada como respaldo, estos dispositivos pueden tener carga equilibrada.

David Langlands, arquitecto de la red de ESPO, dijo: "Para entornos de tamaño mediano, es mejor encontrar un experto certificado en HVAC para comunicarse. Si la financiación lo permite, se proporciona un completo entorno redundante n + 1. Habrá 3-4 unidades de refrigeración en funcionamiento, lo que significa que su sistema de refrigeración seguirá estando disponible al 100% ".

Para los centros de datos grandes (más de 5,000 pies cuadrados), las necesidades de refrigeración son diferentes. En comparación con los centros de datos pequeños y medianos, los centros de datos grandes generalmente incorporan diseños para evitar fallas de refrigeración. Solo entonces, si es una rutina normal El mantenimiento o la solución de problemas, incluso durante las horas pico de trabajo, incluso si hay varios sistemas en ejecución, existe suficiente garantía de mantenimiento. Por ejemplo, Emerson Electric o algunos consultores independientes reconocidos pueden ayudarlo a diseñar una solución de refrigeración de servidor redundante.

Los grandes centros de datos generalmente utilizan las siguientes tecnologías de refrigeración:

: levante el espacio debajo del piso para mejorar el flujo de aire frío.

- Instale un deflector en la brecha entre los servidores para aumentar la eficiencia del flujo de aire.

- El aire en toda la sala de equipos es todo desde el pasillo frío. Todo el aire caliente se elimina del pasillo caliente. Para salas grandes de computadoras, se deben instalar múltiples pasajes de frío y calor.

- El refrigerador instalado en el techo empuja el glicol a través del tubo cerrado hacia el centro de datos y circula en el centro de datos para enfriarse.

- Use un soplador de CA para soplar aire enfriado por glicol en la sala de servidores.

Hay otros tipos de equipos y tecnologías de refrigeración. Lo mejor es escuchar las opiniones de los expertos de HVAC que pueden ayudarlo a elegir el producto más adecuado.

Mejores prácticas para la refrigeración del servidor

Finalmente, hemos resumido varios principios importantes para tratar los problemas de refrigeración del centro de datos:

: agregue números de expertos de HVAC a los grupos de marcación rápida . Hay un plan listo para redundancia de refrigeración.

: supervise la temperatura y establezca un sistema para registrar el cambio de temperatura. Cuando la temperatura del servidor supera el umbral de advertencia, el sistema AVTECH TemPageR es un sistema de este tipo. Muestra el valor de la temperatura en el registro y el gráfico. El dispositivo de $ 200 simplemente vale un millón.

- Además de la temperatura, controle la humedad y no deje que la sala de servidores se congele.

- Vea la dirección de todo el flujo de agua, ya sea que esté utilizando una bandeja de goteo o un método de enrutamiento de agua, siempre que el flujo de agua salga de la sala de máquinas, sin fugas.

- La demanda de refrigeración en los centros de datos es cada vez mayor, pero la tasa de crecimiento de la demanda de refrigeración a menudo se pasa por alto. Langlands dijo: "No diseñe sistemas de refrigeración de acuerdo con las necesidades actuales. Planificación ".

Resumen

Hay demasiados factores a considerar cuando se planifica o se trata de una falla del sistema de enfriamiento del servidor. La mejor manera es prevenir los problemas antes de que ocurran. En una oración, el secreto es: Realice redundancias y copias de seguridad, y tenga en cuenta los datos de contacto de los expertos en HVAC.

Copyright © Conocimiento de Windows All Rights Reserved