La Gestión a través de DCIM..
..y la Certificación de Uptime Sostenibilidad Operacional

 DCIM y la Certificación de Sostenibilidad Operacional de Uptime

Me voy a permitir hacer una breve introducción para dar mi punto de vista de lo que son las operaciones en el Data Center, aunque la mayoría las conoce.

Las operaciones en el Data Center se basan en la continuidad, extensamente versado en todas las normativas y artículos del sector. Sin embargo, habitualmente la continuidad está orientada a las infraestructuras electromecánicas.

Obviamente, la continuidad de energía y climatización habilitan las condiciones de operación del resto de la infraestructura, en este caso el equipamiento TI que consume la energía y genera el calor que será aliviado o evacuado por la climatización de la sala blanca.

Me gustaría incorporar además un factor adicional, la continuidad de los servicios que están alojados en la infraestructura TI.

Resumiendo, para Bjumper la continuidad en un Data Center, es la capacidad de tener disponible la energía y la climatización que permiten a los equipos TI operar, y, por tanto, habilitar los servicios que en ellos se alojan, y que normalmente son lo que permiten generar los ingresos económicos de las empresas.

Las empresas denominadas Colocation, reciben a su vez los ingresos de proporcionar las infraestructuras y continuidad electromecánica para que sus clientes ofrezcan las aplicaciones y servicios a los clientes de estos.

En definitiva, los ingresos del sector del Data Center provienen de los servicios y aplicaciones que están al alcance de los clientes como empresa o usuarios finales. Algunos ejemplos podrían ser desde una suscripción a juegos online, a canales de televisión por cable o aplicaciones como banca online o sistemas de gestión en la nube.

 Dicho esto, parece que el objetivo de las operaciones en Data Center no puede olvidarse de la gestión de la infraestructura TI y por supuesto de su correcto funcionamiento.

Entrando en el objeto del artículo, analizaremos la certificación de Sostenibilidad Operacional de Uptime desde el punto de la aplicación y efectividad.

 Empezando con un análisis sencillo  de un Data Center, podríamos resumir las tareas del día a día según el cargo empezando desde los niveles de dirección hacia las operaciones de campo.

 CxOs

  1. Establecer el presupuesto anual

  2. Control de costes

  3. Crecimiento de resultados

  4. Definir el plan de inversiones

  5. Análisis de resultados para presentación a consejo de administración

 
Infraestructuras electromecánicas o bien mantenimiento

  1.    Control de valores acorde a los umbrales de operación adecuados del equipamiento

  2.      Facilitar energía a nuevos racks

  3.      Mantenimientos preventivos y predictivos

  4.      Mantenimientos correctivos

  5.      Gestión con fabricantes y otros proveedores para escalar soporte con SLA determinado.

  6.    Renovación de elementos o gestiones para ello. Control de stock de repuestos.

  7.      Enviar solicitudes de recursos a CxOs.

Personal IT

  1. Gestión del cambio en servidores, electrónica y conexiones de network con un  SLA determinado.

  2. Etiquetado de racks, equipos y cables de networking

  3. Enviar solicitudes de recursos a CxO

  4. Servicios de manos remotas

       Si analizamos las operaciones por cada perfil, perdemos la visión holística de las operaciones.

Como se puede percibir de estas actividades, todas están vinculadas, y por tanto hay que analizar el conjunto y no las partes.

La certificación de Sostenibilidad de Operaciones de Uptime, podría ser similar a las que se aplican a otros sectores, y por tanto, en BJ creemos que hay aspectos que deben definirse con algo más de precisión, al igual que se hace en otros sectores.

La definición de procesos y su documentación es la base de todo marco operacional, sin embargo, la automatización de procesos es muy importante, y asegurarnos de la aplicación de los mismos, apoyándonos en tecnología es realmente el mejor resultado de un buen marco operacional.

 A continuación, quisiera presentar algunas situaciones que creo que pueden ser familiares para muchos de vosotros con el fin de facilitar el mensaje.

  •     Etiquetas de los nombres de los servidores no corresponden con la            documentación excel o word.

  • Etiquetado de cables de network tienen variaciones entre las que realizan distintos técnicos.

  • Ubicación de servidores no corresponde con la documentación excel o word.

  • Puntos de exceso de calor en alguna zona del Data Center, teniendo zonas donde al pasar se ven racks bastante vacíos y en el que se aprecia más frío.

  • Reubicación de equipos TI por falta de puertos de red o energía.

  • Nombre físico de los puertos de los servidores, chasis blade y sobre todo switches, difiere del nombre que se indican en los partes de trabajo.

  • Medición manual todos los meses del consumo eléctrico por rack.

  • Realización de termografías puntuales.

  • Reprocesos en gestiones de altas y bajas de equipos y cableado por información incompleta o incorrecta.

  • Informes que cuesta mucho realizar porque los datos están muy repartidos entre áreas.

  • Dificultad en configuración de previsiones de crecimiento o necesidades.

  • Conocimiento ágil sobre el estado de los mantenimientos.

La certificación intenta ayudar a detectar los procesos que debe tener un Data Center y la documentación necesaria para su ejecución. Sin embargo, no detalla en muchas ocasiones la forma de llevarlo a cabo, dejando posibilidades de cumplimiento de la norma con metodologías anticuadas y poco eficientes dada la cantidad de información que se maneja y la inmediatez de atender las cuestiones del día a día.

Por ejemplo, llevar una gestión del estado de los mantenimientos puede realizarse en un excel, cumpliendo con el requerimiento de la norma, sin embargo, cuando se necesita conocer el estado, puede que ese archivo lo manejen únicamente personas del área electromecánica, y accesible por parte del equipo, por tanto,  requiere de una validación de que el archivo está efectivamente  actualizado. Entra en juego la confiabilidad del dato.

Si disponemos de un control automatizado y centralizado en un software, la información estará accesible por todos los interesados, sabiendo que la información está actualizada, ya que hay un proceso definido y automatizado.

Es por ello, que Bjumper apuesta por el uso de tecnología que permita automatizar los procesos definidos en el marco operacional, utilizando los datos centralizados en una plataforma DCIM, que concentra los datos que necesitan todos los roles del Data Center.

DCIM puede recibir información de la infraestructura electromecánica en diversos protocolos , realizar una gestión de activos completa de equipos TI, así como el cableado de energía y Network. Ofrece la posibilidad de incluir los workflow de trabajo tanto en las operaciones de gestión del cambio TI como de los mantenimientos de equipamiento de energía climatización.

La concentración de información en DCIM ofrece la base tecnológica para acometer el reto de automatizar las operaciones en el Data Center con garantías para ofrecer la información necesaria para la toma de decisiones de los distintos roles del Data Center.

Nuestra labor no es certificar, no somos de hecho empresa homologada para ello. Somos una empresa comprometida con nuestros clientes para que las certificaciones sean útiles en el día a día y ayudamos a la definición, análisis y mejora de esos procesos de forma continua.

Es sencillo: buena definición de procesos, facilitados y automatizados por la tecnología y asegurar el conocimiento de las personas de dichos procesos y del uso de los sistemas te garantizará una gestión adecuada de tu infraestructura.


                                                                      

                                                                       Let it work for you!