Difícilmente hoy una empresa piense en su panorama tecnológico sin involucrar alguna estrategia de monitoreo, es decir, de esas soluciones que permiten detectar si cualquier elemento -desde un nodo hasta una red y desde un servicio específico hasta una API (siglas en inglés por interfaz de programación de aplicaciones)- funciona bien, si se maneja con tiempos de respuesta adecuados y si su desempeño es correcto, entre otros parámetros similares.
La observabilidad surge como una evolución del monitoreo, en especial para infraestructuras muy grandes o complejas, como las que suelen gestionar las distribuidoras de contenido audiovisual, las grandes plataformas de e-commerce o las empresas de servicios financieros. En esos casos, los sistemas de monitoreo suelen crecer fuera de control al punto de que los administradores lidian de manera literal con decenas de miles de datos, alarmas y semáforos.
En esa marea de información, resulta casi imposible determinar qué es importante, lo que representa un doble riesgo: por un lado, un uso extensivo de recursos para atender situaciones que en realidad no eran problemáticas; por el otro, la posibilidad de que un conflicto de proporciones se vuelva «invisible» entre tanta alerta simultánea.
Ordenar, jerarquizar y accionar
En este contexto, la observabilidad se nutre de tecnologías de avanzadas como machine learning y deep learning para ordenar ese enorme caudal de información, jerarquizarla, extraer insights, generar diagnósticos en tiempo real y proponer cursos de acción preventivos o correctivos -de acuerdo al nivel de avance del problema-, todo eso con la menor participación humana posible. En los casos en que resulta necesaria la intervención de una persona, esta dispone de dashboards claros que permiten tomar decisiones informadas y ágiles.
El perfil de los talentos necesarios para llevar adelante una estrategia de observabilidad cambia respecto de las habilidades requeridas para administrar el monitoreo: en el primero de los casos, se vuelve muy importante contar con capacidad de análisis funcional, a diferencia de lo que ocurre para el segundo, donde es suficiente una mirada técnica para entender parámetros sencillos como que el servidor no se quede sin memoria. Ese paradigma tradicional de acumular eventos en logs y producir análisis “post-mortem» de problemas que no pudieron evitarse está quedando obsoleto.
Un proceso y no una solución
La observabilidad es más un proceso que una solución y se apoya en una mirada más proactiva, que busca resolver situaciones desde una perspectiva del negocio. Por ejemplo, si una empresa tiene servidores distribuidos en tres zonas de disponibilidad y detecta anomalía en un patrón de comportamiento en uno de ellos, la observabilidad le permite definir cómo se puede traspasar el tráfico a los otros dos de forma natural y desatendida -es decir, sin un ser humano que presione ningún botón-, de manera que no resulte brusco y no genere problemas de desempeño en algún punto.
O, por citar otro caso, cuando se detecta de manera anticipada que los pedidos tienden a encolarse en una plataforma de e-commerce y se decide revisar y optimizar los procesos del back office antes de sufrir el abandono de las compras por parte de los clientes. Las posibilidades son muy numerosas y dependen de las necesidades puntuales de cada empresa o de las características de las diversas industrias.
El camino hacia la observabilidad
Las empresas que inicien el camino a la observabilidad deben considerar que es fundamental contar con un volumen de datos de alta calidad. En caso de que no existan, el proyecto iniciará por la creación de un data lake como repositorio, luego la definición de una capa semántica para garantizar un acceso eficiente y recién en una instancia posterior se trabajará la estrategia de observabilidad.
Por otra parte, se trata de una implementación que, para que entregue resultados exitosos, no se puede hacer de la noche a la mañana. Una estrategia para ingresar en este mundo es elegir uno o dos puntos de dolor del sistema de monitoreo, evolucionarlos hacia la observabilidad y obtener valor rápidamente para apuntalar en ese éxito los siguientes proyectos.
El esfuerzo valdrá la pena: según estimaciones de Nubiral, el tiempo de diagnóstico de un problema podría reducirse hasta en un 80%. En palabras de la vida real: lo suficiente como para evitar una caída en el sistema.