Los datos están consolidados como el núcleo de las organizaciones: los modelos data driven revolucionan la forma en que se toman decisiones en las empresas y avanzan de la mano de la aceleración de la transformación digital, la madurez de las soluciones analíticas apoyadas en inteligencia artificial y el número cada vez más grande de casos de uso relacionado con el big data.
Este enfoque hace que cobren mayor importancia conceptos como el de data governance (o gobierno de datos): un concepto que define un sistema de decisiones y responsabilidades que tiene como objetivo promover la gestión y la calidad de los datos en aspectos como disponibilidad (que estén accesibles cada vez que se los necesita y a disposición de quien los requiere), integridad (que sean correctos y estén completos, que haya consistencia a lo largo de los diferentes sistemas de toda la organización), usabilidad (facilidad para extraer valor a partir de ellos) y seguridad (que solo puedan acceder a ellos las personas autorizadas).
¿En qué momento se hace relevante la existencia de data governance en una organización? Cuando por el tamaño de la empresa, la complejidad del panorama de IT, la criticidad o el volumen de los datos se hace imposible una gestión tradicional.
Planes y procedimientos
Un programa de data governance incluye algo llamado “consejo de gobierno”, es decir un grupo de líderes que llevan adelante la estrategia y que tendrá diferentes responsabilidades en términos de monitoreo, control y actualización de los datos.
Además, incluye un conjunto de procedimientos y el consecuente plan de ejecución en los que se define de qué manera se va a producir el almacenamiento, el archivado, el respaldo y, por supuesto, la protección de los datos ante incidentes (accidentales o consecuencia de ataques) o errores, así como las estrategias de recuperación ante desastres.
En este mismo plano suelen establecerse procedimientos respecto de quién puede acceder a cada conjunto de datos, de qué manera, cuándo, a través de qué métodos y qué tipo de uso podrá darle. También se definen controles y auditorías que aseguren el cumplimiento de todas las normas definidas en este plan de gobierno.
Nuevos paradigmas arquitectónicos
Los nuevos desafíos que implican los datos hacen que emerjan también nuevas arquitecturas para dar soporte a las estrategias data driven. Es el caso de data mesh: un modelo de autoservicio que permite utilizar recursos y herramientas bajo demanda para procesar, preparar y analizar los datos necesarios para cumplir con una tarea a nivel de cada área, equipo o departamento.
El principal objetivo de este modelo es avanzar hacia una democratización en el acceso a los datos: evitar las brechas entre quienes los gestionan y quienes los utilizan, eliminar intermediarios y ofrecer una visualización única de 360º sobre los activos de datos.
Entre los principios que guían la arquitectura data mesh se cuenta la necesidad de establecer un gobierno de datos federado: un equilibrio entre las políticas y controles de gobernanza generales, para garantizar la calidad, la privacidad y el cumplimiento de políticas y normativas, y la flexibilidad del lado del usuario, para dar agilidad y escalabilidad.
Data fabric versus data mesh
Otra arquitectura tendiente a facilitar la gestión de datos en ambientes distribuidos, diversos y complejos es data fabric (o tejido de datos): al igual que data mesh, provee funcionalidades de gestión que habilitan una visibilidad única de todo el conjunto de datos independientemente de que estén ubicados en la nube, en instalaciones on premise o en el borde (edge) de la red.
Se destaca por su capacidad de conectar espacios de almacenamiento, tipos y fuentes de datos con los métodos apropiados para acceder a ellos de manera certera y oportuna, sea cual sea el proceso que los necesite, el entorno desde el que se lo requiera o el uso que se le vaya a dar.
La diferencia entre ambas arquitecturas se basa en cómo abordan el problema: data fabric crea una única capa de gestión virtual, mientras data mesh permite que los diferentes equipos gestionen los datos de acuerdo a sus necesidades específicas, respetando algunos elementos comunes de gobernanza.
Los caminos elegidos pueden variar, tener matices o diferir de acuerdo al tipo de organización, pero el destino es siempre el mismo: las organizaciones deben encontrar los mecanismos para avanzar hacia modelos data driven.