La transformación digital avanza a toda velocidad. En el camino, las empresas encuentran innovaciones extremadamente atractivas: desde la inteligencia artificial para anticipar escenarios hasta estrategias para conocer a fondo el comportamiento de los clientes, pasando por incursiones en el Metaverso, por citar apenas algunos ejemplos.
Sin embargo, muchas veces esas iniciativas terminan en frustraciones: los resultados de negocios no suelen cubrir las expectativas. En líneas generales, las razones por la que esto ocurre suelen parecerse mucho. Una de las principales es que se utilizó como base un conjunto de datos inconsistente, incompleto o directamente erróneo.
El gobierno de datos cobra en estas situaciones una gran relevancia: no se trata de un proyecto tan “glamoroso” como uno de IA, es cierto, pero resulta clave para que este último tenga éxito. Se trata, en principio, de hacer un trabajo de análisis de arquitectura y un pulido para construir repositorios integrados, eliminar los silos y garantizar la calidad de todos los datos almacenados: una única fuente de verdad.
Los datos: elemento crítico del negocio
Si algo nos dejó en claro la aceleración digital de los negocios es que hoy los datos son esenciales para competir y ganar: la correcta explotación de este activo crítico permite obtener ventajas diferenciales que van desde optimizar las operaciones o ganar eficiencias en costos hasta incrementar la productividad o generar experiencias inolvidables para los clientes y también para los colaboradores, una cuestión clave en época de escasez y alta rotación de talentos.
El viejo paradigma de “acumular” datos está obsoleto. Hoy, las empresas necesitan definir cómo capturarán, guardarán, analizarán y tomarán acciones a partir de ellos. En este contexto, es importante establecer las estrategias de gestión, protección y almacenamiento que garanticen que cada usuario tenga los datos oportunos para tomar decisiones asertivas en el momento adecuado.
DataOps: de la expectativa a la realidad
En este marco, emergen algunos principios ágiles que buscan optimizar la gestión de datos y simplificar el paso de la idea o del proyecto a la realidad, de forma tal que las soluciones de datos estén alineadas con las necesidades del negocio.
DataOps, por ejemplo (cuyo nombre hace acrónico de “datos” y “operaciones”), es una metodología que tiene como objetivo generar una mayor eficiencia en la generación de valor y en la creación de análisis a partir de los datos.
Para lograrlo, combina equipos de científicos e ingenieros de datos con expertos en operaciones para que trabajen de manera colaborativa, unifiquen las herramientas, los procesos y las estructuras que se están aplicando y promuevan el modelo data driven dentro de la organización.
DataOps mejora la calidad de los análisis y los resultados. O, dicho de manera más sencilla, incrementa la probabilidad de éxito en las nuevas implementaciones de tecnología. Tiene, además, un beneficio adicional: reduce los costos de gestión de los datos.
MLOps: machine learning llega a producción
Otra metodología ágil que aprovecha un buen gobierno de datos para llevar a producción proyectos innovadores es MLOps (acrónimo entre “machine learning (ML)” y “operaciones”). Siguiendo la lógica descripta para la anterior, se trata de un ciclo de mejora continua que apela a la colaboración y la integración entre esos dos mundos para industrializar la producción de software basado en modelos matemáticos.
Hasta el momento, muchos de los proyectos de ML no logran superar la etapa de prueba de concepto, es decir, el estado en que el científico de datos está experimentando con los resultados, pero en que la solución no tiene impacto sobre el negocio.
MLOps se define precisamente como un “conjunto de prácticas y tecnologías para desplegar y administrar aplicaciones de aprendizaje automático en ambientes productivos de manera gobernada y escalable”.
Es cierto: probablemente resulte más “cool” trabajar en un proyecto innovador de IA que en una cuidadosa iniciativa de pulido de datos que incorpore conceptos de gobierno de datos y metodologías ágiles asociadas, como las mencionadas DataOps y MLOps. Pero nunca hay que perder de vista que la segunda es la que hace posible el éxito del primero.