Por Natalia Regalado, Data Science Leader en Nubiral.
Datos sin estructura, uso ni visibilidad, que las empresas recopilan en grandes cantidades y que, por solo en relación a aspectos vinculados al almacenamiento y la seguridad, suelen generar más gastos y mayores riesgos que valor.
Esta es la definición, a grandes rasgos, del concepto de dark data (también llamados “datos ocultos” en español). ¿Algunos ejemplos? Las grabaciones de las llamadas que se realizan en los centros de atención al cliente, los videos que registran las cámaras de seguridad, datos de geolocalización, publicaciones en redes sociales relacionadas a los productos… La lista puede seguir durante un buen rato.
En un mundo data driven, en el que el valor diferencial está dado precisamente por la capacidad de basar todas las decisiones en datos, las empresas tienen que asumir el desafío de comenzar a rentabilizar su dark data.
Los primeros obstáculos
Existen algunas barreras que dificultan el aprovechamiento del dark data. Por lo pronto, según datos recogidos por Nubiral, el 85% de las empresas considera que no cuentan con una herramienta para capturar y almacenar esa data, mientras que otro 39% menciona que es ‘demasiada’ data y que el equipo de analítica del que disponen no es lo suficientemente grande para analizarla.
Son obstáculos que se pueden esquivar. Hoy en día, contamos con la ayuda de diferentes herramientas que nos permiten almacenar y procesar esta información. Existen diferentes arquitecturas posibles a la hora de pensar y armar una solución apropiada.
Las herramientas clave
No se debe perder de vista que cuando hablamos de dark data seguramente nos estemos refiriendo también a datos no estructurados, incluyendo audios, videos, blogs, posteos en redes sociales o correos electrónicos, por citar apenas algunos, por lo que sería ideal arrancar construyendo un data lake (lago de datos) que nos habilite a almacenarlos en un único repositorio centralizado de información.
El siguiente paso será reconocer las diferentes herramientas que podrían permitirnos, mediante el análisis de estos datos, obtener insights que agreguen valor al negocio. El abanico de posibilidades es amplio y abarca desde alternativas no-code o low-code (como pueden ser Excel o Tableau) hasta aquellas que requieren conocimientos de programación, como SQL o Python. Hay una opción que es la más adecuada para cada equipo de trabajo: es fundamental encontrarla.
Casos de uso ilimitados
La cantidad de casos de uso es también muy amplia. El procesamiento de las cámaras de seguridad ubicadas en las puertas de los locales comerciales, por ejemplo, podría indicarnos la cantidad de personas que ingresan al negocio y, de ese total, cuántas egresan con alguna bolsa (es decir, efectuaron una compra).
Las cámaras alojadas en la zona de cajas pueden ayudar a cuantificar el tiempo promedio que los clientes esperan para ser atendidos, información que podría utilizarse para mejorar la experiencia del usuario.
El análisis de los tweets de los clientes, por otra parte, ofrece información clave sobre si están conformes con los productos, así como datos de sus perfiles, sus hábitos y sus preferencias para que una empresa pueda armar promociones personalizadas. Tal como indicamos, el número de ejemplos es muy extenso para intentar abarcarlos todos en este artículo.
Por lo pronto, es hora de dar el primer paso: reconocer cuál sería la dark data de nuestro negocio y comenzar por almacenar toda esa información para, en un próximo paso, generar valor a partir de ella.