Una inmersión en las aguas profundas del aprendizaje automático
Deep learning es un subconjunto de machine learning que busca imitar el comportamiento del cerebro humano a través de una red de neuronas artificiales y de procesos de corrección a partir de los errores.
¿Puede un algoritmo imitar el comportamiento del cerebro? Esta es al menos la premisa del concepto de deep learning (aprendizaje profundo). Si bien está lejos de igualar el desempeño de los seres humanos en materia cognitiva, su arquitectura -redes neuronales artificiales con tres o más capas- le permite aprender de grandes cantidades de datos y emitir predicciones extremadamente precisas y optimizadas. No solo eso: por su propio funcionamiento, mejora con el paso del tiempo.
En la base del aprendizaje automático encontramos redes neuronales profundas con múltiples capas de nodos interconectados, cada uno de los cuales se basa en lo recibido de la anterior para refinar y optimizar la predicción o categorización. Esta progresión de cálculos a través de la red se llama “propagación directa”. En la llamada “capa de entrada” el modelo ingiere los datos y en la de salida, entrega la predicción o clasificación que utilizará la siguiente. La retropropagación, por su parte, calcula los errores en las predicciones y luego ajusta los pesos y sesgos de la función corrigiendo hacia atrás a través y entrenando el modelo por sí mismo.
ML y deep learning: parecidos pero diferentes
Muchas veces se confunde deep learning con machine learning (aprendizaje automático, ML). La realidad es que el primero es apenas un subconjunto del segundo. La principal diferencia entre ambos está en el tipo de datos que utilizan como materia prima y en las metodologías de aprendizaje que aplican. Si bien ambos trabajan con el aprendizaje supervisado (el que utiliza conjuntos de datos de entrada etiquetados por humanos), deep learning también se destaca en el no supervisado: es decir, detecta patrones y agrupa los datos por cualquier característica distintiva.
Así, en general, ML apela a datos estructurados y etiquetados, con características que se definen cuando se establece qué necesita el modelo para funcionar y dar resultados. Aún cuando emplee datos no estructurados -imágenes, videos, posteos de redes sociales, localizaciones geográficas, entre otros-, se los procesa previamente para ubicarlos en una tabla y que el algoritmo los reciba con algún tipo de estructura.
El aprendizaje profundo, en cambio, puede ingerir y procesar datos no estructurados y automatizar la extracción de funciones, lo que disminuye (incluso hasta cero) la dependencia respecto de la participación de humanos. Por ejemplo, si se pone a un algoritmo de deep learning a categorizar fotos de automóviles según marca, podrá determinar el elemento distintivo para identificar cada una de ellas, mientras que en ML probablemente sea necesario que un experto humano defina manualmente el patrón de reconocimiento (como podría ser el logotipo en el frente).
Deep learning en todos lados
Estamos en contacto continuo con soluciones de deep learning: se utilizan con frecuencia para tareas analíticas y de automatización relacionadas con inteligencia artificial para procesos en los que no hay ninguna intervención humana.
Los asistentes digitales capaces de llevar adelante conversaciones en lenguaje natural, los traductores inteligentes o los algoritmos con capacidad para detectar fraudes financieros son apenas algunos ejemplos. En el segmento salud, las aplicaciones de reconocimiento de imágenes son claves para anticipar enfermedades o investigar medicamentos o tratamientos. Cada vez que damos una instrucción a Siri o a Alexa estamos interactuando con una solución de deep learning.
Esto recién empieza
Según la especialización, el deep learning utiliza diferentes tipos de redes neuronales. Las convolucionales (CNN) se emplean para clasificación de imágenes y visión por computadora, mientras las recurrentes (RNN) son las que se emplean en aplicaciones de lenguaje natural y reconocimiento de voz.
Por supuesto, se trata de un concepto tecnológico que aún está muy lejos de desarrollar todo su potencial: su presencia es clave en el desarrollo de los vehículos autónomos o de las ciudades inteligentes, entre otras tecnologías emergentes. Y, por supuesto, para ayudar a los negocios a mejorar sus procesos, predecir comportamientos y llevar la experiencia del cliente a un nuevo nivel.
Deep learning: un paradigma sobre el que, valga la redundancia, vale la pena comenzar a profundizar.