En los últimos años, se ha normalizado el uso de términos relacionados con las nuevas tendencias tecnológicas. Y abunda la literatura que habla sobre Inteligencia Artificial (IA), Machine Learning, Big Data o Analítica Avanzada. ¿Pero a qué hacen referencia cada uno de estos términos y qué nos aportan desde el punto de vista empresarial?
En todo este tiempo, a menudo me encuentro que existe una cierta confusión en lo que estas tecnologías representan y lo que pueden aportar. A lo largo de este post (serie de artículos) voy a tratar de aterrizar cada uno de estos conceptos, todos ellos relacionados entre sí.
Inteligencia Artificial (IA)
Uno de los conceptos emergentes es Inteligencia Artificial (IA), el cual, ha generado un creciente murmullo entre los líderes empresariales. Además de un próspero nicho para la aparición de startups, que ofrecen soluciones basadas en IA. Sistemas de recomendación, Chatbots o el coche autónomo, son algunos de los ejemplos más conocidos, pero podemos encontrar multitud de casos donde las soluciones basadas en IA están presentes en nuestro día a día. Lo que está empujando a que otros ámbitos más terrenales estén transformando el funcionamiento de las empresas.
Pero, ¿qué se entiende por IA? IA es un concepto amplio que define la ciencia capaz de hacer que las maquinas realicen cosas de forma “inteligente”. Es decir, que tengan cierta inteligencia a través de soluciones de software que las dotan de ella.
El concepto de IA ronda en la imaginación de los seres humanos ya desde la antigua Grecia. Y ya los primeros ordenadores nacieron como maquinas lógicas capaces de resolver cálculos básicos, lo que implicaba cierta inteligencia. A medida que ha ido progresando nuestra comprensión sobre la mente humana, ha ido evolucionando lo que entendemos por IA. Hoy en día, podemos decir que hace referencia a la capacidad de las máquinas para imitar procesos en los que se toman decisiones y realizan tareas que necesitan de cierta inteligencia, con resultados cada vez más cercanos a como lo resolvemos los seres humanos.
La inteligencia humana se apoya en una serie de capacidades en cuya base reside lo que entendemos por inteligencia: aprendizaje, razonamiento, resolución de problemas, percepción y comprensión del lenguaje. Todas ellas, se apoyan en habilidades analíticas. Y en habilidades analíticas también se basan las soluciones de IA. En la siguiente gráfica podemos ver los distintos niveles de lo que conocemos como disciplinas analíticas, desde lo más básico a lo más sofisticado.
La base de toda actividad de analítica, es entender qué está pasando utilizando la información del pasado. Es lo que cubre el análisis descriptivo, que nos ayuda a entender qué ocurre. Y el análisis de diagnóstico, que trata de entender por qué algo ha ocurrido. Desde el punto de vista empresarial, la ciencia de datos es lo que tradicionalmente ha cubierto las disciplinas Data Mining y Business Intelligence.
El siguiente paso lo cubren los siguientes tres niveles, tratando de utilizar y adquirir conocimiento para mejorar las decisiones que queremos proyectar a futuro. Es lo que entendemos como Analítica Avanzada y dota de “inteligencia” a lo que hoy entendemos por IA.
Cada uno de estos niveles utilizan técnicas estadísticas y matemáticas que permiten alcanzar el objetivo propuesto, entender qué ocurre, qué ha pasado, qué podrá ocurrir, qué debe hacerse para que ocurra lo que quiero y cómo puedo hacerlo para que sea lo más parecido a como lo harían los humanos. Gracias a técnicas de IA es posible automatizar la toma de decisiones, garantizando la calidad de estas decisiones y su aportación al negocio.
Y todo ello se apoya en algo, que para que sea posible lo necesitamos en gran cantidad: los datos. Aquí entra en juego otro concepto que seguro que nos suena: Big Data.
IA tiene sentido si tenemos datos y pueden ser explotados mediante técnicas analíticas para alcanzar los objetivos planteados. Estos objetivos pueden ser: conocer mejor a los clientes, mejorar la eficiencia de los procesos o incrementar la rentabilidad de los servicios que ofrecemos. De ahí la gran importancia que han adquirido este tipo de técnicas para las organizaciones empresariales.
Big Data
Dentro del concepto de Big Data se engloban todas las actividades relacionadas con los sistemas que manejan y manipulan grandes volúmenes de datos. Big data hace posible que dispongamos de la gran cantidad de datos que necesitamos para cumplir con objetivos como los que indicamos anteriormente. Proporciona la infraestructura y las capacidades necesarias para capturar, almacenar, transferir y tratar esta gran cantidad de información.
Big data permite manejar datos que no tienen por qué estar estructurados, es decir, que pueden proceder de cualquier origen (base de datos tradicionales, redes sociales o dispositivos IoT), en cualquier formato (imagen, audio, video o texto) y en tiempo real.
En la siguiente figura se muestran 5 características que lo definen:
Bien, volvamos a centrarnos en aquellas técnicas analíticas que agrupamos dentro de la Analítica Avanzada. Para hacer un zoom en cada una de ellas.
Analitica Predictiva vs. Machine Learning
De un tiempo a esta parte, el termino Machine Learning es ampliamente utilizado tanto por Data Scientist como directivos o responsables de negocio. Hay cierta confusión entre los conceptos Machine Learning y Analítica Predictiva. ¿Qué es cada uno de ellos y cuál es la diferencia?
El objetivo de ambas disciplinas es el mismo, ser capaces de predecir. La diferencia reside en el volumen de datos involucrados y la implicación humana a la hora de construir los modelos con capacidad de predicción.
El análisis predictivo utiliza técnicas estadísticas para estimar qué comportamiento o resultado es probable. Es decir, intenta proyectar lo que puede ocurrir prediciendo situaciones futuras. Por tanto, su naturaleza es probabilística, porque nos dicen cuál es la probabilidad de que algo suceda. Y lo hace tratando de encontrar relaciones y patrones entre variables utilizando información actual e histórica para extraen conclusiones y predecir el futuro. Una de las aplicaciones más conocidas para el análisis predictivo es la calificación crediticia, en la que las compañías financieras utilizan una variedad de información para evaluar la probabilidad de impagos futuros. Pero hay muchas más, como la propensión de un determinado cliente a comprar un tipo de producto o la probabilidad de que un empleado deje la compañía. A medida que disponemos de más datos, más precisas pueden ser nuestras predicciones.
Existen distintas técnicas estadísticas de modelado (gráfica inferior). Y su elección dependerá de la necesidad de tener un análisis descriptivo del resultado que nos ayude a entender por qué se llega a un resultado así, de la estructura y de los tipos de datos.
Machine learning es una disciplina que trata de construir modelos complejos y algoritmos que buscan también alcanzar una predicción. A diferencia de la anterior, esta funciona sin instrucciones explícitamente programadas, aprendiendo de los datos, permitiendo que los modelos evolucionen y se adapten a medida que se agregan nuevos datos. Es decir, solo nos apoyamos en los datos disponibles y el resultado que deseamos. El resultado del aprendizaje automático es una predicción que puede guiar las decisiones en tiempo real sin la necesidad de depender de la intervención humana.
Los enfoques principales incluyen el uso de redes neuronales, algoritmos genéticos, inducción de reglas y aprendizaje analítico. Pero a diferencia del análisis predictivo, que los utiliza de forma independiente, en ML se usan de manera híbrida. La combinación de métodos analíticos puede asegurar resultados efectivos y repetibles y confiables. Algo de especial valor para su uso práctico en las soluciones empresariales.
Una de las aplicaciones destacadas del aprendizaje automático es automatizar la adquisición de conocimiento en sistemas que pretenden emular el proceso de toma de decisiones de los seres humanos. De ahí que muchas veces lo veamos como una disciplina dentro de la computación cognitiva como veremos más adelante.
Hay casos de gran repercusión, como Amazon, que lo utiliza para hacer recomendaciones de productos personalizadas basándose en el comportamiento de navegación y compra del cliente casi al instante. Google lo utiliza para mejorar el resultado de las búsquedas. Facebook en el reconocimiento de imágenes para etiquetar y relacionar personas conocidas en las fotos. En el gráfico se muestra distintas aplicaciones de esta tecnología en la industria.
Un símil que he encontrado en SHARP SIGHT LABS y que me ha parecido muy acertado es el de que el «aprendizaje de la máquina» y «modelos estadísticos de predicción» son como gemelos idénticos. Comparten el mismo ADN, como los gemelos. Sin embargo, se visten de manera diferente, se relacionan con personas distintas y se comportan de forma distinta.