Aprendizaje automático para mejorar el análisis conversacional y optimizar la escucha social

David García-Navas

2 junio 2016

En el pasado TcDesayunos, Isaac Hernández de Google for Work nos recordaba la serie de partidas en las que un ordenador ganó a Go a uno de los mejores jugadores del mundo. Un hito que ilustra cómo ha cambiado la forma en la que debemos entender lo que una máquina nos puede aportar: si en el pasado nos pareció notable que un ordenador pudiera ganarnos al ajedrez, ¿cómo es posible que en solo unos años la computación avance tanto para retarnos a un juego muchísimo más complejo?

La respuesta la encontramos en el aprendizaje automático o machine learning: la máquina que ganó jugando a Go analizó millones de partidas para evaluar patrones y utilizarlos en el momento llegando a jugadas muy eficaces. ¿Cómo podemos utilizar el aprendizaje automático en las actividades que nos afectan?

  • Mejorar la categorización o sentimiento de nuestros análisis

El aprendizaje automático (machine learning) es un subcampo de la inteligencia artificial (IA) que trata con algoritmos que permiten a las máquinas aprender. Algoritmos que a través de conjuntos de datos deducen información sobre las propiedades de esos datos y la información extraída le permite hacer predicciones sobre otros datos futuros.
Esto es posible debido a que casi todos los datos no aleatorios contiene patrones, y esos patrones permiten a la máquina generalizar. Con el fin de generalizar, se entrena un modelo con el que se determinan los aspectos importantes de los datos.

Muchas veces nos encontramos con herramientas de escucha social o monitorización que clasifican por sentimientos, etiquetas o categorías. Según la aplicación, pueden hacerlo manualmente, a través de librerías que tienen por defecto o bien con reglas en las que determinamos ciertos operados y términos a buscar. El modo manual es cercano al 100% en precisión pero muy lento y costoso en tiempo y generalmente el modo automático es mucho más impreciso aunque más rápido. ¿Cómo podemos mejorar ambos? Utilizando aprendizaje automático para combinar el conocimiento humano y servirlo a la máquina para que, poco a poco, afine sus procedimientos y pueda categorizar automáticamente pero con una precisión mucho mayor. Un ejemplo de herramienta que solemos utilizar para esto es MonkeyLearn.

  • Extraer conclusiones que afectan a negocio en tiempo real

El Procesamiento de Lenguaje Natural permite a la máquina «entender» textos o mensajes de voz que luego pasan a cadenas de texto susceptibles de ser analizados. Para entenderlo, considera un ejemplo sencillo en la compleja tarea del filtrado de correo electrónico. Supongamos que recibes una gran cantidad de spam que contiene las palabras «farmacia en línea.» Como ser humano, puedes reconocer patrones, y determinar rápidamente que cualquier mensaje con las palabras «farmacia en línea» es spam y debe trasladarse directamente a la basura. Ésta es una generalización que tiene, de hecho, un modelo mental de lo que es spam.
Después de marcar varios de estos emails, como mensajes de correo no deseado, un algoritmo de aprendizaje diseñado para filtrar el spam debe ser capaz de hacer la misma generalización que has realizado.

Texto automatizado

Gracias al Procesamiento de Lenguaje Natural, además, se pueden identificar patrones en textos o mensajes de voz casuales, emitidos de forma espontánea. Por ejemplo, un cliente tuitea sobre lo bien o mal que ha sido tratado en un concesionario y por qué ha tenido esa experiencia. Gracias a herramientas con PLN y machine learning podemos extraer conceptos e identidades (text mining) de las que podemos servirnos para identificar qué elementos de esa experiencia fueron positivos o negativos: el trato del comercial, la prueba del automóvil, la propuesta de precios o el ambiente. Como éste, otros casos en diferentes ámbitos marcan el viaje del consumidor. Por ejemplo, cómo obtener conclusiones que afectan a negocio a través de opiniones de clientes en comparadores de hoteles.

  • Salvar vidas

El suicidio es la segunda causa de defunción entre las personas de 15 a 29 años, un problema muy grave que afecta a la sociedad hoy en día a día. Con este problema en mente, el Grupo de Procesamiento de Lenguaje Natural y Sistemas de Información de la Universidad de Alicante decidió tomar medidas: han lanzado el proyecto de crowdfunding Life! para desarrollar una herramienta capaz de detectar sentimientos o emociones publicadas en base a texto en las diferentes plataformas sociales e intentar evitar estos fatales sucesos poniendo en contacto con organizaciones de prevención de forma anónima.

  • Mirando al futuro

Gracias a la aplicación de técnicas como el Aprendizaje automático, Procesamiento de Lenguaje Natural combinados con los avances en software y hardware podemos aplicar la precisión de la labor manual efectuada por una persona y su conocimiento de las experiencias realizadas a la automatización que supone que una máquina cada vez más avanzada sea capaz de mostrarnos patrones, ahorrarnos tiempo de trabajo y ofrecernos aprendizajes que nos permitan mejorar el análisis de procesos que día a día intentamos realizar con herramientas que tan solo infieren en base a unos pocos datos y que nos suponen un tiempo de elaboración demasiado costoso.