Cómo las interfaces de usuario de voz están dominando el mundo y por qué deberías tenerlo en cuenta

Daniel Requejo

6 abril 2018

180406 gr rebelthinking vuie wp 1 1

Las interfaces de usuario, o IU, son aquéllas que nos permiten interactuar con máquinas. Abarcan todo, desde aquellas cosas que tendemos a dar por hechas, como los teclados y las pantallas de nuestros ordenadores, hasta tecnologías más sofisticadas, como las interfaces de usuario basadas en movimiento, como en la que se basa la Xbox Kinect. A medida que se introducen nuevas tecnologías, su tasa de adopción depende totalmente del desarrollo de un diseño de interfaz de usuario eficiente y centrado en las personas.

captura de pantalla 2018 04 05 a las 20 33 19 1

Diferentes tipos de interfaz de usuario

La interfaz de usuario de voz, o VUI (voice-user interface), ha adquirido mucha popularidad en los últimos años. Los VUI utilizan tecnología de reconocimiento de voz para permitir a los usuarios interactuar con máquinas sólo a través de su voz. Las asistentes virtuales como Siri y Alexa han llevado a las VUI a una nueva dimensión, con gigantes como Google y Sonos siguiendo su ejemplo. Algunas empresas, como Synqq y Nexmo, han aprovechado estas tecnologías para desarrollar dispositivos que permitan la traducción y transcripción en tiempo real. Sin embargo, los asistentes virtuales también juegan un rol fundamental en el mundo empresarial.

Las VUIs permiten que haya interacciones eficientes que sean más «humanas» en su naturaleza que cualquier otra forma de interfaz de usuario. «El discurso es el medio fundamental de la comunicación humana«, escribe Clifford Nass, investigador de Stanford y co-autor de Wired for Speech, «…todas culturas persuaden, informan y construyen relaciones principalmente a través del discurso.» Para crear sistemas VUI que funcionen, los desarrolladores necesitan entender en su totalidad las complejidades de la comunicación humana. Los consumidores esperan un cierto nivel de fluidez en la idiosincrasia humana y, además, un tono más conversacional por parte de los bots y asistentes virtuales con los que interactúan casi a diario.

Todavía no vivimos en el universo como el de Westworld, pero queda claro que los asistentes robóticos estarán aquí para quedarse. En este sentido, es importante entender todos los riesgos potenciales y las oportunidades positivas que se presentan con esta nueva tecnología popular; por lo tanto, exploremos lo bueno, lo malo y lo francamente feo de la VUI.

 

Lo Bueno

Con el fin de crear una buena VUI, las marcas necesitan conocer a sus consumidores, qué es lo que quieren de un asistente virtual y, más importante, cuáles son los aspectos de la interacción con la Inteligencia Artificial (IA) que los llevan al límite. Hay una infinidad de beneficios que vienen desde el uso de una VUI que otras interfaces de usuario no pueden proporcionar, es decir:

  • Personalidad y tono: con asistentes virtuales basados en voz, hay más oportunidades para que las marcas inyecten un poco de personalidad y humor. Pídele a Siri que te haga beatbox por ti y ella lo hará, llámala por un nombre equivocado y te dirá «Muy gracioso. Quiero decir, no es gracioso, ‘ja-ja’, pero es gracioso». Google Home está totalmente familiarizada con referencias de la cultura pop, desde Star Trek hasta Sir Mix A Lot, como Alexa de Amazon. Un tono más personal ayuda a los usuarios a perdonar aquellos momentos en los que los asistentes virtuales son todavía incapaces de completar tareas o responder a preguntas con las que un humano real no tendría ningún problema. Una VUI cercana también ayuda a aumentar la afinidad de la marca: es más probable que utilice un dispositivo o servicio si sea más entretenido y, esencialmente, de una naturaleza más «humana».
  • Eficiencia y conveniencia: una VUI no requiere nada más que un comando vocal para llevar a cabo tareas o responder a preguntas. Los cocineros amateurs ya no se verán obligados a lavarse para ajustar un temporizador para no manchar las pantallas de sus smartphones carísimos. Ahora pueden pedírselo a Alexa y ella lo arreglará para ellos. Los usuarios pueden consultar rápidamente el pronóstico del tiempo al salir de casa, añadir un artículo a su lista de compra sin tener que buscar un bolígrafo, o saltarse una canción en Spotify sin mover un dedo. Es más probable que las VUIs existan dentro de dispositivos que están en línea y conectados durante todo el día, dispositivos que algún día pueden ser integrales para nuestra vida diaria.
  • Una experiencia más «humana»: un software de reconocimiento de voz preciso y eficiente permite una conversación más «humana» que la que se puede realizar con cualquier otro dispositivo. No debemos subestimar el valor de la interacción humana; si alguna vez ha tenido una larga y tediosa conversación telefónica con un centro de atención al cliente automatizado, entonces sabe que no siempre es fácil conseguir la interfaz VUI correcta, o cualquier tipo de interfaz de usuario conversacional. Sin embargo, con los avances del aprendizaje automático y el procesamiento del lenguaje natural, las interacciones con marcas y dispositivos a través de una VUI se están volviendo rápidamente más «humanas» y menos robóticas. La implementación de una tecnología basada en VUI demuestra un compromiso real con una cultura de centralidad humana.

 

Lo Malo

Como se mencionó anteriormente, la implementación de la VUI no está carente de obstáculos. A menudo, los problemas que se presentan durante el proceso de conceptualización y diseño son el resultado de una comprensión insuficiente de la psicología humana. Para evitar problemas relacionados con la adopción y la frustración del consumidor con los dispositivos basados en VUI, debemos tener en cuenta lo siguiente:

  • Descubrimiento y retención: mientras que Amazon ha hecho muy fácil para los desarrolladores de terceros llegar a sus propias habilidades para Amazon Echo, sólo el 31% de los 7.000 + habilidades tienen más de una revisión, una indicación de bajo uso. Este tema no es exclusivo de Amazon. Para aumentar la tasa de adopción, los desarrolladores necesitan transmitir a los usuarios lo que pueden y no pueden hacer desde el principio, mientras trabajan todo el tiempo para `humanizar’ los sistemas VUI sobre los que están construidos estos asistentes virtuales.
  • Comprender las limitaciones: cuando una máquina y un humano participan en una conversación, tenemos que adaptar la forma en que nos comunicamos (los seres humanos no están acostumbrados a seguir una ley lingüística estricta e inquebrantable, especialmente cuando se trata del habla). Si los usuarios entienden desde el principio las formas en que su dispositivo está limitado, es menos probable que se sientan decepcionados cuando su asistente no completa una tarea o no responde, lo que podría parecer una pregunta muy simple.
  • Procesamiento del Lenguaje Natural: actualmente no somos capaces de desarrollar una VUI con una comprensión incorporada, natural y compleja de la comunicación humana, aún no. Acentos regionales, jerga, matices conversacionales, sarcasmo… algunos humanos luchan con estos aspectos de la comunicación, así que en este momento, ¿podemos esperar mucho más de una máquina?
  • Feedback visual: la inclusión de un elemento de retroalimentación visual ayuda a reducir el nivel de frustración y confusión en los usuarios que no están seguros de si el dispositivo está escuchando o entendiendo lo que están diciendo. El anillo de luz azul de Alexa, por ejemplo, comunica visualmente el estado actual del dispositivo, por ejemplo, cuando el dispositivo se está conectando a la red WIFI, si se ha activado o no el «modo no molestar», y cuando Alexa se está preparando para responder a una pregunta…etc.

 

Lo Feo

En los últimos meses, la privacidad del usuario se ha convertido en un tema aún más polémico; tras el escándalo de Cambridge Analytica, las acusaciones de que dispositivos como Google Home y Alexa de Amazon podrían estar escuchando conversaciones privadas y en vísperas de la introducción de GDPR. Los consumidores están empezando a preguntarse: ¿qué se está grabando, qué se está almacenando y cómo utilizan mis datos privados las empresas? A medida que sigue aumentando la preocupación por la privacidad, la confianza en los asistentes virtuales y en la IoT en general está disminuyendo. Para recuperar la confianza, los desarrolladores y fabricantes de tecnología deben encontrar formas de asegurar a su base de consumidores que su privacidad es de la máxima prioridad, al mismo tiempo que confían en que con el tiempo los consumidores se sentirán más cómodos con la tecnología.

 

El Futuro de VUI

El objetivo de los sistemas basados en VUI es proporcionar a los usuarios una experiencia totalmente inmersiva; matizada, compleja y de naturaleza más humana. Todavía no hemos llegado a ese punto, pero los avances tecnológicos que nos permiten desarrollar algoritmos más complejos y software más apto para simular comportamientos humanos, han abierto más oportunidades de crecimiento, tanto en el hogar como en el lugar de trabajo.

  • Uso profesional: a finales de 2017 Amazon anunció Alexa for Business, diseñado para ayudar a los empleados a administrar sus horarios, hacer un seguimiento de su lista de tareas, marcar en conferencias telefónicas y hacer llamadas de voz en su nombre. Alexa for Business permite a las plataformas de reuniones controlar los equipos de su sala de conferencias usando sólo su voz, notificar a IT sobre una impresora averiada y recuperar los últimos datos de ventas o niveles de inventario. Dentro del entorno de trabajo, el asistente virtual se convierte en la secretaria virtual.
  • Casas Inteligentes y la IoT: La mayoría de los asistentes virtuales entran en la categoría de dispositivos domésticos inteligentes. Cuanto más nos centramos en la compatibilidad entre los dispositivos domésticos inteligentes, más nos acercamos a un hogar completamente interconectado. Con Google Home, los usuarios controlan todos los dispositivos de Google de sus hogares a través de su teléfono inteligente Android. Google Assistant puede controlar más de 1.000 productos domésticos inteligentes, entre los que se incluyen calderas, microondas, aspiradoras robotizadas y termostatos. Con el HomePod de Apple, los usuarios pueden incluso utilizar una frase pegadiza como «Good Morning» (Buenos días) para encender varios dispositivos domésticos inteligentes a la vez.

 

Encontrar tu voz

La principal barrera que impide la implementación y aceptación generalizada de los sistemas VUI es el hecho de que los desarrolladores se ven obligados a adaptar las reglas de comunicación para adaptarse a las limitaciones del dispositivo. Para los usuarios, estas limitaciones pueden hacer que la interacción con estos dispositivos sea bastante tediosa. A menudo hay tantas respuestas diferentes y posibles a una pregunta, que los asistentes virtuales se encuentran en un bucle incómodo que enumeran un sinfín de opciones para restaurantes italianos o razas de perros. Muchos desarrolladores han intentado remediar esto limitando el número inicial de opciones presentadas a tres, y luego preguntando al usuario si quiere escuchar más. Para mejorar la calidad de la experiencia del usuario, necesitamos desarrollar máquinas capaces de comprender el contexto, el tono de voz y la actitud, con una mejor comprensión de la intención del usuario basada en datos históricos y en la observación de patrones de comportamiento anteriores. Tenemos que ir más allá de un guión preprogramado.

«Las interfaces con los sistemas digitales del futuro ya no estarán controladas por máquinas. Se centrarán en el ser humano», explica Werner Vogels, director de tecnología de Amazon, «Podemos construir interfaces naturales humanas para los sistemas digitales y con ello se activará todo un entorno».