Speech to Speech translation: la traducción instantánea ya está aquí

Innovación, Tecnología


Entre los dispositivos futuristas de la serie Star Trek, ninguno parecía más útil que el traductor universal: un adelanto tecnológico que ayudaba a fomentar el entendimiento entre las civilizaciones intergalácticas presentes en la ya mítica saga cinematográfica. No hace falta salir de nuestro sistema solar para recordar cómo la comunicación universal ha sido un sueño humano casi permanente, que de forma periódica nos ha llevado a imaginar cómo sería expresarse en un idioma y obtener la comprensión automática de interlocutores de otras lenguas completamente distintas.

Este hito, sin embargo, ha ido convirtiéndose casi en una necesidad a medida que fenómenos como el turismo, el comercio internacional, la telemedicina o la inmigración se han hecho más globales y ha trascendido, con ello, las tradicionales barreras entre países, culturas y dialectos.

La traducción simultánea es una tarea muy compleja que incluye casi todas las capacidades cognitivas y emocionales humanas. Jaime Carbonell, director de Tecnologías del Lenguaje de la Universidad de Carnegie Mellon, explica que “el problema más difícil es interpretar el contexto para elegir el significado correcto de una palabra y resolver la ambigüedad, de modo que las frases sean correctas en el idioma de destino”.

¿Cómo funciona esta tecnología?

Salim Roukos, Senior Manager de Tecnologías de PNL en el Thomas J. Watson Research Center de IBM, describe las funciones que deben desarrollar los sistemas de traducción simultánea:

  1. Reconocimiento de voz: convertir el audio de la lengua de origen del hablante en texto escrito;
  2. Conversión de texto a texto: traducir el texto al idioma de destino;
  3. Conversión de texto a voz: sintetizar el audio de la lengua de destino.

Estas tres tareas deben realizarse al unísono, individualmente y en conjunto para lograr un buen resultado. Los desafíos tecnológicos que plantea este proceso en apariencia sencillo son:

  • Reconocimiento de voz: cuando no se articulan las palabras, cuando se habla rápidamente o se olvidan palabras, si se tiene acento pronunciado…
  • Palabras fuera de vocabulario: principalmente, debido al uso de dialectos y argots propios de cada cultura.

¿Qué papel están jugando las grandes compañías?

Google en los últimos días ha actualizado su aplicación para móviles Google Translate. Basta con ver este vídeo para darse cuenta de que con solo pulsar el botón de escucha para que el software proceda a hacer de “intérprete”. Además, a través de la cámara de nuestro móvil y gracias al sistema World Lens podremos enfocar una imagen y traducir al instante su texto o símbolos en una característica que, por el momento, solo acepta los idiomas español, inglés, francés, alemán, italiano, portugués y ruso.

Skype, no iba a ser menos, y también ha lanzado su servicio Skype Translator ofreciendo traducción simultánea para usuarios que mantengan conversaciones en inglés y español. Asimismo, además del audio también traduce de forma automática textos.

En agosto de 2013, Facebook adquirió el equipo y la tecnología de Mobile Technologies, una empresa emergente surgida de Carnegie Mellon que dispone de un software de reconocimiento de voz y traducción automática llamado Jibbigo. Esta aplicación permite a los usuarios grabar su voz, traducir las palabras en pantalla y leerlas en voz alta en cualquiera de los 25 idiomas disponibles.

Phraselator es, por su parte, el sistema que el Ejército de los Estados Unidos utiliza en Afganistán e Irak para traducir frases en tiempo real a 25 idiomas distintos, gracias a un dispositivo móvil que portan sus soldados y que se conoce como Sigmo.

La aparición cada vez más recurrente de aplicaciones como éstas o como Speak and Translate o iTranslate y hacen pensar en un rápido avance de dicha tecnología y en un acceso generalizado a la misma en un corto espacio de tiempo. En un futuro más lejano, podríamos encontrar este tipo de servicios acoplado a dispositivos wereables. Herramientas como las Google Glass permitirán, por ejemplo, leer el periódico en el idioma que cada persona elija. Investigadores como Babak Parviz, de la Universidad de Washington, van más allá e imaginan lentes de contacto con conexión a Internet que posibilitarán una traducción instantánea.

Tales pronósticos anticipan cambios sociales aún insospechados. Puede que, entre ellos, figure el abandonar para siempre el aprendizaje de segundas y terceras lenguas.

Esta y otras 14 tecnologías que cambiarán nuestra vida en los próximos años las analizamos en el whitepaper publicado recientemente en Territorio creativo: #Tctrends. Os invito a echarle un ojo y conocer más acerca de los coches autónomos, las monedas virtuales, ordenadores que predicen cosechas, robots repartidores de mercancía, células artificiales que atacan microtumores, prótesis de fabricación 3D casera y sensibles al tacto…

Menú