Las 'big tech' intensifican la lucrativa demolición de la Torre de Babel con el ariete de la IA
Las soluciones de traducción cada vez más rápidas y fiables se extienden ahora a la voz y ultiman su asalto al consumo masivo, un nuevo filón de negocio innovador en el que Europa vuelve a aparecer en segundo plano
El despegue de la IA se topa con el talón de Aquiles del gasto energético
Esta funcionalidad es sólo para registrados
Iniciar sesiónLas nuevas tecnologías están removiendo los cimientos de la Torre de Babel. La gran sacudida ha venido con todo un arsenal de artilugios, herramientas y software, basados en inteligencia artificial, que realizan traducciones en multitud de idiomas casi al instante, o por lo menos con ... latencias que a veces ni llegan a uno o dos segundos. Lo sorprendente es que estos ingenios no solo traducen textos sino también voz, hasta el punto que un emisor puede estar hablando en español y el receptor recibir esas palabras, de forma casi simultánea, en inglés, y viceversa.
Sus aplicaciones son infinitas. Pueden traducir directamente desde una conferencia presencial, una llamada de teléfono, una videoconferencia, un mensaje de Whatsapp, hasta una conversación entre varias personas y cada una recibe el diálogo en su propia lengua y textos incluso reflejados en una foto.
Es una carrera por llegar a soluciones cada vez más precisas y a la cabeza están las grandes tecnológicas. El ingenio más reciente ha venido este mismo mes de la mano de Apple que ha presentado los auriculares AirPods Pro 3. Entre otras prestaciones, su IA traduce español, inglés, francés, alemán y portugués en tiempo real. Y se puede usar tanto en una conferencia como una conversación entre humanos.
Al activar la función de traducción, los auriculares detectan el habla y lo traducen directamente a los oídos en la lengua que se haya establecido previamente. El texto traducido aparece en el iPhone del usuario. El interlocutor (que no tiene los auriculares) puede ver la transcripción de la conversación y lo que el usuario está diciendo en el idioma que desee. Para que la comunicación sea fluida, la idea es que los dos interlocutores usen los AirPods. Así la conversación se traduce de forma simultánea. Apple quiere también extender esta función a italiano, japonés, coreano y chino.
La compañía de la manzana ha sido de los últimos en coger posiciones en esta carrera, porque Google ya tenía en el mercado sus auriculares Pixel Buds con la misma prestación. También la firma china Timekettle Edge tiene sus auriculares inalámbricos que traducen 40 idiomas.
Para cien idiomas
Existen desarrollos muy específicos para traducir. Meta (la empresa matriz de Facebook, Instagram, WhatsApp) desarrolló la tecnología Seamless, un modelo de inteligencia artificial que permite la traducción de 100 idiomas. Traduce textos, voz, de texto a voz y viceversa. Su latencia es menor a dos segundos, es decir que la traducción se realiza casi al instante. Además, esa IA es capaz de mantener la forma en la que habla la persona.
Durante su presentación Paden Tomasello, Research Manager at Meta, explicaba que el modelo SeamlessExpressive «conserva las complejidades del habla, como las pausas, la velocidad del habla y el énfasis en determinadas palabras, así como el estilo vocal y el tono emocional. Creemos que es imprescindible que nuestras traducciones no solo transmitan con precisión las palabras que pronunciamos, sino que también capturen las sutilezas de la expresión humana».
Contamos con otras aplicaciones específicas para traducir como Google Translate, Microsoft Translator, DeepL... Hay ingenios de todo tipo: una de las prestaciones que tienen las gafas Ray-Bande Meta, donde la tecnológica americana ha integrado IA, es también traducir en tiempo real inglés, francés, italiano y español. Al hablar con alguien en uno de esos idiomas, quien lleve puestas las gafas lo escuchará en la lengua elegida. También se transcribe la traducción de la conversación al móvil del usuario para que mantengan ambos el diálogo. En el mercado también se comercializan dispositivos, similares a un móvil, que son puramente traductores, como los que desarrolla la empresa polaca Traductor VA (Vasco Electronics), o la japonesa Pocketalk o la china Timekettle.
La revolución llegó en 2015 con la popularización de la traducción automática neuronal, una IA basada en Deep learning. «La mayoría de estos sistemas, como Google Translate y DeepL, se basan en esta tecnología. Se trata de una serie de redes neuronales multicapa que están continuamente procesando datos a través de algoritmos matemáticos. Las traducciones tienen una calidad y un rendimiento muy alto, porque son sistemas entrenados con grandes cantidades de texto, lo que arrojan una calidad en ocasiones similar a la traducción humana», explica Diana González, profesora de Traducción e investigadora en IA aplicada a la traducción en la Universidad de Valencia.
IA generativa
También tenemos las IA generativas como ChatGPT, Gemini, Copilot o Meta AI que son capaces de generar contenidos nuevos y también traducir. Meta AI incluso permite que los 'reels' (vídeos cortos) de los creadores de contenido se puedan traducir para llegar a más seguidores en otros países del mundo. «Los modelos GPT son grandes modelos de lenguaje (LLM, por sus siglas en inglés) que a diferencia de la traducción automática neuronal, tienen todavía más entrenamiento, mayor conocimiento de la lengua, mayor adaptación, información contextual y además se pueden supervisar, refinar y ajustar. Y van aprendiendo. No están concebidos específicamente para traducir, sino que son sistemas que pueden realizar diversas tareas, como resumir, buscar información, parafrasear, revisar o adaptar un texto, analizarlo....», indica Diana González.
En cualquier caso, el proceso de traducción, en el que el protagonista es el lenguaje natural (propio del ser humano), está cada vez más tecnologizado. «Cada vez se automatiza más el proceso de traducción, para que sea más rápido, de mayor calidad, más productivo y barato, es decir que se traduzca más texto en menos tiempo, por lo que las empresas proveedoras de servicios lingüísticos están invirtiendo grandes sumas en estos nuevos desarrollos», considera la investigadora.
Y en la carrera, Europa no puede alcanzar los grandes desarrollos. «Los modelos fundamentales de IA exigen enormes inversiones, una capacidad de computación gigantesca y gran cantidad de datos. Y está en manos de las grandes tecnológicas. Nuestro potencial comparado con el de Meta o Google no tiene nada que ver, ellas tienen todo», asegura Daniel Fernández, CEO de Fonvirtual, una plataforma de comunicaciones que ofrece servicios de centralita virtual y call center en la nube, entre ellos traducciones con IA. «Empresas -continúa- que apliquen modelos para la traducción simultánea hay, pero que desarrollen y hagan evolucionar el estado del arte en Europa, apenas».
Daniel Fernández cita el caso de Kyutai, el primer laboratorio europeo de iniciativa privada dedicado a la investigación abierta en inteligencia artificial ubicado en París. Este mismo año ha presentado Hibiki, un modelo de traducción simultánea oral y escrita en tiempo real. Por ahora, solo puede hacerlo de francés a inglés.
Una posibilidad de seguir la estela de esta carrera es aprovechar los modelos de código abierto, como sugiere Fernández. «China -afirma- es un actor fundamental en el sector de la innovación en IA. Alibaba ha desarrollado un modelo de traducción automática basado en IA. Se llama Marco MT y, a priori, supera a ChatGPT. China está trabajando mucho en modelos 'open sources', en modelos abiertos que cualquiera puede coger, descargar, adaptar y utilizar de manera gratuita y local. Esto es importante para Europa. Las empresas europeas o dependen de las grandes tecnológicas americanas o utilizan estos modelos de código abierto que vienen de China y los pueden adaptar a sus necesidades».
Privacidad
En Europa además tenemos otra derivada: una normativa mucho más estricta para proteger la privacidad de nuestros datos. Los datos sí pueden salir de Europa, pero el lugar de destino debe cumplir una serie requisitos y tener un nivel de protección adecuado. Y da la casualidad que todas estas herramientas y dispositivos basados en IA funcionan en la nube, es decir en servidores remotos. «Y no se sabe qué garantías de cumplimiento de privacidad existen si se sacan las conversaciones y los datos fuera de Europa», plante Daniel Fernández.
De hecho, la función de traducción de los nuevos AirPods de Apple no ha llegado, por ahora, a la UE. Pero esta vez por un motivo diferente a la salvaguarda de la privacidad. Los auriculares solo son compatibles con iPhone. En un comunicado oficial, Apple explicó que la Ley de Mercados Digitales (DMA) europea les exige hacer que esta función sea compatible con «productos y aplicaciones que no son de Apple» antes de introducir la función de traducción de los AirPods Pro 3 en el mercado de la UE.
Debate
En el debate también está en identificar hasta qué punto estos artilugios y software con IA ofrecen la precisión de traducción que puede dar un traductor e intérprete humanos. Porque los errores en una traducción se pagan muy caros. «Hay textos con cierta complejidad, como el manual de un electrodoméstico. Errores al traducir este documento a varios idiomas pueden acabar con la reputación de una empresa. O se dan situaciones complejas en las que equivocarse en la traducción sale caro, por ejemplo cuando un operario se traslada a otro país a explicar el funcionamiento de una máquina», comenta Miguel Pérez Bornstein, vicepresidente de la Asociación Española de Traductores, Correctores e Intérpretes (Asetrad). «En las condiciones de entornos reales -continúa- estas tecnologías a día de hoy no dan garantías de un buen funcionamiento. En una conferencia a veces el sonido no es totalmente bueno. La máquina puede errar dependiendo del acento del interlocutor, de su entonación, de que su lenguaje sea correcto... La IA no sabe juzgar si el interlocutor utiliza un término con doble sentido, si se entiende o no lo que dice, o cuál es la última intención de un hablante o un escritor. Y esto sí sabe hacerlo un intérprete humano».
Desde hace años, los modelos de IA también los utilizan los propios traductores humanos. «Son los servicios posedición: el modelo realiza una primera traducción del texto y el profesional lo revisa y hace los cambios necesarios», indica Miguel Pérez. La supervisión es la garantía de una calidad correcta. «La máquina supone una mejora pero debe plantearse dentro de cada proyecto de traducción. Cada uno requiere diferentes necesidades. Y siempre un traductor profesional tiene que controlar el proceso», considera Diana González.
Otro planteamiento que está sobre la mesa es si estos ingenios de IA acabarán algún día con la riqueza que supone para el ser humano aprender idiomas. «La traducción simultánea con IA no elimina la necesidad de saber idiomas para una comunicación fluida y natural», cree Daniel Fernández.
Ejemplos cercanos
A pesar de que las grandes tecnológicas estén a la cabeza de estos desarrollos, en Europa contamos con compañías que también generan tecnología para la traducción. Por ejemplo, la empresa polaca Traductor VA tiene varios productos en el mercado. Con una latencia de 0,5 a un segundo desde que una persona deja de hablar hasta que se reproduce la traducción oral, su traductor Q1 (un dispositivo inteligente muy similar a un pequeño móvil) trabaja con 86 idiomas. Además tiene la capacidad de clonar la voz del interlocutor y permite hablar como un nativo en 54 lenguas diferentes. Puede traducir llamadas de teléfono, el texto de una imagen, documentos... «Utilizamos varios motores para una traducción de calidad, con un nivel de precisión del 96%. Nuestro traductor primero reconoce la voz, la transforma en texto, luego realiza una traducción con inteligencia artificial y vuelve a convertir el texto en voz. Tiene internet gratuito y funciona en 200 países», cuenta Fernando Santonja, director regional del Sur de Europa y Sudamérica de Traductor VA.
Esta compañía empezó a comercializar diccionarios electrónicos en 2008 hasta que dio el gran salto a su primer traductor de voz en 2013. Ahora acaba de sacar al mercado los auriculares que traducen conversaciones fluidas en 51 idiomas. «Cada interlocutor recibe en su idioma. Ofrecemos una solución para que todo el mundo pueda comunicarse. Pero la IA nunca podrá hacerlo tan bien como una comunicación natural entre personas que se miran a los ojos y se ven los gestos», considera Fernando Santonja.
Aplicaciones
Los escenarios donde utilizar estos dispositivos parecen infinitos. Cruz Roja ha empleado estos traductores en misiones de ayuda humanitaria en Ucrania y la ONG Open Arms también los tiene en sus barcos. «Psicólogos Sin Fronteras, la Guardia Urbana de Cataluña para comunicarse con turistas internacionales, en cruceros, en hospitales y farmacias, en colegios para los profesores puedan comunicarse con los padres... Lo utilizan muchas empresas porque también nuestros traductores cuentan con un chat para grupos cuyos miembros están en diferentes partes del mundo y hablan en distintos idiomas, cada uno recibe el mensaje en su lengua. O para técnicos que tienen que reparar maquinaria en diferentes países, o para reuniones en diferentes idiomas, visitas guiadas a fábricas...», expone Santonja. Además, asegura que «tenemos la protección de datos bajo legislación europea, nuestros servidores se encuentran en Alemania y no se comparten conversaciones con terceros».
Tampoco las comunicaciones de los clientes de empresa española Fonvirtual salen de Europa, como garantiza Daniel Fernández. Esta empresa ha desarrollado un software capaz de realizar traducciones en tiempo real en todos los canales de comunicación tanto internos como externos que puede tener una empresa. Traduce llamadas telefónicas, videollamadas, mensajes de texto, chats, Whatsapp... al idioma de cada interlocutor. «Ofrecemos tanto un call center para atender a los clientes como una centralita virtual. Al activar la traducción simultánea, por ejemplo, un cliente que solicita una grúa para su coche averiado en francés, a los 3 o 4 segundos esa petición la recibe en español la operadora. Su respuesta en español, salta al cliente, a los 3 o 4 segundos, en francés», expone Daniel Fernández.
La traducción simultánea con IA se aplica sobre todo para dar servicio de soporte durante 24 horas siete días a la semana (resolver dudas, consultas y otras tareas repetitivas) y en servicios postventas. «También en reuniones de empresa donde participan miembros de diferentes países, o en cursos de formación con audiencia de distintos países», comenta Daniel Fernández.
Si la IA está todavía en un desarrollo inicial, quizá no sea tan descabellada la idea (desde luego muy futurista) que persigue Elon Musk con su chip cerebral para hablar idiomas. Y así pueda caer la Torre de Babel con la que Dios nos castigó en el Antiguo Testamento.
Límite de sesiones alcanzadas
- El acceso al contenido Premium está abierto por cortesía del establecimiento donde te encuentras, pero ahora mismo hay demasiados usuarios conectados a la vez. Por favor, inténtalo pasados unos minutos.
Has superado el límite de sesiones
- Sólo puedes tener tres sesiones iniciadas a la vez. Hemos cerrado la sesión más antigua para que sigas navegando sin límites en el resto.
Esta funcionalidad es sólo para suscriptores
Suscribete
Esta funcionalidad es sólo para registrados
Iniciar sesiónEsta funcionalidad es sólo para suscriptores
Suscribete