Buscador
Ver revista digital
Tecnología

El idioma ya no será una barrera: Meta desarrolla un traductor de voz universal en tiempo real

20-10-2022, 3:39:28 PM Por:
© Facebook Connect

Meta busca crear un modelo de traducción en tiempo real en todos los idiomas existentes, para "romper barreras y unir a las personas".

Meta ha asegurado que está desarrollando una tecnología basada en Inteligencia Artificial (IA) que sea capaz de traducir idiomas que no disponen de una gramática y una ortografía oficial, esto es, lenguas no escritas.

La compañía ha hecho un adelanto del desarrollo de su proyecto Universal Speech Translator (UST), con el que busca crear un modelo de traducción en tiempo real en todos los idiomas existentes, para “romper barreras y unir a las personas”, según ha indicado en un comunicado.

Este proyecto, que se centra en fomentar la comunicación hablada en diferentes escenarios, tanto en el mundo real como en el metaverso, contempla dar soporte a todos los idiomas, independientemente de que sean escritos y hablados o exclusivamente hablados.

Traducción de lenguas que no disponen de un sistema escrito

Meta ha comentado que, hasta ahora, la traducción mediante IA “se ha centrado principalmente en las lenguas escritas” y ha reconocido que existen más de 7,000 idiomas vivos en todo el mundo de los cuales cerca de la mitad “no disponen de un sistema de escritura estándar o ampliamente utilizado”.

Asimismo, ha reiterado que es consciente de ese vacío existente en estos últimos. Esto se debe a que los modelos de aprendizaje automático precisan de mayor información para desarrollar una traducción simultánea. Por ejemplo, gramática y ortografía.

Te podría interesar: Meta presenta Quest Pro, el visor para entrar al metaverso, y esto costará

Para hacer frente a este reto, ha creado su primer sistema de traducción para una lengua principalmente oral, como es el hokkien. Esta, que se habla en algunas regiones chinas, carece de una forma escrita estándar, por lo que inicialmente no se podría traducir mediante sus estándares de IA.

Así se construye el proyecto

Para trabajar en este proyecto, la compañía señala que la recopilación de datos “fue un obstáculo importante”, principalmente porque no tenía información suficiente para crear modelos de ‘machine leargning’.

Para dar solución a esta falta de información, Meta aprovechó el chino mandarín como lengua intermedia para construir traducciones relativamente fieles. En primes lugar, tradujo el habla hokkien a texto mandarín. Como consecuencia de este paso intermedio, el resultado de la traducción mejoró al tomar como referencia los datos de un idioma similar.

A continuación, mediante un modelo de entrenamiento, se analizó la semántica y la oratoria de esta lengua y se comparó con otras lenguas que sí disponen de un formato escrito, como el inglés. Después, sintetizó la lengua inglesa a partir de textos escritos y originó una lengua paralela entre el hokkien y el inglés.

Sistema de voz a voz

La compañía ha recordado que buena parte de los sistemas de traducción se basan en transcripciones de voz a texto. En este sentido, ha reformulado el concepto para analizar las transcripciones de voz a voz.

Para ello, ha utilizado la traducción de voz a unidad (S2UT) que genere diferentes formas de ondas a partir de estas. Después, se adoptó UnitY para un mecanismo de decodificación de dos fases.

Primero, el decodificador genera el texto traducido de la lengua no escrita a un texto en un idioma afín (en este caso, el mandarín). A continuación, crea unidades acústicas. En este sentido, el fabricante ha reconocido que ha desarrollado un sistema que transcribe el habla hokkien a una notación fonética estandarizada llamada Tâi-lô.

Por otra parte, ha recordado que los sistemas de traducción de voz se suelen evaluar utilizando una métrica denominada ASR-BLEU. Este sistema consiste en transcribir primero a texto el habla traducida mediante ‘machine learning’. Después, calcula la calidad de la transcripción de esta solución tecnológica, comparando el texto traducido por la máquina con el traducido por una persona.

Debido a que esto no es posible con el hokkien, porque no dispone de una gramática escrita, Meta ha creado su primer conjunto de datos de referencia de traducción bidireccional. Se trata de un sistema de código abierto en el que pueden participar los investigadores para avanzar en este sistema de traducción propio de Meta.

Finalmente, la compañía ha adelantado que esta solución de traducción actualmente está en sus primeras fases. Espera que próximamente sea capaz de ofrecer una traducción simultánea entre varios idiomas.

Asimismo, ha asegurado que este proyecto se puede extender a más lenguas, aparte del hokkien y, por ello, ha anunciado que va a publicar un corpus de traducciones de voz a voz llamado SpeechMatrix, que ha extraído de su herramienta de representaciones de oraciones agnósticas del lenguaje (LASER).

Lo último:

Comentarios