Categorías: Tecnología

Google Translatotron traduce su voz a otro idioma sin usar texto de por medio

Comparta este Artículo en:

Traduce la voz de un idioma a otro directamente, sin convertirla antes en texto.

Los de traducción son un buen ejemplo de servicios que permiten desarrollar y poner a prueba diversos modelos de inteligencia artificial.

Y eso es lo que lleva años haciendo Google, como propietaria del servicio de traducción online más popular del planeta.

Los últimos avances obtenidos por los de Mountain View, en este caso, no tienen tanto que ver con la habitual traducción de texto a texto, sino de voz a voz.

Y es que Google ha conseguido superar su antiguo sistema de ‘traducción en cascada’, basado en tres pasos: la conversión de la voz en texto, la traducción en sí, y volver a sintetizar ésta como voz en el idioma de destino elegido.

Los primeros modelos de traducción de extremo a extremo se crearon en 2016, y un año más tarde ya se había demostrado que este tecnología podía dar mejores resultados que los modelos de cascada.

El nuevo sistema, mucho más preciso, ha sido bautizado con el nombre Translatotron, y permite la traducción directa de voz a voz.


Entrada (Español)

Traducción de Referencia (Inglés)

Traducción por sistema de cascada
Every year 1.4 million buy viagra in canadas are sold through online as well as offline pharmacies. And when individuals are feeling happy, viagra soft 50mg it increases their sex drive. 4. Many people cialis online mouthsofthesouth.com feel that alternative and natural treatments to seek gout pain relief are the safest and the best options to make nutritional antioxidant drinks. However, you must remember these buy viagra prescription medications do not produce instant reactions and may take a while to trigger sexual stimulation.

Traducción por Translatotron (voz canónica)

Traducción por Translatotron (voz original)

Se basa en el procesamiento de la voz como un espectrograma, utilizando un vocoder neuronal para dar forma al sonido de salida y dando la opción de usar un codificador pre-entrenado con el fin de generar una voz similar a la original.

Presenta, además, otras ventajas: se evitan ciertos errores de composición de las frases, que aparecían como consecuencia de los pasos intermedios del modelo de cascada, y maneja mejor las palabras que no requieren de traducción (como los nombres propios).

Google ha compartido en su blog corporativo sobre IA los primeros ejemplos del uso de Translatotron, recurriendo a dos breves grabaciones en español (la primera de ellas tan sencilla como “¿Qué tal? Eh… yo soy Guillermo, ¿cómo estás?”), que aparecen traducidas tanto mediante el antiguo sistema en cascada como mediante el nuevo.

Pero en esta otra web puede acceder a una amplia gama de ejemplos de cada uno de los sistemas de traducción de voz de Google.

En el ejemplo proporcionado, claro está, la traducción es precisa; lo es en general con todas las frases cortas, según Google, aunque reconocen que todavía tienen que trabajar más en aquellos casos en las que el emisor habla demasiado bajo o, sencillamente, no es capaz de expresar correctamente la idea (cosa relativamente habitual en el lenguaje hablado).

“Que sepamos, Translatotron es el primer modelo de extremo a extremo capaz de traducir directamente una grabación de voz de un idioma a otro, así como de retener la voz del hablante de origen en el discurso traducido.

Esperamos que este trabajo puede servir como punto de partida para futuras investigaciones sobre los sistemas de traducción de voz a voz”.

Fuente: Xataca

Editor PDM

Entradas recientes

Herramienta de detección de sesgos de IA para combatir la discriminación en los modelos

Los modelos de IA generativa como ChatGPT se entrenan con grandes cantidades de datos obtenidos…

4 hours hace

NVIDIA presenta su supercomputador compacto de IA generativa

El kit para desarrolladores NVIDIA Jetson Orin Nano Super está diseñado tanto para aficionados como…

4 hours hace

Google presenta una IA que genera videos 4K de hasta 2 minutos

Google ha presentado Veo 2, una IA que supera a Sora al generar videos realistas…

4 hours hace

Whisk, la nueva IA de Google para crear imágenes a partir de otras imágenes

La nueva IA de Google es capaz de generar diseños de cualquier tipo sin necesidad…

4 hours hace

El buscador con IA SearchGPT ahora es gratuito y busca competir con el de Google

Han pasado casi cinco meses desde el lanzamiento de SearchGPT. La prometedora función de búsqueda…

4 hours hace

Desarrollan dispositivo que fusiona funciones de detección y computación

En los últimos años, los ingenieros han intentado crear sistemas de hardware que soporten mejor…

1 day hace
Click to listen highlighted text!