Meta presenta SeamlessM4T, un nuevo modelo de inteligencia artificial multilingüe y multimodal dedicado a reconocer, transcribir y traducir hasta 100 idiomas.
Se trata de la primera inteligencia artificial “todo en uno” dedicada a labores de este tipo.
Según el blog oficial de Meta, esta nueva IA forma parte de una estrategia que aspira a desarrollar un traductor universal.
Una labor por demás compleja, pero a través de la cual la compañía se propone terminar con las barreras idiomáticas entre las personas de cualquier parte del mundo.
A través de su canal de difusión en Instagram, Mark Zuckerberg brindó una breve descripción de SeamlessM4T.
El CEO de Meta explicó que la IA en cuestión puede reconocer y traducir hasta 100 idiomas en una variedad de combinaciones: voz a texto, texto a voz, voz a voz y texto a texto.
Y dejó en claro que su plan es incorporar la tecnología en los principales servicios de la compañía.
“Con el tiempo, integraremos estos avances de traducción y transcripción a través de inteligencia artificial en Facebook, Instagram, WhatsApp, Messenger y Threads“, aseveró.
Además, el empresario compartió un breve video con una demostración de cómo funciona SeamlessM4T, y los resultados mostrados son más que interesantes.
Para crear su nueva IA, Meta tuvo que desarrollar un set de datos de gran calibre.
El mismo, bautizado como SeamlessAlign, está basado en miles de millones de oraciones de texto y 4 millones de horas de registros de voz extraídos de la web.
Como suele suceder en este tipo de lanzamientos, la compañía afirma que la información en cuestión proviene de fuentes disponibles públicamente.
Con los datos obtenidos, los de Zuckerberg afirman haber podido “alinear automáticamente más de 443.000 horas de voz con textos“, así como crear unas 29.000 horas de alineaciones de voz a voz.
En su blog dedicado a los avances en IA, Meta explica que el nuevo modelo es capaz de reconocer automáticamente hasta 100 idiomas a partir de un registro de voz.
También soporta esa cantidad de idiomas como método de entrada y salida para traducir de voz a texto y de texto a texto.
No obstante, otras tareas están un poco más limitadas.
En el caso de las traducciones de texto a voz y de voz a voz, la inteligencia artificial reconoce hasta 100 idiomas como método de entrada, pero puede entregar resultados en hasta 36 lenguajes, incluyendo el inglés.
Esta no es la primera vez que Meta experimenta con una IA multilingüe.
A mediados del año pasado, la compañía lanzó NLLB-200, un modelo de código abierto capaz de traducir hasta 200 idiomas en tiempo real.
Uno de los avances importantes de dicha propuesta era que podía traducir entre dos idiomas de forma directa, de birmano a español, por ejemplo.
Esto implicaba no tener que pasar por el inglés como un punto intermedio.
La IA y el set de datos SeamlessAlign se lanzarán bajo licencia Creative Commons (CC BY-NC 4.0).
Fuente: Meta
Los modelos de IA generativa como ChatGPT se entrenan con grandes cantidades de datos obtenidos…
El kit para desarrolladores NVIDIA Jetson Orin Nano Super está diseñado tanto para aficionados como…
Google ha presentado Veo 2, una IA que supera a Sora al generar videos realistas…
La nueva IA de Google es capaz de generar diseños de cualquier tipo sin necesidad…
Han pasado casi cinco meses desde el lanzamiento de SearchGPT. La prometedora función de búsqueda…
En los últimos años, los ingenieros han intentado crear sistemas de hardware que soporten mejor…