Categorías: Tecnología

Inteligencia artificial capaz de generar audio simplemente usando texto

Comparta este Artículo en:
FacebookFacebookTwitterTwitterEmailEmailWhatsAppWhatsAppShareShare

NVIDIA Fugatto (Foundational Generative Audio Transformer Opus 1) es un nuevo modelo de IA generativa que puede generar una salida de audio simplemente usando texto.

Este modelo no solo entiende el audio, sino que también genera sonido como lo harían los humanos.

Lo que realmente diferencia a Fugatto de otros generadores de texto a audio es la técnica ComposableART del modelo, que combina instrucciones que solo se vieron por separado durante el entrenamiento.

Un ejemplo sería usar una combinación de indicaciones que pidan un texto hablado con un sentimiento de tristeza con acento francés y, debido a la capacidad del modelo para interpolar entre instrucciones, brindaría a los usuarios un control detallado sobre aspectos como la pesadez del acento o el grado de tristeza.

“Esto es una locura. El sonido es mi inspiración.

Es lo que me mueve a crear música. La idea de poder crear sonidos completamente nuevos sobre la marcha en el estudio es increíble“, dijo Ido Zmishlany, cofundador de One Take Audio y miembro del programa NVIDIA Inception.

Fuente: NVIDIA

 

Editor PDM

Entradas recientes

Microoalgas magnetizadas viajarán por su cuerpo como robots

Crean microrobots biohíbridos a partir de microalgas magnetizadas que son capaces de nadar en entornos…

12 hours hace

Inteligencia artificial detecta el deterioro cognitivo

Científicos desarrollan un dispositivo portátil capaz de detectar el deterioro cognitivo leve con un 83%…

13 hours hace

Inteligencia artificial utiliza la cámara de un smartphone para monitorear la frecuencia cardíaca

Un equipo de investigadores médicos e ingenieros de Google Research ha desarrollado una forma de…

13 hours hace

CardioMind, inteligencia artificial enfocada en el diagnóstico de afecciones cardíacas

Ha sido entrenada con cientos de miles de datos de pacientes y, de momento, sólo…

13 hours hace

Google anuncia Gemini 2.5, su nueva familia de modelos de inteligencia artificial de vanguardia

La carrera por la IA no se detiene y Google acaba de presentar su modelo…

13 hours hace

Manus, una nueva IA china, supera a o3 de OpenAI

Manus AI es un agente de IA general capaz de ejecutar tareas complejas de forma…

2 days hace
Click to listen highlighted text!