El audio se puede incorporar automáticamente sin necesidad de mucho tiempo de animación manual.
Investigadores de la Universidad de East Anglia, Caltech, Carnegie Mellon University y Disney han creado una forma de animar el habla en tiempo real.
Con su método, en lugar de tener animadores cualificados haciendo coincidir manualmente la boca de un personaje animado con el habla grabada, el nuevo diálogo se puede incorporar automáticamente en mucho menos tiempo con mucho menos esfuerzo.
Para ello, los investigadores registraron más de ocho horas de audio y video de un orador recitando más de 2500 oraciones diferentes.
El rostro del hablante fue rastreado mientras hablaba, lo cual se usó para crear una cara de referencia para un modelo de animación.
Luego se utilizó un software de reconocimiento de voz para transcribir los sonidos del habla.
Toda esta información se utilizó posteriormente para entrenar una red neuronal para animar una cara de referencia, fotograma a fotograma, basándose en fonemas, o bits individuales distintos de sonido, extraídos de un nuevo audio.
It’s also not advised for you to take viagra sample canada a high-cholesterol meal. It is quite important to maintain a balance in viagra no prescription usa the digestive acids, improving the digestive system and growing appetite along with a higher rate of metabolism. In recent times, criminals have started taking step towards natural remedial care for the free sample of viagra male sexual role. Maintaining excellent penis health Unfortunately, there respitecaresa.org generic levitra online is no magic pill to you’re your problems. Ese rostro de referencia se superpuso y se emparejó con los personajes generados por computador en tiempo real.
El entrenamiento de la Inteligencia artificial con el video de referencia y de audio sólo toma un par de horas y este método le permite utilizar el habla con cualquier acento e incluso en diferentes idiomas.
También se acomoda al canto.
“La animación realista del habla es esencial para la animación eficaz del carácter.
Hecha mal, puede distraer y conducir a un fracaso de taquilla”, dijo la investigadora principal Sarah Taylor en un comunicado.
“Hacerlo bien sin embargo consume tiempo y costoso, ya que tiene que ser producido manualmente por un animador cualificado.
Nuestro objetivo es generar automáticamente la producción de calidad de voz animada para cualquier estilo de carácter, dado sólo el audio como entrada”.
Fuente: Engadget
Un grupo de científicos evalúa las conexiones sociales entre estudiantes de instituto y revela que…
La prueba evitaría algunas cirugías, altamente invasivas y riesgosas, que hoy se necesitan para diagnosticar…
El modelo cuenta con 70.000 millones de parámetros. Puntúa más alto que GPT-3.5 y se…
Investigadores de Apple y la Universidad de California en Santa Bárbara han lanzado MGIE, un…
La ciberdelincuencia también puede afectar a los automóviles autoconducidos y a otros vehículos con esta…
Airbus ha logrado importantes avances en su programa ZEROe, con el que pretende desarrollar un…