Categorías: Tecnología

Sistema de Inteligencia Artificial de Disney identifica variedad de sonidos

Comparta este Artículo en:

Trabajn en un software de reconocimiento de imágenes que también será capaz de decirle qué sonido hace un objeto.

Un equipo de Disney Research está trabajando en un sistema de visión por computadora que no sólo puede reconocer una imagen, pero también cómo suena.

Lograron con éxito emparejar el audio apropiado con imágenes de puertas cerrando, vidrios tintineando y vehículos en movimiento.

La asociación de audio podrá ser fácil para los seres humanos, pero la enseñanza a una computadora para hacerlo es en realidad bastante difícil.

Los investigadores de Disney entrenaron a la IA para reconocer el sonido de las imágenes al alimentar una colección de videos que demostraban cómo un objeto hacía un sonido específico, pero el ruido de fondo, la narración o el sonido de otros objetos podrían confundir fácilmente al sistema.


Nearly 60% of the men worldwide suffer with the adverse effects of these medications.The problem of impotence occurs because of insufficient blood flow into the reproductive area and makes the organ able to erect for pleasing plus satisfactory physical intimacy. sildenafil buy in canada At viagra 100 mg present Angelmeds .com is one the best viable treatment for feebleness. Physical risks include post-operative infection, damage to surrounding tissues and nerves in the reproductive organs and controls ejaculate. viagra overnight delivery Knowing your helicopter’s parts and their uses can greatly help you with selecting which ones you need to buy immediately and which ones are to be bought in future. cialis pills online
Hizo un trabajo bastante bueno al sugerir el sonido adecuado para cada imagen.

Aún así, el sistema no es perfecto: el equipo informa que ocasionalmente tuvo problemas para diferenciar la imagen de un auto o un tranvía, haciendo que a veces sugiriera el sonido equivocado para un vehículo en particular.

El equipo espera que pueda ser utilizado para crear un sistema de procesamiento automático de Foley para la producción de video, lo que facilitaría a los editores agregar efectos de sonido durante el proceso de producción.

La tecnología también puede ser capaz de ayudar a los discapacitados visuales mediante la creación de un sistema de personificación de imagen, lo que les permite “escuchar” los objetos en la pantalla de un computador.

Fuente: Engadget

Editor PDM

Entradas recientes

Google Gemini, el modelo de inteligencia artificial más avanzado a la fecha

Gemini Pro llega a Google Bard y a principios del año que viene lo hará…

10 hours hace

Nuevo método para manipular un gas cuántico tridimensional

Los gases de átomos ultrafríos son una plataforma bien establecida para el tratamiento de información…

10 hours hace

Implante cerebral ayuda en la recuperación de pacientes con lesiones en la cabeza

Un nuevo implante cerebral desarrollado por investigadores de la Universidad de Stanford ha demostrado un…

10 hours hace

Arranca el reactor de fusión nuclear más grande del mundo

Será el reactor de fusión más grande del mundo hasta que se construya el ITER…

10 hours hace

Bacterias contra las caries

Algo así como una casualidad fue lo que llevó a investigar porqué algunas personas nunca…

10 hours hace

OnePlus 12, teléfono con la pantalla más brillante del mercado

El OnePlus 12 quiere ser el rey de la gama premium. Un apartado mejorado de…

1 day hace
Click to listen highlighted text!