Categorías: Tecnología

Utilizan inteligencia artificial para simular cómo un oyente escucharía el sonido desde cualquier punto de una habitación

Comparta este Artículo en:

Investigadores del MIT y del MIT-IBM Watson AI Lab han desarrollado un sistema de aprendizaje automático impulsado por IA que simula cómo un oyente escucharía el sonido desde cualquier punto de una habitación.

Más específicamente, logra esto al capturar cómo se propagará cualquier sonido en una habitación a través del espacio, lo que permite que el modelo simule lo que un oyente escucharía en diferentes lugares.

Dado que el sistema es capaz de modelar con precisión la acústica de una escena, puede aprender rápidamente la geometría 3D subyacente de una habitación a partir de grabaciones de sonido.

Luego, los investigadores pueden usar la información acústica para crear representaciones visuales precisas de una habitación, al igual que los humanos usan el sonido al estimar las propiedades de su entorno físico.

Las aplicaciones prácticas incluyen tanto la realidad virtual como la aumentada, además de ayudar a los agentes de IA a desarrollar una mejor comprensión del mundo que los rodea.

“Si te imaginas parado cerca de una puerta, lo que más afecta lo que escuchas es la presencia de esa puerta, no necesariamente las características geométricas lejos de ti en el otro lado de la habitación.

Descubrimos que esta información permite una mejor generalización que una simple red conectada”, dijo Andrew Luo, autor principal y estudiante de posgrado en la Universidad Carnegie Mellon (CMU).

Fuente: MIT News

Editor PDM

Entradas recientes

Mano robótica capaz de manipular objetos

Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)

3 days hace

Robots atraviesan entornos complejos sin sensores adicionales ni entrenamiento previo en terrenos difíciles

Especialistas en robótica de la Universidad de Leeds y el University College de Londres han…

3 days hace

Rompiendo barreras: IA para interpretar el lenguaje de señas americano en tiempo real

El lenguaje de señas es un medio de comunicación sofisticado y vital para las personas…

3 days hace

Dispositivo ayuda a personas con discapacidad visual a realizar tareas de localización tan bien como las personas videntes

Según un nuevo estudio dirigido por el Imperial College, una tecnología de navegación que utiliza…

3 days hace

Google lanza una versión de Gemini 2.0 capaz de razonar

Gemini 2.0 Flash Thinking Experimental es una nueva versión de la IA de Google que…

3 days hace

El siguiente paso de la computación cuántica: un nuevo algoritmo potencia la multitarea

Las computadoras cuánticas difieren fundamentalmente de las clásicas. En lugar de utilizar bits (0 y…

4 days hace
Click to listen highlighted text!