Se puede tener 4 personas teniendo dos conversaciones y aislar cualquiera de las cuatro voces.
Un nuevo altavoz puede reorganizar sus siete micrófonos “autodesplegables” para dividir una habitación en las llamadas “zonas de voz“, lo que le permite rastrear e identificar diferentes voces, incluso cuando se mueven.
Aún mejor, los investigadores detrás de la invención dicen que esta localización precisa les permite no solo separar conversaciones simultáneas, sino también silenciar zonas ruidosas (o individuos molestos) cuando se le ordene, para aplicaciones como videoconferencias en reuniones.
Los micrófonos autodesplegables vienen como robots del tamaño de un dedal que se comunican entre sí, moviéndose sobre sus pequeñas ruedas a diferentes puntos por sí solos y regresando a una estación de carga cuando es necesario.
“Por primera vez, utilizando lo que llamamos un ‘enjambre acústico’ robótico, podemos rastrear las posiciones de varias personas que hablan en una habitación y separar su discurso”, dijo el coautor principal del estudio, Malek Itani. en la Escuela de Ingeniería y Ciencias de la Computación Paul G. Allen, en un comunicado.
Para navegar en su entorno, los prototipos de robots utilizan una técnica similar a la ecolocalización de alta frecuencia, dicen los investigadores.
La movilidad que esto permite es crucial.
Al extender los micrófonos lo más posible, la red neuronal que procesa los datos puede realizar cálculos más precisos.
Por ahora, sin embargo, los robots se limitan a desplazarse sobre mesas, ya que sólo pueden localizarse en el espacio 2D.
“Desarrollamos redes neuronales que utilizan estas señales retardadas en el tiempo para separar lo que dice cada persona y rastrear sus posiciones en un espacio“, explicó en el comunicado el coautor principal Tuochao Chen de la Escuela Allen.
“Así que puedes tener cuatro personas teniendo dos conversaciones y aislar cualquiera de las cuatro voces y ubicar cada una de las voces en una habitación”.
Las afirmaciones de Chen se ven confirmadas por los resultados de experimentos del mundo real.
Los investigadores probaron el enjambre de robots en lugares como oficinas y cocinas mientras de tres a cinco personas hablaban, sin que el sistema tuviera conocimiento previo de las ubicaciones ni de las voces.
A pesar de esos obstáculos, el dispositivo aún pudo localizar las voces el 90 por ciento del tiempo, a una distancia de 1,6 pies entre sí.
Mientras tanto, el error medio fue incluso menor, poco menos de seis pulgadas, en todos los escenarios.
Sin embargo, su velocidad lo decepciona ligeramente.
En promedio, el sistema tarda 1,82 segundos en procesar tres segundos de sonido, lo que puede hacer que las videoconferencias sean un poco complicadas.
A continuación, los investigadores quieren aplicar estas técnicas de silenciamiento y separación en el espacio físico, en tiempo real, utilizando sus micrófonos localizadores para hacer lo que hacen unos auriculares con cancelación de ruido en los oídos, pero en una habitación entera.
Este altavoz hubiera sido muy útil en la época de Yoko Ono:
Fuente: Nature
Daihatsu Motor está causando sensación en el Japan Mobility Show 2023 con su innovador me:MO,…
La hipertensión arterial es el principal factor de riesgo cardiovascular. (more…)
La enfermedad de Alzheimer es un trastorno cerebral progresivo que produce disfunción neuronal y cognitiva…
La 'súper melanina' sintética acelera la reparación de la piel. (more…)
Esta tecnología ha permitido separar y editar la voz de John Lennon en Now and…
Crear un logo para su proyecto o negocio es algo sencillo con inteligencia artificial, e…