Se puede tener 4 personas teniendo dos conversaciones y aislar cualquiera de las cuatro voces.
Un nuevo altavoz puede reorganizar sus siete micrófonos “autodesplegables” para dividir una habitación en las llamadas “zonas de voz“, lo que le permite rastrear e identificar diferentes voces, incluso cuando se mueven.
Aún mejor, los investigadores detrás de la invención dicen que esta localización precisa les permite no solo separar conversaciones simultáneas, sino también silenciar zonas ruidosas (o individuos molestos) cuando se le ordene, para aplicaciones como videoconferencias en reuniones.
Los micrófonos autodesplegables vienen como robots del tamaño de un dedal que se comunican entre sí, moviéndose sobre sus pequeñas ruedas a diferentes puntos por sí solos y regresando a una estación de carga cuando es necesario.
“Por primera vez, utilizando lo que llamamos un ‘enjambre acústico’ robótico, podemos rastrear las posiciones de varias personas que hablan en una habitación y separar su discurso”, dijo el coautor principal del estudio, Malek Itani. en la Escuela de Ingeniería y Ciencias de la Computación Paul G. Allen, en un comunicado.
Para navegar en su entorno, los prototipos de robots utilizan una técnica similar a la ecolocalización de alta frecuencia, dicen los investigadores.
La movilidad que esto permite es crucial.
Al extender los micrófonos lo más posible, la red neuronal que procesa los datos puede realizar cálculos más precisos.
Por ahora, sin embargo, los robots se limitan a desplazarse sobre mesas, ya que sólo pueden localizarse en el espacio 2D.
“Desarrollamos redes neuronales que utilizan estas señales retardadas en el tiempo para separar lo que dice cada persona y rastrear sus posiciones en un espacio“, explicó en el comunicado el coautor principal Tuochao Chen de la Escuela Allen.
“Así que puedes tener cuatro personas teniendo dos conversaciones y aislar cualquiera de las cuatro voces y ubicar cada una de las voces en una habitación”.
Las afirmaciones de Chen se ven confirmadas por los resultados de experimentos del mundo real.
Los investigadores probaron el enjambre de robots en lugares como oficinas y cocinas mientras de tres a cinco personas hablaban, sin que el sistema tuviera conocimiento previo de las ubicaciones ni de las voces.
A pesar de esos obstáculos, el dispositivo aún pudo localizar las voces el 90 por ciento del tiempo, a una distancia de 1,6 pies entre sí.
Mientras tanto, el error medio fue incluso menor, poco menos de seis pulgadas, en todos los escenarios.
Sin embargo, su velocidad lo decepciona ligeramente.
En promedio, el sistema tarda 1,82 segundos en procesar tres segundos de sonido, lo que puede hacer que las videoconferencias sean un poco complicadas.
A continuación, los investigadores quieren aplicar estas técnicas de silenciamiento y separación en el espacio físico, en tiempo real, utilizando sus micrófonos localizadores para hacer lo que hacen unos auriculares con cancelación de ruido en los oídos, pero en una habitación entera.
Este altavoz hubiera sido muy útil en la época de Yoko Ono:
Fuente: Nature
Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)
Especialistas en robótica de la Universidad de Leeds y el University College de Londres han…
El lenguaje de señas es un medio de comunicación sofisticado y vital para las personas…
Según un nuevo estudio dirigido por el Imperial College, una tecnología de navegación que utiliza…
Gemini 2.0 Flash Thinking Experimental es una nueva versión de la IA de Google que…
Las computadoras cuánticas difieren fundamentalmente de las clásicas. En lugar de utilizar bits (0 y…