Predecir lo que alguien va a hacer a continuación basándose en su lenguaje corporal es algo natural para los humanos, pero no para los computadores o robots.
Cuando conocemos a otra persona, puede saludarnos con un “hola”, un apretón de manos o de otras maneras.
Puede que no sepamos qué va a hacer exactamente, pero podemos leer la situación y reaccionar adecuadamente.
Científicos de la Universidad de Columbia en la ciudad de Nueva York han desarrollado un algoritmo de visión por computador para predecir las interacciones humanas a partir del lenguaje corporal.
El aprendizaje por parte del sistema se basa en observar videos de personas interactuando entre ellas.
Esta capacidad de predicción podría darles a los robots y a otras máquinas un sentido más intuitivo de lo que ocurrirá a continuación en sus interacciones con humanos.
Las aplicaciones potenciales son muchas, abarcando, entre otras, los sistemas de ayuda física a personas ancianas o con discapacidades, los vehículos autoconducidos, y los robots capaces de trabajar de manera cooperativa con obreros humanos.
Hasta donde sabe el equipo de Carl Vondrick, Dídac Surís y Ruoshi Liu, su método es el más preciso hasta la fecha para predecir acciones en video hasta varios minutos en el futuro.
Tras analizar miles de horas de películas, series y otros programas televisivos, el sistema ha aprendido a predecir cientos de actividades, desde un apretón de manos hasta un choque amistoso de puños.
Cuando no puede predecir la acción concreta, encuentra el concepto de nivel superior que las relaciona, en este caso, la palabra “saludo”.
Los intentos anteriores de aprendizaje automático predictivo, incluidos sistemas previos del equipo, se han venido centrando en predecir una sola acción a la vez.
En cambio, para el nuevo sistema, se abordó el problema de la predicción a largo plazo desde un ángulo diferente.
“No todo en el futuro es predecible“, subraya Surís.
Cuando una persona no puede prever exactamente lo que va a ocurrir, juega sobre seguro y hace una predicción más general.
“Nuestro algoritmo es el primero que aprende esta capacidad de razonar de forma abstracta sobre los acontecimientos futuros“, recalca Surís.
Fuente: Columbia
Samsung ha presentado Gauss, su propio modelo de inteligencia artificial generativa. Puede procesar lenguaje natural,…
Un equipo de físicos del Instituto de Tecnología de Massachusetts (MIT) ha descubierto una propiedad…
Una carcasa experimental de marcapasos sin cables puede recargar parcialmente la batería del dispositivo generando…
No había mucho en juego, ya que era solo una demostración en vivo, pero la…
La prótesis decodifica señales del centro del habla del cerebro para predecir qué sonido alguien…
El invento ya se probó en un paciente francés, de 63 años, al que le…