Investigadores del MIT han desarrollado un algoritmo que puede predecir lo que va a ocurrir a continuación en un video.
El algoritmo está tratando lentamente aprender una habilidad que los seres humanos pasan toda su vida refinando y perfeccionando.
A través de un sinnúmero de interacciones y experiencias con los demás, estamos en condiciones de predecir lo que sucederá cuando dos personas se encuentran o despiden, ya sea un apretón de manos, un abrazo o un beso.
Para dar a un algoritmo las mismas intuiciones sobre el comportamiento humano que todos tenemos, los investigadores tuvieron que analizar muchas horas de YouTube, así como series de televisión como The Office y amas de casa desesperadas.
Cuando se le da una imagen de uno de esos videos, el algoritmo busca estructuras y objetos reconocibles, manos, rostros humanos, etc., e intenta predecir su movimiento con el fin de concluir en que va a terminar.
Por ejemplo, dos caras cada vez más cerca imagen a imagen es un buen indicador de qué dos personas están a punto de besarse.
¿Cómo lo hace? Tras el análisis de unas 600 horas de video en bruto (sin explicaciones o descriptores) el algoritmo CSAIL pudo predecir la acción correcta (abrazos, apretones de manos, high-fives, o besos) alrededor del 43 por ciento de las veces (frente a 71 por ciento para los seres humanos) cuando se muestra un video un segundo antes de que en realidad esto ocurra.
Los investigadores esperan que un día algoritmos de este tipo podrían ayudar a mejorar la forma en que los robots interactúan con los seres humanos.