No es fácil jugar bien. No lo es para nosotros, los humanos. Y mucho menos para las máquinas.
Moverse por el campo con una pelota en los pies requiere coordinación y equilibrio, pero también de habilidades para competir en equipo.
Quizás le parezca una obviedad, algo asequible para cualquiera que entrene lo suficiente.
A una inteligencia artificial (IA), no tanto.
Si conseguimos que una asuma los fundamentos que se necesitan para moverse con soltura por un campo quizás habremos facilitado, de hecho, que en el futuro haya robots capaces de desplazarse de forma más natural, más similar a la de los humanos.
En DeepMind, subsidiaria de Alphabet, la compañía matriz de Google, lo saben y han estado entrenando a una IA para que quizás algún día pueda convertirse en un Luka Modrić digital. ¿Cómo?
Pues siguiendo una dinámica no muy distinta a la que se utilizaría en cualquier escuela de fútbol para enseñar a jugar a un niño.
Solo que partiendo de cero y a un ritmo mucho más acelerado.
En Alphabet empezaron dándole control a la IA sobre figuras digitales con forma humana y movimientos articulares en cierto modo similar a los que tenemos nosotros.
Paso a paso, los científicos le enseñaron a caminar, regatear, lanzar balones y, por último, jugar con otras figuras, empezando por competiciones básicas con equipos de solo dos miembros.
Durante la primera fase las figuras adquirieron habilidades básicas de locomoción y manejo de la pelota.
El proceso consumió las primeras 24 horas de entrenamiento, pero eran equivalentes a alrededor de un año y medio de partidos simulados.
Ya en una segunda etapa del experimento empezaron a aplicarse comportamientos de cooperación y trabajo en equipo propios de un partido real.
New Scientist precisa que las habilidades del trabajo en equipo, claves para que la IA pudiera intuir dónde iba a recibir un pase, exigieron algo más de tiempo: alrededor de dos o tres décadas de partidos simulados, lo que equivale aproximadamente a dos o tres semanas en el mundo real.
“Nuestros agentes adquirieron habilidades como la locomoción ágil, el pase y la división del trabajo, tal y como demuestran una serie de estadísticas, incluidas las métricas que se usan en los análisis deportivos del mundo real”, explica DeepMind.
Entre las habilidades que muestra la IA destaca, por ejemplo, la capacidad para anticipar el comportamiento de sus compañeros de equipo.
“Al principio del entrenamiento, todos los agentes se limitaban a correr hacia el balón.
Al cabo de unos días veíamos que se daban cuenta de que uno de sus compañeros tenía el control del balón, se daban la vuelta y corrían por el campo, anticipando que intentaría marcar o tal vez pasar el balón”, explica a Wired Guy Lever, parte del equipo que ha plasmado sus estudios en Science Robotics.
Hace unos cinco años los investigadores ya intentaron enseñar a figuras articuladas cómo afrontar una carrera de obstáculos.
El experimento dejó lecciones sobre las ventajas del sistema de prueba y error y el aprendizaje por refuerzo (RL), pero sus patrones de movimiento eran “poco naturales”.
El problema, confiesa DeepMind, es que “no serían prácticos” para la robótica.
El reto no es tanto tener una IA capaz de mover figuras imitando a los humanos como lograr “un comportamiento bien regularizado”, fundamental para caminar sobre terrenos accidentados o incluso manipular objetos frágiles.
“Los movimientos nerviosos pueden dañar el propio robot o su entorno o como mínimo agotar la batería”, comenta la subsidiaria de Alphabet.
De ahí los esfuerzos para lograr robots con un comportamiento “seguro y eficiente” que respondan a las órdenes que reciben.
Y en ese empeño el juego de Maradona y Pelé puede convertirse en un aliado inesperado.
“El fútbol ha sido durante mucho tiempo un reto para la investigación de la inteligencia incorporada, ya que requiere habilidades individuales y un juego de equipo coordinado”, detallan en DeepMind.
Para lograr su propósito los científicos usaron el neural probabilistic motor primitives (NPMP), que basa el aprendizaje en patrones de movimiento tomados de humanos y animales y ayuda a traducir las órdenes de control.
“Ya habíamos demostrado que el comportamiento coordinado puede surgir en equipos que compiten entre sí.
El NPMP nos permitió observar un efecto similar en un escenario que requería un control motor significativamente más avanzado”.
“Básicamente sesga su control motor hacia un comportamiento humano realista, movimientos humanos realistas.
Y eso se aprende de la captura de movimiento, en este caso, actores humanos jugando al fútbol”, comenta el equipo a Wired.
Como parte del mismo proceso, se recompensó también a la IA para que no se desviase de las estrategias marcadas para cada escenario.
¿Significa eso que Google quiere convertirse en el campeón absoluto de la RoboCup?
Bueno, por lo pronto indica que está trabajando para que el día de mañana podamos ver IA con movimientos más eficientes.
Fuente: New Scientist