CyberRunner puede vencer de forma autónoma a los humanos en un clásico juego de canicas laberínticas.
Para aquellos que no están familiarizados con el juego, los jugadores básicamente dirigen una canica desde un punto inicial hasta el final, evitando al mismo tiempo que caiga en cualquiera de los agujeros que están presentes en el tablero.
Este robot de IA aprovecha el aprendizaje por refuerzo basado en modelos y su capacidad para tomar decisiones informadas sobre comportamientos potencialmente exitosos mediante la planificación del futuro.
Básicamente, aprende acumulando experiencia mientras juega.
Las observaciones se capturan y luego se recompensan en función de su desempeño.
La memoria recopilada se utiliza luego para un algoritmo de aprendizaje por refuerzo basado en modelos, lo que le permite reconocer qué estrategias y comportamientos son más prometedores.
“En consecuencia, la forma en que el robot utiliza los dos motores (sus ‘manos’) para jugar se mejora continuamente.
Es importante destacar que el robot no deja de jugar para aprender; el algoritmo se ejecuta al mismo tiempo que el robot juega.
Como resultado , el robot sigue mejorando, juego tras juego”, dijeron los investigadores de ETH Zurich.
Fuente: CyberRunner