CyberRunner puede vencer de forma autónoma a los humanos en un clásico juego de canicas laberínticas.
Para aquellos que no están familiarizados con el juego, los jugadores básicamente dirigen una canica desde un punto inicial hasta el final, evitando al mismo tiempo que caiga en cualquiera de los agujeros que están presentes en el tablero.
Este robot de IA aprovecha el aprendizaje por refuerzo basado en modelos y su capacidad para tomar decisiones informadas sobre comportamientos potencialmente exitosos mediante la planificación del futuro.
Básicamente, aprende acumulando experiencia mientras juega.
Las observaciones se capturan y luego se recompensan en función de su desempeño.
La memoria recopilada se utiliza luego para un algoritmo de aprendizaje por refuerzo basado en modelos, lo que le permite reconocer qué estrategias y comportamientos son más prometedores.
“En consecuencia, la forma en que el robot utiliza los dos motores (sus ‘manos’) para jugar se mejora continuamente.
Es importante destacar que el robot no deja de jugar para aprender; el algoritmo se ejecuta al mismo tiempo que el robot juega.
Como resultado , el robot sigue mejorando, juego tras juego”, dijeron los investigadores de ETH Zurich.
Fuente: CyberRunner
Un algoritmo de aprendizaje profundo ayudó a identificar nuevos compuestos que son eficaces contra infecciones…
Un compuesto de carbono común permite mejoras notables en el rendimiento cuando se mezcla en…
Un trío de estudiantes graduados de Stanford ha creado una poderosa IA que puede adivinar…
Con una simple instrucción, el asistente inteligente del navegador Edge puede crear una canción del…
La empresa de inteligencia artificial DeepMind afirma que ha desarrollado una forma de aprovechar la…
Con el Snapdragon 8 Gen 3 y 6.000 mAh, el Nubia Z60 Ultra compite contra…