Los agentes robóticos que operan de forma autónoma en el mundo real necesitan explorar continuamente su entorno y aprender de los datos recopilados, con una supervisión humana mínima.
Si bien es posible crear agentes que puedan aprender de esa manera sin supervisión, los métodos actuales tienen dificultades para adaptarse al mundo real.
Por lo tanto, investigadores proponen ALAN, un agente robótico de exploración autónoma, que puede realizar muchas tareas en el mundo real con poco tiempo de entrenamiento e interacción.
Esto se habilita midiendo el cambio del entorno, que refleja el movimiento del objeto e ignora los cambios en la posición del robot.
Usan esta métrica directamente como una señal centrada en el entorno y también maximiza la incertidumbre del cambio del entorno previsto, lo que proporciona una señal de exploración centrada en el agente.
Se evaluó el enfoque en dos entornos de cocina de juego diferentes del mundo real, lo que permite que un robot explore y descubra habilidades de manipulación de manera eficiente y realice tareas especificadas a través de imágenes objetivo.
Fuente: GitHub