La optimización del autoaprendizaje de un robot acuático mejora las habilidades de manipulación de objetos bajo el agua.
En los últimos años, los expertos en robótica han presentado sistemas robóticos que pueden completar misiones en diversos entornos, desde el suelo hasta entornos subterráneos, sobre el suelo y bajo el agua.
Si bien varios de estos robots pueden agarrar y mover objetos en el suelo, hasta ahora la manipulación de objetos por parte de sistemas robóticos bajo el agua ha resultado más desafiante.
Investigadores de la Universidad de Columbia desarrollaron recientemente AquaBot, un nuevo robot submarino que puede completar de forma autónoma tareas básicas de manipulación de objetos bajo el agua.
El robot combina hardware accesible con un modelo computacional entrenado con datos extraídos de demostraciones humanas.
“La manipulación robótica submarina enfrenta desafíos significativos debido a la dinámica de fluidos compleja y los entornos no estructurados, lo que hace que la mayoría de los sistemas de manipulación dependan en gran medida de la teleoperación humana”, escribieron Ruoshi Liu, Huy Ha y sus colegas en su artículo.
“Presentamos AquaBot, un sistema de manipulación completamente autónomo que combina la clonación de comportamientos a partir de demostraciones humanas con la optimización del autoaprendizaje para mejorar el rendimiento de la teleoperación más allá de la humana”.
Aquabot, el robot diseñado por Liu, Ha y sus colegas, se basa en el dron submarino QYSEA V-EVO.
Los investigadores agregaron una pinza de mandíbula paralela QYSEA y dos cámaras a este dron acuático, ya que esto le permitiría recopilar imágenes relevantes bajo el agua y completar tareas de manipulación de objetos.
También crearon un código que permitiría al robot aprender de forma autónoma políticas visomotoras de extremo a extremo que guían su manipulación de objetos bajo el agua.
Los modelos computacionales que planifican y controlan las acciones del robot se entrenaron en dos etapas diferentes.
“En la primera etapa, destilamos la adaptabilidad humana en una política visomotora de circuito cerrado“, escribieron los investigadores.
“Para ello, grabamos demostraciones humanas que teleoperan el robot para realizar varias tareas de manipulación y luego usamos los datos para entrenar una política visomotora.
Al acortar el horizonte de acción de la política, aumentamos efectivamente su reactividad, lo que es fundamental para lidiar con dinámicas submarinas inesperadas”.
Como parte de la segunda etapa de entrenamiento, Liu, Ha y sus colegas intentaron acelerar el aprendizaje del robot de nuevos comportamientos.
Para ello, utilizaron una optimización autoguiada, un enfoque que permite a los sistemas ajustar de forma autónoma su proceso de aprendizaje utilizando la retroalimentación derivada de sus predicciones o decisiones anteriores.
“En este paso, ejecutamos repetidamente la política aprendida y utilizamos el tiempo de ejecución como recompensa para acelerar la política con un algoritmo de optimización basado en sustitutos”, escribieron los investigadores.
“Este paso permite al sistema optimizar aún más los parámetros subóptimos (por ejemplo, la velocidad de ejecución) en los datos de demostración humana”.
Los investigadores evaluaron a Aquabot en una serie de experimentos del mundo real, probando su capacidad para completar diferentes tareas de manipulación de objetos.
Estas tareas incluían agarrar rocas nunca antes vistas bajo el agua, clasificar la basura en diferentes contenedores y recuperar grandes objetos deformables diseñados para emular cuerpos humanos.
El robot se desempeñó bien en todas estas tareas, completándolas más rápido de lo que lo haría un operador humano.
Cabe destacar que su enfoque de optimización autoguiada subyacente también permite que la raíz mejore continuamente su política base a medida que gana más experiencia en entornos del mundo real.
“Con experimentos exhaustivos en el mundo real, demostramos la versatilidad de AquaBot en diversas tareas de manipulación, como agarrar objetos, clasificar basura y recuperar objetos”, escribieron Liu, Ha y sus colegas.
“Nuestros experimentos en el mundo real muestran que la política autooptimizada de AquaBot supera a un operador humano en un 41% en velocidad.
AquaBot representa un paso prometedor hacia sistemas de manipulación submarina autónomos y automejorables”.
El diseño de hardware y el software utilizados por el equipo de investigación son de código abierto y otros científicos informáticos de todo el mundo pueden acceder a ellos.
En el futuro, el sistema robótico que desarrollaron podría mejorarse aún más, probarse en otros experimentos y, finalmente, implementarse en entornos naturales para completar varias misiones.
Por ejemplo, podría usarse para ayudar a los agentes humanos durante las misiones de búsqueda y rescate y para recolectar basura, minerales u otros objetos del fondo marino.
Fuente: arXiv