Inteligencia artificial imita a los humanos para mejorar la destreza de una mano robótica

Inteligencia artificial imita a los humanos para mejorar la destreza de una mano robótica

Comparta este Artículo en:

El sistema Dactyl de OpenAI mejora la destreza de las manos de los robots.

El equipo solo usó simulaciones abstractas para entrenarlo.

Aún es pronto para crear el tipo de androides humanos que vemos en las películas, pero las nuevas investigaciones nos acercan cada vez más a la idea.

Ahora, los investigadores de la OpenAI fundada por Elon Musk están trabajando para que las manos de los robots sean más diestras.

El equipo ha entrenado una mano robótica similar a la humana llamada Shadow Dextrous Hand para manipular objetos del mundo real como el bloque con letras de un niño.

Utiliza los mismos algoritmos y el mismo código de su proyecto OpenAI Five, que ha estado entrenando robots DOTA 2 para jugar videojuegos.

El sistema resultante centrado en la mano se llama Dactyl, y ha aprendido a manipular los bloques utilizando un modelo de entrenamiento llamado aleatorización de dominio.

Tres cámaras observan la mano del robot mientras una computadora rastrea la posición de las yemas de los dedos en tiempo real.

Este enfoque proporciona muchas experiencias diferentes en lugar de tareas que se repiten en el mundo real, lo que permite al equipo escalar más rápido que otros modelos de capacitación.

Para OpenAI, la tarea que se habían propuesto era enseñar a un robot a manipular un cubo de seis caras; moviéndolo de una posición a otra, por lo que un lado específico estaba hacia arriba.

Al igual que con investigaciones anteriores, comenzaron simulando este entorno con la mayor precisión posible, pero su siguiente paso fue lo que marcó la diferencia: comenzaron a jugar con la simulación.

Primero, agregaron ruido visual aleatorio.

Luego, cambiaron los colores de la mano virtual y el cubo.

Aleatorizaron el tamaño del cubo; cuán resbaladizas eran sus superficies; y qué pesado tan pesado era.

Incluso se metieron con la gravedad de la simulación.

This plant bears white viagra 5mg flowers with pink shade. A solution like opacc.cv viagra 25 mg 100mg helps such men stuck in an unfortunate situation in peachy rest. You viagra online free can get rid of this condition effectively with some erectile dysfunction drugs, externally used devices, surgical treatments etc. These web medical stores will then provide you a physical exam and performing some cialis generika other order lab tests. El efecto de todo esto fue darle a la IA una mejor comprensión de cómo sería manipular el cubo en el mundo real.

Si bien la simulación puede no haber sido totalmente fiel a la realidad, tenía suficientes variaciones que le permitieron al sistema aprender a lidiar con lo inesperado.

Sin embargo, pasar por todas estas aleatorizaciones llevó mucho tiempo. Un tiempo muy largo.

De hecho, Dactyl tuvo que acumular aproximadamente 100 años de experiencia para alcanzar el máximo rendimiento.

Eso, a su vez, significaba que el equipo tenía que usar mucha potencia informática: unas 6.144 CPU y ocho poderosas y potentes GPU Nvidia V100.

Ese es el tipo de hardware al que solo pueden acceder unas pocas instituciones de investigación.

Pero los resultados finales lo valieron, dice Plappert.

Una vez que estuvo completamente entrenado, Dactyl pudo mover el cubo de una posición a otra hasta 50 veces seguidas sin soltarlo.

(Aunque la mediana de veces lo hizo fue mucho más pequeña, solo 13).

Y al aprender a mover el cubo en su mano, Dactyl incluso desarrolló comportamientos similares a los humanos. Todo esto fue aprendido sin ninguna instrucción humana, solo prueba y error, durante décadas.

Además, los investigadores observaron que a medida que desplegaban su sistema de posicionamiento en las manos del robot del mundo real, el sistema Dactyl usa un conjunto de estrategias similares a las de los humanos para lograr el resultado deseado, como mover el bloque específico hacia la parte superior.

Estas estrategias no fueron enseñadas a Dactyl, sino que surgieron como comportamientos del entrenamiento.

En un caso, Dactyl eligió un agarre que favorecía el pulgar y el meñique (posiblemente debido a la mayor flexibilidad de su meñique), mientras que los humanos tienden a preferir usar el pulgar y el índice o el dedo medio.

Esto muestra que las manos de robot y, por extensión, los robots en general, pueden descubrir y adaptar los comportamientos humanos a sus propios tipos de cuerpo específicos.

Fuente: Engadget

Leave a Reply

Your email address will not be published. Required fields are marked *