Categorías: Tecnología

Este robot de DeepMind sólo ha recibido una tarea, ha aprendido por sí mismo a moverse y completarla

Comparta este Artículo en:

DeepMind, la filial de Alphabet dedicada al desarrollo de la inteligencia artificial y el aprendizaje automático, ha conseguido un nuevo logro.

Dejando de lado juegos de mesa como el Go, le han encomendado a un brazo robótico la tarea de guardar todos los objetos de una mesa en una caja.

Con esta simple tarea en mente, el brazo robótico ha tenido que ingeniárselas primero para aprender a moverse usando sus sensores y habilidades, luego para guardar los objetos y cumplir la tarea.

A DeepMind la conocemos principalmente por sus progresos con AlphaGo, la inteligencia artificial que crearon para ser la mejor jugadora del mundo en el Go.

Una evolución de esta inteligencia, AlphaGo Zero, aprendió a jugar por si sola al Go y batió 100 veces a 0 a su antigua versión.

Básicamente se entrenó por si misma, sin basarse en la experiencia recopilada de partidas reales.

Con SAC-X, el nuevo proyecto de DeepMind, van un paso más allá.

A la inteligencia artificial ni siquiera se le dan las reglas o su manera de funcionar, sólo una tarea que cumplir. Y esto aumenta la dificultad de manera considerable.

El experimento se ha llevado a cabo en un espacio virtual donde un brazo robótico tenía a su alcance una mesa con varios cubos y una caja donde colocarlos.

Para completar la tarea primero debe conocer los recursos de los que dispone, que en este caso son ese brazo robótico con todos los sensores apagados y por descubrir.

Al comenzar a mover el brazo encuentra los sensores que le permiten detectar la proximidad o medir su fuerza por ejemplo, así practica hasta conseguir controlar el brazo robótico coordinando todas sus articulaciones.

El siguiente paso es interactuar con los dos cubos que se encuentran en la mesa: los toca, los empuja, los coge y levanta…
Note: This preparation should be consumed after consulting your family physician or a qualified ayurvedic physician. online viagra prescription http://amerikabulteni.com/2011/09/19/nfl-2nci-haftada-detroit-ve-buffalo-suprizi-iste-sonuclar-ve-genel-gorunum/ purchase viagra Sleeping with your eyes open is not healthy and hinders your body’s natural healing process. In another try the same balloon ascended to about 3000 meters – a new world of possibilities to restore men to healthy cialis pharmacy online sexual functioning. Mast Mood viagra sale amerikabulteni.com capsule improves secretion of testosterone and corrects nocturnal emissions naturally.
Y por último, aprende a levantar la tapa de la caja y a guardar los dos cubos dentro.

El proceso es de lo más curioso, de un primer vistazo nos puede parecer un robot algo inepto (más si lo comparamos con el perro-robot de Boston Dynamics), pero teniendo en cuenta que ha aprendido desde cero… recuerda mas bien a un bebe que está descubriendo cómo coger objetos y a caminar.

La motivación del brazo robótico es conseguir una recompensa, un punto virtual.

Por cumplir acciones pequeñas recibe pequeñas puntuaciones, por guardar los objetos en la caja recibe la puntuación máxima.

De este modo, el robot descubre que si aprende a coger un objeto se le recompensa por ello, también por apilar los cubos.

Pero como no hay recompensa por sacar fuera de la mesa un cubo, entiende que ese no es el camino a seguir en su aprendizaje.

En otras palabras, traza su propio plan de aprendizaje para adaptarse al contexto en el que se encuentra, aprende a aprender.

¿Cuál es el objetivo de todo esto?

Conseguir que una inteligencia artificial sea capaz de aprender desde cero adaptándose al entorno en el que se encuentra y aprovechando los recursos de los que dispone.

Las decisiones que debe tomar un brazo robótico son mucho mayores que las que se deben tomar en una partida del Go.

SAC-X es un sistema de inteligencia artificial que esperan aplicar en muchos otros ámbitos, se especifica un objetivo general y se le deja aprender.

Fuente: Xataca

Editor PDM

Entradas recientes

En China patrulla un nuevo robot policía

RT-G es un robot avanzado diseñado para escenarios de confrontación. (more…)

4 hours hace

Técnica reduce el sesgo en los modelos de IA y al mismo tiempo preserva o mejora la precisión

Los modelos de aprendizaje automático pueden fallar cuando intentan hacer predicciones para individuos que estaban…

4 hours hace

Curso de humanidades en universidad norteamericana utilizará un libro de texto generado por IA

La IA ha llegado a un mercado que estaba maduro para la disrupción: los libros…

4 hours hace

IA resuelve problemas complejos de ingeniería más rápido que las supercomputadoras

Modelar cómo se deforman los automóviles en un choque, cómo responden las naves espaciales a…

4 hours hace

Diseñan celdas que generan electricidad a oscuras

Investigadores chinos han afirmado que su unidad generó una producción de electricidad estable durante 160…

4 hours hace

Mano robótica capaz de manipular objetos

Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)

3 days hace
Click to listen highlighted text!