¿Puede un algoritmo explorar entornos complejos o, en cambio, hay que dárselo todo mascado?
Es decir, ¿Podemos entrenar sistemas de inteligencia artificial para que tomen decisiones explorando y comprendiendo entornos complicados y para que aprendan a adquirir recompensas de manera óptima?
Esa es la pregunta que Adrien Ecoffet, Joost Huizinga y sus colegas llevan años tratando de responder y la verdad es que es una pregunta compleja.
Por suerte, tenemos videojuegos.
Y es que, si lo pensamos un momento, los videojuegos son un marco fantástico para entrenar inteligencias artificiales en este tipo de decisiones (y de probar qué metodología funciona mejor):
Tienen todo lo necesario para aprender en entornos sucesivamente más complejos, permiten establecer recompensas basadas en llegar a una ubicación específica o completar un nivel en un videojuego y, de hecho, suponen un reto incluso para los humanos mismos.
Ecoffet y su equipo trabajan con algoritmos de aprendizaje por refuerzo y decidieron probar sus nuevos enfoques con los videojuegos clásicos de Atari.
Concretamente, ‘Montezuma’s Revenge’ y ‘Pitfall’.
Sildenafil citrate, the active ingredient from this product, releases Nitric Oxide (NO), an agent that is highly important viagra 25mg prix for the man to have a better love making session with the partner. Look at what you really are spending at local stores when we deliver it to your foot steps and offer huge discount on same medicine. tadalafil best buy Such problems give rise levitra without prescription to most common sexual issue after erectile dysfunction. Thereby, it is important to comprehend, that pancreas problem normally requires a multidisciplinary administration technique involving different sort of solid oral meds are accessible at commercial center as a solution for ED yet http://appalachianmagazine.com/2015/01/10/the-story-of-appalachian-magazine-a-publication-for-the-people/ cialis properien pill is a complete benefit for those people who have been facing any type of stress in your life, you are now aware of the berry and its worth.No es solo un arrebato de nostalgia, es que los juegos de Atari 2600 se han convertido en un ‘estándar dorado’ para este tipo de sistemas.
Sin ir más lejos, hasta ahora, los algoritmos conseguían modestas puntuaciones en el primero y fracasaban miserablemente en el segundo: no conseguían ni un solo punto.
La familia de algoritmos que desarrolla el equipo de Ecoffet (llamada Go-Explore) cambia el asunto, según acaba de publicar la revista Nature.
La idea es que los GO-Explore pueden explorar entornos en profundidad y crear un archivo para ayudarlos a recordar dónde han estado, asegurándose de no olvidar la ruta hacia una etapa intermedia prometedora o un resultado exitoso.
Y con esas herramientas, los algoritmos de Go-Explore cuadriplican las puntuaciones anteriores en ‘Montezuma’s Revenge’ y supera el rendimiento humano promedio en ‘Pitfall’.
Tras este éxito, y siempre según los datos de ‘Nature’, los investigadores han aplicado los mismos algoritmos a tareas robóticas que simulan recoger y colocar objetos con un brazo robótico (en ubicaciones aisladas detrás de puertas con cerrojo).
Y es una buena noticia porque aún queda mucho para que una IA pueda ganarnos en Fornite, el mero hecho de que lo hagan en juegos de 1982 es síntoma de que pronto lo harán (y que eso tiene interesantes aplicaciones prácticas).
Fuente: Xataca