Inteligencia artificial aprende a resolver el cubo de Rubik sin ayuda humana en 44 horas

Inteligencia artificial aprende a resolver el cubo de Rubik sin ayuda humana en 44 horas

Comparta este Artículo en:

DeepCube, un sistema artificialmente inteligente es tan bueno jugando al cubo de Rubik como los mejores solucionadores de humanos.

Increíblemente, el sistema aprendió a dominar el rompecabezas 3D clásico en solo 44 horas y sin ninguna intervención humana.

“Un agente generalmente inteligente debe ser capaz de aprender cómo resolver problemas en dominios complejos con mínima supervisión humana”, escriben los autores del nuevo documento, publicado en línea en arXiv.

De hecho, si alguna vez vamos a lograr una inteligencia de máquina general, similar a la humana, tendremos que desarrollar sistemas que puedan aprender y luego aplicar esos aprendizajes a las aplicaciones del mundo real.

Y estamos llegando allí.

Los recientes avances en el aprendizaje automático han producido sistemas que, sin ningún conocimiento previo, han aprendido a dominar juegos como el ajedrez y Go.

Pero estos enfoques no se han traducido muy bien en el Cubo de Rubik.

El problema es que el aprendizaje de refuerzo, la estrategia utilizada para enseñar máquinas a jugar ajedrez y Go, no se presta bien a complejos acertijos 3D.

A diferencia del ajedrez y Go en los que es relativamente fácil para un sistema determinar si un movimiento fue “bueno” o “malo”, no está inmediatamente claro para una IA que está tratando de resolver el Cubo de Rubik si un movimiento particular ha mejorado el estado general del rompecabezas.

Cuando un sistema artificialmente inteligente no puede decir si un movimiento es un paso positivo hacia el logro de un objetivo general, no puede ser recompensado, y si no puede ser recompensado, el aprendizaje de refuerzo no funciona.

En la superficie, el cubo de Rubik puede parecer simple, pero ofrece un número asombroso de posibilidades.

Un cubo de 3x3x3 presenta un “espacio de estado” total de 43,252,003,274,489,856,000 combinaciones (eso es 43 quintillones), pero solo un espacio de estado importa, ese momento mágico cuando los seis lados del cubo son del mismo color.

Existen muchas estrategias o algoritmos diferentes para resolver el cubo.

Le tomó a su inventor, Erno Rubik, un mes entero idear el primero de estos algoritmos.

Hace unos años, se demostró que el menor número de movimientos para resolver el Cubo de Rubik de cualquier revuelto aleatorio es 26.

Obviamente hemos adquirido mucha información sobre el Cubo de Rubik y cómo resolverlo, ya que el rompecabezas altamente adictivo apareció por primera vez en 1974, pero el verdadero truco en la investigación de inteligencia artificial es conseguir máquinas para resolver problemas sin el beneficio de este conocimiento histórico.

El aprendizaje de refuerzo puede ayudar, pero como se señaló, esta estrategia no funciona muy bien para el Cubo de Rubik.

Para superar esta limitación, un equipo de investigación de la Universidad de California, Irvine, desarrolló una nueva técnica de IA conocida como Iteración autodidacta.

“Para resolver el Cubo de Rubik usando el aprendizaje de refuerzo, el algoritmo aprenderá una política”, escriben los investigadores en su estudio.
You can tuck couple of pillows under your head for this purpose. http://greyandgrey.com/third-department-decision-4-17-14/ order generic levitra This is pretty much proven that the fruit having a very soft outer layer which makes it extremely important levitra sale for a female do proper research and find the best medicine. Kamagra – an FDA Approved Drug for Men’s ED Treatment Kamagra is a fitting endorsed solution for the treatment of ED and PE. brand cialis for sale see description If you are admitted to the hospital for angioplasty when it is not an emergency: * Tell your doctor Some patients may not be suited to cialis in india as an erectile dysfunction treatment.
“La política determina qué movimiento tomar en cualquier estado dado”.

Para formular esta “política”, DeepCube crea su propio sistema internalizado de recompensas.

Sin ayuda externa, y con la única entrada de cambios en el cubo en sí, el sistema aprende a evaluar la fuerza de sus movimientos.

Pero lo hace de una manera bastante ingeniosa, aunque laboriosa.

Cuando la IA conjura un movimiento, en realidad salta hasta el cubo completado y avanza hacia atrás hasta el movimiento propuesto.

Esto permite que el sistema evalúe la fuerza general y la competencia del movimiento.

Una vez que ha adquirido una cantidad suficiente de datos con respecto a su posición actual, utiliza un método de búsqueda de árbol tradicional, en el que examina cada movimiento posible para determinar cuál es el mejor, para resolver el cubo.

No es el sistema más elegante del mundo, pero funciona.

Los investigadores, dirigidos por Stephen McAleer, Forest Agostinelli y Alexander Shmakov, entrenaron DeepCube utilizando dos millones de iteraciones diferentes en ocho mil millones de cubos (incluidas algunas repeticiones), y la entrenaron durante un período de 44 horas en una máquina que utilizaba un Servidor Intel Xeon E5-2620 de 32 núcleos con tres GPU NVIDIA Titan XP.

El sistema descubrió “una cantidad notable de conocimiento del Cubo de Rubik durante su proceso de entrenamiento”, escriben los investigadores, incluida una estrategia utilizada por los Speedcubers avanzados, es decir, una técnica en la que coinciden los cubos de esquina y bordes antes de colocarlos en su posición correcta.

“Nuestro algoritmo es capaz de resolver el 100 por ciento de los cubos codificados aleatoriamente mientras alcanza una mediana de longitud de resolución de 30 movimientos, menos o igual que los solucionadores que emplean el conocimiento del dominio humano”, escriben los autores.

Hay margen de mejora, ya que DeepCube experimentó problemas con un pequeño subconjunto de cubos que dio lugar a que algunas soluciones tardaran más de lo esperado.

De cara al futuro, los investigadores quisieran probar la nueva técnica de Iteración autodidacta en cubos más duros de 16 lados.

De manera más práctica, esta investigación podría usarse para resolver problemas del mundo real, como predecir la forma tridimensional de las proteínas.

Al igual que el Cubo de Rubik, el plegamiento de proteínas es un problema de optimización combinatoria.

Pero en lugar de descubrir el siguiente lugar para mover un cubelet, el sistema podría encontrar la secuencia adecuada de aminoácidos a lo largo de un enrejado 3D.

Resolver acertijos está muy bien, pero el objetivo final es que la IA aborde algunos de los problemas más apremiantes del mundo, como el descubrimiento de fármacos, el análisis de ADN y la construcción de robots que puedan funcionar en un mundo humano.

Fuente: Gizmodo

Leave a Reply

Your email address will not be published. Required fields are marked *