Los humanos pueden ayudar a una inteligencia artificial a aprender juegos más rápidamente

Los humanos pueden ayudar a una inteligencia artificial a aprender juegos más rápidamente

Comparta este Artículo en:

Después del entrenamiento la inteligencia artificial pudo igualar a los humanos en “Space Invaders” (pero no con “Ms. Pac-Man”).

Google enseñó a DeepMind a jugar los juegos de Atari por su cuenta, pero dejar que los humanos ayuden puede ser más rápido, según investigadores de Microsoft y Alemania.

Invitaron a gente de diferentes habilidades a jugar cinco títulos de Atari 2600: Ms. Pac-Man, Space Invaders, Video Pinball, Q*Bert y Montezuma’s Revenge.

Después de ver 45 horas de juego humano, el algoritmo podía vencer a sus mentores en Pinball.

A diferencia de los métodos de ensayo y error de DeepMind (en el video), la inteligencia artificial ayudada por humanos aprendió a jugar los juegos en menos tiempo que otros sistemas de inteligencia artificial.

“Los actuales enfoques de vanguardia requieren millones de muestras de entrenamiento”, dice el documento.

“Una forma prometedora de abordar este problema es aumentar el aprendizaje profundo con demostraciones humanas”.

Los investigadores entrenaron la Inteligencia Artificial usando “Javatari”, un emulador Atari 2600 codificado en Javascript que funciona en cualquier navegador.

A continuación, se abrió a cualquier persona, registrando las acciones tomadas en cada paso de tiempo junto con la recompensa ganada.

Para motivar a los jugadores, les mostraron sus puntuaciones promedio comparadas con otros seres humanos, así como con el sistema DeepMind de Google a partir de 2015.

Al final, el estudio recogió 45 horas de juego de 60 fps, alrededor de 9,7 millones de fotogramas en total.

Después de triturar esos datos, la máquina podría vencer a los humanos en Pinball Q * Bert y Space Invaders, aunque fue superada tanto en Pac-Man como en Montezuma’s Revenge.

El equipo reconoce que estos últimos títulos más orientados a la estrategia siguen dando trabajo a la máquina.

Sin embargo, encontraron que grabar a los mejores jugadores da mejores resultados, por lo que está utilizando esos datos para ajustar la próxima ronda de investigación.

“El desarrollo más importante del conjunto de datos es recolectar más datos de los jugadores profesionales que logran puntuaciones más altas”, explican los investigadores.

Fuente: Engadget

Print Friendly, PDF & Email

Artículos relacionados: