Algoritmo acerca a los robots a la capacidad de “actuar según la intuición”

Algoritmo acerca a los robots a la capacidad de "actuar según la intuición"

Comparta este Artículo en:

Investigadores de la Universidad de Hertfordshire han desarrollado un nuevo algoritmo que permitirá a los robots funcionar de forma más intuitiva, es decir, tomar decisiones utilizando su entorno como guía.

El principio es que, a través del algoritmo, el agente robot crea sus propios objetivos.

Por primera vez, el algoritmo unifica diferentes enfoques de fijación de objetivos bajo un concepto que está directamente vinculado a la física, y además hace que este cálculo sea transparente para que otros puedan estudiarlo y adoptarlo.

El principio del algoritmo está relacionado con la famosa teoría del caos, porque el método hace que el agente sea “el amo del caos de la dinámica del sistema“.

Los investigadores de Hertfordshire exploraron “modelos de motivación” de robots que imitan los procesos de toma de decisiones de humanos y animales, incluso en ausencia de señales claras de recompensa.

El estudio presenta fórmulas de inteligencia artificial (IA) que calculan una forma en la que un robot puede decidir acciones futuras sin instrucciones directas ni intervención humana.

Daniel Polani, profesor de Ciencias de la Computación y autor principal, explica:

“En un sentido aplicado, esto podría significar, por ejemplo, conseguir que un robot juegue y manipule objetos por sí solo sin que se le ordene hacerlo.

“Podría mejorar la forma en que los robots aprenden a interactuar tanto con humanos como con otros robots al fomentar comportamientos e interacciones más ‘naturales’.

“Esto tiene otras aplicaciones, como el comportamiento de supervivencia de robots semiautónomos colocados en situaciones en las que son inalcanzables para un operador humano, como en lugares subterráneos o interplanetarios”.

En los humanos y los animales, una teoría supone la existencia de una “motivación intrínseca“, donde los comportamientos son impulsados solo por la interacción entre el ser y su entorno en lugar de por recompensas aprendidas específicas, como la comida.

Este artículo traduce con éxito esa teoría de la “motivación intrínseca” en una que puede ser utilizada por agentes robóticos.

El profesor Polani añade: “Este trabajo es apasionante porque ahora podemos implementar en robots un mecanismo similar a los que ayudan a los humanos y a los animales a resolver nuevos problemas sin experiencia previa.

Esperamos poder basarnos en este trabajo para desarrollar robots más parecidos a los humanos en el futuro con procesos más intuitivos.

“Esto abre una enorme oportunidad para robots más sofisticados con procesos de decisión similares a los nuestros”.

La teoría que sustenta este artículo, llamada “maximización del empoderamiento”, se ha desarrollado en Herts durante muchos años.

Sugiere que al aumentar el rango de resultados futuros, un robot tendrá mejores opciones también en el futuro más largo.

Es importante destacar que este método reemplaza y, por lo tanto, posiblemente obvia los sistemas de recompensa tradicionales (por ejemplo, las señales de comida).

Si bien la maximización del empoderamiento ha demostrado ser prometedora, aún no se comprende completamente ni se aplica ampliamente.

La mayoría de los estudios solían basarse en simulaciones, mientras calculaban meticulosamente la información necesaria para sistemas complejos y la teoría sigue siendo desafiante.

Sin embargo, esta última investigación innovadora tiene como objetivo explicar por qué las motivaciones basadas en el empoderamiento pueden crear comportamientos similares a los de los organismos vivos, lo que potencialmente conduce a robots más motivados intrínsecamente; y además ofrece una forma significativamente mejorada de calcular estas motivaciones.

El profesor Polani dice que los próximos pasos son utilizar este algoritmo innovador para permitir que los robots descubran más sobre el mundo, desarrollando el aprendizaje directo e identificando y perfeccionando nuevas habilidades que impulsarían su valor en escenarios del mundo real.

Fuente: APS