Entrar en una web de reserva de vuelos. Buscar con la vista el formulario de búsqueda. Seguir las instrucciones (expresadas en lenguaje natural).
Mover el cursor y hacer clic. Repasar las opciones y seleccionar la más barata. Mover el cursor y hacer clic. Reservar. Parece sencillo, sin duda. Pero para una inteligencia artificial puede no serlo tanto.
Podemos intentarlo haciendo que aprenda a partir de ejemplos humanos, pero eso resulta poco escalable: si queremos que sea capaz de realizar su misión en una amplia variedad de webs de reserva de vuelos, la mejor estrategia es apostar por el aprendizaje por refuerzo (como el usado para enseñar a jugar a AlphaZero Go), una técnica que permita a la inteligencia artificial aprender autónomamente, mediante miles o millones de procesos de prueba y error.
Pero en un caso como el que se nos plantea aquí, la variedad de elementos a contemplar y el abanico de acciones a realizar crece exponencialmente.
Por ello, un equipo de investigadores de Google se planteó el mejor modo de resolver este reto: el resultado lo podemos encontrar en el artículo académico, recientemente publicado, ‘Learning to Navigate the Web’:
“Aunque los enfoques más recientes mejoran la tasa de éxito en entornos relativamente simples con la ayuda de demostraciones humanas para guiar la exploración, aún fallan en entornos donde el conjunto de posibles instrucciones puede llegar a millones”.
“Hemos abordado los problemas mencionados desde una perspectiva diferente, proponiendo enfoques de aprendizaje reforzado guiado que pueden generar una cantidad ilimitada de experiencia para que una IA aprenda”.
Los investigadores capacitaron a una red neuronal para comprender la estructura de las páginas web, lo que le permite navegar por ellas y conocer las opciones que éstas le ofrecen.
The most active ingredient in raindogscine.com order generic cialis is Sildenafil. Blacklists are basically lists of know domains that send out unsolicited email, which wholesale cialis pills is very difficult to keep accurate. The best male enhancement pills can be http://raindogscine.com/estreno-mundial-de-una-noche-sin-luna/ viagra 50 mg placed from the comfort of home using credit or debit cards. Occasionally a person might get a local twitch response from this medication. viagra effects womenLa clave reside en desarrollar un modelo que permita a la red neuronal dar soluciones a un problema con numerosas variables:
“Como ejemplo, en el entorno de reserva de vuelos, el número de instrucciones/tareas posibles puede aumentar a más de 14 millones, con más de 1700 palabras de vocabulario y aproximadamente 100 elementos web en cada episodio”.
Este artículo viene a ser la secuela de este otro publicado hace un año por investigadores de la Universidad de Stanford, en el que se venía a probar la capacidad de una computadora para aprender a realizar clics de ratón y pulsaciones de teclado para completar tareas en un sitio web, recurriendo a una red neuronal basada en demostraciones humanas.
Sin embargo, al carecer de este último recurso, los investigadores de Google han diseñado una propuesta basada en el uso de dos redes neuronales: una, ‘INET’, analiza la estructura del documento y propone los siguientes pasos que debe dar su compañera, ‘Qweb’, la responsable de ejecutar las pulsaciones y clics.
Los investigadores intentaron innovar también en otros aspectos frente a intentos previos como el de Stanford, y utilizaron una técnica llamada ‘aprendizaje curricular’ para fragmentar las tareas en otras más pequeñas y ayudar así a la red neuronal a superar los múltiples pasos de un formulario web.
También recurrieron a la ‘codificación superficial’ para que la IA comprendiera mejor el contenido de la web: así, el campo del formulario con el listado de aeropuertos no es, a ojos de la red neuronal, una mera lista de nombres, sino que es capaz de percibir su sentido por el contexto en que se encuentra dentro de la estructura de la web.
Según los investigadores, esta clase de innovaciones impiden que la IA incurra en comportamientos de navegación frustantes como el de hacer clic en el botón de envío del formulario como primer paso para obtener la menor recompensa negativa posible.
Fuente: Xataca