En 2016, una supercomputadora venció al campeón mundial en Go, un complicado juego de mesa. ¿Cómo?
Utilizando el aprendizaje de refuerzo, un tipo de inteligencia artificial en la que los computadores se entrenan a sí mismos después de ser programados con instrucciones simples.
Los computadores aprenden de sus errores y, paso a paso, se vuelven muy poderosos.
El principal inconveniente del aprendizaje de refuerzo es que no se puede utilizar en algunas aplicaciones de la vida real.
Eso es porque en el proceso de entrenamiento, los computadores inicialmente intentan casi todo antes de acabar tropezando con el camino correcto.
Esta fase inicial de prueba y error puede ser problemática para ciertas aplicaciones, como los sistemas de control climático, en los que no se tolerarían cambios bruscos de temperatura.
Los ingenieros del CSEM han desarrollado un método que supera este problema.
Demostraron que las computadoras pueden ser entrenadas primero en modelos teóricos extremadamente simplificados antes de ser preparadas para aprender sobre sistemas de la vida real.
Esto significa que cuando las computadoras comienzan el proceso de aprendizaje automático en los sistemas de la vida real, pueden utilizar lo que aprendieron previamente en los modelos.
Some of them are listed below: cialis no prescription canada – a sildenafil citrate manufactured by Pfizer. cialis – a tadalafil derivative manufactured by Eli Lily. buy cialis online – a derivative of vardenafil hydrochloride made by GaxoSmithKlein and Bayer. There are a lot of teens that are sexually active with their partners, but still are not much aware about the pills that are been given for erectile dysfunction in so many men and always shows up with the best of its results. online viagra a very important component which is sildenafil citrate. Moreover, strenuous poses during tadalafil online pharmacy lovemaking sessions makes your body flexible, while sweating during these love episode burns fat. Specifically stating, impotence refers to the trouble in achieving and maintaining viagra samples uk erection on being sexually enthused.Por lo tanto, las computadoras pueden tomar rápidamente el camino correcto sin pasar por un período de fluctuaciones extremas.
La investigación de los ingenieros acaba de ser publicada en la revista IEEE Transactions on Neural Networks and Learning Systems.
“Es como aprender el manual del conductor antes de arrancar un carro“, dice Pierre-Jean Alet, jefe de investigación de sistemas de energía inteligente en el CSEM y coautor del estudio.
“Con este paso previo a la formación, los computadores construyen una base de conocimientos a la que pueden recurrir para no ir a ciegas mientras buscan la respuesta correcta“.
Los ingenieros probaron su enfoque en un sistema de calefacción, ventilación y aire acondicionado (HVAC) para un complejo edificio de 100 habitaciones usando un proceso de tres pasos.
Primero, entrenaron a una computadora en un “modelo virtual” construido a partir de ecuaciones simples que describían aproximadamente el comportamiento del edificio.
Luego introdujeron en la computadora datos reales del edificio (temperatura, tiempo de apertura de las persianas, condiciones climáticas, etc.), para que el adiestramiento fuera más preciso.
Finalmente, dejaron que la computadora ejecutara sus algoritmos de aprendizaje de refuerzo para encontrar la mejor manera de manejar el sistema de HVAC.
Este descubrimiento podría abrir nuevos horizontes para el aprendizaje automático al ampliar su uso a aplicaciones en las que las grandes fluctuaciones de los parámetros de funcionamiento tendrían importantes costos financieros o de seguridad.
Fuente: Noticias de la Ciencia