Ingenieros de investigación de Disney han hecho posible que un robot aprenda políticas a partir de datos de movimiento no estructurados.
Primero, extrajeron una codificación espacial latente entrenando un autocodificador variacional y luego tomando breves ventanas de movimiento de datos no estructurados como entrada.
Luego, utilizaron incrustación de código latente variable en el tiempo para entrenar una política condicional en una segunda etapa, proporcionando así un mapeo de la entrada cinemática a una salida consciente de la dinámica.
Al mantener estas dos etapas separadas, el equipo pudo beneficiarse de métodos autosupervisados para obtener mejores códigos latentes y recompensas de imitación explícitas para evitar el colapso del modo.
La eficiencia y la solidez se demostraron en la simulación, con movimientos especificados por el usuario que no se vieron, y en un robot bípedo, donde movimientos dinámicos se llevaron al mundo real.
Fuente: Disney
En un esfuerzo por reducir el impacto ambiental de las emisiones de dióxido de carbono,…
El nuevo dispositivo se basa en los patrones de moiré, un nuevo enfoque que podría…
Investigadores de la Universidad Carnegie Mellon (CMU) presentan Picotaur, un micro robot del tamaño de…
Investigadores de la EPFL han desarrollado una interfaz cerebro-máquina miniaturizada de última generación capaz de…
Al igual que un ser humano, es difícil leer la mente de la inteligencia artificial.…
La insuficiencia cardíaca es una de las principales causas de muerte en todo el mundo…