Investigadores de UC Berkley utilizaron el aprendizaje por refuerzo de muestra eficiente, junto con un objetivo de preentrenamiento relevante para…