Toutes les news taguées avec ce sujet.
Une approche semi-paramétrique qui réutilise les données d'entraînement à l'inférence pour corriger les erreurs de généralisation du behavior cloning.
Un algorithme combine Behavior Cloning et Reinforcement Learning pour apprendre des politiques robotiques robustes en 1 à 2 heures d'interaction réelle.