2 items

#behavior-cloning

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 42
DARP : politiques de récupération différentielle pour l'imitation learning
Une approche semi-paramétrique qui réutilise les données d'entraînement à l'inférence pour corriger les erreurs de généralisation du behavior cloning.
RECHERCHE
heat 52
Q2RL : extraire des Q-fonctions depuis le Behavior Cloning pour le RL sur robot
Un algorithme combine Behavior Cloning et Reinforcement Learning pour apprendre des politiques robotiques robustes en 1 à 2 heures d'interaction réelle.