Toutes les news taguées avec ce sujet.
Un nouveau modèle dual DiT découple la planification visuelle basse fréquence et l'exécution d'actions haute fréquence pour améliorer le contrôle embodied.
Un modèle Vision-Language-Action capable d'accélérer en phase sûre et de ralentir lors des contacts précis, via une augmentation de trajectoire à vitesse variable.
Un algorithme combine Behavior Cloning et Reinforcement Learning pour apprendre des politiques robotiques robustes en 1 à 2 heures d'interaction réelle.