RECHERCHE

VERITAS : vérification visuelle pour l'amélioration autonome des politiques robotiques

Un framework générateur-vérificateur permet à un robot d'évaluer ses propres actions à l'inférence et de s'améliorer sans intervention humaine.

arXiv cs.AI · cs.LG · cs.CL·Mingtong Zhang, Dhruv Shah·16 juin 2026

Image · Source originale

VERITAS couple une politique robotique généraliste (générateur) avec un vérificateur visuel sans gradient pour évaluer les actions au moment de l'inférence. Ce pilotage à l'inférence améliore les performances sans entraînement supplémentaire sur de nouvelles démonstrations. Les trajectoires vérifiées servent ensuite de supervision pour un fine-tuning offline, atteignant une efficacité comparable aux démonstrations d'experts, sans intervention humaine.

Chaleur 8

Pertinence 58

Nouveauté 72

OUVRIR LA SOURCE ↗

#robotique #inference-time steering #self-improvement #policy learning #vérification visuelle