RECHERCHE
VERITAS : vérification visuelle pour l'amélioration autonome des politiques robotiques
Un framework générateur-vérificateur permet à un robot d'évaluer ses propres actions à l'inférence et de s'améliorer sans intervention humaine.
arXiv cs.AI · cs.LG · cs.CL·Mingtong Zhang, Dhruv Shah·16 juin 2026

Image · Source originale
VERITAS couple une politique robotique généraliste (générateur) avec un vérificateur visuel sans gradient pour évaluer les actions au moment de l'inférence. Ce pilotage à l'inférence améliore les performances sans entraînement supplémentaire sur de nouvelles démonstrations. Les trajectoires vérifiées servent ensuite de supervision pour un fine-tuning offline, atteignant une efficacité comparable aux démonstrations d'experts, sans intervention humaine.