RECHERCHE
PEEU : des agents GUI autonomes grâce à l'exploration et la réutilisation d'expériences
Une méthode d'exploration autonome d'environnements GUI permet à un modèle 7B de surpasser Qwen2.5-VL-32B sur la planification de tâches.
arXiv cs.AI · cs.LG · cs.CL·Tianyi Men, Zhuoran Jin, Pengfei Cao, Yubo Chen·25 juin 2026

Image · Source originale
La méthode PEEU (Planning Experience Exploration and Utilization) entraîne des agents GUI open-source à explorer leur environnement de façon autonome et à synthétiser des données d'entraînement alignées via un mécanisme de hindsight experience. Un framework d'analyse hiérarchique (TDHAF) révèle que la maîtrise des actions atomiques bas niveau ne suffit pas à garantir la compétence en planification complexe. Sur des benchmarks réels, le modèle 7B résultant atteint 30,6 % de précision, dépassant Qwen2.5-VL-32B.