RECHERCHE
Clonage comportemental scalable pour agents web par distillation de compétences
Des chercheurs proposent de transformer les traces d'interaction humaine en compétences réutilisables pour entraîner des agents de navigation web à grande échelle.
arXiv cs.AI · cs.LG · cs.CL·Kaisen Yang, Zheng Jiang, Yuzhao Peng, Houde Qian·30 juin 2026

Image · Source originale
Cette étude introduit une approche de behavior cloning pour agents web reposant sur la distillation de compétences : les trajectoires d'interaction utilisateur sont converties en compétences en langage naturel, stockées dans un graphe structuré. Les chercheurs soutiennent que le vrai goulot d'étranglement des agents browser est la prise de décision sous information incomplète, et que les données comportementales humaines constituent une source sous-exploitée de priors pertinents. La scalabilité proviendrait ainsi des usages collectifs réels plutôt que de tâches conçues manuellement.