RECHERCHE
ClawGym : un framework scalable pour entraîner des agents sur fichiers locaux
ClawGym propose un pipeline complet — données synthétiques, fine-tuning et benchmark — pour des agents IA capables de gérer des workflows multi-étapes sur fichiers locaux.
arXiv cs.AI · cs.LG · cs.CL·Fei Bai, Huatong Song, Shuang Sun, Daixuan Cheng·29 avril 2026

Image · Source originale
ClawGym est un framework couvrant l'intégralité du cycle de développement d'agents personnels de type Claw, opérant sur des fichiers locaux et des espaces de travail persistants. Il inclut ClawGym-SynData (13 500 tâches synthétiques), un pipeline de fine-tuning supervisé sur des trajectoires rollout, et ClawGym-Bench, un benchmark de 200 instances validées par filtrage automatisé et revue humaine-LLM. Le reinforcement learning est exploré via des sandboxes parallélisées par tâche.