RECHERCHE
OpenThoughts-Agent : recettes de données pour modèles agentiques
Un pipeline open-source de curation de données pour entraîner des modèles agentiques polyvalents, avec 100 000 exemples et +3,9 pts sur 7 benchmarks.
arXiv cs.AI · cs.LG · cs.CL·Negin Raoof, Richard Zhuang, Marianna Nezhurina, Etash Guha·23 juin 2026

Image · Source originale
OpenThoughts-Agent propose un pipeline entièrement ouvert pour curating des données d'entraînement de modèles agentiques, comblant un manque notable face aux approches existantes ciblant un seul benchmark. Après plus de 100 expériences d'ablation, les chercheurs fine-tunent Qwen3-32B sur 100 000 exemples et atteignent 44,8 % de précision moyenne sur sept benchmarks agentiques, soit +3,9 points sur Nemotron-Terminal-32B. Les données, le pipeline et les modèles sont publiés en open source sur openthoughts.ai.