RECHERCHE

Performances de modèles à 1 000 milliards de paramètres avec un agent MoE de 35 milliards

Agents-A1 démontre qu'élargir l'horizon agentic d'un modèle MoE 35B suffit à rivaliser avec des LLM mille fois plus grands.

arXiv cs.AI · cs.LG · cs.CL·Lei Bai, Zongsheng Cao, Yang Chen, Zhiyao Cui·29 juin 2026

Image · Source originale

Agents-A1 est un modèle MoE de 35 milliards de paramètres entraîné selon une recette en trois étapes : fine-tuning supervisé global, modèles enseignants spécialisés par domaine, puis distillation multi-enseignants avec alignement lexical saillant. L'approche mise sur la mise à l'échelle de l'horizon agentic — trajectoires longues de 45 K tokens en moyenne — plutôt que sur la taille du modèle. Sur plusieurs benchmarks long-horizon (SEAL-0, IFBench, HiPhO), il surpasse ou égale des modèles à 1 000 milliards de paramètres comme Kimi-K2 et DeepSeek-V4-pro.

Chaleur 51

Pertinence 82

Nouveauté 78

OUVRIR LA SOURCE ↗

#agents #MoE #distillation #long-horizon #scaling