RECHERCHE

Comment les agents IA dépensent vos tokens : analyse et prédiction des coûts dans les tâches de codage

Une première étude systématique révèle que les tâches de codage agentique consomment 1000x plus de tokens que le raisonnement standard, avec une variance jusqu'à 30x entre exécutions.

arXiv cs.AI · cs.LG · cs.CL·Longju Bai, Zhemin Huang, Xingyao Wang, Jiao Sun·24 avril 2026

Image · Source originale

Des chercheurs analysent les patterns de consommation de tokens sur huit LLMs frontier testés sur SWE-bench Verified. Les tâches agentiques s'avèrent 1000x plus coûteuses que le code reasoning classique, avec les tokens en entrée comme principal facteur de coût. La consommation est fortement variable (jusqu'à 30x d'écart pour une même tâche) et ne corrèle pas avec la précision. Les modèles diffèrent sensiblement en efficacité : Kimi-K2 et Claude-Sonnet-4.5 consomment en moyenne 1,5 million de tokens de plus que GPT-5 sur les mêmes tâches.

Chaleur 0

Pertinence 82

Nouveauté 72

OUVRIR LA SOURCE ↗

#agents #LLM #token-efficiency #coding #benchmark