RECHERCHE

AgentSpec : un framework modulaire pour analyser les scaffolds d'agents LLM incarnés

AgentSpec propose une architecture de composition typée pour isoler et comparer les modules (mémoire, raisonnement, réflexion) des agents LLM sur plusieurs benchmarks.

arXiv cs.AI · cs.LG · cs.CL·Jixuan Chen, Jianzhi Shen, Haoqiang Kang, Zhi Hong·12 juin 2026

Image · Source originale

AgentSpec est un framework de spécification modulaire représentant les agents incarnés comme des compositions typées de composants politiques réutilisables à interfaces standardisées. Il permet de permuter et recombiner les modules de perception, mémoire, raisonnement, réflexion et apprentissage dans des conditions contrôlées. Les expériences sur DeliveryBench, ALFRED, MiniGrid et RoboTHOR montrent que les performances dépendent davantage des interactions entre modules que de la force isolée de chacun.

Chaleur 1

Pertinence 72

Nouveauté 65

OUVRIR LA SOURCE ↗

#agents #LLM #scaffold #modularité #benchmark