RECHERCHE

MAS-PromptBench : quand l'optimisation de prompts améliore-t-elle les systèmes multi-agents ?

Un benchmark systématique évalue l'optimisation de prompts système dans des architectures multi-agents LLM variées, révélant gains et limites.

arXiv cs.AI · cs.LG · cs.CL·Juyang Bai, Laixi Shi·22 juin 2026

Image · Source originale

MAS-PromptBench étudie l'optimisation des prompts système dans des configurations multi-agents (MAS) variant par tâche, workflow, protocole de communication et taille d'équipe. Deux optimiseurs de prompts, étendant des méthodes single-agent de l'état de l'art, sont comparés sur un large spectre de setups. Les résultats montrent que l'optimisation peut générer des gains significatifs, mais expose aussi des défis ouverts liés à l'espace de recherche exponentiellement croissant des MAS.

Chaleur 12

Pertinence 72

Nouveauté 65

OUVRIR LA SOURCE ↗

#multi-agent #prompt-optimization #LLM #benchmark #MAS