RECHERCHE
MAS-PromptBench : quand l'optimisation de prompts améliore-t-elle les systèmes multi-agents ?
Un benchmark systématique évalue l'optimisation de prompts système dans des architectures multi-agents LLM variées, révélant gains et limites.
arXiv cs.AI · cs.LG · cs.CL·Juyang Bai, Laixi Shi·22 juin 2026

Image · Source originale
MAS-PromptBench étudie l'optimisation des prompts système dans des configurations multi-agents (MAS) variant par tâche, workflow, protocole de communication et taille d'équipe. Deux optimiseurs de prompts, étendant des méthodes single-agent de l'état de l'art, sont comparés sur un large spectre de setups. Les résultats montrent que l'optimisation peut générer des gains significatifs, mais expose aussi des défis ouverts liés à l'espace de recherche exponentiellement croissant des MAS.