SAFETY
MESA : prioriser les canaux vulnérables pour sécuriser les systèmes multi-agents
Un framework sans étiquettes classe les canaux de communication les plus critiques dans les systèmes multi-agents, avant même qu'une attaque ne soit détectée.
arXiv cs.AI · cs.LG · cs.CL·Kunyang Li, Kyle Domico, Jonathan Gregory, Patrick McDaniel·29 juin 2026

Image · Source originale
MESA est un framework proactif qui identifie les canaux inter-agents les plus susceptibles d'être exploités dans les systèmes multi-agents (MAS), sans nécessiter de traces d'attaques préalables. Il combine six métriques graph-théoriques et deux sondes dynamiques pour classer les arêtes critiques. Évalué sur huit topologies réseau et cinq LLMs open-source, il atteint une corrélation de Spearman moyenne de +0,60 avec le taux d'attaque réel. Surveiller les 10 % d'arêtes les mieux classées permet d'intercepter environ 3 fois plus d'attaques réussies qu'une allocation aléatoire.