SAFETY · Microsoft
Red-teaming d'un réseau d'agents : ce qui se brise quand les agents IA interagissent à grande échelle
Microsoft Research explore les vulnérabilités émergentes des réseaux multi-agents : certaines failles n'apparaissent qu'en interaction, jamais en test isolé.
Microsoft Research·Gagan Bansal, Shujaat Mirza, Keegan Hines, Will Epperson, Zachary Huang, Whitney Maxwell, Pete Bryan, Tyler Payne, Adam Fourney, Amanda Swearngin, Wenyue Hua, Tori Westerhoff, Amanda Minnich, Maya Murad, Ece Kamar, Ram Shankar Siva Kumar, Saleema Amershi·30 avril 2026

Image · Source originale
Des chercheurs de Microsoft Research ont conduit des exercices de red-teaming sur des réseaux d'agents IA et constaté que certains risques n'émergent qu'en interaction. Un seul message malveillant peut se propager de proche en proche, extraire des données privées à chaque étape et enrôler des agents tiers non ciblés. Si des signes de résistance accrue apparaissent dans certains réseaux, les défenses restent un problème ouvert.