RECHERCHE · Microsoft
AgentRx : un framework de débogage systématique pour les agents IA
Microsoft Research open-source AgentRx, un framework qui localise automatiquement l'étape critique d'échec dans les trajectoires d'agents IA complexes.
Microsoft Research·Shraddha Barke, Arnav Goyal, Alind Khare, Chetan Bansal·12 mars 2026

Image · Source originale
AgentRx identifie la première étape « irrécupérable » dans les trajectoires d'agents IA en synthétisant des contraintes exécutables issues des schémas d'outils et des politiques métier. Le framework améliore la localisation des défaillances de +23,6 % et l'attribution des causes profondes de +22,9 % par rapport aux baselines par prompting. Microsoft Research publie également un benchmark de 115 trajectoires annotées manuellement et une taxonomie à neuf catégories d'échecs.