RECHERCHE
NonZero : exploration guidée par interactions pour le MCTS multi-agents
Une méthode réduisant l'explosion combinatoire du Monte Carlo Tree Search en domaines coopératifs multi-agents, via des déviations locales et un score d'interaction.
arXiv cs.AI · cs.LG · cs.CL·Sizhe Tang, Zuyuan Zhang, Mahdi Imani, Tian Lan·1 mai 2026

Image · Source originale
NonZero s'attaque à la malédiction de la dimensionnalité dans le Monte Carlo Tree Search (MCTS) multi-agents : au lieu d'explorer l'espace complet des actions jointes, la méthode sélectionne des déviations locales guidées par un score d'interaction mesurant les bénéfices de coordination. Le problème de proposition de candidats est formalisé comme un bandit, avec une garantie de regret local sous-linéaire. Sur MatGame, SMAC et SMACv2, NonZero surpasse les baselines model-based et model-free à budget de recherche équivalent.