RECHERCHE

La malédiction de la mémoire : comment l'historique étendu nuit à la coopération des agents LLM

Élargir la fenêtre de contexte des LLM dégrade la coopération dans les dilemmes sociaux multi-agents — un phénomène contre-intuitif documenté sur 7 modèles et 4 jeux.

arXiv cs.AI · cs.LG · cs.CL·Jiayuan Liu, Tianqin Li, Shiyi Du, Xin Luo·8 mai 2026

Image · Source originale

Sur 500 rounds, 7 LLMs et 4 jeux, l'extension de l'historique accessible détériore la coopération dans 18 des 28 configurations testées. L'analyse de 378 000 traces de raisonnement révèle que ce phénomène, baptisé « memory curse », tient à l'érosion des intentions prospectives plutôt qu'à une montée de la paranoïa. Un adapter LoRA entraîné sur des traces prospectives atténue cet effet et se transfère en zero-shot. Le Chain-of-Thought explicite amplifie paradoxalement la dégradation.

Chaleur 0

Pertinence 72

Nouveauté 78

OUVRIR LA SOURCE ↗

#LLM #multi-agent #coopération #mémoire #fine-tuning