RECHERCHE
FORGE : mémoire d'agent auto-évolutive sans mise à jour des poids via diffusion populationnelle
FORGE permet à des agents LLM d'améliorer leurs décisions par mémoire auto-générée, sans gradient, grâce à une boucle de réflexion collective.
arXiv cs.AI · cs.LG · cs.CL·Igor Bogdanov, Chung-Horng Lung, Thomas Kunz, Jie Gao·15 mai 2026

Image · Source originale
FORGE (Failure-Optimized Reflective Graduation and Evolution) est un protocole par étapes qui fait évoluer la mémoire en langage naturel d'agents ReAct hiérarchiques, sans mise à jour des poids. Une boucle interne de type Reflexion convertit les trajectoires échouées en artefacts de connaissance réutilisables (heuristiques, démonstrations), tandis qu'une boucle externe propage la meilleure mémoire à toute la population. Évalué sur CybORG CAGE-2, FORGE améliore le retour moyen de 1,7 à 7,7× par rapport au zero-shot et de 29 à 72 % par rapport à Reflexion, sur 12 conditions modèle-représentation.