RECHERCHE

FORGE : mémoire d'agent auto-évolutive sans mise à jour des poids via diffusion populationnelle

FORGE permet à des agents LLM d'améliorer leurs décisions par mémoire auto-générée, sans gradient, grâce à une boucle de réflexion collective.

arXiv cs.AI · cs.LG · cs.CL·Igor Bogdanov, Chung-Horng Lung, Thomas Kunz, Jie Gao·15 mai 2026

Image · Source originale

FORGE (Failure-Optimized Reflective Graduation and Evolution) est un protocole par étapes qui fait évoluer la mémoire en langage naturel d'agents ReAct hiérarchiques, sans mise à jour des poids. Une boucle interne de type Reflexion convertit les trajectoires échouées en artefacts de connaissance réutilisables (heuristiques, démonstrations), tandis qu'une boucle externe propage la meilleure mémoire à toute la population. Évalué sur CybORG CAGE-2, FORGE améliore le retour moyen de 1,7 à 7,7× par rapport au zero-shot et de 29 à 72 % par rapport à Reflexion, sur 12 conditions modèle-représentation.

Chaleur 0

Pertinence 72

Nouveauté 74

OUVRIR LA SOURCE ↗

#agents #mémoire #LLM #reflexion #reinforcement-learning