RECHERCHE
Echo-Memory : étude contrôlée de la mémoire dans les world models actionnables
Une analyse systématique des mécanismes de mémoire dans les world models vidéo, qui isole capacité, compression, lecture et récurrence.
arXiv cs.AI · cs.LG · cs.CL·Wayne King, Zeyue Xue, Yuxuan Bian, Jie Huang·8 juin 2026

Image · Source originale
Echo-Memory est un cadre expérimental contrôlé pour comparer les mécanismes de mémoire dans les world models conditionnés par l'action, qui génèrent des vidéos multi-segments. En fixant le backbone de diffusion vidéo et en faisant varier uniquement le stockage et la lecture de l'historique, l'étude isole quatre axes : capacité, compression, read-out et récurrence. Les résultats montrent que le contexte brut reste une baseline solide et que la compacité ne remplace pas la capacité : les mémoires très compressées perdent des détails saillants. Les métriques de replay ne suffisent pas à évaluer la mémorisation d'un monde.