RECHERCHE
TSN-Affinity : réutilisation de paramètres guidée par similarité pour l'apprentissage par renforcement continu hors ligne
Une nouvelle méthode architecturale combine TinySubNetworks et Decision Transformer pour apprendre des tâches séquentielles sans oubli catastrophique, sans rejouer de données.
arXiv cs.AI · cs.LG · cs.CL·Dominik Żurek, Kamil Faber, Marcin Pietron, Paweł Gajewski·28 avril 2026

Image · Source originale
TSN-Affinity propose une approche de continual offline reinforcement learning (CORL) basée sur des sous-réseaux parcimonieux et un Decision Transformer. La méthode route les tâches selon la compatibilité des actions et la similarité latente, évitant l'overhead mémoire des approches par replay. Évaluée sur Atari et des tâches de manipulation robotique (Franka Emika Panda), elle montre une bonne rétention des performances et améliore les résultats multi-tâches grâce au routage par affinité.