RECHERCHE
SpecRLBench : un benchmark pour la généralisation en RL guidé par spécification
Un nouveau benchmark évalue la capacité des méthodes de reinforcement learning basées sur la logique temporelle linéaire à généraliser sur des tâches et environnements inédits.
arXiv cs.AI · cs.LG · cs.CL·Zijian Guo, İlker Işık, H. M. Sabbir Ahmad, Wenchao Li·27 avril 2026

Image · Source originale
SpecRLBench est un benchmark conçu pour mesurer la généralisation des méthodes de reinforcement learning guidées par des spécifications formelles en LTL (linear temporal logic). Il couvre plusieurs niveaux de difficulté dans des domaines de navigation et de manipulation, avec des environnements statiques et dynamiques, diverses dynamiques robotiques et modalités d'observation. Les évaluations empiriques révèlent les limites des approches existantes face à la complexité croissante des spécifications et des environnements.