RECHERCHE
MDM-VGB : scaling à l'inférence pour les modèles de diffusion masqués
Un nouveau sampler discret guide la génération par récompense dans les modèles de diffusion masqués, avec une complexité quadratique prouvée.
arXiv cs.AI · cs.LG · cs.CL·Kijung Jeon, Thuy-Duong Vuong, Molei Tao·26 juin 2026

Image · Source originale
MDM-VGB est un sampler pour les Masked Diffusion Models qui enrichit la génération par démasquage avec un remasquage guidé par récompense, inspiré de la chaîne de Markov avec backtracking de Jerrum-Sinclair. Le mécanisme étend la marche aléatoire d'un arbre de préfixes fixe à un graphe d'états masqués, permettant de démasquer et remasquer des tokens à positions arbitraires. Robuste au bruit des vérificateurs de processus, l'approche atteint une complexité quadratique, surpassant théoriquement les heuristiques best-of-N sujettes à l'accumulation d'erreurs.