RECHERCHE
TuneJury : une métrique ouverte pour aligner les préférences en génération musicale
Des chercheurs publient TuneJury, un reward model open-source capable de prédire les préférences humaines pour la génération musicale texte-vers-audio.
arXiv cs.AI · cs.LG · cs.CL·Yonghyun Kim, Junwon Lee, Haiwen Xia, Yinghao Ma·15 juin 2026

Image · Source originale
TuneJury est un reward model pairwise open-source pour la génération texte-vers-musique, entraîné sur des labels de préférence humaine issus de votes en arène, comparaisons crowdsourcées et notations esthétiques d'experts. Il intègre une calibration par ancrage (anchor calibration) via Bradley-Terry pour s'adapter à de nouveaux générateurs sans réentraînement complet. Le modèle améliore de façon cohérente les performances dans trois applications : sélection best-of-N, optimisation latente DITTO et post-training par expert iteration.