RECHERCHE
PDI-Bench : évaluation quantitative de la cohérence géométrique dans les modèles vidéo génératifs
Un nouveau benchmark mesure objectivement la plausibilité physique des vidéos générées, révélant des défaillances géométriques invisibles aux métriques perceptuelles classiques.
arXiv cs.AI · cs.LG · cs.CL·Jiaxin Wu, Yihao Pi, Yinling Zhang, Yuheng Li·14 mai 2026

Image · Source originale
PDI-Bench (Perspective Distortion Index) est un framework quantitatif pour auditer la cohérence géométrique des vidéos générées. Il combine segmentation, suivi de points et reconstruction monoculaire pour projeter les objets en coordonnées 3D, puis calcule des résidus géométriques selon trois axes : alignement échelle-profondeur, cohérence du mouvement 3D et rigidité structurelle. Testé sur des générateurs vidéo state-of-the-art, PDI révèle des modes de défaillance géométriques systématiques absents des métriques perceptuelles habituelles.