Toutes les news taguées avec ce sujet.
L'intelligence des modèles vidéo viendrait avant tout des LLM, pas des données vidéo. Le prochain Sora serait un agent, pas un meilleur modèle génératif.
Un nouveau benchmark mesure objectivement la plausibilité physique des vidéos générées, révélant des défaillances géométriques invisibles aux métriques perceptuelles classiques.
Un nouveau benchmark de 140 épisodes évalue la cohérence des personnages, objets et lieux sur de longues séquences vidéo multi-plans.