RECHERCHE
ActCam : contrôle conjoint caméra et mouvement 3D pour la génération vidéo en zero-shot
Une méthode sans entraînement qui synchronise trajectoire de caméra et motion d'acteur dans la génération vidéo diffusion.
arXiv cs.AI · cs.LG · cs.CL·Omar El Khalifi, Thomas Rossi, Oscar Fossey, Thibault Fouque·7 mai 2026

Image · Source originale
ActCam est une méthode zero-shot permettant de transférer le mouvement d'un personnage depuis une vidéo source vers une nouvelle scène, tout en contrôlant les paramètres intrinsèques et extrinsèques de caméra image par image. Basée sur un modèle diffusion image-to-video préentraîné, elle génère des conditions de pose et de profondeur géométriquement cohérentes via un schedule de débruitage en deux phases. Les évaluations montrent de meilleures performances que les approches pose-seule sur des benchmarks variés, notamment lors de changements de point de vue importants.