RECHERCHE
OrbitForge : génération de scènes 3D à partir de texte via synthèse vidéo ancrée sur la reconstruction
OrbitForge convertit une vidéo générée par LLM en scène 3D complète via Gaussian Splatting, sans fine-tuning spécifique à la tâche.
arXiv cs.AI · cs.LG · cs.CL·Chenrui Fan, Paolo Favaro·23 juin 2026

Image · Source originale
OrbitForge est un adapter qui exploite des modèles vidéo text-to-video gelés pour produire des scènes 3D en Gaussian Splatting à orbite fermée. Il génère d'abord une reconstruction préliminaire par Deformable Gaussian Splatting, détecte les points de vue manquants, puis utilise le modèle vidéo pour compléter uniquement ces vues. L'approche ne nécessite ni fine-tuning multiview ni optimisation par score distillation. Sur un audit de 300 prompts dérivés de T3Bench, la couverture médiane atteint 359 degrés.