Toutes les news taguées avec ce sujet.
Une nouvelle approche permet d'exploiter les modèles de diffusion sur une seule image, sans phase d'entraînement préalable.
Un framework d'agent LLM sans fine-tuning prédit la prochaine localisation en combinant chemin rapide et collecte itérative de preuves géographiques.
Une méthode training-free qui exploite les points de bascule intrinsèques des DiTs pour générer des vidéos longues à plusieurs événements distincts.