Toutes les news taguées avec ce sujet.
DeepMind présente DiffusionGemma, une approche de diffusion appliquée aux LLM promettant un gain de vitesse de 4x en génération de texte.
Des chercheurs proposent une carte de flux stochastique généralisant la distillation des modèles génératifs au-delà des ODE, avec accès différentiable aux échantillons postérieurs.
PTL-Diffusion remplace la distribution gaussienne statique des modèles de diffusion classiques par une famille périodique de lois terminales pour mieux capturer la structure géométrique des données.
Un nouveau cadre génératif basé sur la dérive (drifting) accélère de deux ordres de grandeur la simulation CFD surrogate sans perte de précision.
Un framework ML basé sur le Jacobien permet de retrouver les réseaux d'influence cachés derrière des cascades, sans supposer de modèle de diffusion.
Une nouvelle approche permet d'exploiter les modèles de diffusion sur une seule image, sans phase d'entraînement préalable.
Une approche sans entraînement pour éditer des scènes 3D avec des changements géométriques majeurs, en maintenant la cohérence entre plusieurs points de vue.
DrPO propose une méthode d'alignement par préférence pour les générateurs text-to-image déterministes en un seul forward pass, sans rétropropagation de la reward.
Un algorithme d'inférence sans gradient basé sur la mesure de Girsanov surpasse les approches classiques de guidage pour les modèles diffusion.
Un décodeur VAE conditionné par une image de référence corrige l'asymétrie architecturale des modèles de diffusion latents pour la génération vidéo.
Un framework neuronal unifié pour résoudre des équations aux dérivées partielles avec seulement 3 % de données observées, via diffusion latente et apprentissage contrastif.
Un nouveau framework de reinforcement learning appliqué à la diffusion résout les déséquilibres entre modalités pour améliorer la génération audio-vidéo synchronisée.
Une nouvelle architecture de diffusion linguistique reste en espace continu jusqu'à la dernière étape, surpassant les modèles discrets existants.
Des chercheurs proposent plusieurs techniques pour rendre les LMs byte-level jusqu'à deux fois plus rapides, sans sacrifier la qualité de génération.
Une nouvelle architecture combine normalizing flows et diffusion pour générer des images en seulement 4 étapes tout en conservant une vraisemblance exacte.
Une méthode sans entraînement qui synchronise trajectoire de caméra et motion d'acteur dans la génération vidéo diffusion.
Une nouvelle approche théorique explore comment calculer directement l'intégrale des trajectoires d'un modèle de diffusion pour améliorer l'échantillonnage.