RECHERCHE · DeepMind
DiffusionGemma : génération de texte 4 fois plus rapide
DeepMind présente DiffusionGemma, une approche de diffusion appliquée aux LLM promettant un gain de vitesse de 4x en génération de texte.
Article composé de 3 sources

Image · Source originale
Google/DeepMind dévoile DiffusionGemma, une variante de Gemma exploitant la diffusion discrète plutôt que l'auto-régression classique, atteignant une génération de texte jusqu'à 4x plus rapide token-by-token. Optimisé pour les plateformes NVIDIA, il cible les assistants conversationnels, copilots et workflows agentiques. Ce modèle s'inscrit dans un intérêt croissant pour les architectures de diffusion discrète comme alternative aux Transformers autoregressifs.