RECHERCHE · DeepMind

DiffusionGemma : génération de texte 4 fois plus rapide

DeepMind présente DiffusionGemma, une approche de diffusion appliquée aux LLM promettant un gain de vitesse de 4x en génération de texte.

DeepMind·10 juin 2026·+ 2 sources

Article composé de 3 sources

DeepMinddeepmind.google · source primaire
NVIDIA Developer Blogdeveloper.nvidia.com → mention
Hacker News (filtré IA)blog.google → mention

Image · Source originale

Google/DeepMind dévoile DiffusionGemma, une variante de Gemma exploitant la diffusion discrète plutôt que l'auto-régression classique, atteignant une génération de texte jusqu'à 4x plus rapide token-by-token. Optimisé pour les plateformes NVIDIA, il cible les assistants conversationnels, copilots et workflows agentiques. Ce modèle s'inscrit dans un intérêt croissant pour les architectures de diffusion discrète comme alternative aux Transformers autoregressifs.

Chaleur 84

Pertinence 88

Nouveauté 80

OUVRIR LA SOURCE ↗

#diffusion #LLM #gemma #génération-texte #deepmind