OUTILS · NVIDIA
Exécuter DiffusionGemma sur NVIDIA pour une génération de texte à haut débit
Google DeepMind et NVIDIA s'associent autour de DiffusionGemma, un modèle de génération de texte par diffusion qui contourne les limites du décodage token par token.
NVIDIA Developer Blog·Anu Srivastava·10 juin 2026

Image · Source originale
DiffusionGemma, développé par Google DeepMind et optimisé pour les plateformes NVIDIA, adopte une approche par diffusion pour la génération de texte, contournant la lenteur inhérente au décodage autorégressif token par token. Cette architecture vise à réduire les coûts de serving et à améliorer la réactivité pour des usages temps réel comme les chatbots, copilots et workflows agentiques. NVIDIA propose une intégration prête pour les développeurs sur ses GPU.