Toutes les news taguées avec ce sujet.
DeepMind présente DiffusionGemma, une approche de diffusion appliquée aux LLM promettant un gain de vitesse de 4x en génération de texte.
Une nouvelle architecture de diffusion linguistique reste en espace continu jusqu'à la dernière étape, surpassant les modèles discrets existants.