OUTILS · Google
Gemma 4 QAT : optimisation de la compression pour mobile et laptop
Google publie des modèles Gemma 4 entraînés avec quantification consciente (QAT) pour améliorer l'efficacité sur appareils edge.
Hacker News (filtré IA)·@theanonymousone·5 juin 2026

Image · Source originale
Google annonce des variantes QAT (Quantization-Aware Training) de ses modèles Gemma 4, conçues pour réduire l'empreinte mémoire et accélérer l'inférence sur mobile et laptop. Cette technique intègre la quantification dès l'entraînement, limitant la dégradation de performance habituellement associée à la compression post-entraînement. Les modèles ciblent les déploiements on-device sans recourir au cloud.