3 items

#quantification

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
huggingfaceheat 45
Un LLM en 1 bit tourne directement dans le navigateur
Une démo Hugging Face fait tourner un modèle quantifié en 1 bit dans le navigateur grâce à WebGPU, sans serveur ni backend.
RECHERCHE
heat 35
La « leçon des 4 bits » : stabilité et performance dans l'apprentissage par renforcement en NVFP4
Un article technique explore comment entraîner des modèles en RL avec le format de quantification NVFP4 sans sacrifier la stabilité de l'entraînement.
RECHERCHE
heat 52
OrbitQuant : quantification sans données pour les diffusion transformers image et vidéo
OrbitQuant propose une quantification post-entraînement agnostique aux données pour les DiTs, atteignant l'état de l'art jusqu'en W2A4 sur FLUX.1, Wan 2.1 et CogVideoX.

3 items

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
huggingfaceheat 45
Un LLM en 1 bit tourne directement dans le navigateur
Une démo Hugging Face fait tourner un modèle quantifié en 1 bit dans le navigateur grâce à WebGPU, sans serveur ni backend.
RECHERCHE
heat 35
La « leçon des 4 bits » : stabilité et performance dans l'apprentissage par renforcement en NVFP4
Un article technique explore comment entraîner des modèles en RL avec le format de quantification NVFP4 sans sacrifier la stabilité de l'entraînement.
RECHERCHE
heat 52
OrbitQuant : quantification sans données pour les diffusion transformers image et vidéo
OrbitQuant propose une quantification post-entraînement agnostique aux données pour les DiTs, atteignant l'état de l'art jusqu'en W2A4 sur FLUX.1, Wan 2.1 et CogVideoX.