5 items

#entraînement

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
h-companyheat 25
H Company traque les fuites de mémoire GPU dans l'entraînement de modèles IA
Un billet technique détaille la chasse aux « fantômes VRAM », ces fuites de mémoire GPU qui plombent l'entraînement des modèles.
OUTILS
h-companyheat 25
VRAM Ghost Busting : traquer les fuites de mémoire GPU
H Company détaille des techniques pour diagnostiquer et corriger les fuites de VRAM lors de l'entraînement de modèles d'IA.
RECHERCHE
nvidiaheat 48
Réduire les goulots d'étranglement HBM dans l'entraînement LLM sous JAX avec le host offloading
NVIDIA détaille comment le host offloading permet de dépasser les limites de mémoire HBM des GPU lors de l'entraînement de LLM avec JAX.
RECHERCHE
nvidiaheat 52
Améliorer le goodput dans l'entraînement LLM à grande échelle avec le parallélisme tensoriel non uniforme
NVIDIA présente une approche de parallélisme tensoriel non uniforme pour maintenir l'efficacité des entraînements LLM malgré les interruptions matérielles.
OUTILS
heat 45
La boucle d'entraînement PyTorch annotée
Un guide technique détaillé et commenté pour maîtriser la boucle d'entraînement PyTorch, de l'initialisation à l'optimisation.

5 items

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
h-companyheat 25
H Company traque les fuites de mémoire GPU dans l'entraînement de modèles IA
Un billet technique détaille la chasse aux « fantômes VRAM », ces fuites de mémoire GPU qui plombent l'entraînement des modèles.
OUTILS
h-companyheat 25
VRAM Ghost Busting : traquer les fuites de mémoire GPU
H Company détaille des techniques pour diagnostiquer et corriger les fuites de VRAM lors de l'entraînement de modèles d'IA.
RECHERCHE
nvidiaheat 48
Réduire les goulots d'étranglement HBM dans l'entraînement LLM sous JAX avec le host offloading
NVIDIA détaille comment le host offloading permet de dépasser les limites de mémoire HBM des GPU lors de l'entraînement de LLM avec JAX.
RECHERCHE
nvidiaheat 52
Améliorer le goodput dans l'entraînement LLM à grande échelle avec le parallélisme tensoriel non uniforme
NVIDIA présente une approche de parallélisme tensoriel non uniforme pour maintenir l'efficacité des entraînements LLM malgré les interruptions matérielles.
OUTILS
heat 45
La boucle d'entraînement PyTorch annotée
Un guide technique détaillé et commenté pour maîtriser la boucle d'entraînement PyTorch, de l'initialisation à l'optimisation.