18 items

#GPU

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
nvidiaheat 40
Fusion de kernels dans NVIDIA CUDA : optimiser la bande passante mémoire et les surcoûts de lancement
NVIDIA explique comment la fusion de kernels CUDA permet de réduire les goulots d'étranglement mémoire et les latences de lancement sur GPU.
OUTILS
heat 42
Concevoir une couche d'abstraction GPU sans liaison (bindless)
Un développeur détaille la conception d'une couche d'abstraction GPU bindless, une approche moderne qui simplifie la gestion des ressources graphiques.
OUTILS
heat 62
Rétro-ingénierie de CUDA-checkpoint Nvidia pour accélérer les démarrages à froid
Un développeur décortique le mécanisme CUDA-checkpoint de Nvidia pour réduire drastiquement les temps de démarrage des processus GPU.
RECHERCHE
nvidiaheat 38
Guide pratique de la communication GPU pour la dynamique moléculaire à grande échelle
NVIDIA détaille comment optimiser les communications initiées par GPU pour accélérer les simulations de dynamique moléculaire sur des infrastructures HPC massives.
SIGNAL
heat 55
Un GPU fait maison : le projet qui a rapidement pris de l'ampleur
Un créateur documente la construction d'un GPU artisanal, un projet DIY qui a évolué bien au-delà de ses ambitions initiales.
OUTILS
heat 52
Enigma M4 Breaker : casser le chiffrement Enigma par GPU
Un projet open-source exploite la puissance des GPU pour déchiffrer les messages codés par la machine Enigma M4 de la Seconde Guerre mondiale.
MARCHE
heat 78
Nvidia propose à des startups d'échanger de la puissance de calcul contre une part de revenus
Le géant des puces GPU explore un modèle inédit : offrir des ressources de calcul à des startups en échange d'une participation à leurs revenus futurs.
RECHERCHE
heat 38
Bornes d'erreur de linéarisation GPU-parallèles pour le contrôle optimal robuste en temps réel de dynamiques non linéaires et neuronales
Une méthode GPU-parallèle calcule des garanties formelles de contrôle robuste jusqu'à 67 Hz pour des systèmes non linéaires et des dynamiques réseaux de neurones.
OUTILS
nvidiaheat 42
Concevoir des moteurs de requêtes accélérés par GPU avec NVIDIA GQE
NVIDIA détaille comment ses avancées matérielles — HBM, NVLink-C2C et décompression dédiée — lèvent les goulots d'étranglement mémoire et I/O des moteurs de requêtes GPU.
OUTILS
heat 72
ZLUDA 6 : exécuter des applications CUDA sans modification sur des GPU non-Nvidia
Le projet ZLUDA franchit une nouvelle étape avec sa version 6, permettant de faire tourner des workloads CUDA natifs sur du matériel AMD ou Intel.
OPINION
heat 62
Moondream : faut-il croire à la bulle GPU ?
L'équipe Moondream remet en question l'hypothèse d'une pénurie durable de GPU et analyse les dynamiques réelles du marché des puces IA.
OPINION
heat 52
Que se passe-t-il lorsqu'on exécute un kernel CUDA ?
Un tour d'horizon technique et pédagogique du cycle de vie complet d'un kernel CUDA, du code hôte jusqu'à l'exécution sur GPU.
OUTILS
heat 72
Un moteur Rust exécute des requêtes spatiales sur les RT cores GPU gaming, surpassant un H100
SedonaDB 0.4 exploite les RT cores des GPU grand public pour accélérer les jointures spatiales, battant un H100 sur certains benchmarks.
OUTILS
nvidiaheat 35
NVIDIA simplifie le resource binding avec le support complet des Vulkan Descriptor Heaps
NVIDIA détaille son support bout-en-bout des descriptor heaps Vulkan pour optimiser la liaison des ressources GPU dans les shaders.
OUTILS
h-companyheat 52
Chasse aux fantômes VRAM : optimisation de la mémoire GPU
H Company publie une analyse technique sur les fuites et gaspillages cachés de VRAM qui plombent les performances des modèles en production.
RECHERCHE
nvidiaheat 45
Accélération du BEV Pooling sur GPU NVIDIA pour l'IA physique
NVIDIA détaille comment optimiser le BEV pooling sur ses GPU pour les véhicules autonomes et la robotique spatiale.
OUTILS
heat 62
AMD étend FSR 4.1 aux cartes graphiques plus anciennes
AMD déploie FidelityFX Super Resolution 4.1 pour les GPU RX 7000 (RDNA 3), élargissant l'accès à son upscaling ML au-delà des seules RX 9000.
OUTILS
nvidiaheat 42
CCCL Runtime : un runtime C++ moderne pour CUDA
NVIDIA introduit un nouveau groupe de fonctionnalités dans ses CUDA Core Compute Libraries pour moderniser le développement C++ sur GPU.

18 items

#GPU

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
nvidiaheat 40
Fusion de kernels dans NVIDIA CUDA : optimiser la bande passante mémoire et les surcoûts de lancement
NVIDIA explique comment la fusion de kernels CUDA permet de réduire les goulots d'étranglement mémoire et les latences de lancement sur GPU.
OUTILS
heat 42
Concevoir une couche d'abstraction GPU sans liaison (bindless)
Un développeur détaille la conception d'une couche d'abstraction GPU bindless, une approche moderne qui simplifie la gestion des ressources graphiques.
OUTILS
heat 62
Rétro-ingénierie de CUDA-checkpoint Nvidia pour accélérer les démarrages à froid
Un développeur décortique le mécanisme CUDA-checkpoint de Nvidia pour réduire drastiquement les temps de démarrage des processus GPU.
RECHERCHE
nvidiaheat 38
Guide pratique de la communication GPU pour la dynamique moléculaire à grande échelle
NVIDIA détaille comment optimiser les communications initiées par GPU pour accélérer les simulations de dynamique moléculaire sur des infrastructures HPC massives.
SIGNAL
heat 55
Un GPU fait maison : le projet qui a rapidement pris de l'ampleur
Un créateur documente la construction d'un GPU artisanal, un projet DIY qui a évolué bien au-delà de ses ambitions initiales.
OUTILS
heat 52
Enigma M4 Breaker : casser le chiffrement Enigma par GPU
Un projet open-source exploite la puissance des GPU pour déchiffrer les messages codés par la machine Enigma M4 de la Seconde Guerre mondiale.
MARCHE
heat 78
Nvidia propose à des startups d'échanger de la puissance de calcul contre une part de revenus
Le géant des puces GPU explore un modèle inédit : offrir des ressources de calcul à des startups en échange d'une participation à leurs revenus futurs.
RECHERCHE
heat 38
Bornes d'erreur de linéarisation GPU-parallèles pour le contrôle optimal robuste en temps réel de dynamiques non linéaires et neuronales
Une méthode GPU-parallèle calcule des garanties formelles de contrôle robuste jusqu'à 67 Hz pour des systèmes non linéaires et des dynamiques réseaux de neurones.
OUTILS
nvidiaheat 42
Concevoir des moteurs de requêtes accélérés par GPU avec NVIDIA GQE
NVIDIA détaille comment ses avancées matérielles — HBM, NVLink-C2C et décompression dédiée — lèvent les goulots d'étranglement mémoire et I/O des moteurs de requêtes GPU.
OUTILS
heat 72
ZLUDA 6 : exécuter des applications CUDA sans modification sur des GPU non-Nvidia
Le projet ZLUDA franchit une nouvelle étape avec sa version 6, permettant de faire tourner des workloads CUDA natifs sur du matériel AMD ou Intel.
OPINION
heat 62
Moondream : faut-il croire à la bulle GPU ?
L'équipe Moondream remet en question l'hypothèse d'une pénurie durable de GPU et analyse les dynamiques réelles du marché des puces IA.
OPINION
heat 52
Que se passe-t-il lorsqu'on exécute un kernel CUDA ?
Un tour d'horizon technique et pédagogique du cycle de vie complet d'un kernel CUDA, du code hôte jusqu'à l'exécution sur GPU.
OUTILS
heat 72
Un moteur Rust exécute des requêtes spatiales sur les RT cores GPU gaming, surpassant un H100
SedonaDB 0.4 exploite les RT cores des GPU grand public pour accélérer les jointures spatiales, battant un H100 sur certains benchmarks.
OUTILS
nvidiaheat 35
NVIDIA simplifie le resource binding avec le support complet des Vulkan Descriptor Heaps
NVIDIA détaille son support bout-en-bout des descriptor heaps Vulkan pour optimiser la liaison des ressources GPU dans les shaders.
OUTILS
h-companyheat 52
Chasse aux fantômes VRAM : optimisation de la mémoire GPU
H Company publie une analyse technique sur les fuites et gaspillages cachés de VRAM qui plombent les performances des modèles en production.
RECHERCHE
nvidiaheat 45
Accélération du BEV Pooling sur GPU NVIDIA pour l'IA physique
NVIDIA détaille comment optimiser le BEV pooling sur ses GPU pour les véhicules autonomes et la robotique spatiale.
OUTILS
heat 62
AMD étend FSR 4.1 aux cartes graphiques plus anciennes
AMD déploie FidelityFX Super Resolution 4.1 pour les GPU RX 7000 (RDNA 3), élargissant l'accès à son upscaling ML au-delà des seules RX 9000.
OUTILS
nvidiaheat 42
CCCL Runtime : un runtime C++ moderne pour CUDA
NVIDIA introduit un nouveau groupe de fonctionnalités dans ses CUDA Core Compute Libraries pour moderniser le développement C++ sur GPU.

Fusion de kernels dans NVIDIA CUDA : optimiser la bande passante mémoire et les surcoûts de lancement

Concevoir une couche d'abstraction GPU sans liaison (bindless)

Rétro-ingénierie de CUDA-checkpoint Nvidia pour accélérer les démarrages à froid

Guide pratique de la communication GPU pour la dynamique moléculaire à grande échelle

Un GPU fait maison : le projet qui a rapidement pris de l'ampleur

Enigma M4 Breaker : casser le chiffrement Enigma par GPU

Nvidia propose à des startups d'échanger de la puissance de calcul contre une part de revenus

Bornes d'erreur de linéarisation GPU-parallèles pour le contrôle optimal robuste en temps réel de dynamiques non linéaires et neuronales

Concevoir des moteurs de requêtes accélérés par GPU avec NVIDIA GQE

ZLUDA 6 : exécuter des applications CUDA sans modification sur des GPU non-Nvidia

Moondream : faut-il croire à la bulle GPU ?

Que se passe-t-il lorsqu'on exécute un kernel CUDA ?

Un moteur Rust exécute des requêtes spatiales sur les RT cores GPU gaming, surpassant un H100

NVIDIA simplifie le resource binding avec le support complet des Vulkan Descriptor Heaps

Chasse aux fantômes VRAM : optimisation de la mémoire GPU

Accélération du BEV Pooling sur GPU NVIDIA pour l'IA physique

AMD étend FSR 4.1 aux cartes graphiques plus anciennes

CCCL Runtime : un runtime C++ moderne pour CUDA

Fusion de kernels dans NVIDIA CUDA : optimiser la bande passante mémoire et les surcoûts de lancement

Concevoir une couche d'abstraction GPU sans liaison (bindless)

Rétro-ingénierie de CUDA-checkpoint Nvidia pour accélérer les démarrages à froid

Guide pratique de la communication GPU pour la dynamique moléculaire à grande échelle

Un GPU fait maison : le projet qui a rapidement pris de l'ampleur

Enigma M4 Breaker : casser le chiffrement Enigma par GPU

Nvidia propose à des startups d'échanger de la puissance de calcul contre une part de revenus

Bornes d'erreur de linéarisation GPU-parallèles pour le contrôle optimal robuste en temps réel de dynamiques non linéaires et neuronales

Concevoir des moteurs de requêtes accélérés par GPU avec NVIDIA GQE

ZLUDA 6 : exécuter des applications CUDA sans modification sur des GPU non-Nvidia

Moondream : faut-il croire à la bulle GPU ?

Que se passe-t-il lorsqu'on exécute un kernel CUDA ?

Un moteur Rust exécute des requêtes spatiales sur les RT cores GPU gaming, surpassant un H100

NVIDIA simplifie le resource binding avec le support complet des Vulkan Descriptor Heaps

Chasse aux fantômes VRAM : optimisation de la mémoire GPU

Accélération du BEV Pooling sur GPU NVIDIA pour l'IA physique

AMD étend FSR 4.1 aux cartes graphiques plus anciennes

CCCL Runtime : un runtime C++ moderne pour CUDA