Toutes les news taguées avec ce sujet.
NVIDIA présente NemoClaw et les capacités multi-nœuds du DGX Spark pour faire tourner des agents autonomes en local, sans dépendance au cloud.
Les GPU Blackwell de NVIDIA décrochent un record de référence STAC-AI pour l'inférence de grands modèles de langage appliquée aux marchés financiers.
NVIDIA présente DynoSim, un outil de simulation permettant d'explorer les compromis de configuration dans les déploiements LLM à grande échelle.
Modal détaille comment combiner plusieurs techniques système pour réduire drastiquement la latence au démarrage des inférences GPU en environnement serverless.
Après un premier S-1 retiré et un partenariat stratégique avec OpenAI, Cerebras entre en bourse avec une capitalisation de 60 milliards de dollars.
Une nouvelle stratégie de recherche fine des facteurs d'échelle BFP réduit l'erreur de quantification de 27 % sur NVFP4 et améliore les LLM en post-training.
La dépréciation des APIs de fine-tuning d'OpenAI ravive une question centrale : le fine-tuning est-il en train de disparaître du toolkit des ingénieurs IA ?
NVIDIA détaille dans Dynamo la gestion des échanges agentiques multi-tours, avec streaming de tokens, appels d'outils et rejeu sélectif du raisonnement.