RECHERCHE
Nemotron 3 Ultra : MoE hybride Mamba-Transformer pour le raisonnement agentique
NVIDIA publie Nemotron Ultra, une architecture open-weights combinant Mixture of Experts, Mamba et Transformer pour des tâches de raisonnement complexes.
Hacker News (filtré IA)·@victormustar·4 juin 2026

Image · Générée · Gemini Nano Banana Pro
NVIDIA Research présente Nemotron Ultra, un modèle open-weights reposant sur une architecture hybride MoE associant des couches Mamba et Transformer. Le modèle est conçu pour le raisonnement agentique à long horizon. Le rapport technique détaille les choix architecturaux, les données d'entraînement et les performances sur plusieurs benchmarks de raisonnement et de codage.