Toutes les news taguées avec ce sujet.
Retour sur la décision controversée d'OpenAI de retenir GPT-2 en 2019, invoquant des risques de désinformation.
CohereLabs publie North Mini Code sur Hugging Face, un modèle compact orienté génération de code, ciblant directement les workflows des développeurs.
NVIDIA frappe fort avec un modèle omnimodal Mixture-of-Transformers, un LLM 550B open-weights et un superchip personnel d'un pétaflop.
Un essai critique explore comment l'IA américaine reproduit un modèle économique basé sur la dépendance et l'extraction, à l'image d'OnlyFans.
Le lancement du prochain modèle d'IA de Meta à destination des développeurs est repoussé à plusieurs reprises, selon le Wall Street Journal.
NVIDIA publie Nemotron Ultra, une architecture open-weights combinant Mixture of Experts, Mamba et Transformer pour des tâches de raisonnement complexes.
NVIDIA publie Nemotron 3.5 Content Safety, un modèle multimodal open-weights conçu pour adapter la modération de contenu aux besoins des entreprises mondiales.
Google publie Gemma 4 12B, un modèle open-weights multimodal qui traite texte, image et vidéo sans encodeur visuel séparé.
H Company publie Holo3.1, un modèle d'agent capable de contrôler un ordinateur en local, avec une latence réduite et des performances accrues.
JetBrains publie Mellum2 en open-weights, un modèle optimisé pour l'intégration dans les chaînes de développement assistées par IA.
JetBrains publie Mellum2, un modèle Mixture-of-Experts 12B spécialisé pour la complétion de code et l'assistance au développement.
Hugging Face lance Ettin, une nouvelle famille de modèles de reranking open-weights conçus pour améliorer les pipelines RAG.
Allen AI publie OlmoEarth v1.1, une nouvelle génération de modèles open-weights dédiés à l'analyse des données satellitaires et d'observation de la Terre.
Alex Rives (BioHub) annonce ESMFold 2, un moteur open-science pour la prédiction et le design de protéines, avec un atlas de 6,8 milliards de séquences.
Mistral AI dévoile Mistral 3, une nouvelle génération de modèle qui renforce la position du laboratoire français sur le marché des LLM.
Mistral AI annonce Mistral Small 4, son dernier modèle de la gamme « small », alliant efficacité et performances compétitives.
Nathan Lambert dresse un état des lieux de l'IA en 2026 : montée des enjeux, absence d'un moment agentic majeur pour les modèles open-weights, et accélération sans pause.
NVIDIA lance Cosmos 3, un modèle omnimodal open-weights conçu pour le raisonnement et l'action dans les environnements physiques.
DeepSeek publie les poids de son nouveau modèle de base V4-Pro sur Hugging Face, poursuivant sa stratégie open-weights.
Des chercheurs publient le premier pipeline entièrement ouvert pour construire des LLM d'aide à la décision clinique, données et entraînement inclus.
Un mois dense pour les modèles ouverts : plusieurs sorties majeures et une évaluation controversée du CAISI sur l'écart open/closed frontier.
La sortie de DeepSeek-V4-Flash avec ses poids ouverts rouvre la piste des vecteurs de steering pour modifier le comportement des LLM sans fine-tuning.
DeepSeek met à disposition une version expérimentale de base de son modèle V3.2, accessible publiquement sur Hugging Face.
DeepSeek met à disposition les poids du modèle de base V3.1, nouvelle itération de sa série phare open-weights.
DeepSeek met à disposition une nouvelle variante de son modèle V3, baptisée V3.2-Speciale, sur la plateforme Hugging Face.
IBM lance une nouvelle version de ses modèles d'embeddings multilingues sous licence Apache 2.0, affichant les meilleures performances retrieval sous 100M de paramètres.
DeepSeek publie DeepSeek-V3.1 sur Hugging Face, une mise à jour de son grand modèle de langage open-weights.
DeepSeek publie DeepSeek-V3.2 sur Hugging Face, une mise à jour de son modèle phare open-weights.
DeepSeek publie son nouveau modèle phare V4-Pro sur Hugging Face, poursuivant sa stratégie open-weights face aux grands labs occidentaux.
DeepSeek publie V4-Flash sur Hugging Face, une nouvelle version allégée de son modèle phare avec poids ouverts.