Toutes les news taguées avec ce sujet.
Le nouveau modèle de DeepSeek afficherait de meilleures performances que GPT-5.5 Pro sur les métriques de précision, selon une comparaison publiée sur RuntimeWire.
DeepSeek publie les poids de son nouveau modèle de base V4-Pro sur Hugging Face, poursuivant sa stratégie open-weights.
Un mois dense pour les modèles ouverts : plusieurs sorties majeures et une évaluation controversée du CAISI sur l'écart open/closed frontier.
La sortie de DeepSeek-V4-Flash avec ses poids ouverts rouvre la piste des vecteurs de steering pour modifier le comportement des LLM sans fine-tuning.
DeepSeek met à disposition une version expérimentale de base de son modèle V3.2, accessible publiquement sur Hugging Face.
DeepSeek met à disposition les poids du modèle de base V3.1, nouvelle itération de sa série phare open-weights.
DeepSeek met à disposition une nouvelle variante de son modèle V3, baptisée V3.2-Speciale, sur la plateforme Hugging Face.
DeepSeek publie DeepSeek-V3.1 sur Hugging Face, une mise à jour de son grand modèle de langage open-weights.
DeepSeek publie DeepSeek-V3.2 sur Hugging Face, une mise à jour de son modèle phare open-weights.
DeepSeek publie son nouveau modèle phare V4-Pro sur Hugging Face, poursuivant sa stratégie open-weights face aux grands labs occidentaux.
DeepSeek publie V4-Flash sur Hugging Face, une nouvelle version allégée de son modèle phare avec poids ouverts.
DeepSeek publie la collection DeepSeek-V4 sur Hugging Face, marquant une nouvelle étape dans le développement de ses modèles de langage open-weights.
DeepSeek met en ligne DeepSeek-V3.2-Exp sur Hugging Face, une version expérimentale de son modèle phare V3.
Un développeur publie un moteur d'inférence léger pour faire tourner DeepSeek 4 Flash localement via Metal, le framework GPU d'Apple.