OUTILS

DeepSeek-V4 dès le jour 0 : inférence rapide et RL vérifié avec SGLang et Miles

LMSYS détaille l'intégration immédiate de DeepSeek-V4 dans SGLang, avec support du reinforcement learning vérifié dès la sortie du modèle.

Hacker News (filtré IA)·@mji·25 avril 2026

Le blog LMSYS présente le déploiement de DeepSeek-V4 le jour même de sa sortie, en s'appuyant sur le framework SGLang pour une inférence optimisée et le système Miles pour le reinforcement learning avec vérification. L'article décrit les choix d'architecture d'inférence et les performances obtenues. Cette intégration illustre la rapidité croissante de l'écosystème open-weights à supporter les nouveaux modèles frontier.

Chaleur 0

Pertinence 85

Nouveauté 68

OUVRIR LA SOURCE ↗

#DeepSeek #SGLang #inférence #reinforcement-learning #open-weights