OPINION

Le trou noir de l'efficacité d'échantillonnage

Dwarkesh Patel questionne les vrais progrès de l'IA : les modèles s'améliorent-ils vraiment, ou empilent-ils simplement plus de données ?

Dwarkesh Patel·Dwarkesh Patel·8 juin 2026

Image · Source originale

L'intelligence peut se définir par l'efficacité d'échantillonnage — la quantité de données nécessaires pour maîtriser un domaine. Selon Patel, les progrès récents des LLM reposent davantage sur l'élargissement des distributions de données et l'augmentation du compute que sur une véritable amélioration de cette efficacité. Le RL est analysé comme une forme de génération de données synthétiques : on dépense du compute contre un vérificateur pour isoler les bons exemples, ce qui requiert toujours des volumes massifs de trajectoires humaines expertes très spécialisées.

Chaleur 18

Pertinence 72

Nouveauté 45

OUVRIR LA SOURCE ↗

#sample-efficiency #scaling #RL #données-synthétiques #LLM