OPINION
Estimation des coûts d'inférence à grande échelle par le calcul sur coin de table
Une analyse chiffrée des coûts réels de l'inférence LLM à l'échelle, réalisée avec des calculs d'ordre de grandeur simples.
Hacker News (filtré IA)·@gmays·16 juin 2026

Image · Générée · Gemini Nano Banana Pro
L'article propose une estimation par ordre de grandeur (« napkin math ») des coûts d'inférence des grands modèles de langage déployés à l'échelle. L'auteur détaille les composantes clés — GPU, mémoire, débit de tokens — pour donner une vision concrète de ce que représente économiquement l'inférence en production. Une ressource utile pour quiconque cherche à évaluer la viabilité financière d'un déploiement LLM.