RECHERCHE
Quantifier l'expression fidèle de la confiance dans les grands modèles de raisonnement
Une étude révèle que les LRMs peinent à aligner leur confiance interne et leur expression linguistique, malgré des chaînes de raisonnement étendues.
arXiv cs.AI · cs.LG · cs.CL·Areeb Gani, Asal Meskin, Gabrielle Kaili-May Liu, Arman Cohan·2 juin 2026

Image · Source originale
Des chercheurs proposent un cadre pour mesurer la calibration fidèle (FC) des grands modèles de raisonnement (LRMs), soit l'alignement entre leur confiance intrinsèque et celle exprimée linguistiquement. Le framework analyse la décisivité linguistique via les probabilités de tokens, les états cachés et la cohérence des réponses échantillonnées. Résultat : les comportements de raisonnement ne se traduisent pas automatiquement par une meilleure FC, soulevant des questions sur la fiabilité perçue des LRMs.