RECHERCHE

L'auto-évaluation est déjà présente : activer la calibration latente des LLMs de base avec peu de données

Des chercheurs montrent qu'un LLM de base peut prédire les scores d'un juge externe avec très peu d'exemples, sans entraînement ciblé.

arXiv cs.AI · cs.LG · cs.CL·XiuYu Zhang, Yi Shan, Junfeng Fang, Zhenkai Liang·3 juin 2026

Image · Source originale

L'étude introduit SEE (Self-Evaluation Elicitation), une méthode qui révèle la capacité latente d'un modèle de base à prédire les scores multi-attributs d'un juge externe. À partir de seulement 160 exemples — 31 fois moins qu'une baseline RL — SEE améliore la calibration sur trois benchmarks sans dégrader la qualité des réponses. Les auto-évaluations obtenues restent stables face à des juges jamais vus à l'entraînement, suggérant une notion transférable de qualité.

Chaleur 2

Pertinence 72

Nouveauté 68

OUVRIR LA SOURCE ↗

#LLM #auto-évaluation #calibration #reinforcement-learning #alignement