RECHERCHE

Quand les LLM lisent les tableaux à la légère : mesurer et réduire les erreurs de référencement de données

Une première évaluation systématique des erreurs de citation de valeurs tabulaires dans les LLM, avec une méthode critic légère qui améliore la précision jusqu'à 12 %.

arXiv cs.AI · cs.LG · cs.CL·Yuqing Yang, Qi Zhu, Zhen Han, Boran Han·30 juin 2026

Image · Source originale

Les LLM commettent des erreurs de référencement de données (DREs) — citations incorrectes ou omissions de valeurs tabulaires — même lorsqu'ils comprennent la structure du tableau. Cette étude présente la première évaluation systématique de ces erreurs sur des modèles de 1,7 B à 20 B paramètres. Les auteurs montrent qu'intégrer un modèle critic dédié améliore la précision des réponses jusqu'à 12 %, et qu'un critic léger de 4 B paramètres atteint un F1 moyen de 78,2 % en détection des DREs.

Chaleur 26

Pertinence 65

Nouveauté 62

OUVRIR LA SOURCE ↗

#LLM #tableaux #raisonnement #critic #benchmark