RECHERCHE
Quand les LLM lisent les tableaux à la légère : mesurer et réduire les erreurs de référencement de données
Une première évaluation systématique des erreurs de citation de valeurs tabulaires dans les LLM, avec une méthode critic légère qui améliore la précision jusqu'à 12 %.
arXiv cs.AI · cs.LG · cs.CL·Yuqing Yang, Qi Zhu, Zhen Han, Boran Han·30 juin 2026

Image · Source originale
Les LLM commettent des erreurs de référencement de données (DREs) — citations incorrectes ou omissions de valeurs tabulaires — même lorsqu'ils comprennent la structure du tableau. Cette étude présente la première évaluation systématique de ces erreurs sur des modèles de 1,7 B à 20 B paramètres. Les auteurs montrent qu'intégrer un modèle critic dédié améliore la précision des réponses jusqu'à 12 %, et qu'un critic léger de 4 B paramètres atteint un F1 moyen de 78,2 % en détection des DREs.