RECHERCHE

Quand la certitude est un artefact : biais des lexiques par mots-clés dans la mesure rhétorique

Une étude montre que des corrélations statistiquement significatives en sciences sociales computationnelles peuvent être de purs artefacts de l'outil de mesure.

arXiv cs.AI · cs.LG · cs.CL·Bo Chen·24 juin 2026

Image · Source originale

En analysant 85 interviews de quatre intellectuels publics (2016-2026), l'étude révèle que le scoring par mots-clés génère de fausses corrélations entre affect négatif et certitude emphatique (r = 0,72-0,93). Le remplacement par une classification sémantique zero-shot via LLM réduit drastiquement ces corrélations. L'analyse d'erreurs identifie trois défaillances structurelles des lexiques : aveuglement syntaxique, polysémie et absence catégorielle.

Chaleur 24

Pertinence 62

Nouveauté 58

OUVRIR LA SOURCE ↗

#NLP #sciences-sociales-computationnelles #LLM #mesure #biais