RECHERCHE
Quand la certitude est un artefact : biais des lexiques par mots-clés dans la mesure rhétorique
Une étude montre que des corrélations statistiquement significatives en sciences sociales computationnelles peuvent être de purs artefacts de l'outil de mesure.
arXiv cs.AI · cs.LG · cs.CL·Bo Chen·24 juin 2026

Image · Source originale
En analysant 85 interviews de quatre intellectuels publics (2016-2026), l'étude révèle que le scoring par mots-clés génère de fausses corrélations entre affect négatif et certitude emphatique (r = 0,72-0,93). Le remplacement par une classification sémantique zero-shot via LLM réduit drastiquement ces corrélations. L'analyse d'erreurs identifie trois défaillances structurelles des lexiques : aveuglement syntaxique, polysémie et absence catégorielle.