RECHERCHE
Transformers augmentés pour la détection robuste de textes IA cross-domaines
Une approche par fusion de features linguistiques améliore la généralisation des détecteurs de textes générés par IA face aux décalages de distribution.
arXiv cs.AI · cs.LG · cs.CL·Mohamed Mady, Johannes Reschke, Björn Schuller·5 mai 2026

Image · Source originale
Des chercheurs entraînent des détecteurs basés sur des transformers (dont DeBERTa-v3) sur le corpus HC3 PLUS et les évaluent selon un protocole à seuil fixe sur plusieurs benchmarks cross-domaines. Si les modèles atteignent jusqu'à 99,5 % de précision en contexte in-domain, leurs performances se dégradent fortement sous distribution shift. L'augmentation par fusion de features linguistiques (lisibilité, vocabulaire) via attention améliore le transfert, le meilleur modèle atteignant 85,9 % sur M4, surpassant les baselines zero-shot de +7,22 points.