RECHERCHE
OpAI-Bench : un benchmark pour détecter le texte IA à granularité multiple lors de co-édition humain-IA
Un nouveau benchmark évalue la détection de texte IA à travers des révisions progressives humain-IA, révélant des patterns de détection non-monotones.
arXiv cs.AI · cs.LG · cs.CL·Sondos Mahmoud Bsharat, Jiacheng Liu, Xiaohan Zhao, Tianjun Yao·4 juin 2026

Image · Source originale
OpAI-Bench propose un benchmark guidé par opérations pour étudier la transformation progressive de textes humains vers du contenu IA, à quatre niveaux de granularité (document, phrase, token, span). Partant de textes humains, le benchmark génère neuf versions révisées selon cinq opérations d'édition IA et quatre domaines. Les expériences montrent que les versions à co-authorship mixte sont souvent plus difficiles à détecter que les textes purement humains ou massivement IA, exposant des limitations des détecteurs existants.