RECHERCHE
TextSeal : un watermark localisé pour LLM avec protection contre la distillation
TextSeal surpasse SynthID-Text en robustesse de détection et résiste à la dilution, tout en étant « radioactif » contre la distillation non autorisée.
arXiv cs.AI · cs.LG · cs.CL·Tom Sander, Hongyan Chang, Tomáš Souček, Tuan Tran·12 mai 2026

Image · Source originale
TextSeal est un watermark pour LLM fondé sur l'échantillonnage Gumbel-max, enrichi d'une génération à double clé, d'un scoring pondéré par entropie et d'une localisation multi-région. Sans surcoût à l'inférence, il supporte le speculative decoding et la prédiction multi-token. Il surpasse SynthID-Text en force de détection, reste robuste aux documents mixtes humain/IA et transfère son signal à travers la distillation, permettant de détecter toute réutilisation non autorisée.