SAFETY
Les VLMs suppriment les représentations féminines face à des entrées ambiguës
Une étude révèle que les modèles vision-langage encodent en interne des associations féminines mais les effacent avant la génération, au profit du genre masculin.
arXiv cs.AI · cs.LG · cs.CL·Arnau Marin-Llobet, Simon Henniger, Mahzarin R. Banaji·29 mai 2026

Image · Source originale
Des chercheurs montrent que les VLMs alignés, bien que capables d'éviter les biais de genre sur des images claires, échouent face à des visuels ambigus (silhouettes, tenues couvrantes). Introduisant le score LALS, une métrique zero-shot analysant les activations internes, ils démontrent que les modèles encodent souvent une association féminine en couches intermédiaires, mais la suppriment avant la génération. Un filtre asymétrique amplifie le signal masculin de bout en bout, tandis que le féminin est atténué, un biais encore renforcé par des indices visuels culturels comme la couleur des vêtements.