Toutes les news taguées avec ce sujet.
Une étude benchmark révèle que les LLM s'effondrent sur les problèmes probabilistes contre-intuitifs, avec des chutes de performance allant jusqu'à 34 %.
Des chercheurs identifient une feature interne dans Gemma 3 qui, amplifiée ou supprimée, modifie significativement la pondération de Bitcoin dans un portefeuille généré par LLM.
Des chercheurs identifient un biais systématique dans les modèles multimodaux jouant le rôle de juges : ils privilégient le texte sur la perception visuelle.
Une étude révèle que les modèles vision-langage encodent en interne des associations féminines mais les effacent avant la génération, au profit du genre masculin.
Les corpus d'entraînement saturés de discours sur l'alignement IA pourraient conditionner les modèles à reproduire les biais normatifs qu'ils sont censés corriger.
Des chercheurs montrent que les LLMs introduisent des biais directionnels dans les textes humains et peuvent déplacer l'opinion collective via les réseaux sociaux.
Une méthode d'inférence sans fine-tuning qui réduit les biais de précision et d'ambiguïté dans la localisation d'éléments d'interface pour agents GUI.