Toutes les news taguées avec ce sujet.
Des chercheurs montrent que les évaluations corrélatives standard des LLM sont biaisées et proposent une approche causale rigoureuse.
Dwarkesh Patel décortique pourquoi les runs de pré-entraînement échouent, entre causalité brisée et biais introduits dans les architectures MoE.
Une nouvelle approche fusionne explications conceptuelles et formelles pour identifier les concepts de haut niveau causalement déterminants dans les prédictions des réseaux de neurones.