RECHERCHE
Les LLM apprennent la sémantique constructionnelle, pas seulement la syntaxe
Une étude analyse comment les LLM open-source comprennent des constructions rares comme « let alone » et révèle des dynamiques d'apprentissage inattendues.
arXiv cs.AI · cs.LG · cs.CL·Wesley Scivetti, Ethan Wilcox, Nathan Schneider, Kanishka Misra·29 mai 2026

Image · Source originale
Des chercheurs ont construit un dataset original pour évaluer la compréhension de constructions appariées rares en anglais (ex. « let alone », « much less ») par divers LLM. Résultat : des modèles de taille modeste sont sensibles à leurs formes et significations, tandis que les modèles entraînés sur des données à échelle humaine échouent sur les tâches sémantiques. L'analyse des checkpoints révèle que la compréhension sémantique émerge après la connaissance syntaxique et corrèle avec les gains en connaissance du monde.