RECHERCHE

Les LLM apprennent la sémantique constructionnelle, pas seulement la syntaxe

Une étude analyse comment les LLM open-source comprennent des constructions rares comme « let alone » et révèle des dynamiques d'apprentissage inattendues.

arXiv cs.AI · cs.LG · cs.CL·Wesley Scivetti, Ethan Wilcox, Nathan Schneider, Kanishka Misra·29 mai 2026

Image · Source originale

Des chercheurs ont construit un dataset original pour évaluer la compréhension de constructions appariées rares en anglais (ex. « let alone », « much less ») par divers LLM. Résultat : des modèles de taille modeste sont sensibles à leurs formes et significations, tandis que les modèles entraînés sur des données à échelle humaine échouent sur les tâches sémantiques. L'analyse des checkpoints révèle que la compréhension sémantique émerge après la connaissance syntaxique et corrèle avec les gains en connaissance du monde.

Chaleur 0

Pertinence 55

Nouveauté 62

OUVRIR LA SOURCE ↗

#LLM #sémantique #linguistique #benchmark #open-source