RECHERCHE
Encodage du dictionnaire arabe-anglais Al-Mawrid avec ISO LMF et TEI Lex-0
Une méthodologie de numérisation systématique transforme un dictionnaire imprimé du XXe siècle en lexique computationnel standardisé.
arXiv cs.AI · cs.LG · cs.CL·Diaa Fayed, Laurent Romary·16 juin 2026

Image · Source originale
Des chercheurs proposent une méthode d'encodage du dictionnaire bilingue Al-Mawrid (arabe-anglais) en combinant le cadre ISO LMF et les directives TEI Lex-0. Sur un échantillon représentatif (la lettre Ayn, 4,6 % du volume total), l'analyse atteint 91 % de précision de parsing structurel, 85 % de précision et 98 % de rappel pour les synonymes. L'étude discute également des limites de TEI Lex-0 face aux spécificités de l'arabe et explore l'intégration dans les Linked Open Data linguistiques.