RECHERCHE
Un modèle offline compact pour la traduction vocale simultanée — soumission CUNI à l'IWSLT 2026
Des chercheurs adaptent le modèle Canary (1B paramètres) à la traduction simultanée grâce à la politique AlignAtt pour l'IWSLT 2026.
arXiv cs.AI · cs.LG · cs.CL·Aziz Sharipov Ortega, Dominik Macháček·2 juin 2026

Image · Source originale
L'équipe CUNI soumet à l'IWSLT 2026 un système de traduction vocale simultanée basé sur le modèle direct speech-to-text Canary, enrichi de la politique AlignAtt. Le système couvre les paires tchèque-anglais, anglais-allemand et anglais-italien, avec un modèle de seulement 1 milliard de paramètres supportant 25 langues sources et cibles. Il surpasse les baselines de taille comparable en qualité de traduction, aussi bien en faible qu'en forte latence.