Toutes les news taguées avec ce sujet.
Des chercheurs adaptent le modèle Canary (1B paramètres) à la traduction simultanée grâce à la politique AlignAtt pour l'IWSLT 2026.
Un système en deux étapes transcrit et traduit le Wardaman, langue aborigène australienne menacée, à partir de seulement 6 heures d'audio annoté.
OpenAI publie trois nouveaux modèles vocaux dont GPT Realtime-2, avec +15,2 % sur le benchmark Big Bench Audio et un contexte étendu à 128K tokens.