SAFETY
L'IA vocale en temps réel entend mais n'écoute pas vraiment
Une étude révèle que les systèmes vocaux IA ignorent les émotions dans la voix, même quand ils les perçoivent correctement.
arXiv cs.AI · cs.LG · cs.CL·Martijn Bartelds, Federico Bianchi, James Zou·24 juin 2026

Image · Source originale
Des chercheurs de Stanford ont évalué quatre systèmes vocaux temps réel (GPT Realtime 2, Gemini Flash Live, Qwen3.5 Omni) sur des scénarios où le ton vocal est décisif. Résultat : tous ignorent la détresse, la peur ou le sarcasme dans leurs décisions, en se fiant au contenu textuel plutôt qu'aux propriétés acoustiques. Paradoxalement, trois des quatre systèmes identifient correctement l'émotion lorsqu'on leur pose la question directement. Les auteurs nomment ce phénomène « emotional intelligence gap » et recommandent la prudence dans tout déploiement sensible.