6 items

#audio

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
moonshotheat 60
Sortie de Kimi-Audio-7B par Moonshot AI
Moonshot AI publie Kimi-Audio-7B, un nouveau modèle audio de 7 milliards de paramètres.
OUTILS
huggingfaceheat 65
Real World VoiceEQ : mesurer la qualité vocale de l'IA
Hugging Face dévoile Real World VoiceEQ, un nouveau benchmark pour évaluer la qualité humaine des modèles de voix.
SIGNAL
heat 42
Redonner vie à un groupe de fac de 2001 grâce à l'IA
Un développeur utilise des outils d'IA pour ressusciter les enregistrements de son groupe universitaire vieux de plus de vingt ans.
RECHERCHE
heat 30
MulTTiPop : un dataset multitrack pour la transcription automatique de musique pop
Un nouveau benchmark de 572 segments de pop music avec MIDI multitrack pour évaluer les modèles de transcription automatique.
RECHERCHE
heat 32
Comprendre l'attrait de la narration dans les livres audio via l'analyse audio
Une étude computationnelle relie pour la première fois les qualités acoustiques de la narration (ton, rythme, volume) aux données de consommation des livres audio.
RECHERCHE
heat 52
LeVo 2 : génération de chansons stables et mélodieuses par modélisation hiérarchique
Un framework hybride LLM-Diffusion capable de générer des chansons complètes en combinant planification sémantique et raffinement acoustique par piste.

6 items

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
moonshotheat 60
Sortie de Kimi-Audio-7B par Moonshot AI
Moonshot AI publie Kimi-Audio-7B, un nouveau modèle audio de 7 milliards de paramètres.
OUTILS
huggingfaceheat 65
Real World VoiceEQ : mesurer la qualité vocale de l'IA
Hugging Face dévoile Real World VoiceEQ, un nouveau benchmark pour évaluer la qualité humaine des modèles de voix.
SIGNAL
heat 42
Redonner vie à un groupe de fac de 2001 grâce à l'IA
Un développeur utilise des outils d'IA pour ressusciter les enregistrements de son groupe universitaire vieux de plus de vingt ans.
RECHERCHE
heat 30
MulTTiPop : un dataset multitrack pour la transcription automatique de musique pop
Un nouveau benchmark de 572 segments de pop music avec MIDI multitrack pour évaluer les modèles de transcription automatique.
RECHERCHE
heat 32
Comprendre l'attrait de la narration dans les livres audio via l'analyse audio
Une étude computationnelle relie pour la première fois les qualités acoustiques de la narration (ton, rythme, volume) aux données de consommation des livres audio.
RECHERCHE
heat 52
LeVo 2 : génération de chansons stables et mélodieuses par modélisation hiérarchique
Un framework hybride LLM-Diffusion capable de générer des chansons complètes en combinant planification sémantique et raffinement acoustique par piste.