TTS

論文要約

WhisTLE: テキストだけで ASR を改善!

紹介論文今回紹介する論文はWhisTLE: Deeply Supervised, Text-Only Domain Adaptation for Pretrained Speech Recognition Transformersという論文...
論文要約

DiFlow-TTS徹底解説: 低遅延ゼロショットTTSの最前線

紹介論文今回紹介する論文はDiFlow-TTS: Discrete Flow Matching with Factorized Speech Tokens for Low-Latency Zero-Shot Text-To-Speechとい...
論文要約

VibeVoice解説!次世代TTSの衝撃

紹介論文今回紹介する論文はVibeVoice Technical Reportという論文です。 この論文を一言でまとめるとマイクロソフトが開発した革新的なTTSモデル、VibeVoiceの技術レポートを徹底解説。Next-Token Dif...