音声合成

論文要約

DiFlow-TTS徹底解説: 低遅延ゼロショットTTSの最前線

紹介論文今回紹介する論文はDiFlow-TTS: Discrete Flow Matching with Factorized Speech Tokens for Low-Latency Zero-Shot Text-To-Speechとい...
論文要約

SageLM徹底解説: 音声判断LLMの最前線

紹介論文今回紹介する論文はSageLM: A Multi-aspect and Explainable Large Language Model for Speech Judgementという論文です。 この論文を一言でまとめるとSageL...
論文要約

VibeVoice解説!次世代TTSの衝撃

紹介論文今回紹介する論文はVibeVoice Technical Reportという論文です。 この論文を一言でまとめるとマイクロソフトが開発した革新的なTTSモデル、VibeVoiceの技術レポートを徹底解説。Next-Token Dif...