音声認識

論文要約

ハンガリー語音声認識の新境地: BEA-Large/Dialogueデータセット徹底解説

紹介論文今回紹介する論文はToward Conversational Hungarian Speech Recognition: Introducing the BEA-Large and BEA-Dialogue Datasetsという論...
論文要約

敵対的ドメイン適応でSQA精度向上!

紹介論文今回紹介する論文はMitigating the Impact of Speech Recognition Errors on Spoken Question Answering by Adversarial Domain Adapt...
論文要約

低リソースASRに朗報!音声合成でデータ不足を解消

紹介論文今回紹介する論文はSpeech Synthesis as Augmentation for Low-Resource ASRという論文です。 この論文を一言でまとめると音声合成技術を活用して、低リソース言語の自動音声認識(ASR)性...
論文要約

音声データ作成の盲点:低リソース言語のコスト分析

紹介論文今回紹介する論文はCost Analysis of Human-corrected Transcription for Predominately Oral Languagesという論文です。 この論文を一言でまとめると低リソース言...
論文要約

TokenChain: 最新音声認識モデルを徹底解説

紹介論文今回紹介する論文はTokenChain: A Discrete Speech Chain via Semantic Token Modelingという論文です。 この論文を一言でまとめるとTokenChain論文を分かりやすく解説。...
論文要約

VoiceAssistant-Eval徹底解説:AIアシスタント性能を測る新指標

紹介論文今回紹介する論文はVoiceAssistant-Eval: Benchmarking AI Assistants across Listening, Speaking, and Viewingという論文です。 この論文を一言でまとめ...
論文要約

LLMの誤りを正す!DRESで会話精度UP

紹介論文今回紹介する論文はDRES: Benchmarking LLMs for Disfluency Removalという論文です。 この論文を一言でまとめると会話理解を阻害する「言い淀み」。DRESベンチマークでLLMの除去性能を徹底評...
論文要約

SloPalSpeech解説: スロバキア語ASRの新時代

紹介論文今回紹介する論文はSloPalSpeech: A 2,8000-Hour Slovak Speech Corpus from Parliamentary Dataという論文です。 この論文を一言でまとめるとSloPalSpeech論...
論文要約

Wolof音声データセット徹底解説!銀行タスクへの応用

紹介論文今回紹介する論文はWolBanking77: Wolof Banking Speech Intent Classification Datasetという論文です。 この論文を一言でまとめるとアフリカのウォロフ語に特化したWolBan...
論文要約

音声LLMの落とし穴?理解度低下を防ぐC3Tとは

紹介論文今回紹介する論文はPreservation of Language Understanding Capabilities in Speech-aware Large Language Modelsという論文です。 この論文を一言でま...