CONF-TSASR
https://www.itmedia.co.jp/news/articles/2308/25/news060.html
複数人の会話から特定の1人だけを音声識別する手法 米
NVIDIA
「CONF-TSASR」開発
話者プロファイルと補助発話(ターゲット話者)が与えられた重複多話者環境において、「単一チャネル話者自動音声認識」という特定の話者の発話を書き起こすタスクがある。この研究では、エンド・ツー・エンドの単一チャネル話者自動音声認識「CONF-TSASR」を提案する。
音声分離