CONF-TSASR

https://www.itmedia.co.jp/news/articles/2308/25/news060.html 複数人の会話から特定の1人だけを音声識別する手法　米NVIDIA「CONF-TSASR」開発

話者プロファイルと補助発話（ターゲット話者）が与えられた重複多話者環境において、「単一チャネル話者自動音声認識」という特定の話者の発話を書き起こすタスクがある。この研究では、エンド・ツー・エンドの単一チャネル話者自動音声認識「CONF-TSASR」を提案する。