パソコンで再生される音を直接音声認識する方法
2022/11/04
一番簡単な方法
パソコンで出力された音をそのままマイクに入力して音声認識アプリに入力する
実施している環境のノイズが入るため,認識精度の低下につながる
実施者が話すとその音声も認識される
https://gyazo.com/c55842dc3a6ae686eaacea2ccf5c4c45
そもそもパソコンの音は?
OS上で再生される音は,音声デバイスに出力される
一般的には音声デバイス=スピーカー
https://gyazo.com/20b070058a94c0a67f5ac6122b64860f
OS上で再生される音を直接音声認識するには
仮想的な音声デバイスを生成して,そのデバイスにアプリの音を出力
仮想的な音声デバイスから,音声認識アプリに音を入力
必要があればスピーカーに分配
https://gyazo.com/03e0f4a76c0a06dd736fc9c3f4017d4f
仮想的な音声デバイスを準備する必要がある
Macの一例
BlackHoleという仮想音声デバイスを利用
仮想音声デバイス「BlackHole 2ch」が利用できるようになる
MACに標準で入っている「Audio MIDI設定」アプリを起動
「+」ボタンで「複数出力装置を作成」を選択し,適当な名前をつける
MacのスピーカーとBlackHole 2chの「使用」にチェックを入れる
https://gyazo.com/000be253871d123da988ce9e296a291d
OSの音の出力先を先程作成したオーディオ装置に設定する
https://gyazo.com/f411db0bbd5117e58d8c2ea6a965b731
音声認識をさせるアプリの入力にBlackHole 2chを設定する
(例)Zoomの場合はマイクの入力でBlackHole 2chを選択する
全体の構成イメージ図
https://gyazo.com/b13f9802b0e84e43927306c2b35b6447
Windowsの場合
Windowsでは試していませんが次のような仮想オーディオデバイスがあるようです
構築できた方はその方法をご報告いただければ幸いです
仮想オーディオデバイス
Windows標準の「ステレオミキサー」※ドライバが対応している必要があるのでパソコンのオーディオデバイスによる
「ステレオミキサー」「ループバック」といったキーワードでGoogle等で検索
「VB-CABLE」「音声認識」といったキーワードでGoogle等で検索