Zoomなどの音を直接音声認識する方法(macOS編)
はじめに
ZoomやYouTubeなどの音声を認識させたい場合にはPCの音をスピーカから出すよりも、内部で直接アプリに渡してあげたほうが綺麗な音のまま音声認識ができます。最近のMacbookはApple Siliconを搭載しており、iPhoneやiPadのアプリがそのまま使えます。そのアプリに音声をそのまま入力してしまおうというお話です。
普通の音声認識のイメージ
https://gyazo.com/73d5a32cdf3b3eae868c42ff7235c271
Apple SiliconのMacがあれば、1台で完結(しかも綺麗に音を入れられる)
https://gyazo.com/548fbebee3b9f444260df5ff173c4b1e
0. 必要なソフトをインストールする
Apple Silicon(M1とかM2)が搭載されたMacを用意する。
App StoreでUDトークやYYProbe、YY文字起こしなどの音声認識ソフトを探すと、iPhone版やiPad版のアプリをインストールすることができます。
https://gyazo.com/eb116e57453bd8a90e5feb9e3831cd14
https://gyazo.com/2a36fa9fef3356f5cf56b6745a939abc
次に、仮想のオーディオデバイス(仮想スピーカや仮想マイク)であるBlackHoleをインストールします。
https://gyazo.com/e5911c835adbbc4176334eb1890dbd6a
ここからインストーラをダウンロードしてインストールします。
1. 音声の出力をBlackHole 2chにする
https://gyazo.com/804b6631c64a81358e8773f2ce38f17a
もしくはZoomオーディオ設定でBlackhoke 2chを選択します
https://gyazo.com/7bec31c6eb636cc775b34f60c8fc7f01
この設定で、パソコンから鳴っている音は全て仮想スピーカに送られます。
※ この設定はMacから音が出なくなります。同時に出したい場合についても下で説明します
2. 音声の入力をBlackHole 2chにする
macOS🍎>システム環境設定>サウンド>入力 でBlackHole 2chを選びます。
この設定で、仮想スピーカの出力が仮想マイクにつながります。YouTubeなどを再生し入力レベルか動いていることを確認しましょう。
https://gyazo.com/5d0e61d301dad607fca002be42e188d9
3. アプリで音声認識を動かす
アプリを起動して、音声認識を始めてみましょう。
UDトークの場合、「タップして話す」を押すと丸印が動いて音声が入力されているのがわかります。
さらにOBSなどの画面合成ソフトなどと組み合わせると認識結果の画面を仮想カメラからZoomに送ることができます。
https://gyazo.com/3306ab9d166da6a3756a83696c871694
(なんの内容かさっぱりかと思いますが、人間情報工学という講義で、人間の皮膚感覚のが先鋭化のために微分をしていることと、ノーベル賞をとったベケシーのことを説明しようとしています)
YY文字起こしを起動するとこのような画面になります。(2022/12/7追記)
https://gyazo.com/98aed381a999310ade185ac8e1fac8bc
YYProbeも動きました(2022/12/7追記)。ただ、職場などのネットワーク(具体的にはネットワークのプロキシを設定している場合)では起動後固まってしまいました。WIfiルータや携帯のテザリングからだとつながりました。
https://gyazo.com/2bc2ede7238d8b543403f74da7900e03
(こちらも人間情報工学の講義です。)
補足. 仮想スピーカに音を送りつつ、自分でも聞きたい場合
macOSの音をBlackHoleに出力してしまうと、Macからは音が出なくなります。どのような内容かを確認したい場合には、「複数出力装置」というスピーカを作ることで両方出せます。これはmacOSの標準機能でできます。
「アプリケーション>ユーティリティ」から「オーディオMIDI設定」を起動します。MIDIで検索すると出てきます。
https://gyazo.com/3dd9cae78a53dcf81dfb7277c99c4a11
アプリの左下の+を押します。
https://gyazo.com/d7ba9317f950ea1c3a2c86a83bcd2657
「複数出力装置」を選びます。
https://gyazo.com/dd6e4443bcd30d674f284a3657c20134
メニューから、音を出したい機器を選びます。「BlackHole 2ch」と音を確認したいスピーカ(ここではMacbook Proのスピーカ)を選びます。
https://gyazo.com/9627abfc20f1d83b6af800165fc5019c
(追記)Bluetoothの出力先も選択可能です(ペアリング済みの場合)
https://gyazo.com/ab5809e86c5b10e041fecc1a588838ba
Bluetoothのヘッドセットにも音が出せることを確認しました。
https://gyazo.com/8ec9458f3998cb12f905cbaf6e53c2cf
Zoomで設定する場合も「複数出力装置」を選択
https://gyazo.com/9f14427ab512898752356756e614fe21
Zoomのマイク入力はBlackholeではなく内蔵マイクなどにすると、相手にも声を伝えることができます。
(2024/06/25追記)
以上です。(安啓一)
ご質問がありましたら、こちらのtweetにご返信ください。
https://gyazo.com/38b26c24063ff694bd3cad0bab64eb8c
更新履歴
2022/12/6 初版
2022/12/7 Bluetoothヘッドセットについて、YYProbe、YY文字起こしの画面を追加