12 音漏れ信号を用いたヒアラブルデバイス向け手形状認識手法の検討
https://scrapbox.io/files/6392b4f36b9cb3001db78656.png
要旨:
本研究ではヒアラブルデバイスの音漏れが手と耳介で形成される空間内を反響することに着目し,耳介反響音を測定,解析することで現在の手形状を認識する手法を開発した.提案手法はヒアラブルデバイスにて一般的に搭載されているスピーカと外側マイクで実装できる点でヒアラブルデバイスとの親和性が高い.本研究ではプロトタイプデバイスを用いて, 5種類の手形状のデータを収集した.実験の結果,参加者(5名)ごとの個人分類モデルによる認識精度が平均92.7%(F値)であることを確認した. ヒアラブルデバイスのためのジェスチャ認識のためにイヤホンからの音漏れに着目した点は査読者全員が新規性を認めているが, 実用性の面や安全性に大きな疑問が残る論文である. 音漏れを用いたジェスチャ認識自体についてはWISSで議論することに価値があると判断し, ショート採択とするのが妥当である. 付録:
実験ではこんな信号を使っています(音量注意)
参加者メモ・コメント:
輪ゴム
いまはスピーカー+マイクのようなヘッドセットが主流
将来、ここに活動量計などが入るかもしれない
そうすると、ボタン操作やタッチ操作では操作が難しくなるかもしれない
耳の周囲(頬とか)をタップするのは結構見かけるようになりましたね (SONY, Xiaomi)、小さなボタン探さなくて良いので楽。
そのため、ジェスチャで操作できるようにしたい
耳を覆っている手が手袋着用しているか素手かも音響特性から判別できたり?池松香.icon
音が吸収されやすい素材などはできる気がします!(手形状の認識に影響しないかも調査しないといけないです)
(外向けの)proximity sensor 使ってるのはありますね
なるほど!
関連研究
追加のセンサが必要だったり
マスク着用時にできなかったり、日常動作と混同したり
EarBuddy: Enabling On-Face Interaction via Wireless Earbuds (CHI2020)とやっていることが近いけど、覆うか触るかの違い?narumi.icon
原稿を読んできたけど、やっぱりもしかしたら結構近いのかも?
やりたいことは結構似ていると思います、、将来的にホバージェスチャだけで完結できれば違いが出るかもしれません。
認識システム
特徴量
スピーカーとマイク別なんだyuiseki.icon
内蔵マイクだと周波数帯域が狭い
チャープ信号
0-22kHz だと結構気になりそう(gestureだと連続的に出すのでなおさら)。
5種類のジェスチャを認識する
分類モデル
今後の改善
チャープ信号が可聴域
ユーザーが手を近づけたときだけチャープ信号を出す
チャープ信号ではなく音楽から周波数特性を測定する
オープンイヤーデバイスでの検証
質疑応答
これらのジェスチャで、具体的にどんな操作を想定していますか?
今後の調査対象だと考えている
5種類のジェスチャはどう決めましたか?yuiseki.icon塚田浩二.icon
一般的な自然なジェスチャを選んでいる
たしかに一般的な自然なジェスチャなので、そのまま能力拡張のアプリケーションが考えられそう
今回の北大の方の発表を聞いてやりたくなってきました!
MFCCが30次で処理しているのは何か理由があるのでしょうか?(もっと多くても、もっと少なくても良いのか?)hirai.icon
音響センシングでジェスチャコマンドとして処理するのなら、ヒアラブルデバイスを付けた状態で、耳をタップした際の音を検出してコマンドにするほうが処理的には簡単ではないでしょうか?ダブルタップ、トリプルタップ、二本指でタップ、耳介の上をタップ、耳たぶをタップ、みたいな感じで・・・(そういうのは既にある?)hirai.icon
+1yuiseki.icon
EarBuddy(関連研究で説明したもの)という研究がそうですね。今後の結果次第ですが、ノイズに強かったり実現できるジェスチャやジェスチャの想起性とかに違いが出てくれば良いかなとも思います。
「聴いていてたのしい(≒時間の無駄に感じない))チャープ信号」というのはデザインできませんか?qurihara.icon
(会場でチャープ信号が再生された)
ヒエーッyuiseki.icon
耳鳴りの持病があるのでこれを何度も聞いていると耳鳴りが悪化しそうだと感じてしまいましたyuiseki.icon*2 (意外と聞いていて楽しかった・・が飽きそうqurihara.icon)
ランニング中にこういうのが利用できるととても嬉しいです。老眼が強くなって Garmin の画面を見るのがつらいので。で、質問ですが、風の強い日の風切り音の有無には対応できるんでしょうか? kwakita.icon
+1yuiseki.icon
ノイズの影響はまだ調査できていないです。単純に今のシステムのままだと精度はとても下がると思います。その辺りはまず、一般的なノイズ対策(ノイズリダクション/モデル作成)で改善できるか調査したいと思っています。
↑ ご回答ありがとうございました kwakita.icon
音のAR、喋るAIとの相性は良いかもしれないですね
非可聴域を使ったとしてもやはり耳には負担がありそうなのでどれだけ短い時間でセンシングできるようにしてリスクを減らせるかがポイントになりそうな気がします
そうですね、超音波暴露のガイドラインはまだまだ不確定かつ、未調査な部分ですが、極力音量/再生時間は減らしたほうが良いと思っています。