音声認識を用いた空耳自動生成の検討
半田尚暉(資料等置き場)
論文↓
https://ipsj.ixsq.nii.ac.jp/records/232825
概要
本研究では,「空耳」と呼ばれる,音声を聞いた際に本来の言葉とは異なる意味の言葉に聞こえる現象に着目する.空耳は異言語を母国語で誤認することで生じると仮定し,入力の言語(例えば英語)とは異なる言語(日本語)で学習された音声認識ツールを用いて,音声に含まれる非言語情報を考慮した空耳の自動生成に取り組む.具体的には,TV 番組の「空耳アワー」で報告された楽曲に対して日本語モデルの音声認識ツールを複数用いて,出力結果を空耳として利用できるか検証する.発音記号に着目し報告された楽曲から評価基準を定め,発音での近さを評価した.そして,報告された事例と楽曲の聴こえ方が似ている曲を選別し,音声認識を行った.実験結果から,高性能な音声認識手法ほど空耳の自動生成には向かないことが分かった.また,音声認識を通じて新しい空耳を作成できるケースもあり,空耳を音声認識によって生成できる可能性が示唆された.
歌声の歌詞認識を用いた空耳楽曲の分析
情報処理学会音楽情報科学研究会 第9回国際会議既発表・デモ・萌芽・議論セッション(2023年2月 発表)
ポスター
pdf ポスター.pdf
パワーポイントポスター.pptx
概要発表資料
pdf 日本大学 半田尚暉.pdf
パワーポイント日本大学 半田尚暉.pptx
参考資料
以前の学内用の発表資料
pdf (最終)歌声の歌詞認識を用いた空耳楽曲の分析-4.pdf
パワーポイント (最終)歌声の歌詞認識を用いた空耳楽曲の分析-4.pptx
それぞれ内容は同じです。
連絡先
日本大学大学院 生産工学研究科
半田 尚暉
メールアドレス
cina22016@g.nihon-u.ac.jp