メル周波数ケプストラム係数
#DSP
Mel-frequency cepstral coefficients,
MFCC
メル尺度
における
ケプストラム
Mel Filter Bank
をスペクトルにかけて
離散コサイン変換
する
音声認識
・音楽信号の特徴量検出などに使われるらしい
uLipSync
で利用されている
https://en.wikipedia.org/wiki/Mel-frequency_cepstrum
手順
高速フーリエ変換
を通す
uLipSyncはこの前段に
Hamming Window
を通す
各スペクトルのパワーを
メル尺度
に乗っける。三角形またはコサイン形の
Mel Filter Bank
を通す
各メル尺度ごとのパワーを
デシベル
に変換する(
対数
を取る)
各メル尺度ごとのデシベルを信号とみなし、
離散コサイン変換
を通す
出てきたスペクトルがMFCCってやつ