2003 Sven ConvNMF
Discovering hierarchical speech features using convolutional non-negative matrix factorization
Proceedings of the International Joint Conference on Neural Networks, 2003.
Sven Behnke
畳み込み(Convlutive) NMF
データセットの構造を反映する表現を発見することは、多くの推論および学習方法の最初のステップです。この論文は、部分として解釈できる局所的な音声特徴の階層を見つけることを目指しています。非負行列因子分解 (NMF) は、部分ベースの局所的な加法表現を発見するために最近提案されました。ここでは、この方法のバリエーションである畳み込み NMF を提案します。これは、共有重みを使用して特定のローカル接続を強制します。分析はスペクトログラムから始まります。畳み込み NMF によって生成された隠れた表現は、次の上位レベルの同じ分析方法に入力されます。畳み込み NMF を繰り返し適用すると、ますます抽象的な表現のシーケンスが生成されます。これらの音声表現は部分ベースであり、複雑な高レベルの部分は、それほど複雑ではない低レベルの部分に基づいて定義されます。