多様体学習
多様体学習
データの分布構造が非線形なとき、高次元空間に埋め込まれた多様体(manifold)上の分布構造を学習することで、より低次元の空間でのデータ表現が可能になることがある
たとえば下の3次元データ構造は実質的に2次元構造をしている
https://gyazo.com/4592a6937d22edcac0cad58251fdf4da
これを見つけ出すのが多様体学習
高次元空間上の分布構造を学習し、低次元(2次元や3次元)に変換する
これにより、主にデータの可視化によく用いられる
学習データを変換することはできるが、新しいデータ(テストデータ)にその変換を適用することができないことが多く、教師あり学習のための次元削減を行う目的ではほとんど用いられない
ちなみに、PCA(主成分分析)のような方法はあくまで線形変換なので、上のような非線形な構造があるとどうやってもその構造を表現することはできない 多様体学習にもいろいろな方法がある
カーネルPCA
などなど