パターン認識
マハラノビス距離
ユークリッド距離と違い、距離を定義する際に,多次元のデータの相関を考慮している
山の等高線のような感じ。急な斜面は等高線が詰まっているが、より詰まっているところの方に分類させた方がうまく分類できる。
kNN(k nearest neighbor)法
教師あり学習
アダブースト
サポートベクターマシン
マージンを最大にしたところで2分する
ランダムフォレスト(Random Forest)
分類や回帰に使える機械学習の手法
決定木をたくさん作って多数決する(または平均を取る)ような手法
例がわかりやすい↓
教師なし学習
k-means
クラスタリングでおなじみのやつ。
主成分分析
主成分分析
多次元の特徴空間に分散する多数の学習用画像から分布をよく表現できる低次元の特徴空間(部分空間)を求める手法
線形判別法
ここで求められる基底を用いた特徴空間ではクラス間が判別されやすい特徴量に変換される
SELFIC法
主成分分析で低次元化した特徴空間でクラスの近さに基づく識別を行う方法
CLAFIC法
主成分分析を用いて、クラスごとに入力画像群をよく表現する低次元な特徴空間を求め、その特徴空間をパターン学習の結果とみなす方法
KL展開
例えば5つの要素を持つベクトルがいくつかある場合に,出来るだけ元のデータを失わないように 3つや4つの要素のベクトルで表そうといった手法
圧縮やパターン認識の分野で用いられたりしている
要するに元のデータの特徴を残し,あまり特徴と関係ないであろう部分を消してしまおうという処理
その他