パターン認識に関する問題
学習 -> 特徴抽出 -> パターン学習 -> クラス辞書
テスト画像-> 特徴抽出 -> クラス辞書でパターン識別 -> クラス
平均値までの距離が同じでも広がりの大きい分布に対して短くなる距離
定義 mは平均,αは分散,nはテスト画像
$ \sqrt{({m} - {n})^2 \div α}
NN法
特徴空間でテスト画像に対して最も近傍の学習データを検索し、そのデータが属するクラスにテスト画像を識別する
kNN法
特徴空間でテスト画像の近傍のk個の学習用データを検索し、帰属するサンプル数が最も多いクラスへテスト画像を識別する
ハッシングに関する問題
与えられるハッシュ関数でテストデータを計算して求める。
ハッシング
データをハッシュ関数を通すことでいくつかのグループに分けて、あるテストデータについてその中グループ内で探索するようにすると、グループ分けしてない集合から探索するよりも時間短縮できる
グループは散らばっている方が探索が早くなる
例えば、ハッシュ関数が3で割った余りが
0の時はA
1の時はB
2の時はC
とグループ分けするようにすると、データが17の時 17 mod 3 = 2なのでCに属するとわかる
なのでCを探索すれば良い
SVMに関する問題
ハードマージンSVM
学習データ同士が最も遠くなるように分割することで汎化能力を高めたSVMのこと