最近傍法
入力から一番近いデータ(「辞書パターン」)のクラスに識別 非常にシンプル
考える事
クラスが異なると大きく違うのが嬉しい
クラスが同じならあまり変化がないのが嬉しい
次元数が高すぎると、かえって性能劣化することも(「次元の呪い」) (上二つは、相反することも多い)
どのように距離を測るか
ベクトルの特定の方向に重みを持たせたり(ex: 二次元ベクトルの縦方向だけ倍にするとか)
等方的距離でいいのか?
極論を言えば、パターン認識はパターン間の距離の学問
距離はいろいろな(ほぼ無限の)定義ができる
各クラスの重心点のみ?
境界部の点のみ?
全部のデーターを使う? (効率に問題あり)
亜種