クラスタ分析
項目、属性、次元数など、複数の変数を持つデータを利用し、その変数間の相互の関係性を捉えるために使用される
統計的手法
の一つ。
学習手法としては目的変数を設定しない
教師なし学習
に分類できる。
似ているデータを集めて、グループに分類していく過程を結果を
デンドログラム
として表現する。
k平均法
に代表されるような
非階層型クラスタリング
と、Ward 法に代表される
階層的クラスタリング
の2種類が存在する。