階層的クラスター分析 (Hierarchical clustering)
似たもの同士をグルーピングし階層構造を作る、樹形図 (デンドログラム) が出来あがる。
クラスター数の仮定が不要。
クラスタ間の距離の定義によっていくつかの手法がある。
また、距離の計算方法によって結果が変わる。
ウォード法 (Ward)
2つのクラスターを結合したときの重心と各サンプルの距離の二乗和 D(P∪Q) とそれぞれのクラスタの重心とクラスタのサンプルの距離の二乗和 D(P), D(Q) の差 D(P∪Q) - D(P) - D(Q) が最小のクラスタ同士を結合
連鎖(あるクラスターに順次吸収されていく)が起きづらい。
標準化が必要
はずれ値に強い
重心法 (Average Linkage)
2つのクラスター間の重心間の距離
最短距離法 (Single Linkage / Complete Linkage)
2つのクラスター間の個体同士で最も距離の近い個体間の距離
間隔尺度・順序尺度どちらにも使える
最遠距離法 (Maximum Linkage)
2つのクラスター間の個体同士で最も距離の遠い個体間の距離
間隔尺度・順序尺度どちらにも使える
はずれ値に弱い
群平均法 (group average)
2つのクラスター間のすべての個体の組合せにおける距離の平均
参考