クラスタ分析の直観的な手順
照合元の辞書を作る
というアプローチのイメージ
集団の構成要素のそれぞれに特徴ごとに数値を与えて、距離をとる
最も近いもの同士を一つのクラスターとみなす
→マンハッタン距離、ユーグリッド距離、とか、色々
クラスターとそれぞれの構成要素を同列に扱って、また特徴量ごとに数値を与えて距離を取る
クラスターの特徴量はクラスターの構成要素の平均や重心や中央値を取ったり、総当たりして最大最小とかいろんな抽出の方法がある。
ward法→クラスターに新しい構成要素を足した時に、重心からのばらつきが最も大きくならないものを選ぶ
#データ指向モデリング