クラスタリング
クラスタリングとは
データの集まりをデータ間の類似度(あるい は秘類似度)に従って、いつかのグループに 分けること
どのような観点で類似度を設定するかでクラ スタリングの結果は異なるので、クラスタリン グには厳密な正解はない
教師なし学習の手法である
クラスタリングの注意点
クラスタリングの結果,グループ分けされた結果を解釈して,他者でも納得できるような意味を与えることが,クラスタリングの価値を大きく左右する重要なプロセスである
クラスタリングはあくまで分類のみであるため,分類された対象ごとに相関分析や回帰分析を行うことで,成立している法則性・相関関係・因果関係を考察しなければならない
クラスタリングを行うための代表的なアルゴリズム
階層クラスター分析(階層クラスタリング)
ウォード法
群平均法
非階層クラスター分析(非階層クラスタリング)
K-means法
参考文献
茨城大学 クラスタリング入門
http://nlp.dse.ibaraki.ac.jp/~shinnou/zemi2008/Rclustering/r-tanaka-0415.pdf
Qiita クラスタリング手法のクラスタリング
https://qiita.com/suecharo/items/20bad5f0bb2079257568
Udemy ビッグデータ解析にも使われるクラスタリングを解説!
https://udemy.benesse.co.jp/ai/clustering.html
#テーマ5