教師なし学習
用途は主に二つ
k-means
強みは、入力次元の数と関係なくクラスタを扱えること(PCAなどは出来ない)
分布してる点を10クラスに分ける == 各点を10次元の成分(one-hot)に分離する 例: {0,0,0,1,0,0,0,0,0,0}
もしくは、各クラスタセンターへの距離を各次元に割り当てるとか
評価について
答えを使って検証する場合: ARI値などを使う
ただ、↑ができるなら教師あり学習すればいい
ただ、本当に合ってるかは人間の目で可視化されたデーターを見るしかない
自動でR値とか使って検証できる、教師あり学習と違って人間が評価するしかない、大変 ---
情報科学の達人.icon