教師なし学習
教師なし学習(unsupervised learning)
教師あり学習とは異なり、ラベル付けされていない(「正解」がわからない)データの(統計的・確率的)構造を学習し、意味のある情報を取り出す方法
クラスタリング、次元圧縮(次元削減)など
クラスタリング
https://gyazo.com/ef1447a1c9fbb665252b98dc017de3e4
「同じグループに属する(つまり、似ている)」と思われるデータをクラスタ(塊)として分類する方法の総称
探索的データ解析(exploratory data analysis)のいち手法
クラスタ分析と呼ばれることも多い
統計的な、ある特定の意味での「近さ」をもとに「グループ分け」をする
いくつかのグループに分けることはできるが、たとえばそれが「何の」グループであるかはわからない
何のグループか、という「意味づけ」は人間が行う(ときもある)
次元圧縮(次元削減)
https://gyazo.com/4592a6937d22edcac0cad58251fdf4da
多次元の入力データを、より低次元の部分空間に変換する
その入力データの本質的な特徴を保ちつつ次元を圧縮できるような変換を行う
教師あり学習の説明変数(特徴量)を削減するために使うこともある
データの可視化に役立つこともある
多次元のデータを2次元に圧縮するなど(上図の例のように)