アルゴリズム
機械学習のアルゴリズムは主に「教師あり学習」と「教師なし学習」の2つに分類される
https://gyazo.com/b259d177b7d0aa23a7f5a5626c495468
機械学習のタスク
回帰・・・実数値函数を標本点から近似
分類・・・与えられたパターンを識別
異常検知・・・与えられた入力標本に含まれる異常値を見つける
クラスタリング・・・データに内在するグループ分けを見つける
次元削減・・・高次元データから本質的な情報を抽出し低次元の表現に変換
人間があらかじめ付けた正解のラベルに基づき、機械が学習を行い、データセットに対する応答値の予測を行うモデルを構築
>>>>>人間が正解のラベル付けを誤ると、結果が全て異なってしまう
分類:出力がカテゴリ、結果を離散出力で予測
回帰:出力が実際の値、連続出力内で結果を予測し、入力変数をいくつかの連続関数にマップ
ニアレストネイバー法
決定木
サポートベクターマシン
ランダムフォレスト
教師なし学習
入力データのみがあり、ペアとなる正解のデータは存在しません。
ゴールは、データに対する理解を深めるためにデータの基本的な構造や分布をモデル化すること
>>>>>正解がないため誤ったモデルが作成される恐れがある
クラスタリング
アソシエーション分析:データの大部分を表すようなルールを見つける
半教師あり学習
入力データが多く、一部のみ人間などの手でラベル付けされているもの
(例)写真のアーカイブ。数枚のみラベル付けがされてあり(犬、猫、人など)大部分がラベル付けされていない場合
>>>>>今ではこの方法が一番多く用いられている