機械学習のアルゴリズム
https://products.sint.co.jp/hs-fs/hubfs/images/aisia/blog/9_001.png?width=778&height=530&name=9_001.png
教師あり学習
教師あり学習(Supervised Learning)は、学習データに正解ラベルを付けて学習する方法である
教師あり学習の手法
回帰
回帰とは「たくさんのデータをプロットしたときに、その関係性を表す線(関数)を見出すこと」である
機械学習では、たくさんのデータから関数(傾向)を導き、それをもとに今後の予測を行うことを指す
例)回帰を使った売上予測モデル
過去三年のデータに加え、曜日、天気、気温などが与える影響に関する情報を機械学習させたもの
https://products.sint.co.jp/hs-fs/hubfs/images/aisia/blog/2.png?width=778&height=299&name=2.png
分類
分類とは「未知のデータを自動分類するもの」である
たくさんのデータを与え、そこから得た特徴や傾向をもとに判別を行わせるものである
例)画像認識、故障診断、顧客維持
https://gyazo.com/db7337e43deec73f103bd2e7ab001c17
教師なし学習
教師なし学習(Unsupervised Learning)は、学習データにラベルを付けないで学習する方法である
教師なし学習の手法
クラスタリング
様々なものの中から類似性のあるものを集めてグループ化するものである
クリスタリングはたくさんのデータをカテゴライズするのに適している
例)購買実績に基づく顧客のカテゴライズ、商品のレコメンド、異常を早期に検知する予知保全
クリスタリングによる色分け
ラベル付けはされておらず、RGB値の違いを認識してグループ分けをしている。中心には黒に近い色が集まっている。
https://products.sint.co.jp/hs-fs/hubfs/images/aisia/blog/K9_2_low.png?width=432&height=432&name=K9_2_low.png
強化学習
強化学習は、教師あり学習のように「答え」が与えられるわけではなく、「報酬」を得るために自ら学んで賢くなる学習法である
強化学習では報酬をより得るために自ら反省し、学習していく
強化学習の手法
バンディットアルゴリズム
強化学習のひとつであるABテストでは「探索」と「活用」の工程が存在する。しかし、この二つにはトレードオフの関係がある。つまり、データを得るために探索は必要だが、探索が多いと活用が減ってしまう。そして結局報酬を得られないという事態に陥ってしまう可能性がある。この問題を解決するための手法がバンディットアルゴリズムである。
バンディットアルゴリズムは探索しながら活用する。つまり「序盤からこれまで得た情報で活用しながら、適度に探索もし続ける」というものである
例)囲碁、将棋、チェス
https://gyazo.com/2ce35caae3389bf315805a5c951ce0dd