教師あり学習と教師なし学習、強化学習
機械学習=モデルを作り、モデルはデータに基づく動作をさせる仕組み
ルールベースではない
機械学習は大きく分けて3つある
教師あり学習
入力に対して決まった出力をするブラックボックスを作る試み
第1章の最小二乗法
数字の画像(入力)→0, 1, 2, ..., 9
教師ラベルのついたデータで学習する
化学における例
入力:物質の構造
出力:物性(例えばバンドギャップ)
教師なし学習
データの分布を表現、模倣、分類する枠組み
例:クラスタリング
日本人の成人全体の身長体重の散布図があったとする
クラスタリングの結果を教師あり学習のinputとすることがあるか?
事前に教師ラベルがついているわけではない
異常検知
強化学習
AlphaGo, AlphaStarとかに使われたもの
迷路探索アルゴリズム
環境とエージェント
エージェントが環境に働きかける
環境はエージェントの行動に対して報酬を与える
特徴
実験環境やシミュレーションをデータの代わりに使うので、事前に準備するデータを基本的に必要としない
全部理論物理に応用されている
メモ
ゼロから始めるディープラーニング
(x,y) -> z
$ ax^2 + bx^3 + cxy + \dots