079be9dfd3c0,032
http://nhiro.org.s3.amazonaws.com/8/8/88b1d46994394a84313f90ca08471c15.jpg https://gyazo.com/88b1d46994394a84313f90ca08471c15
(OCR text)
強化学習(機械学習の一種)
33
このシチュエーションで使えるのが強化学習
「方策」
状態を引数とし行動を返す関数
行動を繰り返した後で報酬(良し悪しの評価)
が得られる
報酬を大きくするように方策を学習する