079be9dfd3c0,032

http://nhiro.org.s3.amazonaws.com/8/8/88b1d46994394a84313f90ca08471c15.jpg https://gyazo.com/88b1d46994394a84313f90ca08471c15

(OCR text)

強化学習(機械学習の一種)

このシチュエーションで使えるのが強化学習

「方策」

状態を引数とし行動を返す関数

行動を繰り返した後で報酬(良し悪しの評価)

が得られる

報酬を大きくするように方策を学習する