1e40cd43d981,017
http://nhiro.org.s3.amazonaws.com/2/a/2a5cc244f0e30b60f9010489a94767ea.jpg https://gyazo.com/2a5cc244f0e30b60f9010489a94767ea
(OCR text)
多腕バンディット問題で実験
18
問題設定とか実験条件の説明は割愛
(詳細は「強化学習その1」で解説)
ざっくりいうと「観測した情報を元に
どの選択肢にお金を賭けるか決めて
賭ける(行動する)問題」