bb5450697118039
http://nhiro.org.s3.amazonaws.com/9/6/968e205f372c9897c2a1a286269fc4f8.jpg https://gyazo.com/968e205f372c9897c2a1a286269fc4f8
bb5450697118,038
bb5450697118,040
bb5450697118
(OCR text)
モンテカルロ木探索
強化学習の言葉でいえば2つの方策の組み合わせ
で探索して、行動価値関数Q(s, a)を推定する手法
2つの方策:
Tree Policy
Rollout Policy
40
Nearest:
7762aa93ff14,090