bb5450697118055
http://nhiro.org.s3.amazonaws.com/d/2/d233c6c13bbd551cf38d9e46858872f2.jpg https://gyazo.com/d233c6c13bbd551cf38d9e46858872f2
(OCR text)
56
まとめ
Point Based Value Iterationは状態遷移確率を与
える必要がある
そこでブラックボックスシミュレータを使う
部分観測モンテカルロ計画法(POMCP)を実装
ガイスターに適用して、ある確率で青コマで
のゴールを目指すような相手に対しては隠れ
状態を推定して9割近い勝率を出した
もっと人間にとって自明でない思考ルーチン
で実験をしたい