bb5450697118,055 - nishio-a2

bb5450697118055

http://nhiro.org.s3.amazonaws.com/d/2/d233c6c13bbd551cf38d9e46858872f2.jpg https://gyazo.com/d233c6c13bbd551cf38d9e46858872f2

(OCR text)

まとめ

Point Based Value Iterationは状態遷移確率を与

える必要がある

そこでブラックボックスシミュレータを使う

部分観測モンテカルロ計画法(POMCP)を実装

ガイスターに適用して、ある確率で青コマで

のゴールを目指すような相手に対しては隠れ

状態を推定して9割近い勝率を出した

もっと人間にとって自明でない思考ルーチン

で実験をしたい