7762aa93ff14090
http://nhiro.org.s3.amazonaws.com/6/a/6a4a88b17011f3298fd9e0c65007f399.jpg https://gyazo.com/6a4a88b17011f3298fd9e0c65007f399
(OCR text)
ガウス過程によるパラメータサーチ
「良い結果が得られるパラメータを探す」は
関数の最大値を探す最適化問題
関数が滑らかである仮定をガウス過程として
導入することで、未探索の値に対してのUCBが
計算できるようになる
UCBが最大となる点を探索していくことでRegret
最小の探索ができる(強化学習的発想)
Srinivas+ (2010) "Gaussian Process Optimization in the Bandit
Setting:
No Regret and Experimental Design"
rs/Extra/
2012 30 08 MichaelOsborne.pdf p.825