モンテカルロ法
MCTS(monte carlo tree search)
要約してみる。(わかってないので)
はじめに
目的は、d次元空間で点Xの従う確率分布P(X)が与えられたとき、いずれかを行いたい。
P(X)に従うように点Xiをサンプリングする
P(X)について、いろいろな関数の期待値を計算する。
例としては、統計物理のギブス分布、ベイズ統計の事後分布が上記P(X)になる?
モンテカルロ積分から
よくあるπの計算。P(X)を一様分布として、積分領域DからのM個の代表点で、円の面積を求める この場合の誤差は、$ O(M^{-1/2}) 1/2乗で低減する。
この誤差は、被積分変数( g(x) = g(x)/P(X) * P(X) ) の次元数に依存しない。
モンテカルロ法でない、求積法では、次元が増えるごとに区間を切る手間?が増える。
メトロポリスの方法へ
一様な分布からのランダムサンプリングでは問題が。
高次元だと、被積分関数の取る値が非常に小さくなるので、積分値の値?の分散値が大きくなる。
分布関数の値に比例した数だけサンプリングすれば良い。
P(X)からXが解析的に分かる、逆関数 求める必要がある。 熱浴法、ギブスサンプラー
ここらあたりでついていけなくなる...
統計物理の問題・イジング模型の場合
定常分布への遅い緩和の問題
アニーリング法は最適化技法
拡張アンサンブル法
マルチカノニカル法
終わりに