モンテカルロ法 - 未来の自分を助けるメモ

モンテカルロ法

MCTS(monte carlo tree search)

要約してみる。(わかってないので)

はじめに

目的は、d次元空間で点Xの従う確率分布P(X)が与えられたとき、いずれかを行いたい。

P(X)に従うように点Xiをサンプリングする

P(X)について、いろいろな関数の期待値を計算する。

例としては、統計物理のギブス分布、ベイズ統計の事後分布が上記P(X)になる?

モンテカルロ積分から

よくあるπの計算。P(X)を一様分布として、積分領域DからのM個の代表点で、円の面積を求める

この場合の誤差は、$ O(M^{-1/2}) 1/2乗で低減する。

この誤差は、被積分変数( g(x) = g(x)/P(X) * P(X) ) の次元数に依存しない。

モンテカルロ法でない、求積法では、次元が増えるごとに区間を切る手間？が増える。

メトロポリスの方法へ

一様な分布からのランダムサンプリングでは問題が。

高次元だと、被積分関数の取る値が非常に小さくなるので、積分値の値?の分散値が大きくなる。

この問題を解決したのが、メトロポリス法。

重要なところを重点的にサンプリング

分布関数の値に比例した数だけサンプリングすれば良い。

P(X)からXが解析的に分かる、逆関数求める必要がある。

熱浴法、ギブスサンプラー

ここらあたりでついていけなくなる...

統計物理の問題・イジング模型の場合

定常分布への遅い緩和の問題

アニーリング法は最適化技法

拡張アンサンブル法

マルチカノニカル法

終わりに