ベイジアンゲームにおける完全混合戦略均衡と信念の遷移モデル
https://gyazo.com/4774ea6bb82d9094ee1a4594d0e7a9ff
m0t0k1ch1.icon ベイジアンゲームの具体例として、2 人 2 行動 2 タイプの場合を把握する
m0t0k1ch1.icon 研究内容については触れない
---.icon
1 はじめに
ベイジアンゲーム(不完備情報ゲーム)は,他プレイヤの利得に不確かさがあるゲームであり,標準型ゲームの構成要素(プレイヤ,戦略,効用)に加え,効用の不確かさを表すタイプ,そして,タイプ上の確率分布である信念で表現される.
m0t0k1ch1.icon キーワード:「タイプ」「信念」
ベイジアンゲームの解概念は,ベイジアンナッシュ(BN)均衡と呼ばれ,各プレイヤの利得値が釣り合う均衡状態を示す.BN均衡の求解は,意思決定に不確かさが存在する戦略的状況で重要な役割を果たす.例えば,工学においては,悪意の有無が不確かな侵入者をタイプで示したアドホックネットワーク上での侵入・攻撃検知手法では,防衛者は,BN均衡に基づき相手の不確かさを考慮した合理的な防衛をし,電波強度の不確かさをタイプで表現した通信無線混成センサーネットワークの電力計画問題では,各ノードには,BN均衡に基づき電力計画が立てられる.
m0t0k1ch1.icon キーワード:「ベイジアンナッシュ(BN)均衡」
---.icon
2 ベイジアンゲーム
本稿では,2 人 2 行動 2 タイプのベイジアンゲーム$ G(\mathcal{N}, \mathcal{A}, \Theta, u, \mu, S)を対象にする.
$ \mathcal{N} := \{1, 2\}は,プレイヤ集合,
$ \mathcal{A} := \mathcal{A}_1 \times \mathcal{A}_2は,行動集合であり$ a_i \in \mathcal{A}_i := \{\underline{a}, \overline{a}\} ~ \forall{i} \in \mathcal{N}は,プレイヤ$ iの行動,
$ \Theta := \Theta_1 \times \Theta_2は,タイプ集合であり$ \theta_i \in \Theta_i := \{\underline{\theta}, \overline{\theta}\} ~ \forall{i} \in \mathcal{N}はプレイヤ$ iのタイプ($ \theta = (\theta_1, \theta_2) \in \Theta),
$ u := (u_1, u_2)は,効用であり,$ u_i : \mathcal{A} \times \Theta \rightarrow \mathbb{R} ~ \forall{i} \in \mathcal{N}は,プレイヤ$ iの効用,
$ \mu := (\mu_1, \mu_2)は,信念であり,$ \mu_i \in \Pi(\Theta_i) ~ \forall{i} \in \mathcal{N}は,プレイヤ$ iの信念,
$ S := S_1 \times S_2は,戦略集合であり,$ S_i : \Theta_i \rightarrow \Pi(\mathcal{A}_i) ~ \forall{i} \in \mathcal{N}は,プレイヤ$ iの戦略集合を示す.
ここで,$ \Pi(X)は,有限集合$ X上の確率分布を示す.
加えて,$ -iは,プレイヤ$ iを除く,他のプレイヤを示す.例えば,$ i = 1のとき$ a_{-i} = a_2である.
m0t0k1ch1.icon $ \timesは直積
プレイヤの戦略,混合戦略,完全混合戦略,信念を示す.
タイプ$ \theta_iにおけるプレイヤ$ iの戦略$ s_i(\theta_i) \in S_i(\Theta_i)は,$ s_i(\theta_i) = \lbrack s_i(\underline{a} \mid \theta_i) ~ s_i(\overline{a} \mid \theta_i) \rbrack^{\mathrm{T}}を表す.
ここで,$ s_i(\underline{\theta}) \geq 0,$ s_i(\overline{\theta}) \geq 0,$ s_i(\underline{a} \mid \theta_i) + s_i(\overline{a} \mid \theta_i) = 1 ~ \forall{\theta_i} \in \Theta_i ~ \forall{i} \in \mathcal{N}を満たす戦略を混合戦略と呼ぶ.
このとき,戦略の組$ s \in Sは,$ s := \lbrack s_1 ~ s_2 \rbrack^{\mathrm{T}},$ s_i := \lbrack s_i(\underline{\theta}) ~ s_i(\overline{\theta}) \rbrack^{\mathrm{T}} ~ \forall{i} \in \mathcal{N}と表す.
特に,$ s_i(a_i \mid \theta_i) \neq 0 ~ \forall{a_i} \in \mathcal{A} ~ \forall{\theta_i} \in \Theta_i ~ \forall{i} \in \mathcal{N}を満たす混合戦略を完全混合戦略と呼ぶ.
信念の組$ \muは,$ \mu := \lbrack \mu_1 ~ \mu_2 \rbrack^{\mathrm{T}},$ \mu_i := \lbrack \mu_i(\underline{\theta}) ~ \mu_i(\overline{\theta}) \rbrack^{\mathrm{T}} ~ \forall{i} \in \mathcal{N}と表し,
$ \mu_i(\underline{\theta}) > 0,$ \mu_i(\overline{\theta}) > 0,$ \mu_i(\underline{\theta}) + \mu_i(\overline{\theta}) = 1 ~ \forall{\theta_i} \in \Theta_i ~ \forall{i} \in \mathcal{N}を満たす.
いま,信念が互いに独立であると仮定すれば,プレイヤ$ iから見て,あるゲームが選ばれる確率は,$ p_i(\theta_i, \theta_{-i}) = \mu_i(\theta_i)\mu_{-i}(\theta_{-i})となり,その確率分布$ p_i \in \Pi(\Theta)は,
$ p_i := \lbrack p_i(\underline{\theta}, \underline{\theta}) ~ p_i(\underline{\theta}, \overline{\theta}) ~ p_i(\overline{\theta}, \underline{\theta}) ~ p_i(\overline{\theta}, \overline{\theta}) \rbrack^{\mathrm{T}}
$ ~~~~~ = \lbrack p_{i1}, p_{i2}, p_{i3}, p_{i4} \rbrack^{\mathrm{T}} ~ \forall{i} \in \mathcal{N}
となる.
m0t0k1ch1.icon $ s = \lbrack s_1 ~ s_2 \rbrack^{\mathrm{T}} = \lbrack s_1(\underline{\theta}) ~ s_1(\overline{\theta}) ~ s_2(\underline{\theta}) ~ s_2(\overline{\theta}) \rbrack^{\mathrm{T}}
$ ~~~~~~~~ = \lbrack s_1(\underline{a} \mid \underline{\theta}) ~ s_1(\overline{a} \mid \underline{\theta}) ~ s_1(\underline{a} \mid \overline{\theta}) ~ s_1(\overline{a} \mid \overline{\theta}) ~ s_2(\underline{a} \mid \underline{\theta}) ~ s_2(\overline{a} \mid \underline{\theta}) ~ s_2(\underline{a} \mid \overline{\theta}) ~ s_2(\overline{a} \mid \overline{\theta}) \rbrack^{\mathrm{T}}
m0t0k1ch1.icon $ \mu = \lbrack \mu_1, \mu_2 \rbrack^{\mathrm{T}} = \lbrack \mu_1(\underline{\theta}) ~ \mu_1(\overline{\theta}) ~ \mu_2(\underline{\theta}) ~ \mu_2(\overline{\theta}) \rbrack^{\mathrm{T}}
m0t0k1ch1.icon 完全混合戦略では、どんなタイプのときもあらゆる行動をとる可能性が 0 ではない
タイプの組$ \theta = (\theta_i, \theta_{i - 1})における利得行列$ U_i(\theta_i, \theta_{-i})は
$ U_i(\theta_i, \theta_{-i}) := \begin{bmatrix} u_i(\underline{a}, \underline{a}, \theta_i, \theta_{-i}) & u_i(\underline{a}, \overline{a}, \theta_i, \theta_{-i}) \\\ u_i(\overline{a}, \underline{a}, \theta_i, \theta_{-i}) & u_i(\overline{a}, \overline{a}, \theta_i, \theta_{-i}) \end{bmatrix}
で表す.各要素は,効用$ u_i(a_i, a_{-i}, \theta_i, \theta_{-i})であり,
$ u_i(a_i, a_{-i}, \theta_i, \theta_{-i}) = u_{ijk}
$ j \in \{1, 2, 3, 4\} := \{(\underline{a}, \underline{a}), (\underline{a}, \overline{a}), (\overline{a}, \underline{a}), (\overline{a}, \overline{a})\}
$ k \in \{1, 2, 3, 4\} := \{(\underline{\theta}, \underline{\theta}), (\underline{\theta}, \overline{\theta}), (\overline{\theta}, \underline{\theta}), (\overline{\theta}, \overline{\theta})\}
例えば,$ u_i(\underline{a}, \overline{a}, \overline{\theta}, \underline{\theta}) = u_{i23}となる.
加えて,完全混合戦略を$ xで表し,$ x = \lbrack x_1 ~ x_2 \rbrack^{\mathrm{T}},$ x_i := \lbrack s_i(\underline{a} \mid \underline{\theta}) ~ s_i(\underline{a} \mid \overline{\theta}) \rbrack^{\mathrm{T}} ~ \forall{i} \in \mathcal{N}とする.
以下,同様の記法とする.
m0t0k1ch1.icon $ x = \lbrack x_1, x_2 \rbrack = \lbrack s_1(\underline{a} \mid \underline{\theta}) ~ s_1(\underline{a} \mid \overline{\theta}) ~ s_2(\underline{a} \mid \underline{\theta}) ~ s_2(\underline{a} \mid \overline{\theta}) \rbrack^{\mathrm{T}}
m0t0k1ch1.icon ん?$ xは完全混合戦略なのか?$ s_i(\overline{a} \mid \theta_i)はどう考えればよい?
ベイジアンゲーム$ Gは,意思決定での不確かさを各プレイヤの内面情報を示すタイプ$ \theta_iとタイプが選ばれる確率の信念$ \mu_iで表現される.本稿では,BN均衡の定義を省略し,完全混合戦略からなるBN均衡の完全混合戦略BN均衡を扱う.信念$ \muと完全混合戦略$ xの組$ (\mu, x)をアセスメントと呼び,ある信念$ \mu^*とそれに対応する完全混合戦略BN均衡$ x^*の組$ (\mu^*, x^*)を均衡アセスメントと呼ぶ.以後,均衡アセスメントを用い議論するため,右肩のアスタリスクは,省略する.
m0t0k1ch1.icon 冒頭でも述べられていた通り、ベイジアンゲームの特徴はタイプ$ \theta_iと信念$ \mu_iの存在
---.icon
3 主結果
m0t0k1ch1.icon skip
---.icon
4 数値例
m0t0k1ch1.icon skip
---.icon
5 おわりに
m0t0k1ch1.icon skip