ゲームの特徴づけ
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/10/28 04:50 UTC 版)
「ベイジアンゲーム」の記事における「ゲームの特徴づけ」の解説
完備情報の非ベイジアンゲームの正規形表現は、プレーヤーたちの戦略空間と利得関数の特徴づけになっている。プレーヤーの戦略とは、ゲームで起こりうるあらゆる事態に対応する行動の完全な計画であり、これは決して起こりえない事態についてもそのときとるべき行動を定めたものである。プレーヤーの戦略空間は、このプレーヤーがとりうるすべての戦略の集合である。利得関数は、戦略プロファイルの集合から利得の集合 (通常、実数の集合) への関数である。ここに戦略プロファイルとは、すべてのプレーヤーの戦略を特定化したベクトル (組) である。 ベイジアンゲームにおいては、戦略空間、タイプ空間、利得関数、および信念を、各プレーヤーについて特定化する必要がある。プレーヤーの戦略とは、そのプレーヤーがなるかもしれないすべてのタイプについて、起こりうるあらゆる事態をカバーするような行動の完全な計画である。戦略は、実際に実現したタイプを 1 つ所与としてそれについてだけの行動計画であってはならず、もし自分がほかのタイプになっていたならばとったであろう行動をも定めたものでなければならない。戦略空間は前述のとおり。プレーヤーのタイプ空間とは、単にそのプレーヤーのとりうるタイプすべての集合である。プレーヤーの信念は、他のプレーヤーのタイプに関して自分がもっている不確実性を記述したものである。それぞれの信念は、その信念をもつプレーヤー自身のタイプを所与として、他のプレーヤーたちが特定のタイプをもっていることの確率である (すなわち、信念とは条件つき確率 p (他のプレーヤーのタイプ | 自分のタイプ))。 利得関数は戦略プロファイルとタイププロファイルの2変数関数である。プレーヤーが利得関数 U ( x , y ) {\displaystyle U(x,y)} をもち、そのタイプが t {\displaystyle t} であるならば、このプレーヤーが受けとる利得は U ( x ∗ , t ) {\displaystyle U(x^{*},t)} となる。ここに x ∗ {\displaystyle x^{*}} はゲームでとられる戦略プロファイル (戦略の組)。 そのようなゲームの形式的な定義は次のようになるだろう: ゲームは G = ⟨ N , Ω , ⟨ A i , u i , T i , τ i , p i , C i ⟩ i ∈ N ⟩ {\displaystyle G=\langle N,\Omega ,\langle A_{i},u_{i},T_{i},\tau _{i},p_{i},C_{i}\rangle _{i\in N}\rangle } で定められる。ここに、 N {\displaystyle N} はプレーヤーの集合; Ω {\displaystyle \Omega } は自然の状態の集合、たとえばカードゲームではカードの任意の並び順; A i {\displaystyle A_{i}} はプレーヤー i {\displaystyle i} の行動集合で、 A = A 1 × A 2 × ⋯ × A N {\displaystyle A=A_{1}\times A_{2}\times \cdots \times A_{N}} とする; T i {\displaystyle T_{i}} はプレーヤー i {\displaystyle i} のタイプ集合で、関数 τ i : Ω → T i {\displaystyle \tau _{i}:\Omega \to T_{i}} によって決定される。自然の各状態について、ゲームでプレーヤーは異なるタイプをもつ。プレーヤーたちの帰結はタイプを決定するものである。同じ帰結をもつプレーヤーは同じタイプに属する; C i ⊆ A i × T i {\displaystyle C_{i}\subseteq A_{i}\times T_{i}} は、プレーヤー i {\displaystyle i} の T i {\displaystyle T_{i}} に属するタイプがとりうる行動を定める; u i : Ω × A → R {\displaystyle u_{i}:\Omega \times A\to R} はプレーヤー i {\displaystyle i} の利得関数。より形式的には、 L = { ( ω , a 1 , … , a N ) ∣ ω ∈ Ω , ∀ i , ( a i , τ i ( ω ) ) ∈ C i } {\displaystyle L=\{(\omega ,a_{1},\ldots ,a_{N})\mid \omega \in \Omega ,\forall i,(a_{i},\tau _{i}(\omega ))\in C_{i}\}} で、 u i : L → R {\displaystyle u_{i}:L\to R} ; p i {\displaystyle p_{i}} はプレーヤー i {\displaystyle i} にとっての Ω {\displaystyle \Omega } 上の確率分布で、各プレーヤーは自然の状態の確率分布について異なる見解をもっていてよい。ゲームにおいては、彼らは自然の正確な状態を知ることはできない。 純粋戦略 s i : T i → A i {\displaystyle s_{i}:T_{i}\to A_{i}} は,すべての t i {\displaystyle t_{i}} について ( s i ( t i ) , t i ) ∈ C i {\displaystyle (s_{i}(t_{i}),t_{i})\in C_{i}} を満たしていなければならない。したがって各プレーヤーの戦略はそのプレーヤーのタイプにのみ依存する。他のプレーヤーのタイプについては一切の知識を持たないかもしれないからである。戦略プロファイルが与えるプレーヤー i {\displaystyle i} の期待利得は、 u i ( S ) = E ω ∼ p i [ u i ( ω , s 1 ( τ 1 ( ω ) ) , … , s N ( τ N ( ω ) ) ) ] {\displaystyle u_{i}(S)=E_{\omega \sim p_{i}}[u_{i}(\omega ,s_{1}(\tau _{1}(\omega )),\ldots ,s_{N}(\tau _{N}(\omega )))]} となる。 S i {\displaystyle S_{i}} を純粋戦略の集合とする: S i = { s i : T i → A i ∣ ( s i ( t i ) , t i ) ∈ C i , ∀ t i } . {\displaystyle S_{i}=\{s_{i}:T_{i}\rightarrow A_{i}\mid (s_{i}(t_{i}),t_{i})\in C_{i},\forall t_{i}\}.} ゲーム G {\displaystyle G} のベイジアン均衡は、ゲーム G ^ = ⟨ N , A ^ = S 1 × ⋯ × S N , u ^ = u ⟩ {\displaystyle {\hat {G}}=\langle N,{\hat {A}}=S_{1}\times \cdots \times S_{N},{\hat {u}}=u\rangle } の (混合戦略かもしれない) ナッシュ均衡として定義される。したがって、有限ゲーム G {\displaystyle G} については、ベイジアン均衡は常に存在する。
※この「ゲームの特徴づけ」の解説は、「ベイジアンゲーム」の解説の一部です。
「ゲームの特徴づけ」を含む「ベイジアンゲーム」の記事については、「ベイジアンゲーム」の概要を参照ください。
- ゲームの特徴づけのページへのリンク