せんりゃくけいげーむとは? わかりやすく解説

Weblio 辞書 > 学問 > OR事典 > せんりゃくけいげーむの意味・解説 

戦略形ゲーム

読み方:せんりゃくけいげーむ
【英】:strategic form game

概要

プレイヤー集合, 各プレイヤーのとりうる戦略集合, および, 各プレイヤー利得関数記述することによりゲーム表現する形式. 標準形ゲームともいう.

詳説

 ゲーム参加するプレイヤー集合N\, , 各プレイヤーi\, のとりうる戦略全体S_i\, , およびS=S_1 \times \cdots \times S_n\, 上で定義された各プレイヤーi\, フォンノイマン・モルゲンシュテルン効用関数 (von Neumann-Morgenstern utility function) をu_i\, とするとき,


G=(N; S_1, \ldots , S_n; u_1, \ldots , u_n)\,


戦略形ゲーム (game in strategic form) または標準形ゲーム (game in normal form) という. N\, S_i\, がすべて有限集合であるとき, G\, 有限ゲームという. 効用関数u_i\, は, また利得関数 (payoff function) ともいい, その値を利得という.

 戦略形書かれゲームは, 特にことわらない限り非協力ゲームである. 戦略の数が有限な2人ゲーム次のような利得双行列 (payoff bimatrix) で表現することができるので, 双行列ゲーム (bimatrix game) ということがある.


Sk-0071-a-g-03-1.png


 ここに, 縦の1, \ldots, m\, プレイヤー1戦略, 横の1, \ldots, n\, プレイヤー2戦略であり, a_{ij}, b_{ij}\, は, プレイヤー1, 2が各々戦略i, \ j\, をとったときの, プレイヤー1, 2の利得である. a_{ij}\, 成分とする行列A\, , b_{ij}\, 成分とする行列B\, 表し, 利得双行列簡単に(A, B)\, と表す. すべてのi, \ j\, について, a_{ij} + b_{ij} = 0\, となる場合2人ゼロ和ゲーム (two-person zerosum game) の戦略形である. 行列B\, A\, 符号変えたものであり, 行列A\, だけでゲーム記述できるので2人ゼロ和ゲーム行列ゲーム (matrix game) ということもある.

 双行列ゲーム(A, B)\, において, 各プレイヤー混合戦略 (mixed strategy) を各々p=(p_1, \ldots , p_m)\, , q=( q_1, \ldots , q_n)\, とすると, 各プレイヤー利得期待値 (期待利得) は各々 pAq^{\top}\, および pBq^{\top}\, 与えられる. q^{\top}\, q\, 転置ベクトルを表す. また, 混合戦略に対してもとの戦略純戦略 (pure strategy) という. ナッシュ均衡 (p^*, q^*)\, は, 非協力ゲーム理論の項で述べた定義によって,


p^*Aq^{*\top} \ge pAq^{*\top}, \ p^*Bq^{*\top} \ge p^*Bq^{\top}, \ \mbox{ for all } p, \ q \,


をみたす混合戦略の組である. とくに, ゼロ和ゲームでは, B=-A\, であるから


pAq^{*\top} \le p^*Aq^{*\top} \le p^*Aq^{\top} , \ \ \mbox{ for all } p, \ q \,


となり, これからミニマックス定理 (minimax theorem) 


\mbox{max}_{p} \mbox{min}_{q} \ pAq^{\top} \ =\ \mbox{min}_{q}\mbox{max}_{p}\ \ pAq^{\top} \,


導かれ, さらにこの値はp^*Aq^{*\top}\, 等しい. 左辺の値をマックスミニ値 (maxmin value), 右辺の値をミニマックス値(minimax value), さらに, この共通の値をゲームの値 (value of a game) という. また, このときの戦略p^*, \ q^*\, 各々マックスミニ戦略 (maxmin strategy), ミニマックス戦略 (minimax strategy) という.  次に示すのは, 左が囚人のジレンマ (prisoner's dilemma), 右が逢い引きジレンマ (battle of the sexes) という名で知られる有名な双行列ゲームである.


Sk-0071-a-g-03-2.png


囚人のジレンマでは, 純戦略の組 (d, \ d)\, のみが, また, 逢い引きジレンマでは, 純戦略の組 (a, \ a)\, および(b, \ b)\, と, 混合戦略の組 ((2/3, 1/3)\, , (1/3, 2/3))\, ナッシュ均衡である. とくに, 囚人のジレンマナッシュ均衡では, 戦略d\, 相手すべての戦略対す最適反応 (best reply) となっている. このようなナッシュ均衡を, 支配戦略均衡 (dominant strategy equilibrium) ということがある. 逢い引きジレンマには支配戦略存在しない. また, 逢い引きジレンマでは, 混合戦略ナッシュ均衡における利得の組(2/3, \ 2/3)\, は, たとえば純粋戦略ナッシュ均衡(a, \ a)\, における利得の組(2, \ 1)\, に対してプレイヤーについて劣っている. このとき, 利得の組(2/3, \ 2/3)\, (2, \ 1)\, パレート支配 (Pareto dominate) されるという.

 戦略形ゲームにおいて, もし, 各プレイヤーが共通の偶然機構もとづいて戦略を選ぶことが許されているならば, 各プレイヤー互いに相関した行動をとることができる. このような戦略相関戦略 (correlated strategy) という. たとえば, 逢い引きジレンマで, コインを投げて表が出た戦略の組(a, \ a)\, , 裏が出た(b, \ b)\, とすることに2人合意したとしよう. つまり, 2人とも, 表が出たa\, をとり, 裏が出たb\, をとるという相関戦略をとるものとする. このような合意ナッシュ均衡になるとき, すなわち, 相関戦略の組がナッシュ均衡となっているとき, これを相関均衡 (correlated equilibrium) という. 上に述べた相関戦略の組は相関均衡であり, 2人期待利得はともに3/2\, となることが容易にわかる. また, 混合戦略均衡互いに独立相関戦略からなる相関均衡ほかならない. 相関均衡正式な定義については, たとえば [3] など参照.  


 以上のゲームでは, 戦略形G\, についての知識すべてのプレイヤーの間で共有知識 (common knowledge) であると仮定されており, これらは完備情報ゲーム (game with complete information) といわれている. 他方, 不完備情報ゲームはハルサーニ(J. C. Harsanyi) [2] の定式化によって分析できるようになった. たとえば, 利得関数u_i\, に関する情報が不完備場合は, まず有限個のパラメターt_{i1}, t_{i2}, \ldots, t_{ik} \in T_i\, 導入し, プレイヤーi\, 利得関数は, そのタイプによって, 有限個の利得関数u_i(\cdot|t_{i1}), u_i(\cdot| t_{i2}), \ldots, u_i(\cdot| t_{ik})\, (以下, まとめてu_{i}(\cdot|t_{i})\, と表す. )のうちのどれか1つ定まる, と定式化し直すことにより, u_{i}\, に関する完備情報表現する. このt_i \in T_i\, プレイヤーi\, タイプという. 各プレイヤーi\, 自分はどのタイプであるかを知っているが, 他のプレイヤータイプ知らない. ただし, 他のすべてのプレイヤータイプt_{-i} = (t_1 , \ldots, t_{i-1}, t_{i+1}, \ldots , t_n )\, について条件付き確率p_i(t_{-i}|t_i)\, によってt_{-i}\, 推測することができるとする. こうして, 新たな戦略形ゲーム


G'= (N, S_1, \ldots , S_n;
 p_1, \ldots , p_n; T_1, \ldots, T_n;
 u_1(\cdot|t_1), \ldots , u_n(\cdot|t_n))\,


えられる. これをベイジアンゲーム (Bayesian game) という. また, 関数s_i : T_i \rightarrow S_i\, ベイジアンゲーム戦略という. すなわち, プレイヤーi\, は, 自分タイプ知ってはいるが, どのタイプであったとしてもそのもとでの行動指定しておくことがこの場合戦略である. するとナッシュ均衡は, すべてのプレイヤーi\, タイプt_i\, およびa_{i} \in S_{i}\, について次の条件をみたす戦略の組s^*=(s^*_1, \ldots , s^*_n)\, である. この戦略の組を, ベイジアンナッシュ均衡 (Bayesian Nash equilibrium) という.


\sum_{t_{-i} \in T_{-i}} u_i(s^*(t)|t_i)p_i(t_{-i}|t_i) 
 \ \ge\ \sum_{t_{-i} \in T_{-i}} u_i(s^*_{-i}(t_{-i}), a_i
 | t_i)p_i(t_{-i}|t_i)\,


ただし, s^*(t)=(s^*_{-i}(t_{-i}), s^*_i(t_i))=(s^*_1(t_1), \ldots, s^*_n(t_n))\, である. ベイジアンゲームは, 80年代以降, 情報経済学産業組織論などの新し分野発展大きく貢献している. これについてはたとえば, [1] を参照.



参考文献

[1] R. Gibbons, Game Theory for Applied Economists, Princeton University Press, 1992. /福岡正夫, 須田伸一, 『経済学のためのゲーム理論入門』, 創文社, 1995.

[2] J. C. Harsanyi, "Games with Incomplete Information Played by `Bayesian' Players, parts I, II and III", Management Science, 14 (1967-8), 159-182, 320-334, 486-502.

[3] M. J. Osborne and A. Rubinstein, A Course in Game Theory, MIT Press, 1994.

「OR事典」の他の用語
ゲーム理論:  市場ゲーム  微分ゲーム  情報集合  戦略形ゲーム  投票ゲーム  探索ゲーム  提携



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「せんりゃくけいげーむ」の関連用語

せんりゃくけいげーむのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



せんりゃくけいげーむのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
日本オペレーションズ・リサーチ学会日本オペレーションズ・リサーチ学会
Copyright (C) 2024 (社)日本オペレーションズ・リサーチ学会 All rights reserved.

©2024 GRAS Group, Inc.RSS