戦略形ゲームとは? わかりやすく解説

Weblio 辞書 > 学問 > OR事典 > 戦略形ゲームの意味・解説 

戦略形ゲーム

読み方せんりゃくけいげーむ
【英】:strategic form game

概要

プレイヤー集合, 各プレイヤーのとりうる戦略集合, および, 各プレイヤー利得関数記述することによりゲーム表現する形式. 標準形ゲームともいう.

詳説

 ゲーム参加するプレイヤー集合N\, , 各プレイヤーi\, のとりうる戦略全体S_i\, , およびS=S_1 \times \cdots \times S_n\, 上で定義された各プレイヤーi\, フォンノイマン・モルゲンシュテルン効用関数 (von Neumann-Morgenstern utility function) をu_i\, とするとき,


G=(N; S_1, \ldots , S_n; u_1, \ldots , u_n)\,


戦略形ゲーム (game in strategic form) または標準形ゲーム (game in normal form) という. N\, S_i\, がすべて有限集合であるとき, G\, 有限ゲームという. 効用関数u_i\, は, また利得関数 (payoff function) ともいい, その値を利得という.

 戦略形書かれゲームは, 特にことわらない限り非協力ゲームである. 戦略の数が有限な2人ゲーム次のような利得双行列 (payoff bimatrix) で表現することができるので, 双行列ゲーム (bimatrix game) ということがある.


Sk-0071-a-g-03-1.png


 ここに, 縦の1, \ldots, m\, プレイヤー1戦略, 横の1, \ldots, n\, プレイヤー2戦略であり, a_{ij}, b_{ij}\, は, プレイヤー1, 2が各々戦略i, \ j\, をとったときの, プレイヤー1, 2の利得である. a_{ij}\, 成分とする行列A\, , b_{ij}\, 成分とする行列B\, 表し, 利得双行列簡単に(A, B)\, と表す. すべてのi, \ j\, について, a_{ij} + b_{ij} = 0\, となる場合2人ゼロ和ゲーム (two-person zerosum game) の戦略形である. 行列B\, A\, 符号変えたものであり, 行列A\, だけでゲーム記述できるので2人ゼロ和ゲーム行列ゲーム (matrix game) ということもある.

 双行列ゲーム(A, B)\, において, 各プレイヤー混合戦略 (mixed strategy) を各々p=(p_1, \ldots , p_m)\, , q=( q_1, \ldots , q_n)\, とすると, 各プレイヤー利得期待値 (期待利得) は各々 pAq^{\top}\, および pBq^{\top}\, 与えられる. q^{\top}\, q\, 転置ベクトルを表す. また, 混合戦略に対してもとの戦略純戦略 (pure strategy) という. ナッシュ均衡 (p^*, q^*)\, は, 非協力ゲーム理論の項で述べた定義によって,


p^*Aq^{*\top} \ge pAq^{*\top}, \ p^*Bq^{*\top} \ge p^*Bq^{\top}, \ \mbox{ for all } p, \ q \,


をみたす混合戦略の組である. とくに, ゼロ和ゲームでは, B=-A\, であるから


pAq^{*\top} \le p^*Aq^{*\top} \le p^*Aq^{\top} , \ \ \mbox{ for all } p, \ q \,


となり, これからミニマックス定理 (minimax theorem) 


\mbox{max}_{p} \mbox{min}_{q} \ pAq^{\top} \ =\ \mbox{min}_{q}\mbox{max}_{p}\ \ pAq^{\top} \,


導かれ, さらにこの値はp^*Aq^{*\top}\, 等しい. 左辺の値をマックスミニ値 (maxmin value), 右辺の値をミニマックス値(minimax value), さらに, この共通の値をゲームの値 (value of a game) という. また, このときの戦略p^*, \ q^*\, 各々マックスミニ戦略 (maxmin strategy), ミニマックス戦略 (minimax strategy) という.  次に示すのは, 左が囚人のジレンマ (prisoner's dilemma), 右が逢い引きジレンマ (battle of the sexes) という名で知られる有名な双行列ゲームである.


Sk-0071-a-g-03-2.png


囚人のジレンマでは, 純戦略の組 (d, \ d)\, のみが, また, 逢い引きジレンマでは, 純戦略の組 (a, \ a)\, および(b, \ b)\, と, 混合戦略の組 ((2/3, 1/3)\, , (1/3, 2/3))\, ナッシュ均衡である. とくに, 囚人のジレンマナッシュ均衡では, 戦略d\, 相手すべての戦略対す最適反応 (best reply) となっている. このようなナッシュ均衡を, 支配戦略均衡 (dominant strategy equilibrium) ということがある. 逢い引きジレンマには支配戦略存在しない. また, 逢い引きジレンマでは, 混合戦略ナッシュ均衡における利得の組(2/3, \ 2/3)\, は, たとえば純粋戦略ナッシュ均衡(a, \ a)\, における利得の組(2, \ 1)\, に対してプレイヤーについて劣っている. このとき, 利得の組(2/3, \ 2/3)\, (2, \ 1)\, パレート支配 (Pareto dominate) されるという.

 戦略形ゲームにおいて, もし, 各プレイヤーが共通の偶然機構もとづいて戦略を選ぶことが許されているならば, 各プレイヤー互いに相関した行動をとることができる. このような戦略相関戦略 (correlated strategy) という. たとえば, 逢い引きジレンマで, コインを投げて表が出た戦略の組(a, \ a)\, , 裏が出た(b, \ b)\, とすることに2人合意したとしよう. つまり, 2人とも, 表が出たa\, をとり, 裏が出たb\, をとるという相関戦略をとるものとする. このような合意ナッシュ均衡になるとき, すなわち, 相関戦略の組がナッシュ均衡となっているとき, これを相関均衡 (correlated equilibrium) という. 上に述べた相関戦略の組は相関均衡であり, 2人期待利得はともに3/2\, となることが容易にわかる. また, 混合戦略均衡互いに独立相関戦略からなる相関均衡ほかならない. 相関均衡正式な定義については, たとえば [3] など参照.  


 以上のゲームでは, 戦略形G\, についての知識すべてのプレイヤーの間で共有知識 (common knowledge) であると仮定されており, これらは完備情報ゲーム (game with complete information) といわれている. 他方, 不完備情報ゲームはハルサーニ(J. C. Harsanyi) [2] の定式化によって分析できるようになった. たとえば, 利得関数u_i\, に関する情報が不完備場合は, まず有限個のパラメターt_{i1}, t_{i2}, \ldots, t_{ik} \in T_i\, 導入し, プレイヤーi\, 利得関数は, そのタイプによって, 有限個の利得関数u_i(\cdot|t_{i1}), u_i(\cdot| t_{i2}), \ldots, u_i(\cdot| t_{ik})\, (以下, まとめてu_{i}(\cdot|t_{i})\, と表す. )のうちのどれか1つ定まる, と定式化し直すことにより, u_{i}\, に関する完備情報表現する. このt_i \in T_i\, プレイヤーi\, タイプという. 各プレイヤーi\, 自分はどのタイプであるかを知っているが, 他のプレイヤータイプ知らない. ただし, 他のすべてのプレイヤータイプt_{-i} = (t_1 , \ldots, t_{i-1}, t_{i+1}, \ldots , t_n )\, について条件付き確率p_i(t_{-i}|t_i)\, によってt_{-i}\, 推測することができるとする. こうして, 新たな戦略形ゲーム


G'= (N, S_1, \ldots , S_n;
 p_1, \ldots , p_n; T_1, \ldots, T_n;
 u_1(\cdot|t_1), \ldots , u_n(\cdot|t_n))\,


えられる. これをベイジアンゲーム (Bayesian game) という. また, 関数s_i : T_i \rightarrow S_i\, ベイジアンゲーム戦略という. すなわち, プレイヤーi\, は, 自分タイプ知ってはいるが, どのタイプであったとしてもそのもとでの行動指定しておくことがこの場合戦略である. するとナッシュ均衡は, すべてのプレイヤーi\, タイプt_i\, およびa_{i} \in S_{i}\, について次の条件をみたす戦略の組s^*=(s^*_1, \ldots , s^*_n)\, である. この戦略の組を, ベイジアンナッシュ均衡 (Bayesian Nash equilibrium) という.


\sum_{t_{-i} \in T_{-i}} u_i(s^*(t)|t_i)p_i(t_{-i}|t_i) 
 \ \ge\ \sum_{t_{-i} \in T_{-i}} u_i(s^*_{-i}(t_{-i}), a_i
 | t_i)p_i(t_{-i}|t_i)\,


ただし, s^*(t)=(s^*_{-i}(t_{-i}), s^*_i(t_i))=(s^*_1(t_1), \ldots, s^*_n(t_n))\, である. ベイジアンゲームは, 80年代以降, 情報経済学産業組織論などの新し分野発展大きく貢献している. これについてはたとえば, [1] を参照.



参考文献

[1] R. Gibbons, Game Theory for Applied Economists, Princeton University Press, 1992. /福岡正夫, 須田伸一, 『経済学のためのゲーム理論入門』, 創文社, 1995.

[2] J. C. Harsanyi, "Games with Incomplete Information Played by `Bayesian' Players, parts I, II and III", Management Science, 14 (1967-8), 159-182, 320-334, 486-502.

[3] M. J. Osborne and A. Rubinstein, A Course in Game Theory, MIT Press, 1994.

「OR事典」の他の用語
ゲーム理論:  市場ゲーム  微分ゲーム  情報集合  戦略形ゲーム  投票ゲーム  探索ゲーム  提携

標準型ゲーム

(戦略形ゲーム から転送)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/08/31 18:55 UTC 版)

標準型ゲーム(ひょうじゅんがたげーむ、: normal form game)は、展開型ゲームと並び非協力ゲームの基本的表現形式であり、プレイヤー集合、戦略空間、利得関数の 3 つの要素から構成される。展開型ゲームは標準型ゲームより多くの情報を含んでおり、すべての展開型ゲームは標準型ゲームに変換することができる。一方、標準型ゲームは同時手番ゲームとみなすことができる。プレイヤー集合及び戦略空間が有限集合のとき、ナッシュ均衡および完全均衡が混合戦略の範囲で存在することが知られている(ナッシュの定理)。
標準型ゲームは、正規形ゲームあるいは戦略型ゲーム: strategic form game)とも呼ばれる。


  1. ^ 双行列ゲームとは何? Weblio辞書”. 2021年1月24日閲覧。
  2. ^ 渡辺隆裕『ゼミナール ゲーム理論入門』日本経済新聞出版、2008年4月7日。ISBN 978-4-532-13346-7 


「標準型ゲーム」の続きの解説一覧


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「戦略形ゲーム」の関連用語

戦略形ゲームのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



戦略形ゲームのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
日本オペレーションズ・リサーチ学会日本オペレーションズ・リサーチ学会
Copyright (C) 2024 (社)日本オペレーションズ・リサーチ学会 All rights reserved.
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの標準型ゲーム (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2024 GRAS Group, Inc.RSS