支配戦略均衡
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/01/22 20:27 UTC 版)
「囚人のジレンマ」も参照 純粋戦略ゲーム (Pure strategy game) とは、参加者 (プレーヤー) が必ずどれかの戦略を選ぶゲームである。例えば、以下の表は、二人のプレーヤー Pa と Pb がそれぞれ戦略(A1 または A2)と(B1 または B2)を選べるときの、それぞれの利得を示す。並んだ数字の左側は Pa の利得、右側は Pb の利得である。 Pa/Pb B1 B2 A1 5, 2 2, 4 A2 4, 6 1, 6 まず Pa の利得に注目すると、Pb がどちらの戦略を選ぼうが、Pa は A1 戦略を選んだ方がより大きな利得を得ることができる。このような関係が成り立つとき、A1 は強支配戦略であると表現する。支配するとは、ある戦略を選ぶことが他方の戦略を選ぶより有利であるという意味である。 次に Pb の利得に注目すると、Pa がどちらに戦略を選んでも、B2 戦略を選んだ方が B1 戦略のとき以上の利得を得られる。Pa が A2 戦略を選んだ場合には B1 と B2 は同等になるので、このような関係のとき B2 は弱支配戦略であるという。 結果として、Pa にとっての最適戦略は A1、Pb にとっての最適戦略は B2 となり、両者ともここから戦略を変更しても利得は減る。この組み合わせ (A1, B2) が支配戦略均衡となる。 Pa、Pb が (A1, B2) という戦略をとった場合、Paは戦略を変更して A2 をとれば利得が 2 から 1 へ減少してしまうため、戦略を変更する誘因を持たない。同様に Pb も、戦略を変更して B1 をとれば利得が 4 から 2 へ減少してしまうため、戦略を変更する誘因を持たない。従ってこの例では支配戦略均衡はナッシュ均衡である。 なお、Pa、Pb が (A2, B1) という戦略をとった場合の利得は (4, 6) となり、ナッシュ均衡における利得と比べて Pa、Pb ともにより大きな利得を得ることができる。この場合、Pa がより大きな 5 の利得を得るため A1 に戦略を変更する誘因を持つため、ナッシュ均衡ではない。すなわち、このゲームは囚人のジレンマゲームである。また、(A1, B2) から (A2, B1) への戦略変更は、パレート改善であり、ナッシュ均衡 (A1, B2) はパレート効率的ではない。
※この「支配戦略均衡」の解説は、「ナッシュ均衡」の解説の一部です。
「支配戦略均衡」を含む「ナッシュ均衡」の記事については、「ナッシュ均衡」の概要を参照ください。
- 支配戦略均衡のページへのリンク