ゲーム理論による分析
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/07/09 00:30 UTC 版)
「スタグハントゲーム」の記事における「ゲーム理論による分析」の解説
スタグハントでは、(stag, stag) が純粋ナッシュ均衡であるが、(rabbit, rabbit) も同じく純粋ナッシュ均衡である。stag=1、rabbit=0 という具合に、戦略を数字で定義した場合、利得は2つの数字の最小値に依存する。すなわち、利得は π i ( s i j , s − i k ) = 1 + 2 ⋅ min ( s i j , s − i k ) − s i j {\displaystyle \pi _{i}(s_{i}^{j},s_{-i}^{k})=1+2\cdot \min(s_{i}^{j},s_{-i}^{k})-s_{i}^{j}} と記述することができる。相手のプレイヤーが stag を選択する確率が高いことが保証されているならば、自分も stag を選択すべきである。スタグハントにおける戦略の不確実性は、プレイヤー間での共通の動機(どうにか (stag, stag) で協調し、利得2を獲得したい気持ち)と、プレイヤーの個人的な動機(相手が rabbit を選択すれば利得が0になるリスクを回避したい気持ち)とが対立することによるものである。 スタグハントは、行動に関する基本的選択原理を示すものである。均衡 (stag, stag) は、全てのプレイヤーにとって (rabbit, rabbit) よりも高い利得が得られる均衡であることから、利得支配と呼ばれている。一方、rabbit を選択することは、保証されている利得 (minimum) が最も高い (maximum) ことから、マキシミンと呼ばれている。 危険支配均衡は、プレイヤーの共有のリスクを最小化する均衡であり、他のプレイヤーが均衡から逸脱することによる損失の積によって求められる。例えば、プレイヤーが (stag, stag) を均衡として捉え、stag をプレイするならば、もう一方のプレイヤーがその均衡と異なる行動 (rabbit) を採ったとき、そのプレイヤーが被る損失は2であり、両者の積は4である。だが、もしプレイヤーが (rabbit, rabbit) を均衡として捉え、rabbit をプレイするならば、もう一方のプレイヤーがその均衡とは異なる行動を採ろうとも、それによって被る損失は0である。故に、(rabbit, rabbit) は危険支配である。
※この「ゲーム理論による分析」の解説は、「スタグハントゲーム」の解説の一部です。
「ゲーム理論による分析」を含む「スタグハントゲーム」の記事については、「スタグハントゲーム」の概要を参照ください。
- ゲーム理論による分析のページへのリンク