摂動完全均衡
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/05/05 23:19 UTC 版)

摂動完全均衡 (せつどうかんぜんきんこう,英: trembling hand perfect equilibrium, 独: trembling-hand-perfektes Gleichgewicht) とは,ナッシュ均衡の精緻化のひとつ。1975 年に International Journal of Game Theory 誌に掲載された論文において,“A Model of Slight Mistakes” (軽微な誤りのモデル) の名前で,ラインハルト・ゼルテンによってこの概念が発見された。ここでの狙いは,均衡はプレーヤーたちの誤りによってどの程度影響されるかを決定することである。ゼルテンによれば,プレーヤーたちが完全に合理的に行動するならば,誤りは起こらない。しかし現実では,人びとは相手のプレーヤーの誤った決定を計算に入れねばならない。この点をゲーム理論的に表現するために,摂動完全均衡が生みだされた[1]。
アプローチの簡単な説明
簡単な表現で摂動完全均衡のアイデアを説明しよう。プレーヤー A が,プレーヤー B はかならず戦略 b1 をとってくると考えているとして,その b1 へのプレーヤー A の最適反応は戦略 a1 であるとしよう。戦略 a1 をプレーすることは,もしプレーヤー B が小さな誤り確率 ε で b2 をプレーしてくるとしても,なお最適な選択でありつづけるだろうか。そのような条件でもなお a1 がプレーヤー A の最適戦略であるならば,これは摂動完全均衡戦略であるという。
正規形ゲームにおける摂動完全均衡
A\B | b1 | b2 |
---|---|---|
a1 | (3, 3) | (5, 0) |
a2 | (-2, -2) | (5, 0) |
右の利得行列をもつ正規形ゲームによって,摂動完全均衡のアプローチが非常に簡単に説明できる。
この例における 2 つのナッシュ均衡は (a1, b1) と (a2, b2) である。このどちらが (あるいは両方が) 摂動完全均衡であるかを検討しよう。プレーヤー A は戦略 a1 をプレーしたいと思い,かつプレーヤー B は戦略 b1 をプレーするとすると,両者は 3 の利得を得ることになる。しかしプレーヤー A が,プレーヤー B は小さな誤り確率で戦略 b2 をプレーしてこないともかぎらないというふうに不確かに思う。a1 が,このプレーヤー 2 の誤り確率があってもなおプレーヤー 1 の最適な選択であり,したがって摂動完全である,ということを確かめるには,次のことを確認しなければならない:プレーヤー 1 が a1 を選んだときの期待利得が,a2 を選んだときの期待利得以上である。
ε をプレーヤー B の誤り確率とし,これは非常に小さいものと仮定する。すなわち,その余事象の確率 (正しくプレーする確率) が 1 − ε である。ここで 0 < ε < 1 とする。
すると,a1 を選んだときのプレーヤー 1 の期待利得は,
-
2 人プレーヤーの展開形ゲームのゲームツリー 逐次手番ゲームに対しても,摂動完全均衡の概念を応用できる。正規形ゲームの場合と同じようにこの場合も,部分ゲーム完全均衡からのふるいわけには,小さな誤り確率があっても残るものを探しだすことが有用である。
例
右のものには 4 つの部分ゲーム完全均衡がある。(A, (X, X)), すなわち,プレーヤー 1 は戦略 A をプレーし,プレーヤー 2 は,プレーヤー 1 が A を選んだならば X を,プレーヤー 1 が B を選んだときにも X を選ぶようなものである。ほかの 3 つの部分ゲーム完全均衡は,(A, (Y, X)), (B, (X, X)), (B, (Y, X)).
このうち,プレーヤー 1 が戦略 A を選んでいるような 2 つの均衡だけが摂動完全である。プレーヤー 2 が戦略 Y をプレーする確率は十分小さいのだとしても,プレーヤー 1 にとってはやはり A をプレーすることがよりよい。というのもそうすればかならず 2 の利得が得られ,戦略 B を選んだ場合には戦略 A による場合よりも決してよい結果にはならないからである。
したがって,摂動完全均衡は (A, (X, X)) と (A, (Y, X)) の 2 つになる[5]。
エージェント標準形の展開形ゲームにおける摂動完全均衡
エロン・コールベルグの Dalekspiel の展開形表現 ゲーム理論家エロン・コールベルグによるもので,ここでわずかな修正を施した Dalekspiel が,摂動完全均衡のさらなる応用の例になる。展開形ゲームを正規形ゲームに還元するさいに起こる情報の減少を補うため,1953 年の論文でハロルド・クーンはエージェント標準形 (Agentennormalform) を用いた。右に示した Dalekspiel において,プレーヤー 1 は,それぞれの決定節で相関のない意思決定をするよう数学的に記述するために,2 人のエージェントに分割される[6]。
1\2 L R gl (2, 5) (2, 5) gr (2, 5) (2, 5) ul (4, 1) (0, 0) ur (0, 0) (1, 4) 正規形では,純粋戦略の範囲で (gl, R), (gr, R), (ul, L) という 3 つのナッシュ均衡があることが簡単にわかる。いまこれらの均衡が摂動完全であるかを確かめるためには,プレーヤー 1 の 2 つの決定節における誤り確率が相互に相関していないことを保証せねばならない。すなわち,最初の決定節における誤りが,第 2 の決定節における確率を高めたり低めたりしてはならない。このことを保証するため,プレーヤー 1 は,右に示したように,独立して決定を行う 2 人のエージェントに分割されている。
ここで,次のように仮定する:
- 第 1 のエージェント (Sp1A) は,小さな誤り確率 ε で,g でなく u をプレーしてしまう。
- 同様に,第 2 のエージェント (Sp1B) は,小さな誤り確率 δ で,r でなく l をプレーしてしまう。
- 最後に,プレーヤー 2 は,小さな誤り確率 λ で,R でなく L をプレーしてしまう。
1\2 L R 確率 gl (2, 5) (2, 5) (1 − ε) δ gr (2, 5) (2, 5) (1 − ε)(1 − δ) ul (4, 1) (0, 0) εδ ur (0, 0) (1, 4) ε (1 − δ) 確率 λ 1 − λ このように定められた確率のもとで,前記の正規形は右のようになる (周辺に確率を付記した第 2 の表)。
いまや,小さな λ に対して,プレーヤー 1 には戦略 gr および gl が摂動完全戦略であることが簡単に見てとれる。したがってプレーヤー 1 は,プレーヤー 2 がどのように意思決定したとしても等しい,2 の安全な利得を得る。ul を選ぶことによって得られる唯一のよい利得は 4 だが,確率にもとづいて,期待値で得られる利得は,
- 摂動完全均衡のページへのリンク