将来を割り引くケース
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/12/09 14:11 UTC 版)
「囚人のジレンマ」の記事における「将来を割り引くケース」の解説
上記の平均利得を最大化するという設定は、プレイヤーが無限に忍耐強くて将来を割り引かないことを意味しており、現実的とはいえない。プレイヤーが将来を割り引く場合については、次の通りである。 プレイヤーは将来の利得を一定の割引因子 δ ∈ ( 0 , 1 ) {\displaystyle \delta \in (0,1)} で割り引いていくものとし、そうして割り引いた割引利得の総和を最大化するものと想定しよう。お互いトリガー戦略をとると互いに協調しつづけるので、毎回の利得は2であり割引利得の総和は 2 + 2 δ + 2 δ 2 + … = 2 1 − δ = S 1 {\displaystyle 2+2\delta +2\delta ^{2}+\ldots ={\frac {2}{1-\delta }}=S_{1}} である。一方、自分がトリガー戦略から逸脱して裏切った場合、裏切った回で利得3をとるが、その後の利得はせいぜい1であるので、割引利得の総和は 3 + 1 δ + 1 δ 2 + … = 3 + 1 δ 1 − δ = S 2 {\displaystyle 3+1\delta +1\delta ^{2}+\ldots =3+{\frac {1\delta }{1-\delta }}=S_{2}} である。すなわち, δ ≥ 1 / 2 {\displaystyle \delta \geq 1/2} であれば S 1 ≥ S 2 {\displaystyle S_{1}\geq S_{2}} となるので,裏切っても割引利得の総和が増えず、裏切るインセンティブがないので、トリガー戦略はナッシュ均衡になる。すなわち割引因子が十分に高い場合に協調が生まれる可能性がある。
※この「将来を割り引くケース」の解説は、「囚人のジレンマ」の解説の一部です。
「将来を割り引くケース」を含む「囚人のジレンマ」の記事については、「囚人のジレンマ」の概要を参照ください。
- 将来を割り引くケースのページへのリンク