シグナリングゲーム
(Signaling game から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/07/09 06:39 UTC 版)

シグナリングゲーム (英: signaling game, 独: Signalspiel) は、送り手 (sender, Sender) と受け手 (receiver, Empfänger) という 2 人のプレーヤーによる動学ベイジアンゲームである。送り手は、自然によって決められたあるタイプ t をもっている。送り手は自分のタイプを観察できるが、受け手は送り手のタイプを知ることができない。送り手は自分自身のタイプを知っていることにもとづいて、可能なメッセージ (シグナル) の集合 M = {m1, m2, ..., mK} から送るメッセージを選ぶ。受け手はこのメッセージを観察できるが送り手のタイプについては観察できない。そのあと、受け手は可能な行動の集合 A = {a1, a2, ..., aL} からとる行動を選ぶ。両プレーヤーは、送り手のタイプ、送り手が選んだメッセージ、および受け手が選んだ行動に依存した利得を得る[1][2]。関連のゲームにスクリーニングゲームがある。そこではシグナルにもとづいて行動を選ぶのでなく、受け手が送り手に、送り手のタイプにもとづいた提案をなし、送り手が何らかの決定権をもつ。
概要
大まかに言って、シグナリングゲームは次の 3 つの段階に分けられる:
- 第 1 段階では、偶然手番 (自然とも呼ばれる) によって、送り手のタイプが決定される。
- 第 2 段階では、送り手は、自分の利得を最大化するように、自分のタイプに応じてシグナルを決定する。
- 第 3 段階では、受け手は、送られてきたシグナルをもとに送り手のタイプを推測し、それに応じて最適反応を選択する。
簡単な例
大学教授が新しい職員を探しているとしよう。ここで教授は、筆記試験の添削の手伝いをしてもらうため、非常に勤勉な人物を求めている。応募者は学生で、教授のイメージに合致する成績の人物であったが、しかし教授には、この応募者が勤勉であるか怠惰であるか判定できない。これを判定するため、教授は部屋を用意し、数冊の雑誌が散らかった状態にして、そこで学生に待たせた。勤勉な学生ならば整理してしまうだろうと考えたのである。
- 第 1 段階で、自然によって確率 p で、この学生が勤勉であるかそうでないかが選ばれる。
- 第 2 段階で、学生は雑誌を整理するかどうかを決定することができる。
- 最終段階で、シグナルに従って応募者が勤勉であるか怠惰であるかが判断されたあとで、教授はこの学生を採用するかどうかの決定をする。
形式的定義
プレーヤーのタイプの決定:
- プレーヤーは i で、i は S (送り手) または R (受け手) とする。
- 偶然手番が送り手のタイプ tj ∈ T = {t1, ..., tJ} を決定する (J はありうる送り手のタイプの数)。
行動の選択:
- S はシグナル mk ∈ M = {m1, ..., mK} を選ぶ (K は S が送りうる異なるシグナルの数)。
- R は応答行動 al ∈ A = {a1, ..., aL} を選ぶ (L は R が選びうる異なる応答行動の数)。
利得関数はそれぞれ US (tj, mk, al), UR (tj, mk, al) である。
ゲームの進行:
-
第 1 段階で、自然 (nature, Natur) は、送り手のタイプ
同居人探しゲームのゲームツリー ゲームの進行:
- 第 1 段階: 自然 N がプレーヤー 1 のタイプを選び、確率 p でおもしろいタイプ t1 とする。
-
第 2 段階: プレーヤー 1 は自分のタイプ tj に応じた戦略を選ぶ:
- プレーヤー 1 は、自分がタイプ t1 のとき、厳密に行動 a1 をとる。
- プレーヤー 1 は、自分がタイプ t2 のとき、厳密に行動 a2 をとる。
-
第 3 段階: プレーヤー 2 は、観察されたシグナル ak に従って、プレーヤー 1 を受けいれるか拒否するかを決定する:
- プレーヤー 2 は、シグナル a1 を観察したとき、厳密に行動 yes をとる。
- プレーヤー 2 は、シグナル a2 を観察したとき、厳密に行動 no をとる。
プレーヤー 1 の戦略の選択を通して、タイプ t1 にとっての行動 a2 と、タイプ t2 にとっての行動 a1 から始まる部分ゲームツリー (Teilspielbäume, 情報集合でつながっているのでこれはふつう部分ゲームとは言わないが) は排除される。それらはいずれも強く支配される戦略だからである。したがって、プレーヤー 2 のもつ信念は、α = 1, β = 0 となる。
結果は分離均衡になる:均衡戦略は、プレーヤー 1 が (a1, a2) (これは、自分のタイプが t1 だったならば [確率 1 で] 行動 a1 をとり、タイプが t2 だったならば [確率 1 で] 行動 a2 をとる、という戦略を表す)、プレーヤー 2 が (yes, no) (これは、シグナル a1 を観測したならば [確率 1 で] 応答行動 yes をとり、シグナル a2 を観測したならば [確率 1 で] 応答行動 no をとる、という戦略を表す) で、信念は α = 1, β = 0.
したがって、両プレーヤーの利得は、プレーヤー 2 がおもしろいタイプであるかまじめなタイプであるかの確率にのみ依存することになる。p = 0.5 のとき、期待利得は次のようになる:
-
ビール・キッシュゲームのゲームツリー ゲームの進行:
- 第 1 段階: 自然 N が客 G のタイプを選び、確率 p で弱いタイプ tW とする。
-
第 2 段階: 客 G は自分のタイプ tj に応じた戦略を選ぶ:
- 客 G のタイプ tW が好きなのは Q である。しかし、乱暴者 R は Q を観察したならば決して決闘を避けることがなく、また B を観察したならば厳密に決闘を避けるであろうことを知ったならば、次が成りたつとき、tW は逸脱の誘因をもつ:
-
カテゴリ
「Signaling game」の例文・使い方・用例・文例
- Signaling gameのページへのリンク