電子講義:生態系の進化ゲーム

全卓樹

[全HP] [電子講義集] [研究] [冒頭]
[Index] [0] [3] [6] [9] [12] [15]
前へ 次へ

進化ゲームと生態系入門(3a)

利他的動機と混合ナッシュ平衡

 ここからは少し数学がいるので、つらい人は飛ばしていただいてもいいです。でも、知っていると後で役に立つことが出てきますので、ざっと目を通していただくのでもいいです。
 天使と悪魔のゲームでは、元のルールどおり自分の利益だけを追求してプレーすると、双方「悪魔」でいくのがナッシュ平衡でした。対して、「相手の利益」のテーブルを自分の利益と読み替えると、両方「天使」になるのがナッシュ平衡になって、実はこちらの方が双方とも得なのですが、更に、時々天使、悪魔と手を変えてプレーすると、もっといい事があるらしい、という話でした。これを「らしい」でなく、きちんとした話にしましょう。

いま何度もゲームをやるとして、そのうち半分の回数は元のゲームテーブル、残り半分は行と列を入れ替えたテーブル(相手のテーブル)でもって利益が計算されるとします。プレーヤーには毎回プレーするまでどちらのテーブルが与えられてるのか判らないとすると、貴方も相手も毎回サイコロでも振って出す手を決めるしかありません。こういうのを混合戦略といいます。すると利益の計算に使うべきゲームのテーブルは、平均すると両方のテーブルを足して2で割ったものとでも考える他にありません。つまり、自分も相手もゲームテーブルは

貴方の得点 相手は悪魔 相手は天使
貴方は悪魔
0
3/2
貴方は天使
3/2
相手の得点 相手は悪魔 相手は天使
貴方は悪魔
0
3/2
貴方は天使
3/2

貴方は「天使」を確率 s 、悪魔を確率 (1-s) で出すとします。一方相手は「天使」を確率 x 、悪魔を確率 (1-x) で出すとします。すると次のようなテーブルを使って

貴方の得点
1-x
x
1-s
0
3/2
s
3/2
相手の得点
1-x
x
1-s
0
3/2
s
3/2

貴方に期待される利益 Pyou(s, x) 、相手に期待される利益 Popp(x, s)は

    Pyou(s, x) = (1-s) { (1-x)*0 + x * 3/2 } + s { (1-x)*3/2 + x*1 }
    Popp(s, x) = (1-x) { (1-s)*0 + s * 3/2 } + x { (1-s)*3/2 + s*1 }

です。(実はこの二つは全く同じ函数です。)そして貴方は自分の戦略 s をコントロールして Pyou(s, x) の最大化を、相手も自分の戦略 x をコントロールして Popp(s, x) の最大化を試みると考えられます。すなわち

    dPyou(s, x) /ds = 0 、 dPopp(s, x) /ds = 0

これは両方とも一次方程式で、答えは簡単に求まります。

    s = x = 3/4 
    Pyou(3/4, 3/4) = Popp(3/4, 3/4) = 9/8

こういう混合戦略による利益追求の到達点を混合ナッシュ平衡といいます。
行先: 研究のページ
copyright 2003
全卓樹ホーム 教育のページ
t.cheon & associates