なぜ量子ゲームか:確率ヴェクトルとヒルベルト空間ヴェクトル(1)
これまでの説明で、ゲーム理論というのがどのような現象を対象に、どのような道具立てでどのようなアプローチを行うのかという大凡の感じはつかめていただけたものと思う。
確認のためもあって、分かり易いようにゲーム理論の特徴をここで箇条書きにしてみる。簡単のためプレイヤーが二人のゲームに限定しておく。
[プレイヤーの独立性] ゲームには二人のプレイヤーが登場して、各々が自分の意思で有限の戦略のレパートリー中から選択できる。
[利得の極大化] 全プレイヤーの戦略の選択が決まると、行列で表される利得表に従って、各プレイヤーには利得が割り当てられる。各プレイヤーには、自分の利得を出来るだけ大きくしたいという欲求があり、それが戦略の選択の際の行動原理となる。
[繰り返しによる学習] 各プレイヤーは何度かゲームをプレイして、実際に戦略の選択を行いその結果の利得を手にする事ではじめて、利得表の全体と自分および他のプレイヤーの行動を学んで行き、その結果として最適と思われる戦略の選択であるナッシュ平衡に落ち着く。
[確率的戦略] 最適戦略としては、複数の戦略を確率的に組み合わせる選択を考える。特定の選択を行う戦略も、その戦略の確率が1で他の戦略の確率0という選択だと考えれば、確率的戦略の一つの特別な場合と看做せる。
確率的選択というのを要領よく数式にしようと思うと、自然に確率ヴェクトルという考えにたどり着く。例えば戦略の選択肢が「0」と「1」の二つある場合、「0」をとる確率を x0 、「1」をとる確率を x1 として
と書くものである。あらゆる選択をとる確率を足すと必然的に1あるから x0 + x1 = 1 と言う関係があり、また当然 x0 、x1 は0以上1以下の実数である。いまこの x を一人目のプレイヤ−Aの戦略ヴェクトルとして、同様に確率 y0 、y1 から作った二人目のプレイヤーBの戦略ヴェクトルを
とすると、ゲームの戦略は、それぞれ独立に変化させられる二つのヴェクトルの組 (x, y) で指定される。
ゲームの利得は前に出てきた行列の組 (MA , MB) で与えられるので、あとはこの戦略ヴェクトルと利得行列という2組の量からプレイヤー A、B それぞれの利得を計算する手順を確立してしまえばよい。そして x、y を夫々 MA、MB が極大にになるように変化させるという手続を踏めばゲーム理論が出来上がる訳である。
プレイヤーの戦略の選択というものを(2.1)、(2.2)というヴェクトルで表記できた、という時点でゲーム理論の数学的枠組みが決まってしまうのである。極論すれば、それから後の実際にナッシュ平衡を見つける部分は単なる技術的細部であると言う事さえ出来る。
このように0以上の実数のヴェクトルの組で戦略を書いたとき、これを古典的戦略といい、その結果出来るゲーム理論を古典ゲーム理論と呼ぶ。
|