Kandori, M., Mailath, G.J., Rob, R., Learning, Mutation, and Long Run Equilibria in Games, Econometrica, Vol.61, No.1, pp.29-56,1993. 1.はじめに 確率進化ゲーム ・確率的なゆらぎをモデルに明示的に組み込む ・一つの均衡から別の均衡に移動する過程を確率過程の定常分布としてとらえる ・長期的にみてどの均衡が起こりやすいか ・ゆらぎに対して長期的に頑強な均衡=長期的確率安定的 2.モデルに関するラフな話 ・今,ある寮で10人の学生が2つのコンピュータシステム(S1,S2)を選択. ・学生はランダムにマッチングし,同じシステムを持つ2人の学生が対面したと きにはいつでも,「論文を書く」「ソフトウェアを交換」することができる. ・E1=(S1,S1)= 利得(2,2),E2=(S2,S2)= 利得(1,1),残りは利得(0,0). ・このゲームには純戦略均衡として2つの均衡が存在(パレート効率はE1). ・また,混合戦略を考慮すると3つめの均衡状態が存在 →1/3がS1を選択し,2/3がS2を選択する ・純戦略→プレイヤーが必ずどれかの戦略を選ぶゲームのこと ・混合戦略→プレイヤーが行動を確率的に選ぶような戦略をとることでナッシュ 均衡に達する非協力ゲームのこと ・プレイヤーA・Bが戦略S1/S2を選ぶ確率は,p/(1-p)・q/(1-q). ・それぞれの期待効用を計算すると,p=q>1/3のときS1,p=q<1/3のときS2を選択. 【羽藤】:本当はpとqは独立ではないはず. ・最終的な均衡状態は初期分布に大きく依存する ・少なくとも4人の学生がS1を利用していれば,最終的に全ての学生がS1を利用 するようになりパレート均衡E1が達成される. ・上記以外の場合は,最終的な状態はE2となる →長期的に安定にしたい.初期分布によらない方法をとりたい. ・学生は,定期的にコンピュータを変更する機会を持つ →少しのランダム性を与える,毎朝学生の入れ替わりが生じる →これで,戦略分布の長期的過程は,一つにはとどまらず,初期分布にも依存しなくなる. ・システムとしては,よい方の均衡で長時間とどまる ・S1→S2とS2→S1では移りやすさが違う→E1(1,0)に近づく 3.モデル ・戦略S1をとる人数がz人のとき,それぞれの平均利得を算出. 将来効用は考慮しない 【羽藤】:市場の密度が薄いと結果が変わってくる ・ダイナミクスの過程,最適反応ダイナミクスを考えると2つか3つの均衡点が存 在(0,N,1/3). ・ランダムショックを与える ・有限状態空間におけるマルコフチェインとして定義され,一意な定常状態をも つ. 4.極限分布の特徴 ・遷移樹形図分析:マルコフ過程の確率を書き下すよりも簡便な方法で定常分布 (長期的確率安定状態)を求める方法(Freidlin and Wentzell(1984)) ・遷移樹形図定理:長期的安定状態は,最小のコストを持つ樹形図の根となる.逆 に,最小の遷移コストを持つ樹形図の根は,長期的確率安定状態である. ・遷移コスト(遷移確率):ある均衡から別の均衡に映るのに必要な最低限のゆらぎ ・一番値が小さくなる根が長期的にみておちつくところ 5.調整ゲーム ・誘導領域,そこに入ったら均衡へむかうものを集めた領域 【羽藤】19枚目:遷移コストの3例目が4の理由は? →よくわからない? ・利得支配:複数ナッシュ均衡の中で,もっとも二人にとって利得が高い組み合 わせ ・リスク支配:複数ナッシュ均衡の中で,どちらかが戦略を逸脱した際のリスク がもっとも低い組み合わせ 6.期待待ち時間 7.モデルの頑健性のまとめ ・ゲームの利得構造が決定したとき,ゲームの長期的な結果は適応仮定によらな い. ・確率的ショックを与えることで,確率的に安定な戦略を示すことができた ≪捕捉≫ 【斎藤】:適応過程によらないとは,利得構造だけで決まっているということ. 【羽藤】:遷移確率の違いによって,どの戦略をどれだけとりやすいとかみる. 原さんのオークションは繰り返しデータがある.家庭に対して現実に やろうとするとパラメータ利是-ションする必要がある. ---------------------------------------- ■全体のまとめ 一回の試行だけではなく,何回もゲームを繰り返し各プレイヤーが自らの利得を 上げる方向に行動を調整する動学的過程の進化ゲームの始まりともいう論文.一 定条件下でゲームにおける安定な状態(ナッシュ均衡)に収束するが,通常だと 局所安定な均衡が複数存在し,その局所均衡のうちどれが実現しやすいかが明ら かではなかった.また最終的な均衡状態は初期分布に大きく依存してしまってい たためそこも考慮できる方法として,ある均衡点が支配する領域である誘導領域 から別の領域に移動できるような微小なランダム性を与える(ランダムショック). これを繰り返すことで他の領域に一番移動しにくい領域に落ち着かせることがで きる.以上より,ゲームの長期的な結果は適応過程に寄らず,また確率的ショッ クを与えることで確率的に安定な戦略を示すことができた.初期状態によらずに 均衡状態をあらわせることで,複数回の計算に寄ることなく,もっともらしい解 が得られる.誘導領域間の移行について,遷移コストが異なることに着目した点 が興味深く議論の余地があった. ----------------------------------------