あとがき、はしがき、はじめに、おわりに、解説などのページをご紹介します。気軽にページをめくる感覚で、ぜひ本の雰囲気を感じてください。目次などの概要は「書誌情報」からもご覧いただけます。
奥野(藤原)正寛・グレーヴァ香子 著
『自発的関係社会のゲーム理論』
→〈「第1章」「第4章」抜粋(pdfファイルへのリンク)〉
→〈目次・書誌情報・オンライン書店へのリンクはこちら〉
*サンプル画像はクリックで拡大します。抜粋本文はサンプル画像の下に続いています。
第1章はじめに
1.1 問題意識
従来の経済学やゲーム理論では,複数の主体が共同作業や交換などを行う社会・経済関係の定式化は,関係がいつまで継続するかが事前に決まっていることを前提にしたモデルがほとんどである.1 回限りの取引を前提とした一般均衡理論の競争市場モデルや,カバーする時間は長期にわたっても契約自体は1回で終わる契約モデル,無限に続くかあるいは終了時期が確率的に決まるマクロ経済モデルや繰り返しゲームのモデルがその例である.しかし,現代の自由主義社会における社会・経済関係や企業をはじめとした組織・グループ・ネットワークの多くは,それを構築したり参加したりするだけでなく,それを解消したりそれから離脱して関係する相手を変更することも自由である.例えば,市場はオンラインも含め毎日大量に開かれており,同じ相手と継続的に取引を行ってもよいし,さまざまな取引相手を渡り歩いてもよい.かつては新卒採用・終身雇用が中心だった日本の労働市場も,転職や雇用の自由度は従業員・雇用者のどちらから見ても大きくなり,一生を1 つの企業で過ごす従業員のほうが稀になった.このような,各自が自由意思で離脱したりパートナーを変更することが可能な社会・経済関係を自発的関係(voluntary relationships)と呼ぼう.社会を構成するさまざまな関係が自発的関係であり,誰と関係を持つのか,どんな状況ならそれを継続しどんなときには解消するのかを各自が自由に選べるときに,社会全体としてはどのような行動様式が安定になるのか,特に,短期的にはメリットのない行動(例えば囚人のジレンマにおける協力行動)は可能であるか,可能ならばそれはどのようなロジックに基づくのか,またそれに限界があるならば解決策はあるのか,などを解明することが本書の目的である.
2000 年代初頭から奥野とグレーヴァは,この研究課題をゲーム理論を使って考えてきた.この分野の先行研究としては,Matsushima(1990),Datta(1996),Ghosh and Ray(1996),Kranton(1996a)などがあり,それは1990年代まで遡る.これら先行研究は合理的なプレイヤーが主として存在する長期的な社会を前提としていたのに対し,われわれは異なるアプローチを考えた.ここでいう合理的なプレイヤーとは,社会の構成員全員の長期行動計画(ゲーム理論の用語を使えば,展開形ゲームにおける戦略)の分布に対して正しい予想(信念)を持ち,それに対する最適な意思決定を行うプレイヤーである.この仮定は小規模で固定的なメンバーからなる社会ならば問題ないかもしれない.しかし,非常に大規模な社会において自発的関係を結ぶプレイヤーたちを考えるとき,彼らが社会全体の行動計画分布(戦略分布)について正しい信念を形成し,確率的・動学的に変化していくパートナーの行動の変化を見通して長期的な最適化戦略を実行するという仮定は強すぎるように思われた.そこでわれわれは,プレイヤーたちは社会全体の行動計画分布の把握やその将来変化の予想,あるいはそれらに対する最適戦略を発見するための認知能力や計算能力の大きな制約があり,合理的でありたいとは望んでいるが伝統的な意味での合理性を持たない限定合理的(boundedly rational)なプレイヤーだと仮定した.さらに,先行研究は社会の戦略分布が均衡にある場合についての分析だけを行ったが,われわれは限定合理的な人々からなる社会で戦略分布が均衡から乖離することも想定すべきと考えた.以上の理由から,われわれは分析方法として進化ゲーム理論を採用した.
ただし,進化ゲーム理論の基本モデルでは,社会の構成員はランダムに出会って1 回限りのゲームを行い,これが各プレイヤーの一生に対応する.各プレイヤーは1 回限りのゲームをプレイし終わったら次の世代に置き換わり,次期のプレイヤーたちの行動計画分布は彼らの親の適応度である今期の利得に応じて変化すると設定されている.その意味で各プレイヤーが社会で生活しゲームをプレイする期間は外生的で,各期ごとにプレイヤーたちは分断されている.これに対してわれわれは,異なる世代に属するプレイヤーの人生が重なり合い,同じ相手と対峙する期間も戦略的かつ確率的に決まるという,これまでにない新しい進化ゲームのモデルを構築した.
1.2 自発的関係社会のゲーム
われわれが考える自発的関係社会のモデルを最も一般的に記述すると以下のようになる.社会は永続的に存続し,膨大な数の個別主体を最小単位としつつ,彼らが集まった家族・友人・職場・産業などのさまざまなネットワーク,さらにはそれらのネットワーク同士が作り出す関係からなる重層的な構造を持っている.毎期の社会活動の帰結は各主体の意思決定に加えて,彼らが属するネットワーク内でのメンバー全員の意思決定に大きく依存する.個々のネットワークの形成,維持,発展と消滅は(外的な要因も許しつつ)メンバー1 人1人の意思決定に依存し,逆にネットワークの継続期間・方法は個別主体の意思決定に影響を及ぼす.
この枠組みはさまざまなモデルを含んでおり,主体は同質的なのかそうでないか,各ネットワーク内でメンバーの意思によって続くゲーム(これは一般には長期的なゲームであり,コンポーネント・ゲーム(component games)と呼び,各期に行われるものは段階ゲーム(stage games)と呼んで区別する)はどのようなゲームか,どのように主体たちが出会ってネットワークを構築し,解消には合意が必要なのかそうでないか,ネットワークから離脱したときにどんな情報が次の相手に伝わるのか,などの設定に多大な自由度がある.
自発的関係社会全体を俯瞰した一般的分析を直ちに行うことは無理なので,われわれは同質なプレイヤーからなる社会において,各プレイヤーは誰かとペアになって以下の自発的継続繰り返し囚人のジレンマ(Voluntarily Separable Repeated Prisoner’s Dilemma, VSRPD)を行う状況に焦点を当てた.自発的関係社会のモデルの中でも,この「自発的継続囚人のジレンマ(VSRPD)社会」モデルは先行研究にも非常に近いものである.VSRPD は,段階ゲームが囚人のジレンマである無限回繰り返しゲーム(1.3.1 節参照)に,各自が一方的にペアを解消するオプションを付け加えたゲームである.毎期の初めに,すでに相手がいるプレイヤーは引き続きその相手とのコンポーネント・ゲームを継続し,パートナーがいないプレイヤーは出会いの場(マッチング・プールと呼ぶ)でランダムに新しい相手と出会い,新たにコンポーネント・ゲームを始める.
社会を構成する各プレイヤーは,コンポーネント・ゲームを渡り歩く長期のゲームをプレイし,毎期利得を獲得しつつ,なんらかの理由で外生的に社会から退出する(「死ぬ」)まで社会に存在する.退出者の後には新たにプレイヤーが参入する(「生まれる」とも表現する)とし,社会全体は同じ数のプレイヤー集団を保ちつつ永遠に続く.この仮定は出会いの数学的構造を単純化するための便宜的仮定である.また,外生的な退出と参入があるので,マッチング・プールにはいろいろな履歴のプレイヤーが常に存在する.
以上のVSRPD 社会の構造を簡潔に図解したものが図1.1 である.各プレイヤーは生まれたときにはマッチング・プールから出発するのでτ 期の期初をそこから描いている.マッチング・プールでランダムに出会った相手とコンポーネント・ゲーム(点線で囲まれた部分)が始まり,まず段階ゲームである囚人のジレンマを1 回行う.段階ゲーム内のお互いの行動を観察した後で,各プレイヤーは継続か離脱を独立に選択し,少なくとも一方が離脱を選べば関係は解消される.また,相手が外生的に退出(死亡)することもある.これらの場合,このプレイヤーは次期は再びマッチング・プールで新しい相手とペアを作るが,そうでない場合は前期からのコンポーネント・ゲームが続き,同じ相手と再び段階ゲームをプレイする.
ゲームの樹形図そのものではないので,図1.1 には情報構造を示していないが,新しい相手とペアになったとき,お互いの過去の行動履歴はわからないと仮定する.もし過去の行動履歴が社会の全員と正確に共有されるなら,組織や関係からの離脱は大きな意味を持たず,各プレイヤーにとって繰り返しゲームと数学的に同じ構造を持つことになるからである.
(中略)
1.4 本書の構成
本書は,プレイヤー間の社会・経済関係のあり方が社会全体にもたらす影響に対して,知的関心を持つ大学生や社会人を読者と想定し,学術書としてある程度厳密な記述をわかりやすく行うことに重点を置いた.特に,研究者でない読者が原論文を読まずにある程度われわれの研究の成果を理解できるようにするとともに,われわれの理論的成果が現実社会にどのような意味を持つかについても説明することを心がけた.
記号,基本的概念,関連研究の紹介も兼ねて,非協力ゲーム理論と進化ゲーム理論の,本書に関係のある部分に関する解説を第2 章と第3 章でまず行う.(したがって,非協力ゲーム理論や進化ゲーム理論全体の解説ではない.)それらの基礎知識がある読者は第4 章から読み始めることを勧める.第4 章では,自発的関係からなる社会およびVSRPD 社会というゲームモデルについて数学的に厳密な定義を与えるとともに,経済学的意義も詳しく説明する.
第5 章では,先行研究でも唱導された信頼構築戦略とそのVSRPD 社会における安定性を詳述した.お互いの過去の行動履歴がわからない以上,出会ってすぐに協力する戦略だけでは安定的状態(均衡)とならない.しかし,何期間か協力せずに関係を続ける信頼構築局面を経てから同時に協力に移行するという信頼構築戦略は,移行した後の協力局面で誰かが外生的に死ぬまで協力ができる.この戦略を社会全員が行っていると,どの局面でも逸脱することは得策ではない.まず,信頼構築局面では裏切ってもメリットがないうえ,関係が解消されてマッチング・プールで新たに出会った相手と再び利得の低い信頼構築局面から始めなくてはならない.次に,協力局面で裏切ると短期的には高い利得を得るかもしれないが,ここでも関係が解消されるため,新しい相手との信頼構築局面が十分に長いならば,短期的な裏切りの利得は相殺されるというロジックである.信頼構築戦略は現実社会でもしばしば観察される.また,失業の可能性があれば信頼構築局面は必要なく,情報の切断の仮定のもとでもすべてのプレイヤーが常に協力する均衡の存在を説明できるため,いわゆる「効率賃金モデル」とも密接に関係する.
先行研究が単一戦略の均衡の分析だけに注目したのに対して,われわれは同質的プレイヤーの社会であっても多様な戦略が共存する均衡にも分析の射程を広げた.第6 章からは複数戦略が共存する均衡を解説する.第6 章では,信頼構築局面がなく誰とでもすぐに協力関係を目指す(ただし相手が協力しないならすぐに別れる)戦略と,常に非協力的行動を選び1 期限りで相手と別れる短絡的な戦略という対立的な2 戦略が,同質的社会で共存する(ナッシュ)均衡が存在することを明らかにする.短絡的な戦略から逸脱することにメリットがないことは明らかである.すぐに協力する戦略において,パートナーが短絡的戦略だとわかった時点で別れないという逸脱も意味がない.すぐに協力する戦略同士がマッチしたときに,相手の協力を見越して裏切る可能性だけが危険であるが,その場合はマッチング・プールに戻るので,新たな関係の相手が短絡的戦略である確率が十分に高ければ,抑止力になるのである.
この対立的2 戦略均衡をベースにすると,出会ってから数期間はお互いにどんな行動でも許容して継続を選ぶ,という寛容な戦略群も均衡となる.このロジックは自発的関係のゲームならではであり,別れてマッチング・プールに戻ってランダムに出会う相手の戦略の確率分布と,現在の相手の今後の戦略の確率分布が一致するという「入れ子」構造を作ることで継続を選んでもよいという仕組みになっている.この寛容均衡群の発見は,奥野とグレーヴァが共同研究者の助けを得てラボ実験を行った際に観察された行動から触発された.第7 章では,寛容均衡群のうち,最も簡単な均衡を説明する.第6 章と第7 章で解説する均衡群は,先行研究にはまったくない形の均衡だが,残念ながら進化ゲーム理論的な安定性の少なくとも1 つを満たさないことも判明した.
そこで第8 章では,コンポーネント・ゲームの冒頭にパートナー同士がコミュニケーションを行うモデルに拡張するとともにVSRPD でプレイする戦略を制限することで,対立的2 戦略均衡から始まる社会の不均衡経路を分析し,長期的な戦略分布の進化的推移を考察する.コミュニケーションが実質的に意味を持たず対立的な2 戦略均衡が成立している社会に,新たなコミュニケーション手段を使ってコンポーネント・ゲームの最初から協力局面を実施しようという口約束をするプレイヤー(戦略)たちが参入すれば,口約束も最初は効力を持つ.しかしそのような戦略が社会に広がるにつれていずれその効力は失われ,口約束を裏切る人々が生まれ口約束の効力が失われる.結局,社会全体で約束を守り協力を実現するためには,私有制や法的契約とその実効性の担保など,なんらかの社会制度が必要であるようだ.
本書は,Fujiwara-Greve and Okuno-Fujiwara(2009, 2019, 2021),およびFujiwara-Greve et al.(2016)をベースとし,奥野とグレーヴァがお互いの執筆原稿を何度も繰り返し検討修正するという共同作業の過程を経た結果である.また,Fujiwara-Greve et al.(2016)を含むいくつかの論文の共著者であった鈴木伸枝駒澤大学教授には,図表の作成,文言の修正等で本書にも多大な協力を頂戴した.ここに記して深く感謝するものである.なお,第7 章はFujiwara-Greve and Okuno-Fujiwara(2019, 2021)に基づくものだがグレーヴァが単独で執筆し,第8 章は奥野が単独で新たに執筆した.これらの章についての責任はそれぞれの担当者だけが負うものである.
(注と図は割愛しました)
第4 章自発的継続繰り返し囚人のジレンマ社会
4.1 自発的関係社会のゲームの枠組み
本章ではいよいよ自発的継続繰り返し囚人のジレンマ(Voluntarily Separable Repeated Prisoner’s Dilemma, VSRPD)とそれをコンポーネント・ゲームとしたVSRPD 社会の説明に入る.1990 年代半ばごろから似たようなモデルが分析されてきたが,本書ではFujiwara-Greve and Okuno-Fujiwara(2009)(以下ではGreve-Okuno(2009)と書く)のモデルを紹介する.そのためには第1,3 章でも簡単に触れた,より大きい概念である自発的関係社会のゲームの再確認をしておく必要がある.
グローバル化によって,現在では膨大な数の人や企業群が複雑で重層的な社会・経済関係のネットワークを形成し,時間とともにこれらの関係を繰り返したり解消して別の新たな社会・経済関係を形成したりしている.このような大規模で流動的な社会における長期的行動選択の帰結を考えるためには新たなモデルが必要である.すでに第3 章の冒頭で注意したように,伝統的な無限回繰り返しゲーム(infinitely repeated games)の枠組みにおいては,固定されたメンバーからなるプレイヤーたちが,あるいは1 つの社会の成員として,あるいは特定の企業組織やカルテルの仲間として,あるいは1 つの家族として,そのゲームをプレイする相手たちが変わらないことを確信しながら,繰り返し関係を持つことが前提とされる.そこでの問題意識の1 つは,このような固定的閉鎖的な社会や組織において,どのような慣行や規範が安定的な行動様式として生まれるかということを明らかにする点にある.とはいえ,相手がずっと変わらない関係は,狩猟採集社会における家族や親族からなるグループや,別の社会から隔絶された農村共同体ならともかく,人々が村や町を自由に移動する時代における社会を説明するモデルとして必ずしも適切とは言い難い.
そこで本書では,次のような性質を満たすゲーム群を自発的関係社会のゲーム(voluntary-relationship society games)と定義する.この概念は複数形として定義されていることに注意が必要である.つまり,以下の性質を満たすすべてのゲームを自発的関係社会のゲームと呼ぶ.このクラスのゲームは,今後詳細を分析する,自発的に継続するかどうかを選べる繰り返し囚人のジレンマというコンポーネント・ゲームがプレイされるというゲーム以外に無限にあり,「無限回繰り返しゲーム」のような1 つの大きな枠組みである.
(a)始まりも終わりもなく長期間プレイされる展開形ゲームである.
(b)膨大な数のプレイヤーが社会に存在し,場合によっては毎期,その一部が(自発的,あるいは外生的に)社会から退場したり,新たに参入したりする.現実社会でその構成員が死亡・転居・倒産したり,出生・転入・起業したりすることがその具体例である.
(c)毎期,その期に社会に存在しているプレイヤーは,なんらかの(場合によっては複数の)ネットワークに所属する.同じ企業に勤める従業員のネットワーク,ある企業とその顧客や下請け会社のネットワーク,夫婦やパートナー,趣味やスポーツ仲間,共同研究グループなどがその例である.
個々のネットワーク内ではコンポーネント・ゲームがプレイされる.そこでは,以下の2 種類の意思決定が行われる.
(d)個々のネットワークの形成,維持,発展と消滅の背後には,1 人1 人のプレイヤーの意思決定があり,毎期新しく出会ったネットワークやすでに参加しているネットワークについて各プレイヤーが参加(の継続)や脱退を選択できる.
(e)各プレイヤーは,所属するネットワークにおける社会・経済関係において,さまざまな戦略的行動をとる.従業員がまじめに働くかサボるか,レストランが(新規のあるいはなじみの)顧客に提供する料理の質をどう選択するか,家族・恋人をディナーに誘うか,などである.
(f)各プレイヤーは,(d)や(e)の選択を通じて各コンポーネント・ゲームから毎期利得を得る.(もちろん,各プレイヤーの利得は他者,特に当該期に同じネットワークに属する他のプレイヤーの行動選択にも依存する.)
このように定義される自発的関係社会のゲームは,膨大な数のプレイヤーが非常に長期にわたって相互に関係する,きわめて複雑なものである.各プレイヤーの観点から見ると,自分と他のプレイヤーたちの意思決定によって,その場限りの関係を次々と相手を変えて行うこともできるし,長期にわたって同じ相手との関係を続けることもできる.その意味で,現実の経済社会の関係性に近いモデルになっている.
1つの自発的関係社会のゲームでどのような戦略分布が安定になるかを調べるにあたって,ゲームの構造についての知識も計算能力も限られた限定合理的なプレイヤーが,自発的関係社会のゲームを思惟的過程を通じて解くことができるとは考え難い.したがって,均衡は進化的過程を通じて分析することが自然だろう.
無限回繰り返しゲームにおいていろいろな段階ゲームやモニタリングの構造が考えられるように,自発的関係社会のゲームにおいても個別ネットワークにおける(d),(e)の詳細を決定するコンポーネント・ゲームやその内部のモニタリング構造,ネットワークを解消した後で社会全体や次のネットワークの中のプレイヤーたちにどんな情報が伝わるかについてはいろいろな設定が考えられる.
本書では,各プレイヤーは2 人からなるネットワークに1 つだけ所属し,そこでは次節で定義する自発的継続繰り返し囚人のジレンマ(VSRPD)というコンポーネント・ゲームがプレイされ,2 人の関係が解消された後では社会全体や次のペアの相手には過去のペア内の行動履歴がまったく伝わらないという情報構造(「情報の切断」と呼ばれる)を仮定した自発的関係社会のゲームを「VSRPD 社会のゲーム」と呼び,そのゲームのナッシュ均衡とその進化的安定性を分析する.このVSRPD 社会のゲームは非常に単純化されたものではあるが,グローバルな現代経済社会におけるモラルハザードの問題を分析可能な形にしたものである.VSRPD 社会のゲームにおいてどのような戦略分布が長期的,進化的に安定なのか,またそれらの均衡にはどのような性質があるのかを調べることによって,現代経済社会ひいては将来の経済社会への提言をすることが本書の目標である.
(以下、本文つづく。注は割愛しました)