shin422のブログ

『哲学のヤンキー的段階』のための備忘録

天才ナッシュ

数年前に交通事故で亡くなった数学者ジョン・ナッシュプリンストン大学大学院に進む際、学部の指導教授が書いた推薦状には、「この男は天才です」とだけ記されていたというエピソードは、今ではかなり知られているが、一体どういう意味で「天才」であったかまではあまり知られていない。確かに、シルヴィア・ネイサー『ビューティフル・マインド-天才数学者の絶望と奇跡』(新潮社)にはゲーム理論だけでなく純粋数学上の功績にも触れられているが(統合失調症の一症状なのかはわからないが、被害妄想も相当だったようで、廣中平祐のフィールズ賞受賞対象になった代数多様体上の特異点解消定理にいちゃもんをつけた手紙を、当時ハーヴァード大学教授だった廣中自身に送り付けている)、奇行面が目立って、具体的にどういう点で「天才」なのかという核心部分が伝わってこないのである。

 

ナッシュは1994年に、ゲーム理論の発展に貢献した一人として、アルフレッド・ノーベル記念経済学スウェーデン国立銀行賞(いわゆるノーベル経済学賞)を受賞した(他の賞はともかく、こと経済学賞に関しては廃止した方がいいと思うけど)。もっとも、この受賞対象となった業績は、ナッシュの純粋数学上の業績、すなわちリーマン多様体の埋め込み定理や自己放物型方程式と楕円方程式の解のヘルダー連続性の問題への貢献などと比べれば屁みたいなものである。そのようなことを、弟子筋にあたるトポロジストのジョン・ミルナーは言っていたそうである。このミルナーの言は、もちろんナッシュの偉大さを強調した誉め言葉であって、ナッシュの受賞を貶した言葉ではない。

 

しかし、本当にゲーム理論に果たした功績はその他の純粋数学上の業績に比べて格段に劣っているのだろうか。確かに、受賞対象となった「n人非協力ゲーム」だけを取り出せばそうとも言えるかもしれない。数理経済学と威張ったところで、純粋数学理論物理学からすれば「オモチャ」を玩んでいる子どもにしか見えないだろう。しかし、ナッシュの一連の論文の帰結の含意を読み取れば、必ずしもそうではないことがわかる。やはり、ここでもいかんなくナッシュの天才は際立っていたと思われるのである。それは、異質のもの同士を整合的に組み合わせるナッシュの発想力である。

 

「n人ゲーム」は、①ゲームのプレーヤー、②各プレーヤーの戦略の集合、③戦略の集合の直積上の実数値関数である利得関数の組として表現される。「n人ゲーム」の最も単純なモデルとして、「2人ゼロサムゲーム」がある。このゲームには必ず均衡点が存在することを「ミニマックス定理」として証明したのがジョン・フォン・ノイマンである。

 

その立論の流れを簡略化して述べると、以下の通りである。プレーヤーの純戦略の集合をとり、他方のプレーヤーの戦略の集合の確率分布をプレーヤーの混合戦略として、両プレーヤーの混合戦略の集合を定式化することからはじめる。ある混合戦略をとったときのプレーヤーの利得関数を対応させて、この利得関数間に成立する「マックスミニ」かつ「ミニマックス」の性質を持つ一定の関係(利得関数の鞍点になっている)を形成する混合戦略の組を「均衡点」として導きだすというものである。この「ミニマックス定理」を「n人非協力ゲーム」にまで拡張したのが、1951年のナッシュ21歳の時の業績の一つである。

 

確かに、この論文自体は、角谷静夫やブラウアーらの「不動点定理」の応用でしかないように見える(それだけでも経済学では大きな業績であるが)。それゆえ、先述のミルナーの言に表れているように、数学者からすれば、数学上での世界的業績とまでは言えない。事実、この結果を聞かされたノイマンは、さしたる関心を示さなかったらしい。

 

しかし、ゲーム理論に関する主な3篇の論文の個々の数学的側面についての上記の如き評価が仮に適切だとしても(僕には、リーマン多様体の埋め込み定理がどれほど優れているのかを適切に評価する能力はない。抽象的思考にかけては、最も上質な才能に恵まれた集団であろう純粋数学者の中でも、特に秀でた学者であるミルナーノイマンがそう言っているのだから、そう信じるよりほかないだろう)、「均衡解」と「交渉解」という、ある意味で水と油の関係に立つ異質な両者を結びつけるという驚嘆すべき結果を導き出したところにこそ、ナッシュの稲妻の如き閃きの冴えが際立っているのではないか。

 

まず、単純な「ナッシュ均衡」の概念について、ナッシュの1951年の論文「n人非協力ゲーム」に即しながら確認しておこう。「ナッシュ均衡」とは、他のプレーヤーが同一の戦略をとり続ける限り、どのプレーヤーも自らの戦略を変えたとしても、自身の利得を増やすことができない状態を意味する(早い話が「抜け駆け」しても無駄ということだ)。この均衡点の存在について、ナッシュは有限個の純戦略に基づき「n人非ゼロサムゲーム」について証明した。のみならず「2人非セロサムゲーム」に関しては、ゼロサムゲームの場合とは異なり、2人の協力可能性を示し、かかる状況下での解を「ナッシュ交渉解」として定式化することも既に成し遂げている(これは別の論文「交渉問題」において確認された)。

 

ナッシュのアイディアをやや乱暴に整理すると、以下のようになる。①2人が高度に合理的であること、②各人は様々な物に対する自身の欲求を正確に比較できること、③交渉技術については差が無いこと、④各人はもう1人の嗜好と選好について完全に知っていること、という4つの前提から出発する。そこで、(ⅰ)個人の効用理論を展開する際に、個人は2つの可能な期待を提示された部分につき選好を判断することができること、(ⅱ)選好の順序付けは推移性をみたすこと、(ⅲ)等しく望ましい状態の確率的組合わせは等しく望ましいこと、(ⅳ)ある期待と別の期待の確率的組合わせでそれ以外の期待と等しくなるようなものが存在する連続性をもつこと、という補助的条件を措いて効用関数の存在を証明し、この効用関数が線形性をもつことを示していく。これが第一段階。

 

次いで、個人の効用関数をとり、コンパクトかつ凸であり原点を含むような実現可能集合Sとその共同混合拡大を考える。実現可能集合に属する「交渉基準点」についての交渉問題を考えるにあたり、両者を対応づける写像つき、パレート効率性、2人の合理的な個人が実現可能な取引の集合Tにおいて、c(T)が公平な取引であると同意しているとすると、もしSがc(T)を含むならば少なくとも集合S外の点で表される取引を試みないことには同意するはずであるから、SがTに含まれているなら状況はSが実現可能な集合である場合に還元される。すなわちc(S)=c(T)という対称性が確保されていること((a,b)が集合Sに含まれるならば(b,a)もSに含まれるような、要するに直線u1=u2について対称となるような効用演算子u1,u2が存在するときSは対称である)、正一次変換に対して独立であるといった前提を措くことで、交渉基準点が「ナッシュ交渉解」に一意に定まることを証明するのである。

 

このような「ナッシュ均衡解」と「ナッシュ交渉解」との関係をどうみればよいのか。これは異質なもの同士である「非協力ゲーム」と「協力ゲーム」をどう関係づけるかという問題である。「2人協力ゲーム」という論文において、ナッシュは「2人協力ゲーム」の解につき2つの独立した導出を試みている。1つは「協力ゲーム」を「非協力ゲーム」に還元する方法。2つ目は公理論的アプローチであり、解の持つべき性質として自然であると考えられるものを7つの公理として提示した上で、これらの公理が解を一意に定めることを示している。

 

交渉問題の状況に対して、各プレーヤーはそれぞれ混合戦略を選択する要求ゲームを想定する。2人の要求が両立不可能である場合に、この使用を強制される戦略をプレーヤーの「威嚇」とする。プレーヤーたちは互いに自分の威嚇を知らせあう。ここでは各プレーヤーが独立に行動するという仮定が措かれている。この意味は、プレーヤーが協力が自分にある効用をもたらさないかぎり協力しないということである。この利得の実現可能集合を考え、この集合に関する当該要求ゲームにおけるある特性関数を導入して、各人の利得と戦略の組を関係づける。次の段階では、この特性関数をとった際、解析的手法で平滑化されるよう近似された要求ゲームにおいて、唯一の「ナッシュ均衡解」の存在が証明されるのである。一言で表現するならば、平滑化ゲームにおける均衡点の唯一の必然的極限である。そして、この均衡解は「ナッシュ交渉解」に近似していくことが示されるのである。

 

ここから「リヴァイアサン」の必然性の有無を考える際の重要な含意を読み取ることができないだろうか。ある公理系を定めてそこから導かれた「ナッシュ交渉解」を「ナッシュ均衡解」に平滑的に近似させていくことが可能であるとするなら、個々人が存在する一定の範囲を統治する「不可分な主権」のもとに個々人を服せしめずとも、諸々の要求を満足させる秩序形成は可能ではないかという考えを延ばすこともできなくはない。

 

古典的リアリズムに立つ国際政治学者として知られ、既に「古典」となっているPolitics Among Nationsの著者であるハンス・モーゲンソーは、国際社会の状況の説明においてホッブズを引用し「国家がないならば、国民社会は国際舞台と似たものとなり、『万人の万人に対する闘争』状態になる」と述べる。国際政治を「諸国家が諸国家に対する闘争を演じるアリーナ」として捉える「ホッブズ・モデル」は、リアリズムの理論的前提となっている。もちろん、ホッブズ自身が国際政治を国内の政治状況ないしは社会状況と同様、『万人の万人の対する闘争』状態と考えていたかどうかは詳らかには知る由もない。

 

ホッブズの基本的な考えの枠組みを粗っぽくまとめると以下のようになる。ホッブズによれば、各人が現有する力並びに力を行使する手段を確保するためには、それ以上の力を持つ必要がある。この力を他より多く得ようとすれば、誕生したその日から各人はやむことなき力への永続的欲求にかられることになる。この意味で、万人は万人に対する競争者であり敵となる。この状態は万人の万人に対する戦争状態に他ならず、そこでは絶えざる恐怖と暴力による死の危険に苛まれ、人間の一生は孤独で貧しく野蛮で短い生とならざるをえない。各人は自己を保存するために各人の保持する力をいかなる場合でも行使する権利を万人に対して主張でき、かかる自己自身を支配する権利としての自然権を保持すればするほど、闘争状態がやむことは無くなっていく。

 

しかし、各人がかかる自然権を放棄し、自然権を互いの信頼に基づき各人のcovenantによって、個人もしくは合議体に服従を誓うことにともなって成立するのがcommonwealth by institutionである。自然権を移譲された「主権者」は各人に対して絶対的な権力を有し、逆に各人は主権者の命令に従う義務を負うが、ここにいうcovenantとは各人間の約束にすぎず、各人と主権者との間の直接的臣従契約でも各人と主権者との統治契約でもない。各人の信頼に基づく自発的服従による人工的国家と各人の間の恐怖に基づいて服従を力で強いることにより発生する自然的国家が区別がされ、これがcommonwealth by aquisitionとされる。後者は君主制のモデルである。

 

国際政治学の中でも、「ホッブズ・モデル」を採用するリアリストは、これを国際政治の状況に当てはめる。自然状態の下での相互不信と恐怖に苛まれた「囚人のディレンマ」的状況にとどまるか、そこから抜け出てリヴァイアサンによる秩序形成がなされるかの岐路にあって、政府による統治秩序がみられる国内とは異なり、諸主権国家の上位の政府が存在しないリヴァイアサン不在の状況下では自然状態のままである。

 

このゲーム論的状況が明確に現れるのが、国家安全保障の場面である。とりわけ安全保障論においてゲーム理論がよく参照されるのは、抑止理論においてである。抑止とは、相手国にこちらが望まない行動をとらせないために、もし相手国が攻撃的行動に出た場合、こちらが懲罰的報復措置をとるという威嚇態勢をとることによって、相手国が当該行動に出ることを事前に思いとどまらせることを意味する。

 

相互確証破壊理論に代表される抑止理論によると、この抑止が機能するためには抑止する側が当該国家の安全及び国際秩序を遵守する約束を実行しうるだけの能力と意思を有し、かつそのことについての情報が被抑止側に伝達され認識されていることが前提となる。そして被抑止側が攻撃に出た場合の結果は、報復された場合の損害の大きさと被抑止側が推測する報復される蓋然性の掛算によって割り出すことができ、この計算可能性が攻守双方の行動の予測可能性を担保するという構造を持っている。被抑止側と抑止側の意図と能力を誤認・誤算しなければ、予想される報復の被害が攻勢に出た場合に得るはずの期待利益よりも小さいと確信しないかぎり、抑止は機能するとされる。cost(攻撃の費用)、risk(反撃される危険)、benefit(利得)、probability(抑止側が反撃に出る確率)の関係は、P(C+R)>(1-P)Bとなるときに抑止効果が期待できる(計算的抑止)。

 

少し考えてみればわかるように、抑止が機能したことを直接証明することはできない。起こったことをその力によって検証することが可能であっても、起こらなかったとして、それが抑止の効果のためであると証明できないからである。トンプソンは「事実によって証明も反証もされない命題」と言っている。トマス・シェリング『紛争の戦略-ゲームの理論のエッセンス』(勁草書房)のゲーム理論に基づいた戦略理論や、他にも「バーゲニング理論」などが提起され、抑止理論の基礎づけの試みがなさた。

 

その後の意思決定理論は、認知科学や心理学を応用するアレキサンダー・ジョージや組織理論に基づく『決定の本質-キューバ・ミサイル危機の分析』(中央公論新社)において「官僚政治モデル」を示したグリアム・アリソン、サイバネティクスを適用したするジョン・スタインブルーナーらの貢献により精緻化されていった。

 

キューバ危機やベトナムといった事件を除き、意思決定理論を導入した抑止理論であっても検証可能性が乏しいとの批判は依然として根強い。単純な合理的計算モデルが直接反映された例としては、キューバ危機以後に米ソ首脳間にホットラインが敷かれたということが挙げられるが、それ以外に関してはこの単純なモデルのままでは使用に耐えない。実際の政策決定過程におけるアクターは、認知的不協和や価値のトレード・オフを避けつつ限定された状況下での心理的抵抗の少ないオプションを選択するものという前提をおいて抑止理論を再構築する試みがなされてきた。そこでは、意思決定が合理的計算の結果としてなされるのではなく、単純な希望的観測や歴史のアナロジーからもたらされるもの、または初めから一定のありうるオプションが排除されたり、あるいは当初からあるオプションが念頭におかれて政策決定がなされるといったモデルが採用されてきた。サイバネティクスパラダイムに基づくスタインブルーナーの見解は、日常的な各意思決定過程が機能する結果として破局を生ぜしめる可能性があることをも示すものである。

 

とはいえ、ナッシュの驚嘆すべき帰結の含意を汲み取った理論は未だ提示されていない。もちろん提出されたとしても、直ちにそれを具体的な国際政治状況の分析に適用可能になるとは思われない。しかし同時に、アナーキーな状況において、一つの調和の論理的可能性を示したとも解されるナッシュの帰結は、もちろんあくまで抽象論の域をでないまでも、希望たりうるのではないかと思われるのである。