前言
博弈論的思想在古代便產(chǎn)生了,只是它在初期僅研究象棋、賭博中的一些勝負(fù)問(wèn)題,并未形成專業(yè)的理論系統(tǒng)。當(dāng)時(shí)的人們對(duì)于博弈的認(rèn)識(shí)只停留在經(jīng)驗(yàn)的認(rèn)知和積累上,并未形成專業(yè)的理論基礎(chǔ),正式成為一門學(xué)科則是在20世紀(jì)初期。
20世紀(jì)20年代末期,約翰·馮·諾依曼正式證明了博弈的基礎(chǔ)原理,在此基礎(chǔ)上宣告博弈論誕生,因此,馮·諾依曼被稱為“博弈論之父”。再到20世紀(jì)40年代中期,一本跨越時(shí)代的巨著《博弈論與經(jīng)濟(jì)行為》問(wèn)世,而作者正是馮·諾依曼和摩根斯坦。這兩位卓越的數(shù)學(xué)家經(jīng)過(guò)不斷研究,最終將最初的二人博弈理論推廣到了n人博弈理論,還將博弈論成功應(yīng)用到經(jīng)濟(jì)領(lǐng)域,他們奠定了博弈論的基礎(chǔ)和理論體系。
“假設(shè)現(xiàn)在有人能夠讓博弈行為接近野蠻,或者讓人類之間的友善行為和兇殘行為之間的差距無(wú)限大,那么誰(shuí)就更容易在博弈中取勝!边@是《博弈圣經(jīng)》中提到的一段話。
提起博弈論,便需要說(shuō)起“孤獨(dú)的天才”——約翰·納什,他更是博弈論的天才。約翰·納什在20世紀(jì)中期正式發(fā)表了一篇論文——《n人博弈的均衡點(diǎn)》,對(duì)博弈論起到了良好的推動(dòng)作用。除此之外,哈桑尼與賽爾頓對(duì)博弈論的研究和貢獻(xiàn),也為博弈論的發(fā)展起到了催化作用。再到《博弈圣經(jīng)》問(wèn)世,它與原有的博弈論有著極大的區(qū)別,最大的差異在于《博弈圣經(jīng)》中論述了博弈的文化理論,突出表現(xiàn)了人類博弈占據(jù)的優(yōu)勢(shì)。
事實(shí)上,《博弈圣經(jīng)》最大的優(yōu)點(diǎn)是,它能夠?qū)⒃械牟┺睦碚撜綉?yīng)用到現(xiàn)實(shí)中,還能幫助普通大眾通過(guò)自身的學(xué)習(xí)和研究成為博弈的真正高手。它還能將博弈論應(yīng)用到政治、經(jīng)濟(jì)、文化等多個(gè)領(lǐng)域,對(duì)于個(gè)人的生活和發(fā)展也能起到促進(jìn)和推動(dòng)作用。
簡(jiǎn)單來(lái)說(shuō),博弈的基本構(gòu)成要素分為決策人、對(duì)抗者、生物親序、局中人、策略、得失、次序。所謂決策人,指的是在博弈的賽局中率先做出選擇的一方,決策人往往會(huì)根據(jù)自己的經(jīng)驗(yàn)、自身在對(duì)局中的感受、自身的狀態(tài)等,率先做出一種具有方向性的選擇。
在二人博弈對(duì)局中的對(duì)抗者,往往是選擇滯后的那個(gè)人,需要做出與決策人的行為相反的選擇,而且這個(gè)對(duì)抗者不僅選擇落后,連行為與動(dòng)作也是落后的,而且他的選擇幾乎是默認(rèn)的、被動(dòng)的,但是這將成為他最后的優(yōu)勢(shì)。簡(jiǎn)單說(shuō),他所做的選擇極有可能是基于決策者選擇中的劣勢(shì)而做出的,由此一來(lái),便具有了空間優(yōu)勢(shì),這樣看來(lái)對(duì)抗者便成了二人博弈中占優(yōu)的一方。
所謂生物親序,從字面理解,就是生物會(huì)主動(dòng)尋找有序的一種親近行為。由于自然界的所有生物,當(dāng)它們處在陌生、惡劣、未知環(huán)境中時(shí),它們會(huì)發(fā)揮出主動(dòng)尋找規(guī)律和有序環(huán)境的本能。同理,在博弈對(duì)局中,所有的參與者都會(huì)自發(fā)地產(chǎn)生尋找或者等待有序的親近行為。
我們知道一場(chǎng)競(jìng)賽會(huì)由參與者組成,而在博弈中,這些有決策權(quán)力的參與者,則被稱為博弈賽局中的一個(gè)局中人;若在博弈中有兩個(gè)局中人,那么便稱為“兩人博弈”;若在博弈中有多個(gè)局中人,則稱為“多人博弈”。
當(dāng)我們參加較為正規(guī)的比賽時(shí),在遵守規(guī)則的前提下,還會(huì)為自己制訂一定的計(jì)劃或者策略,幫助自己取勝,博弈亦是如此。在一場(chǎng)博弈賽局中,任意一個(gè)局中人都會(huì)制訂自己在實(shí)際情況中所要施行的計(jì)劃或者策略,簡(jiǎn)單來(lái)說(shuō),局中人的方案與計(jì)劃并不只是針對(duì)某一個(gè)階段,而是針對(duì)整個(gè)對(duì)局過(guò)程,即任何一個(gè)局中人的能夠貫穿整個(gè)賽局的可行計(jì)劃被稱為一個(gè)局中人的策略。假設(shè)在一個(gè)博弈賽局中,局中人的策略是有限的,便稱其為“有限博弈”,相反則稱為“無(wú)限博弈”。
在博弈賽局中,結(jié)果無(wú)非勝負(fù)兩種,這種結(jié)果便是博弈中的得失。任何一個(gè)局中人在博弈中的最終得失,都與局中人的決策密切相關(guān),甚至還與全局中的人所做出的一組決策密不可分。因此,每場(chǎng)博弈中的局中人的最終得失,都由全部的局中人做出的一組策略的函數(shù)決定,這組函數(shù)便是通常意義上的支付函數(shù)。
比賽次序有先后,博弈策略亦是如此。博弈中的決策方在一個(gè)賽局中需要做出多次決策,此時(shí)便會(huì)出現(xiàn)決策的次序問(wèn)題。在此過(guò)程中,只有決策的次序是不同的,但是其他要素是相同的,而最后出現(xiàn)的是不同的博弈結(jié)果。
根據(jù)不同的標(biāo)準(zhǔn)產(chǎn)生了不同的博弈種類。我們可以將其大致分為兩類,即通常意義上的合作博弈和非合作博弈。二者的最大差別在于參與博弈的人并沒有達(dá)成一個(gè)相對(duì)具有約束力的協(xié)議。假設(shè)有協(xié)議可以參照,便是“合作博弈”;反之,則是“非合作博弈”。
若以時(shí)間順序?yàn)榛鶞?zhǔn),博弈論可以分為兩類:靜態(tài)博弈和動(dòng)態(tài)博弈。前者是指在博弈中,所有的參與者共同選擇或者非同時(shí)做出選擇,但是所有的后參與者對(duì)此并不知情,即后參與者不知道最初的參與者做出了怎樣的決策和實(shí)際行動(dòng)。后者是指在博弈中,所有的參與者采取的具體行動(dòng)有先后之分,而且后來(lái)加入的參與者能夠非常清晰地看到前面的參與者的具體行動(dòng)。
簡(jiǎn)言之,“囚徒困境”屬于靜態(tài)博弈,而棋牌類的博弈,或者那些行動(dòng)、決策有先后的博弈則是“動(dòng)態(tài)博弈”。事實(shí)上,博弈論根據(jù)不同的基準(zhǔn)還有不同的分類,在此列舉較為基礎(chǔ)的幾種。本書《博弈論》將帶領(lǐng)讀者走進(jìn)博弈的賽局中,開始一場(chǎng)特殊的“博弈”之旅。
譯者序
策略博弈論,我們通常將它稱為博弈論,有些時(shí)候也會(huì)用“競(jìng)賽論”或者“對(duì)策論”來(lái)表示。但是,只有博弈論更符合原意,因?yàn)樗軌蚋玫乇磉_(dá)出此理論所要探究的基本概念和相關(guān)問(wèn)題,同時(shí),它是在最近十幾年間逐漸發(fā)展起來(lái)的,還是運(yùn)籌學(xué)的主要組成部分,本書是博理博弈論的經(jīng)典著作。
約翰·馮·諾依曼的這本思想史上的經(jīng)典之作已經(jīng)問(wèn)世20年之久。本書《博弈論》不僅是成千上萬(wàn)讀者的審美享受,還支撐著約翰·馮·諾依曼之后的研究者。與此同時(shí),《博弈論》還直接推動(dòng)了個(gè)人概率、統(tǒng)計(jì)決策、運(yùn)籌學(xué)等諸多問(wèn)題的研究進(jìn)程。實(shí)際上,這本經(jīng)典著作在各個(gè)領(lǐng)域都產(chǎn)生了一定的影響。
為了讓讀者能夠更加直觀地看到博弈中的邏輯推理,馮·諾依曼先構(gòu)造出一個(gè)概念,其包含了所有參與者的策略選擇。通俗意義上說(shuō),一個(gè)參與者的一個(gè)策略選擇就是一套簡(jiǎn)單的行動(dòng)法則,同時(shí)是提供給這個(gè)參與者所有可能情況下的行動(dòng)指導(dǎo)。假設(shè)任意一名參與者需要遵循給定的各種策略,那么博弈的整個(gè)過(guò)程可以說(shuō)是已知的,顯而易見所有參與博弈的人在博弈結(jié)束時(shí),能夠獲得的收益其實(shí)是確定的。
按照作者約翰·馮·諾依曼的觀點(diǎn),博弈論的方法是最適合研究經(jīng)濟(jì)方面的問(wèn)題的數(shù)學(xué)方法。盡管博弈論的提出沒有能夠幫助作者完成解決經(jīng)濟(jì)問(wèn)題的任務(wù),但這一數(shù)學(xué)理論的提出與建立仍然是具有里程碑意義的。因?yàn)椴┺恼撗芯康氖嵌窢?zhēng),因此,在無(wú)數(shù)的斗爭(zhēng)場(chǎng)景中,都有可能通過(guò)使用博弈論來(lái)解決相關(guān)的技術(shù)問(wèn)題。例如人對(duì)自然財(cái)富的索取,人對(duì)自然災(zāi)害的抵抗,人對(duì)于未知領(lǐng)域的探索,以及軍事上的斗爭(zhēng),等等。博弈論可以使人們?cè)谟邢薜臈l件和既定的要求下,從繁多的數(shù)量關(guān)系里尋找出最適宜、最高效的解決方案。
約翰·馮·諾依曼創(chuàng)作《博弈論》的初衷是推動(dòng)經(jīng)濟(jì)學(xué)理論的革命,但是它在很長(zhǎng)一段時(shí)間內(nèi)沒有完成這個(gè)偉大的目標(biāo)。不過(guò),在它的影響下,人們發(fā)起了對(duì)整個(gè)時(shí)代經(jīng)濟(jì)學(xué)理論的質(zhì)疑。從這一方面來(lái)看,《博弈論》確實(shí)是天才之作,因此它必將被世人永遠(yuǎn)銘記。
經(jīng)濟(jì)學(xué)在未來(lái)是什么樣子的?這在《博弈論》中已經(jīng)予以回答。它必將是充滿數(shù)學(xué)符號(hào)的。對(duì)不少人來(lái)說(shuō),《博弈論》更像一部希臘文著作,只有當(dāng)我們理解它超過(guò)理解一種文化時(shí),我們才能真正讀懂它;蛘,如果說(shuō)《博弈論》是貝多芬的一部樂(lè)曲,那么還需要懂樂(lè)譜的人才能理解它。對(duì)于音盲來(lái)說(shuō),再好的音樂(lè)也無(wú)異于噪音!恫┺恼摗分凶詈玫墓ぞ呤菙(shù)學(xué),如果有人對(duì)數(shù)學(xué)一無(wú)所知,那么他很難進(jìn)入現(xiàn)代科學(xué)的大門,或邁入現(xiàn)代哲學(xué)的世界,這無(wú)疑是令人遺憾的。數(shù)學(xué)不同于街頭俗論,它關(guān)系著許多方面的思維能力。一般來(lái)說(shuō),擁有數(shù)學(xué)潛力的孩子往往具有更好的語(yǔ)言和邏輯能力。
能否理解博弈論可以作為衡量21世紀(jì)文化人的標(biāo)準(zhǔn)。約翰·馮·諾依曼在《博弈論》中對(duì)多人博弈和個(gè)體最大化問(wèn)題進(jìn)行了區(qū)分,并指出了兩者的主要差異。例如,研究一個(gè)典型的最大化問(wèn)題:如何用周長(zhǎng)1英里的籬笆圍出最大的面積?對(duì)于這個(gè)問(wèn)題,我們只需要利用代數(shù)或微積分知識(shí)便可給出答案。若縮小范圍,只允許在三角形中做選擇,那么等邊三角形要比其他三角形更優(yōu);若只允許在四邊形中做選擇,那么正方形是最佳的答案。若在所有正多邊形中做選擇,那么邊數(shù)越多越接近最優(yōu)解。而如果沒有邊數(shù)限制,用周長(zhǎng)1英里的籬笆圍出最大的面積,圓形無(wú)疑是最佳選擇。
而在多人博弈中,比如當(dāng)兩個(gè)理性頭腦為了一個(gè)目標(biāo)而產(chǎn)生沖突的時(shí)候,最終的答案總是會(huì)同時(shí)依賴于兩者的決定,所以這時(shí)的形勢(shì)與個(gè)人最大化問(wèn)題的形勢(shì)便不再相同。兩個(gè)人一起玩井字棋時(shí),如果甲方先行,且行棋方式完全正確,那么乙方將永遠(yuǎn)無(wú)法擊敗他;同樣,若乙方先行,且行棋方式完全正確,那么甲方也永遠(yuǎn)無(wú)法擊敗他。這種博弈的方式是隨機(jī)的,它的解也是隨機(jī)的。
如果兩個(gè)人一起玩向圓桌上放硬幣的游戲:雙方輪流向桌子上放硬幣,率先放不下硬幣的人就算失敗。在這個(gè)博弈中,若A是先行者,他便可以用這樣的策略獲勝,即首先將一枚硬幣放在桌子的正中央,接著每當(dāng)對(duì)方放下一枚硬幣,就在與之對(duì)稱的位置上放上一枚硬幣,這樣一來(lái),他便永遠(yuǎn)不會(huì)輸。所以誰(shuí)后放誰(shuí)就會(huì)輸。這是一個(gè)完美的信息博弈,只要知道誰(shuí)先誰(shuí)后就能知道誰(shuí)贏誰(shuí)輸。
同樣,象棋也是一個(gè)完美信息博弈,它與上面兩種博弈一樣簡(jiǎn)單。若兩個(gè)計(jì)算能力完美的人一起下象棋,那么只會(huì)有三種可能:一是先行者必勝,二是后行者必勝,三是平局。初看之下,我們并不知道最終的結(jié)局究竟屬于哪一個(gè),但只要我們反向推導(dǎo),就能推算出這一博弈結(jié)局與開始信息的關(guān)系。象棋的這種簡(jiǎn)單屬性可由博弈論予以證明。
在大多數(shù)人看來(lái),猜硬幣與下象棋一樣都是簡(jiǎn)單的博弈。但實(shí)際上,猜硬幣并非人們想象的那樣簡(jiǎn)單。如果一個(gè)人要想與另一個(gè)人保持一樣,他就會(huì)在對(duì)方選擇正面時(shí)跟著選擇正面,在對(duì)方選擇背面時(shí)跟著選擇背面。但是,如果他一開始就知道對(duì)方準(zhǔn)備選擇正面,好勝心就會(huì)驅(qū)使他去選擇背面,而若對(duì)方選擇的是背面,他就會(huì)毅然選擇正面。這就形成了一個(gè)無(wú)法跳出的循環(huán)。
約翰·馮·諾依曼在處理這個(gè)無(wú)限循環(huán)問(wèn)題時(shí)表現(xiàn)出了自己的天賦。在他看來(lái),不讓別人知道你的秘密的前提是,你自己也不知道;在投擲硬幣的時(shí)候,你只需要以正反面來(lái)決定你的行動(dòng),這樣一來(lái),在這個(gè)隨意策略中,即使你的對(duì)手始終保持著理性,并能提前知曉你的策略,他也不可能以超過(guò)半數(shù)的概率戰(zhàn)勝你。
約翰·馮·諾依曼給我們呈現(xiàn)的是一個(gè)二人零和博弈。他用這個(gè)經(jīng)典的博弈向我們證明了他的理論:參與這個(gè)零和博弈的人都試圖使自己的利益最大化,于是他們都想盡可能地使對(duì)方的利益最小化,因?yàn)橹挥羞@樣才能最大化自己的利益。
要判斷一條鐵鏈的強(qiáng)度,我們首先要知道它最弱的一環(huán),要判斷一個(gè)木桶能盛多少水,首先要知道它的短板在哪里。在最壞的情況下,最可能獲得的收益取決于最脆弱的一點(diǎn)。這個(gè)時(shí)候,參與者只需采用一種隨機(jī)策略,就能在最壞的情況下最大化自己的收益。這一意義深遠(yuǎn)的定理可以在撲克牌游戲中顯露其冰山一角:我們?cè)谕鎿淇伺茣r(shí)常常會(huì)見到虛張聲勢(shì)的對(duì)手,甚至我們自己有時(shí)為了贏得最后的勝利,也會(huì)采取虛張聲勢(shì)的策略。我們發(fā)現(xiàn)一旦有人虛張聲勢(shì)就意味著他可能有一手差牌,而那些不動(dòng)聲色的人則很可能拿到一手好牌。如果你的對(duì)手為了最大化自己的收益采取了隨機(jī)策略,那么你在面對(duì)這樣的對(duì)手時(shí)有一個(gè)最優(yōu)的虛張聲勢(shì)率可以確保使你的利益最大化。這種情況也出現(xiàn)在考試中,一個(gè)老師在為學(xué)生出考試題時(shí)會(huì)隨機(jī)從教科書中抽取內(nèi)容,這樣一來(lái),學(xué)生就需要復(fù)習(xí)整本教科書才能保證自己考到最優(yōu)的分?jǐn)?shù)。
除了簡(jiǎn)單的兩人零和博弈外,其他博弈中的理論更加復(fù)雜,也更加具有不確定性。比如,賽馬、股票交易、國(guó)際談判等多參與者形式的博弈會(huì)存在更多的可能性。或許博弈論會(huì)給我們的生活帶來(lái)許多助益,但是是否有人愿意用博弈論來(lái)決定自己孩子的未來(lái)呢?比如,一場(chǎng)手術(shù)可能讓你生病的孩子完全治愈,也可能使他出現(xiàn)生命危險(xiǎn)。這個(gè)時(shí)候,你是否還會(huì)以博弈論來(lái)給出最終的判斷呢?對(duì)于這樣的問(wèn)題,人們可能會(huì)永久地爭(zhēng)論下去,因?yàn)樗钡浆F(xiàn)在仍沒有答案;蛟S有人會(huì)說(shuō)這是個(gè)哲學(xué)問(wèn)題,所以不能用數(shù)學(xué)來(lái)予以解決。但是,在博弈論面前,如果你沒有規(guī)劃和尺度,你甚至無(wú)法成為它的觀眾。
《博弈論》一書既包含了博弈數(shù)學(xué)理論的細(xì)致說(shuō)明,又包含了該理論多方面的應(yīng)用與實(shí)踐。博弈數(shù)學(xué)理論于1928年開始發(fā)展和出版,它主要應(yīng)用于博弈本身以及經(jīng)濟(jì)學(xué)和社會(huì)學(xué)問(wèn)題。約翰·馮·諾依曼也希望用數(shù)學(xué)方法來(lái)研究這些問(wèn)題。
如果想要應(yīng)用博弈論,我們至少要在所研究的簡(jiǎn)單博弈中印證這個(gè)理論,隨著約翰·馮·諾依曼研究的深入,其中的相互關(guān)系表現(xiàn)得愈加明顯。不過(guò),對(duì)約翰·馮·諾依曼來(lái)說(shuō),博弈論的最終歸宿應(yīng)該在經(jīng)濟(jì)學(xué)和社會(huì)學(xué)上。他從一些簡(jiǎn)單博弈問(wèn)題深入淺出地闡述了這個(gè)理論,盡管這些問(wèn)題不如實(shí)際問(wèn)題復(fù)雜,但它們都具有根本性和代表性,利用它們可以進(jìn)一步證明:不管是平行利益問(wèn)題和相反利益問(wèn)題、完全信息問(wèn)題和不完全信息問(wèn)題,還是自由合理的決定、機(jī)會(huì)影響問(wèn)題,等等,都能夠用一個(gè)精確的方法來(lái)加以解決。