高頓網(wǎng)校小編在11月24日友情提醒您認(rèn)真仔細(xì)閱讀這篇業(yè)界評(píng)論:董金鵬認(rèn)為好好人會(huì)帶壞中國(guó)社會(huì)風(fēng)氣
羅伯特·艾克斯羅德(Robert Axelrod)是密歇根大學(xué)公共政策學(xué)院的一名教授。他以研究“合作演化”而成名,榮譽(yù)清單上列出了包括美國(guó)科學(xué)院院士,麥克阿瑟獎(jiǎng)等一長(zhǎng)串名字。我*9次知道他的名字是在昨天的一個(gè)學(xué)生沙龍上。這期關(guān)于博弈論的沙龍里提到了艾克斯羅德教授做過(guò)的一個(gè)著名實(shí)驗(yàn),而實(shí)驗(yàn)的結(jié)論頗有戲劇性——和人相處中,雖然要與人為善,卻不能做一個(gè)爛好人。
這項(xiàng)實(shí)驗(yàn)的最初目的是探究“人為什么要合作?人在什么時(shí)候選擇合作?如何使別人與你合作?”這幾個(gè)問(wèn)題。每次實(shí)驗(yàn)都在A,B兩方之間進(jìn)行,而實(shí)驗(yàn)的內(nèi)容則像是一個(gè)小的囚徒困境。舉例來(lái)說(shuō),如果A和B都選擇合作,他們可以各獲得5分;如果A和B都選擇不合作,那么他們則各獲得1分;如果A選擇合作而B選擇不合作,則B可以得到10分,而A則要扣去5分。反之亦然。從這里可以看到一個(gè)絕對(duì)優(yōu)勢(shì)策略,即無(wú)論對(duì)方合作不合作,自己只要不合作,那必然是一個(gè)更好的結(jié)果(對(duì)方合作,自己不合作可以拿10分,而選擇合作只能拿5分;對(duì)方不合作,自己不合作可以拿1分,而選擇合作只能扣5分)。由于A和B都有同樣的考慮,所以兩個(gè)沒(méi)有變數(shù)的聰明人只會(huì)選擇都不合作,各拿1分走人,雖然這并不是一個(gè)群體*3的情況(兩個(gè)人都合作嚴(yán)格好于兩個(gè)人都不合作)。
生活自然不會(huì)像單個(gè)囚徒困境那樣只有一次選擇合作與否的機(jī)會(huì)。在現(xiàn)實(shí)生活中,新認(rèn)識(shí)的伙伴往往會(huì)傾向于合作,有些人在有一段合作關(guān)系后就有了信任,而另一些人則會(huì)利用這種信任在背后捅合作伙伴一刀,而這些人不佳的名譽(yù)則會(huì)影響之后別人與他們的合作。為了模擬現(xiàn)實(shí)生活中的狀況,艾克斯羅德教授請(qǐng)了許多學(xué)生和教授各自開(kāi)發(fā)了總共60個(gè)算法來(lái)替代人進(jìn)行實(shí)驗(yàn)。這些算法如同人一樣有著自己的性格。比如有的算法只要被欺騙一次,之后對(duì)欺騙者就一直采取不合作的態(tài)度。也有的算法對(duì)欺騙過(guò)自己的人有著一定的寬容。在這60個(gè)算法之外,艾克斯羅德教授又加入了3種性格:永遠(yuǎn)合作的爛好人,永遠(yuǎn)不合作的純壞蛋,以及永遠(yuǎn)一半幾率合作一半幾率不合作的神經(jīng)病。
這63個(gè)算法每?jī)蓛芍g進(jìn)行了數(shù)百次模擬的博弈實(shí)驗(yàn)。可以想象,總的模擬數(shù)字非常大。在對(duì)所有的組合打分并求和排序之后,艾克斯羅德教授得到了一個(gè)有意思的結(jié)果:總體來(lái)說(shuō),傾向于選擇合作的“善意”算法排名要遠(yuǎn)高于傾向于不合作的”惡意“算法。在得分前15高的算法里,只有一個(gè)惡意算法(哈靈頓算法,之后再提)。而排名最低的15個(gè)算法里,只有一個(gè)善意算法。沒(méi)錯(cuò),就是那個(gè)永遠(yuǎn)選擇合作的爛好人。
在這63個(gè)算法中,排名*6的被稱為”一報(bào)還一報(bào)“算法。它是這么定義的——*9次見(jiàn)面先選擇合作,之后重復(fù)上一次對(duì)方的選擇??梢韵胂螅绻龅降氖且粋€(gè)總體善意的算法,那么兩個(gè)算法之間會(huì)進(jìn)行很多次合作。而如果碰到惡意算法之后雖然會(huì)吃一次虧,但因?yàn)橛辛藞?bào)復(fù)的行為,總體來(lái)說(shuō)虧得也不會(huì)太多(大不了大家都不合作么)。
這個(gè)結(jié)果可能是出乎人意料的。因?yàn)樵谝话闳说南胂笾校绻谂c人合作中獲得*5的利益,似乎要有一個(gè)非常復(fù)雜的決策過(guò)程。而這個(gè)算法只是簡(jiǎn)單重復(fù)之前對(duì)方的行為而已。這看上去壓根就不像是一個(gè)好的策略。不過(guò)從這個(gè)算法里也可以抽取出一個(gè)”成功者“的五大個(gè)性——善良(總體愿意合作),可激怒(人若犯我,我必犯人),寬容(只要你不是一直陷害我,那么扯平之后我愿意繼續(xù)合作),簡(jiǎn)單(只要模仿對(duì)方的行為),不耍小聰明(不會(huì)突然捅別人一刀)。
不耍小聰明這一點(diǎn)是針對(duì)之前提到的哈靈頓算法而言的。哈靈頓算法可以說(shuō)是一個(gè)狡猾的算法。它有一套自己的評(píng)判體系。如果它覺(jué)得對(duì)方是一個(gè)可以欺負(fù)的好人,那么就會(huì)突然背叛,選擇不合作,從而讓自己獲利。可見(jiàn),這種算法能從善良并軟弱的算法身上得到很多分?jǐn)?shù)。這也是它能排名前15的原因。
當(dāng)然這個(gè)實(shí)驗(yàn)從總體設(shè)計(jì)來(lái)說(shuō)是簡(jiǎn)單的。為了更好模擬現(xiàn)實(shí)中的情況,我們的艾克斯羅德教授又進(jìn)行了一下小改動(dòng)。在每輪博弈結(jié)束后,所有的算法會(huì)根據(jù)得分而排名。排名前的算法會(huì)進(jìn)行自我復(fù)制,排名后的算法會(huì)被淘汰。如果總數(shù)不變的話,可以近似理解為那些得分低的算法學(xué)習(xí)了得分高的算法。這就像生活中一樣,吃過(guò)虧的人會(huì)學(xué)習(xí)別人的經(jīng)驗(yàn)。
最后的結(jié)果令人驚嘆。在63個(gè)算法中,”一報(bào)還一報(bào)“算法占到了24%,而惡意算法則表現(xiàn)拙劣。在前一個(gè)實(shí)驗(yàn)中通過(guò)欺負(fù)好人得分的哈靈頓算法,因?yàn)楹萌寺冎?jǐn)慎的緣故,開(kāi)始拿不到足夠的分?jǐn)?shù)。隨著天真的好人從這個(gè)社會(huì)中消亡,以這些好人為食的惡人也隨之消亡了。
所以這個(gè)實(shí)驗(yàn)的結(jié)論就是“毫無(wú)原則的爛好人一定會(huì)被欺負(fù),并且很有可能會(huì)帶壞社會(huì)風(fēng)氣”(考慮到惡意算法的存在)。因此艾克斯羅德教授教會(huì)我們做人的道理就是要做一個(gè)“有原則的好人”。
用沙龍中的一句話結(jié)尾:“共同演化會(huì)使有原則的好人行為在這個(gè)充滿背信棄義的世界里蔚然成風(fēng)”。