清華大學(xué)-香港中文大學(xué)FMBA 張維迎:謹防社會陷入“二階囚徒困境”

?智能總結(jié)清華大學(xué)-香港中文大學(xué)FMBA 張維迎:謹防社會陷入“二階囚徒困境”
二階囚徒困境
人類社會的進步依賴于人與人之間的合作。合作的范圍越廣,程度越深,社會進步就越快。過去幾百年市場化和國際貿(mào)易的發(fā)展就證明這一點。如果沒有交易,每個人都自給自足,人類的生活恐怕還只能停留在原始狀態(tài)。
社會合作面臨的一個最大挑戰(zhàn)是經(jīng)濟學(xué)家講的“囚徒困境”,即:盡管合作會改進所有社會成員的福利,但每個人基于自利的個人最優(yōu)選擇是不合作,結(jié)果是聰明反被聰明誤,所有人的利益都受損。
囚徒困境之所以發(fā)生,是因為當(dāng)事人處于這樣一種環(huán)境:對每個個體而言,最理想的結(jié)果是別人合作自己不合作(賺便宜),其次是所有人都合作(雙贏),再次是所有人都不合作(雙輸),最悲慘的是自己合作別人不合作(吃虧)。比如說,在人民公社時期的生產(chǎn)隊里,對每個農(nóng)民而言,最好的結(jié)果是別人干活自己偷懶,其次是大家都干活,再次是大家都偷懶,最糟糕的是其他人偷懶自己干活。在這樣的環(huán)境下,每個農(nóng)民的最優(yōu)選擇是偷懶,結(jié)果是所有人都餓肚子。而如果他們都好好干活,是可以吃飽的。
解決囚徒困境需要有對不合作行為的懲罰(或激勵)機制。懲罰的一種方式是“你不仁我不義”,“以德報德”“以怨報怨”。博弈論證明,如果交易關(guān)系是固定的,并且這種關(guān)系可能重復(fù)進行,每個人可以根據(jù)對方前期的行動選擇相應(yīng)的對策,如用“不合作”懲罰對方“不合作”的懲罰,用“合作”獎勵對方的“合作”,相互合作就可能作為納什均衡出現(xiàn)。這就是重復(fù)博弈下的聲譽機制。這里,對不合作行為的懲罰是由受害當(dāng)事人執(zhí)行的,因而被稱為“第二方執(zhí)行”。
但現(xiàn)實社會人與人之間既有固定關(guān)系的交易,也有非固定關(guān)系的交易。事實上,現(xiàn)代社會的大部分交易是非固定關(guān)系交易。在非固定關(guān)系交易中,第二方懲罰常常是不可行的。比如說,你從4S店買了一輛汽車,即使你買到的車的質(zhì)量沒有商家承諾的那么好,你發(fā)現(xiàn)自己受騙了,但你沒有可能通過“不再購買”懲罰商家,因為你在短時期內(nèi)本來也不可能買第二輛車。對你只是一錘子買賣的事情,商家為什么要在乎你滿意不滿意呢?
為了解決一般的囚徒困境問題,社會既需要國家頒布的法律,也需要自發(fā)形成的社會規(guī)范。法律和社會規(guī)范都是通過“第三方執(zhí)行”的,其中法律是由政府集中執(zhí)行,社會規(guī)范由其他社會成員分散執(zhí)行。所謂“社會規(guī)范”,就是公認的行為準(zhǔn)則,它的執(zhí)行是這樣的:A欺騙了B,但B沒有可能懲罰A,只能由C、D、E、F等其他某個(或多個)社會成員懲罰A。這樣的懲罰機制類似其他人為B“打抱不平”。A確實會因為害怕C拒絕與自己交往而不敢欺騙B。但問題是C為什么要懲罰A?畢竟懲罰意味著C也錯過某種有利可圖的機會。一個人可能由于害怕別人的譏諷而遵守社會規(guī)范,但譏諷也是有成本的,譏諷者也可能被反譏諷,甚至受到被譏諷者的人身攻擊。但如果每個人出于自身利益,只要騙子沒有直接侵害自己的利益就聽之任之,社會規(guī)范就不可能得到真正的遵守,社會合作就不可能維持。這就是社會合作的“二階囚徒困境”(the second-order prisoners’ dilemma)問題。
讓我舉一個例子說明這一點。設(shè)想公共車上一個小偷正在行竊,受害人自己沒有覺察,但你(旁觀者)看見了。你是大喊一聲“抓小偷”,還是把頭轉(zhuǎn)向另一側(cè)假裝沒看見?如果你喊“抓小偷”,行竊行為會終止,但小偷也可能報復(fù)你(現(xiàn)場報復(fù)或事后報復(fù))。由于害怕被報復(fù),你可能假裝沒有看見。這里,小偷的行為是一階囚徒困境問題;你自己沒有行竊,但你沒有阻止本來可以阻止的他人行竊,所以屬于“二階囚徒困境”。如果大部分人對小偷視而不見,偷竊行為就會泛濫,每個人的利益都受損。
研究法律和社會規(guī)范的學(xué)者提出多種理論解釋社會規(guī)范的執(zhí)行的問題。比如說,麥克亞當(dāng)斯(McAdams,1997)提出了社會規(guī)范的“尊敬理論”(the Esteem Theory)。他認為,人們既需要得到他人的尊敬,也可以給予他人尊敬,正是對尊敬的競爭使得人們不僅愿意自己遵守社會規(guī)范,也有積極性鄙視不遵守社會規(guī)范的人。因為尊敬是無成本的,所以不存在二階囚徒困境問題。與此相反,艾瑞克·波斯納(Posner,2000)提出了社會規(guī)范的信號理論,根據(jù)這種理論,正因為遵守社會規(guī)范是有成本的,為了顯示自己是合作型的人,人們才遵守社會規(guī)范。人們鄙視或懲罰不遵守社會規(guī)范的人,是為了傳遞自己是“好人”的信號。羅伯特·庫特(Cooter,1995,2000)用社會規(guī)范內(nèi)在化為道德來解決二階囚徒困境問題,他認為,社會規(guī)范一旦內(nèi)在化為道德,違反社會規(guī)范就給當(dāng)事人帶來心理傷害,所以道德水平高的人即使付出成本也愿意懲罰違規(guī)者。另外兩個比較正式的理論模型是“聯(lián)合制裁規(guī)則”(Mahoney 和Sanchirico,2003)和“敵友規(guī)則”理論(Bendor和Swistak,2001),這兩種理論將社會規(guī)范解釋為納什均衡或演化穩(wěn)定戰(zhàn)略:只要預(yù)期多數(shù)人會遵守,每個人都有積極性遵守。
這幾種理論是互為補充的。社會生活非常復(fù)雜,不同環(huán)境下社會規(guī)范不同,執(zhí)行機制也不可能完全相同。下面我分別介紹一下聯(lián)合抵制和敵友規(guī)則。
聯(lián)合制裁
所謂“聯(lián)合制裁”(boycott)是指:每一個社會成員都應(yīng)該誠實,不應(yīng)該欺騙,并且,每一個成員都有責(zé)任懲罰那些欺騙人的人;如果某個成員不懲罰騙過人的人,那么他本身就應(yīng)該受到其他人的懲罰。也就是說, 一個社會成員不僅自己不能行不義之舉,而且有責(zé)任阻止他人的不義之舉。如果不伸張正義,姑息他人的違規(guī)行為,那么就應(yīng)該受到懲罰。
設(shè)想一個多人組成的社會,每次博弈在隨機相遇的兩人之間進行,每個人可以選擇合作,也可以選擇不合作,每個人的行為可以被所有的人觀察到,博弈是重復(fù)進行的??紤]如下社會規(guī)范:(1)在初期每個人都應(yīng)該選擇合作;(2)如果有違規(guī)者出現(xiàn),所有人都不與前一次違規(guī)者合作,作為對他的懲罰;(3)違規(guī)者在接受懲罰之后可以得到寬恕,從下次開始合作恢復(fù);(4)任何人如果沒有履行懲罰義務(wù),就變成新的違規(guī)者,在接下來的博弈中應(yīng)該受到懲罰;如此等等。這里,“違規(guī)者”包括:(1)首先選擇不合作的人;(2)沒有對首先不合作者施行懲罰的人;(3)沒有懲罰該懲罰而沒有懲罰的人的人。
這個社會規(guī)范不同于簡單的“以牙還牙,以眼還眼”戰(zhàn)略,后者不僅懲罰首先不合作的人,也懲罰懲罰者(即如果A在第一期不合作,B就在第二期選擇不合作以作為對A的懲罰,A又在第三期選擇不合作作為對B在第二期不合作的懲罰,等等),但不懲罰不懲罰者(即如果B第二期沒有懲罰A,A在第三期繼續(xù)合作)。聯(lián)合制裁的社會規(guī)范不僅懲罰首先不合作者,也懲罰不懲罰者(不見義勇為者應(yīng)該受到懲罰),但不懲罰懲罰者(見義勇為者不應(yīng)該受到懲罰)。
讓我們用一個例子來說明這一點。假定一個社會由A、B、C、D、E、F、G、H、I和L十個人組成,在第一階段A和B博弈,C和D博弈,…;第二階段A和C博弈,B和D博弈,…;第三階段A和D博弈,B和E博弈,…;等等。設(shè)想第一階段A欺騙了B。那么,按照社會規(guī)范,在第二階段,C就應(yīng)該懲罰A,選擇不合作,但A應(yīng)該選擇合作,表示接受懲罰。如果A和C都按照這樣的規(guī)則行事,第三階段開始所有人都恢復(fù)合作(A得到原諒)。但如果C在第二階段沒有懲罰A(假定A選擇了合作表示愿意接受懲罰),第三階段C和(比如說)F博弈的時候,F(xiàn)就應(yīng)該選擇不合作以懲罰C,但C必須選擇合作。如果F這樣做了,并且C也接受了懲罰,從第四階段開始,所有人都恢復(fù)合作。但如果第三階段F沒有懲罰C,那么在第四階段F和(比如說)L博弈的時候,L就應(yīng)該選擇不合作以懲罰F,但F必須選擇合作。如此等等。
馬豪尼和薩齊里柯(Mahoney 和Sanchirico,2003)證明,如果每個人都有足夠的耐心,有關(guān)個人行為的信息足夠透明,這個懲罰規(guī)則可以保證合作的出現(xiàn),即沒有人會首先選擇不合作,每個人都有積極性懲罰違規(guī)者,每個違規(guī)者都愿意接受懲罰。
聯(lián)合制裁規(guī)則既包含了懲罰,又包含了寬恕,體現(xiàn)了孔子講的“以德報德、以直報怨”的恕道精神,執(zhí)行起來也并不復(fù)雜。
二戰(zhàn)后,聯(lián)合制裁是維持國際和平的重要機制,主要表現(xiàn)為:(1)每個國家尊重他國的主權(quán)和領(lǐng)土完整;(2)任何侵害他國主權(quán)的行為應(yīng)該受到所有國家的懲罰;(3)不懲罰侵略者的國家應(yīng)該受到懲罰;(4)懲罰侵略行為的國家不應(yīng)該受到懲罰。如果所有國家都遵守上述規(guī)則,侵略戰(zhàn)爭就不會發(fā)生,每個國家的主權(quán)都能得到維護。
敵友規(guī)則
聯(lián)合制裁與日常生活中的“敵友規(guī)則”非常類似。該規(guī)則是這樣的:一開始每個社會成員都是你的朋友,但是下一次某個成員還是不是你的朋友取決于他在前一次博弈中的行為:如果這個成員在前一次沒有欺騙過任何人并且沒有同你的任何一個敵人合作,那么他還繼續(xù)是你的朋友;反之,如果這個成員欺騙過任何一個你的朋友,或者幫助過你的敵人,他就成為你的敵人。
這個規(guī)則由以下三個具體規(guī)則組成:(1)“朋友的朋友是朋友”;(2)“朋友的敵人是敵人”;(3)“敵人的朋友是敵人”。
“朋友的朋友是朋友”是指,假如A和B是朋友和合作伙伴關(guān)系,A沒有欺騙過B,B也沒有欺騙過A;C和B也是朋友和合作伙伴關(guān)系,C沒有欺騙過B,B也沒有欺騙過C。那么,A就把C當(dāng)朋友,C也把A當(dāng)朋友,可以相互合作。
“朋友的敵人是敵人”是指,如果A和B是朋友,如果C欺騙了B,那么C就成為A的敵人,A就不應(yīng)該與C合作。
“敵人的朋友是敵人”是指,如果A和B合作很好,C欺騙了B,那么根據(jù)前面講的“朋友的敵人是敵人”,C就變成了A和B的共同敵人?,F(xiàn)在假如有一個D,繼續(xù)和C合作,那么這個D就變成了A和B的共同敵人。
按照敵友規(guī)則,人人是非分明,嫉惡如仇。本德爾和斯韋史特(Bendor and Swistak,2001)證明,如果大部分人足夠重視未來,上述“敵友規(guī)則”不僅是一個納什均衡戰(zhàn)略,而且是演化穩(wěn)定戰(zhàn)略,即采取這一戰(zhàn)略的人在社會競爭中最具有生存能力,演化的結(jié)果是整個社會變成一個合作社會。直觀地講,給定其他人都遵守這個規(guī)則,如果你欺騙任何一個人,你就變成所有其他人的敵人,成為孤家寡人,你在生存競爭者中就處于劣勢。得罪一個人等于得罪所有人,這樣的懲罰是非常嚴酷的。正因為其嚴酷,普遍的合作才成為可能。
社會合作的破壞
現(xiàn)實社會中,小至一個班集體,大至國際社會,很多合作確實是依靠集體懲罰維持的。比如,假設(shè)A同學(xué)在班級里欺負某個同學(xué),那么其他同學(xué)就會孤立A,如果有(比如說)某個H同學(xué)當(dāng)“老好人”,和A繼續(xù)保持良好關(guān)系,那么H同學(xué)也將會遭到所有其他同學(xué)的鄙視。如果這些結(jié)果被A同學(xué)所預(yù)見到,那么A同學(xué)就不敢欺負人了。
國際關(guān)系中采取聯(lián)合制裁便會形成聯(lián)盟的集體行動。例如在伊拉克戰(zhàn)爭中,美國制定的一個規(guī)則是:所有關(guān)于伊拉克戰(zhàn)后重建的合同都只給在伊拉克戰(zhàn)爭期間持積極態(tài)度的國家,不支持對伊拉克作戰(zhàn)的國家將會受到某種形式的懲罰。這樣,美國的盟國不得不紛紛加入到對伊拉克的戰(zhàn)爭中來,即便只是象征性地派出幾名士兵。
由于利益關(guān)系的復(fù)雜性,現(xiàn)實中,無論是國際合作還是一般社會合作,總是面臨“二階囚徒困境”(甚至更高階囚徒困境)的挑戰(zhàn)。比如國際制裁中,參與制裁會失去與被制裁國家的合作機會(如參與制裁意味著不再能獲得廉價的能源供給),由此某些國家可能不愿參加制裁。烏克蘭戰(zhàn)爭中,如果(比如說)德國不參與對俄國的制裁,美國是否應(yīng)該懲罰德國?畢竟,如果美國制裁德國,德國可能采取報復(fù)行動,使得美國的利益受損。但如果德國預(yù)期美國不會懲罰自己的背叛行為,它為什么要參與對俄國的制裁呢?由于不同國家之間經(jīng)濟、地緣政治及其他關(guān)系的相互依賴性不同,為了最大程度維護國家間正常的合作秩序,聯(lián)合制裁規(guī)則對不同盟友的要求會有所不同,如一些國家投棄權(quán)票被視為默許,另一些國家投棄權(quán)票則被當(dāng)作敵對行為。
類似地,在社會治安中,如果B沒有阻止A的行竊行為,C是否有足夠的動機懲罰B?如果C不懲罰B,D是否應(yīng)該懲罰C? 如果D不懲罰C,E是否應(yīng)該懲罰D?如此等等,每個人都可能有自己的小九九,該懲罰時可能選擇不懲罰。由于每個人的行為很大程度上取決于他對別人行為的預(yù)期,如果人們預(yù)期多數(shù)人不會見義勇為,見義勇為的行為就會消失,損人利己的不義之行就會盛行。
社會是復(fù)雜的,推動和維護人與人之間的合作需要社會規(guī)范,也需要法律??上У氖牵覀儺?dāng)前的社會缺乏明確的社會規(guī)范和健全的法律,自然,社會成員之間的合作程度就受到不利影響。假冒偽劣橫行,背信棄義遍地,權(quán)力任性,就是這個時代最為生動的寫照。因此,要想提高社會成員之間的合作,就需要逐步確立起符合市場要求的社會規(guī)范,并完善我們的法律制度。
需要特別強調(diào)的一點是,好的社會規(guī)范必須得到好的法律支持。如果法律與社會規(guī)范相沖突,社會規(guī)范就容易陷入“二階囚徒困境”。比如說,見義勇為是我們提倡的社會規(guī)范,但如果見義勇為的行為不僅得不到法律的認可和支持,甚至可能受到法律的懲罰,在不義行為面前人們就會“睜一只眼閉一只眼”“多一事不如少一事”,作惡者就會肆無忌憚,人們的安全感就會下降。
“二階囚徒困境”是我們當(dāng)前面臨的一個重要挑戰(zhàn)!我們未來的生活如何,很大程度上取決于這個問題解決得如何。
參考文獻:Bendor, Jonathan and Piotr Swistak.(2001). “The Evolution of Norms.” American Journal of Sociology, 106-6:1493-1545.Cooter, Robert D. (1997). “Normative Failure Theory of Law.” Cornell Law Review, Vol. 82.Cooter, Robert. (2000). “Do Good Laws Make Good Citizens? An Economic Analysis of Internalized Norms.”Virgina Law Review50(8):1577-1601.Mahoney, Paul G. and Chris William Sanchirico. (2003). “Norms, Repeated Games and the Role of Law.” California Law Review, Vol.01: 1281-1329.McAdams, Richard. (1997). “The Origin, Development and Regulation of Norms.” Michigan Law Review, Vol.96, No.2: 238-433.Posner, Eric. (2000). Law and Social Norms. Cambridge, MA: Harvard University Press.
2022年6月22日。本文根據(jù)作者《博弈與社會》第六章第三節(jié)和第十三章第四節(jié)的部分內(nèi)容修改而成。
(本文轉(zhuǎn)載自清華大學(xué)-香港中文大學(xué)FMBA ,如有侵權(quán)請電話聯(lián)系13810995524)
* 文章為作者獨立觀點,不代表MBAChina立場。采編部郵箱:news@mbachina.com,歡迎交流與合作。
備考交流
- 【MBAChina 官方社群矩陣】
- 涵蓋 199管理類聯(lián)考備考 · 復(fù)試調(diào)劑 · 博士申請 · 中外合辦學(xué) 四大板塊。
- ??2027 MBA/MPA/MEM/MPAcc /EMBA聯(lián)考備考群
- ??2026 管理類聯(lián)考復(fù)試調(diào)劑群
- ??博士項目交流群
- ??中外合作辦學(xué)項目群
- ?? 添加微信:MBAChina001
- 備注【報考項目】,邀請您加入專屬交流群

掃碼關(guān)注我們
- 獲取報考資訊
- 了解院?;顒?/li>
- 學(xué)習(xí)備考干貨
- 研究上岸攻略
最新動態(tài)
活動日歷
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 06/01 6月1日直播預(yù)告:香港理工大學(xué)SPEED學(xué)院_全新碩士課程專場!26fall入學(xué)!
- 06/03 6月3日活動報名 | 北大光華-凱洛格國際EMBA項目Coffee Chat@上海
- 06/03 【活動報名】中國科學(xué)技術(shù)大學(xué)科技商學(xué)院專題講座重磅開啟!
- 06/04 6月4日 席位鎖定中 | 香港中文大學(xué)(深圳)MBM2027級招生說明會
- 06/06 長春理工大學(xué)2027級工商管理碩士(MBA)考生見面會
- 06/06 重磅!上財?shù)嗡呓?027級全日制金融碩士“新興金融探索日”活動通知
- 06/06 深圳場 | 清華-康奈爾雙學(xué)位金融MBA公開課暨2027級招生說明會報名中!
- 06/06 上海 | 紫荊課堂暨2027級清華MBA招生咨詢會報名開啟!
- 06/06 浪潮已至|南科大科創(chuàng)MBA 2027級招生啟動大會來了
- 06/06 活動報名 | “迅策科技”校友企業(yè)參訪暨清華五道口金融EMBA深圳招生說明會
熱門資訊
掃碼關(guān)注 MBAChina
掃碼關(guān)注
EMBA







