以博弈論破局:中美關稅戰(zhàn)中「一報還一報」的戰(zhàn)略啟示|教授觀點

?智能總結中美關稅戰(zhàn)雖暫停,但影響仍在,已演變?yōu)槿蚪?jīng)濟秩序重構的戰(zhàn)略較量。特朗普政府在關稅問題上操作如“囚徒困境”,以突襲加征關稅等手段進行零和博弈,部分國家“屈服”,中國堅決反制。美國學者阿克塞爾羅德通過計算機模擬“重復的囚徒困境”錦標賽,發(fā)現(xiàn)“一報還一報”策略獲勝,即在適當條件下個體可從追求自身利益發(fā)展為合作。中美關稅戰(zhàn)中,中國先針鋒相對后開啟談判并達成妥協(xié),類似“一報還一報”策略,誘使并逼迫美方合作。合作需斗爭,中國應繼續(xù)堅持該策略,在關稅戰(zhàn)中為自身和全球貿(mào)易爭取更好結果 。
關聯(lián)問題: 中美關稅戰(zhàn)后續(xù)走向如何一報還一報策略優(yōu)勢在哪怎樣實現(xiàn)全球貿(mào)易合作
當市場情緒隨著關稅清單的增減跌宕起伏時,這場博弈早已超越簡單的貿(mào)易摩擦,演變?yōu)殛P乎全球經(jīng)濟秩序重構的戰(zhàn)略較量,每一個回合都牽動著產(chǎn)業(yè)鏈的神經(jīng)。
特朗普政府在關稅問題上的操作堪稱現(xiàn)實版“囚徒困境”:競選時高調(diào)宣揚關稅威脅,執(zhí)政后以“突然襲擊”式加征關稅為籌碼,輔以90天凍結期的心理戰(zhàn)術,將貿(mào)易談判異化為零和博弈的試驗場。
面對這場沒有硝煙的持久戰(zhàn),我們?nèi)绾螛嫿群葱l(wèi)核心利益、又避免兩敗俱傷的戰(zhàn)略框架?


中美關稅戰(zhàn)按下了暫停鍵,但硝煙遠未散盡。
當市場情緒伴隨著關稅戰(zhàn)的大起大落而忽高忽低時,有一個問題卻是中國,尤其是決策層最需要關注的,即中國應該采取什么樣的策略才能從根本上維護自身的長遠利益呢?
我們先來看看我們的對手唐納德?特朗普(Donald Trump,簡稱特朗普)是如何做的?
說實在話,特朗普在關稅這個問題上既是言出必行,又是出爾反爾。說他言出必行是指特朗普在競選的時候就多次贊美關稅,并聲稱要對中國征收高達60%的關稅。
現(xiàn)在看來,他的確是真正揮舞起了關稅這根大棒;說他出爾反爾是指特朗普一會兒說要給多少國家征收多少關稅,一會兒又把自己加征關稅的命令凍結90天等等。
這種忽左忽右的做法讓人確實有些摸不著頭腦,但想想特朗普商人的出身也不難理解。在特朗普的眼中,這個世界沒有正義和邪惡,只有利益和交易,而交易或談判就是零和博弈,沒有雙贏,只有我贏你輸。
他覺得憑借美國世界第一超級大國、第一商品進口大國的地位可以對貿(mào)易對象國搞突然襲擊、極限施壓,再通過后續(xù)談判逼迫對手屈服,接受他的“對等關稅”,同時對美國商品和服務進口大開綠燈。這樣,特朗普就可以大言不慚地宣稱他贏了,而別國的領導人則成了“失敗者”的形象。
應該說,這種做法還真起到了一定的效果,一些國家“屈服”了,只好“求著”美國達成新的貿(mào)易協(xié)議。當然,這時候談判的主導權就到了特朗普的手中。也有一些國家或國家集團說要報復,但到目前為止只是說說而已。
然而,中國沒有吃他的這一套。隨著特朗普對中國加征越來越高的關稅,中國也進行了層層加碼的反制。最后,按照雙方加征的關稅,中美之間的直接貿(mào)易相當于被人為地“中斷”了。
中國的這種做法代表了立地為人、不甘屈服的態(tài)度,是一個大國應有的氣節(jié)。但拋開感情因素來說,如何從根本上維護中國自身的長遠利益呢?
這方面美國的一項學術研究成果或許可以給我們帶來一些啟發(fā)。
二戰(zhàn)后不久,國際地緣政治就進入美國和蘇聯(lián)兩極競爭的冷戰(zhàn)時代,而美蘇這兩個超級大國都擁有摧毀整個地球的核威懾力。
冷戰(zhàn)的陰云也影響到了學術界。當時的學者,尤其是政治學家,非常熱衷于使用博弈論(Game Theory)的框架來分析美蘇兩國的冷戰(zhàn)策略,這里面一個典型且常用的博弈論模型就是囚徒困境(Prisoner's Dilemma)。
囚徒困境模型并不復雜,甚至可以說是十分的接地氣。它說的是警方逮捕了甲、乙兩名合伙犯罪嫌疑人,但沒有足夠證據(jù)指控兩人合伙犯罪。于是警方分開審訊嫌疑犯,并向雙方提供以下相同的選擇:
1.若你自己認罪并作證檢控你的伙伴(我們將此行為定義為“背叛”),而你的伙伴保持沉默,那么作為證人你將即時獲釋,而你的伙伴將被判監(jiān)10年。
2. 若你們兩人都保持沉默(我們將此行為定義為“合作”),則兩人都將被判監(jiān)半年。
3. 若你們兩人都互相檢舉(互相“背叛”),則兩人都將被判監(jiān)5年。
用表格概述如下:

囚徒困境假定每個玩家(囚徒)都是利己的,即都尋求最大自身利益,而不關心其伙伴的利益。另外,我們假定沒有任何其他力量干預個人決策,玩家可完全按照自己意愿選擇策略。
陷入困境的玩家到底應該選擇哪一項策略才能將自己個人的刑期縮至最短?甲和乙由于隔絕審訊并不知道對方的選擇,而且即使他們能交談,也未必能夠盡信對方所說的話。就個人的理性選擇而言,背叛對手方獲得的刑期,總比沉默要來得低。試設想困境中的甲會如何做出選擇:
?若乙沉默、甲背叛,這會讓甲獲釋,所以甲會選擇背叛。
?若乙背叛,甲也要背叛才能得到較低的刑期,所以甲也會選擇背叛。
兩人面對的情況一樣,所以兩人的理性思考都會得出相同的結論——無論對方做哪種選擇,自己選擇背叛是最優(yōu)。
在博弈論里,背叛就因此被稱為占優(yōu)策略(Dominant Strategy),也是這個博弈模型的“納什均衡”(Nash Equilibrium)策略。我們對博弈結果合理的預測就是兩人都背叛,同樣服刑5年。
從個體出發(fā)最理性、收益最大的策略卻不是整體上最理性、收益最大的策略。
我們時常會感嘆人類的自私與短視,囚徒困境似乎也從學理上支持了這種看法。但有人并沒有止步于此,畢竟,現(xiàn)實中人與人之間合作的范例也是舉目可見的。難道美蘇兩國的核軍備競賽的終點注定了就是人類的毀滅嗎?是否存在某些條件使得強大的對手能夠超越相互確保的核毀滅并轉(zhuǎn)向相互合作呢?
帶著對這個問題的好奇,美國密歇根大學的政治學家羅伯特?阿克塞爾羅德(Robert Axelrod,簡稱阿克塞爾羅德)在1977年設計了一場由計算機模擬的囚徒困境錦標賽。阿克塞爾羅德具體的做法是擴展經(jīng)典的囚徒困境,改玩一個回合就決定勝負的博弈為玩多個回合的博弈,這就是“重復的囚徒困境”(Iterated Prisoner's Dilemma)。
為什么要這么做呢?因為人和國家的壽命都不短,而且并不是所有的交易或談判都是一錘子買賣。其實,人類大部分重要的交易都發(fā)生在“熟人”之間(比如上班的同事們、供應鏈上的相關企業(yè)等)。
阿克塞爾羅德向心理學、經(jīng)濟學、政治學、數(shù)學和社會學等領域的專家學者發(fā)出邀請,讓他們設計他們認為最優(yōu)的囚徒困境策略,并寫成計算機程序代碼(使用當時流行的計算機語言Fortran或Basic),然后郵寄給他。
阿克塞爾羅德的計劃是將這些策略的程序代碼放入密歇根大學計算中心的主機中去進行一對一的多回合對壘,看哪種策略獲得的積分最高。比賽的規(guī)則如下:
?每種參賽策略都將和另外一個參賽策略配對,然后進行200個回合的囚徒困境博弈。
?每種參賽策略還將與其自身以及一個隨機策略進行博弈,這個隨機策略就是由計算機在每一回合隨機的選擇背叛或合作。
?參賽策略無法在每一回合前互相交流,所以不知道對手方在本次回合中會做出哪種選擇;但可以觀察到對手方過去的選擇,并參照對手方過去的選擇來做出己方現(xiàn)在和未來的選擇。
?每回合的博弈結束后,對壘雙方將按以下方式獲得積分:相互合作各得三分;相互背叛各得一分;當一名玩家合作另一名背叛時,背叛的玩家得五分,合作的玩家得零分。
從博弈的設計我們可以看到,在相互合作的情況下,雙方得分總和達到最高(3+3=6,即可分的蛋糕最大);而在相互背叛的情況下,雙方得分總和最低(1+1=2,即可分的蛋糕最?。?/span>。所以,囚徒困境并非零和博弈,只要合作就能實現(xiàn)雙贏。
比賽結束后,阿克塞爾羅德將統(tǒng)計每種策略的總分數(shù)并看看誰是最終的獲勝者。這樣一來,阿克塞爾羅德就成功地將一個爭議不清的定性的問題轉(zhuǎn)化為了一個直觀的定量的問題。
阿克塞爾羅德一共收到了14種策略,隨后他將這些策略的代碼放入計算機中模擬對壘。結果大大出乎他的意料之外,獲勝者竟然是“一報還一報”(Tit For Tat)策略。
“一報還一報”的策略非常簡單:
1. 在第一回合比賽中要采取合作的態(tài)度;
2. 在此后的每一回合比賽中,就做對手在前一回合比賽中所做的事情。換句話說,對方合作,己方立即合作;對方背叛,己方立即背叛。
然而,阿克塞爾羅德對這樣的結果仍存有疑慮,因此他又組織了第二場比賽。第二次比賽的規(guī)模更大,阿克塞爾羅德一共收到了62種策略。萬萬沒有想到的是,獲勝者依然是“一報還一報”。
“一報還一報”意味著奉行這一策略的參賽者對另一方有三個態(tài)度:一,先禮;二,禮來回禮;三,兵來回兵。
大家是不是也覺得很有趣?假如你覺得你可以設計一個更牛的策略,不妨在自己的電腦上寫一個程序,拿“一報還一報”來對壘一下。
阿克塞爾羅德由此推論在適當?shù)臈l件下,獨立的個體完全有可能從各自追求自身的利益發(fā)展成一種大家都能繁榮發(fā)展的合作狀態(tài)。
進一步說,當人們遵守以下三條規(guī)則時,合作就成為可能:
●1、只要對手愿意合作,就應積極合作,以避免不必要的沖突;
●2、如果對手背叛你,那就進行一次“一報還一報”;
●3、假如對手在背叛后又選擇合作,那就原諒對手過去的背叛(既往不咎),并選擇再次合作。
始終遵循步驟1、2和3,這樣你的對手就能了解你的行為,并據(jù)此調(diào)整他的策略。
實際上,細心的讀者可能已經(jīng)發(fā)現(xiàn),“一報還一報”的策略在“一錘子買賣”的博弈中必敗無疑,但它卻能成功誘導“熟人”長期合作而實現(xiàn)最終的雙贏勝利。
回到中美關稅戰(zhàn)的問題。中國在這場令人眼花繚亂的關稅戰(zhàn)中先是與特朗普政府針鋒相對,隨后又打開了談判的大門,并在日內(nèi)瓦的談判上最終與美方達成妥協(xié),雙方大幅下調(diào)關稅,這是不是很像“一報還一報”的策略?
畢竟中美兩國是全球經(jīng)濟的兩極,都具備讓全球經(jīng)濟深陷大蕭條的能力,也是地球上相互擺脫不了的鄰居,只有合作才能實現(xiàn)雙贏。
現(xiàn)在關稅戰(zhàn)只是按下了暫停鍵,但它并沒有完全遠離我們而去。筆者認為中國在截至目前的斗爭中所采取的策略是正確的。這種“一報還一報”的策略一邊誘使、一邊逼迫特朗普政府采取合作的態(tài)度來解決關稅的問題。中方做到了不卑不亢,而特朗普則暴露了其色厲內(nèi)荏的本質(zhì)。
特朗普的胃口是難以滿足的,這方面我們可以看看英國的例子。英國是美國的傳統(tǒng)盟國,而且英國對美國是貿(mào)易逆差國,但特朗普依然迫使英國簽訂了一份損人的關稅協(xié)議。雖然這個協(xié)議對美國的長期利益沒有幫助,但特朗普卻可以大吹大擂他在談判桌上的勝利。
不敢想象,假如中國采取英國的態(tài)度,中美之間的關稅協(xié)議會是何種模樣?
合作是斗爭出來的合作,不是綏靖出來的,所以有以打促和的說法。在中美達成最終的貿(mào)易協(xié)定之前肯定還會有很多波折,但拿定主心骨,繼續(xù)堅持“一報還一報”,就像中方所言——“談,大門敞開;打,奉陪到底”——的那樣,那么筆者相信中國一定會在這場波及全球的關稅戰(zhàn)中不但為自己爭取到一個更好的結果,也為維護全球正常貿(mào)易、減少這個世界的關稅做出自己的貢獻,而這就是從根本上維護了中國自身的長遠利益。
(本文轉(zhuǎn)載自長江商學院MBA ,如有侵權請電話聯(lián)系13810995524)
* 文章為作者獨立觀點,不代表MBAChina立場。采編部郵箱:news@mbachina.com,歡迎交流與合作。
備考交流
- 【MBAChina 官方社群矩陣】
- 涵蓋 199管理類聯(lián)考備考 · 復試調(diào)劑 · 博士申請 · 中外合辦學 四大板塊。
- ??2027 MBA/MPA/MEM/MPAcc /EMBA聯(lián)考備考群
- ??2026 管理類聯(lián)考復試調(diào)劑群
- ??博士項目交流群
- ??中外合作辦學項目群
- ?? 添加微信:MBAChina001
- 備注【報考項目】,邀請您加入專屬交流群
最新動態(tài)
活動日歷
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 06/01 6月1日直播預告:香港理工大學SPEED學院_全新碩士課程專場!26fall入學!
- 06/03 6月3日活動報名 | 北大光華-凱洛格國際EMBA項目Coffee Chat@上海
- 06/03 【活動報名】中國科學技術大學科技商學院專題講座重磅開啟!
- 06/04 6月4日 席位鎖定中 | 香港中文大學(深圳)MBM2027級招生說明會
- 06/06 長春理工大學2027級工商管理碩士(MBA)考生見面會
- 06/06 重磅!上財?shù)嗡呓?027級全日制金融碩士“新興金融探索日”活動通知
- 06/06 深圳場 | 清華-康奈爾雙學位金融MBA公開課暨2027級招生說明會報名中!
- 06/06 上海 | 紫荊課堂暨2027級清華MBA招生咨詢會報名開啟!
- 06/06 浪潮已至|南科大科創(chuàng)MBA 2027級招生啟動大會來了
- 06/06 活動報名 | “迅策科技”校友企業(yè)參訪暨清華五道口金融EMBA深圳招生說明會
熱門資訊
掃碼關注 MBAChina
掃碼關注
EMBA








