六大AI模型PK,誰才是智能投資的未來?

?智能總結“Alpha Arena”比賽中,六大頭部AI模型用一萬美元在幣圈實盤對決,阿里Qwen奪冠,兩款中國AI模型包攬冠亞軍,美國四大頂尖AI模型未盈利。這場比賽引發(fā)思考:AI真能做好投資嗎?研究發(fā)現,人類投資者與AI模型在信息處理等方面存在本質認知分工與協同空間,有效的投資決策應構建人機協同動態(tài)系統。為此設計的動態(tài)貝葉斯決策引擎可實現情境自適應權重分配,實證數據驗證了協同模型優(yōu)勢。為推動人機協同決策落地,建議建立動態(tài)加權協同評估流程、將分歧管理納入組織學習系統、配套激勵與績效評價機制 。“分歧驅動協同”模型
關聯問題: AI投資風格為何不同?人機協同如何落地?AI能取代人類投資嗎?
最近,幣圈和AI圈被一場新穎的投資直播刷屏——六大頭部AI模型在真實的幣圈交易場,用一萬美元實盤對決。短短幾天,幾款模型的收益起伏已讓無數圍觀者驚呼,AI炒幣不再只是算法回測,更成為真金白銀的實驗場。

這場AI投資大戰(zhàn),到底在比什么?
這場名叫“Alpha Arena”的比賽是由創(chuàng)業(yè)公司Nof1發(fā)起的。參賽選手個個來頭不?。篋eepSeek、Claude Sonnet 4.5、Grok 4、Qwen3 Max、Gemini 2.5 pro、GPT 5。從10月18日到11月3日,這六個AI各自獨立操盤,買什么賣什么全程直播,賬戶盈虧一目了然。

截至北京時間11月4日比賽結束,阿里Qwen以超20%的收益率奪冠,拿下本輪AI實盤投資大賽冠軍。在此前收益一路領先的DeepSeek,最終位列第二。兩款中國AI模型包攬冠亞軍,成為全場唯二盈利的大模型。而美國四大頂尖AI模型,本次比賽均未能實現盈利。其中最令人大跌眼鏡的是GPT 5,虧損幅度超60%,排名墊底。有人開玩笑說:“這下知道AI的天花板在哪兒了吧?!钡灿腥碎_始認真思考:AI真的能做好投資嗎?我們是不是真的可以把錢交給AI打理了?
比輸贏更重要的事:
AI和人到底誰更懂投資?
在圍觀之余,更值得我們關注的是這六個模型表現差異背后的深層含義。這些差異不僅僅是收益排名的高低,更反映了不同AI在信息處理和決策邏輯上的根本分歧。而當我們進一步思考這些差異的來源時,會發(fā)現一個更具啟發(fā)性的問題:AI與人類在評估投資機會時,遵循的認知路徑有哪些不同?
理解這一差異至關重要,它決定了AI能否真正為投資機構創(chuàng)造價值,也關系到未來投資行業(yè)的決策模式變革。
我們最近做了項研究,叫《人機協作決策中的非對稱動態(tài)貝葉斯學習:基于風投項目篩選的實證研究》,就是從投資者和AI在風險投資篩選中的實證數據出發(fā),揭示二者在項目研判過程中的本質差異。研究發(fā)現:人類投資者與AI模型在信息處理、項目評估和決策判斷時,存在本質上的認知分工與協同空間。
AI投資風格各異,本質是信息處理路徑的差異
回看Alpha Arena的比賽,這幾個AI模型展現出截然不同的投資風格。
DeepSeek表現穩(wěn)健,持倉分散,很少止損,像是經驗豐富的量化投資經理。Gemini 2.5交易頻繁,反應迅速,卻容易追漲殺跌,賬戶凈值持續(xù)下滑。Claude Sonnet分析嚴謹但執(zhí)行猶豫,經常錯失調倉時機。Qwen3 Max偏好重倉單一標的,杠桿使用激進,一旦判斷失誤,損失慘重。GPT 5則在連續(xù)止損后表現低迷,陷入典型的“算法困境”。①
我們在研究VC投資篩選時也觀察到類似現象。同一個項目,人類投資者和AI模型的預測結果經常大相徑庭,甚至呈現系統性負相關。這并非簡單的對錯之分,而是因為兩者的評估維度和認知結構存在根本差異,從而在決策邏輯上形成了高度互補性。

判斷分歧不是缺陷,而是“信息富礦”
在我們的研究中,通過分析近3萬對人類-AI(human-AI pairs)的投資決策數據,我們得出了幾個重要發(fā)現。
第一,人類和AI的預測結果呈現結構性互補。雙方不僅存在顯著負相關,更重要的是,這種系統性決策分歧本身蘊含的信息價值,超越了任何一方的獨立判斷。尤其在雙方判斷不一致時,往往揭示了關鍵的特殊信號。
第二,風險識別與機會發(fā)現存在認知分工。人類決策者對負面信號更為敏感,擅長規(guī)避重大失誤。而AI模型更善于從復雜數據中識別被忽視的積極信號,發(fā)掘具有高成長潛力的項目。
第三,在知識盲區(qū)中,分歧價值尤為顯著。當投資者面對不熟悉的領域時,AI提供的異質判斷能發(fā)揮關鍵的監(jiān)督與補充作用,顯著提升決策準確率。
第四,AI具備更強的元認知校準能力。相較于人類,AI展現出更優(yōu)秀的“信任校準能力”——能夠判斷人類決策者何時可能出錯,何時因投入不足而做出低質量判斷。這一特性在實際投資運作中價值顯著。
有效的投資決策,最優(yōu)模式并非AI取代人類,而是構建人機協同的動態(tài)系統。在這個系統中,AI的核心職能是診斷人類決策的潛在失誤點,而人類則充分發(fā)揮主觀經驗與直覺判斷的優(yōu)勢,雙方精準配合從而實現決策效能最大化。
構建新范式:
從零和博弈到協同增效
當前關于“AI能否超越人類”的討論,往往陷入零和博弈的誤區(qū)。Alpha Arena中波動的收益曲線揭示,核心問題不是尋找永遠正確的決策主體,而是如何理解并利用不同AI在信息處理與推理邏輯上的差異。不同AI展現出各自獨特的優(yōu)勢與偏好,而人類的真正潛力,正在于能夠整合這些異質化的智能,將它們與人類的直覺和判斷動態(tài)結合,從而最大化系統的信息融合與糾錯能力。
基于這一認識,我們設計并驗證了一套可應用于實際投資的決策支持系統。
動態(tài)貝葉斯決策引擎:實現情境自適應的權重分配
系統核心是一個動態(tài)貝葉斯模型,關鍵突破在于:決策權重不是預先固定的,而是根據具體情境動態(tài)判定“誰在當前環(huán)境下更可靠”。
系統運用機器學習算法,為每個項目、每位評估者及每輪決策實時計算“信任得分”,據此分配最終決策權重。在評分過程中,AI能夠根據人類決策輸入的深度、廣度與一致性來判斷其可靠性;而人類通常只能基于AI輸出的表層信息進行判斷。這種非對稱性使得“AI監(jiān)督人類”的效能遠高于反向操作。

分歧驅動的績效提升
實證數據清晰驗證了協同模型的優(yōu)勢。在人類與AI單獨準確率分別為54%與58%的情況下,我們的動態(tài)協同模型將整體準確率提升至78.5%,明顯優(yōu)于傳統靜態(tài)加權模型的77.4%。
更關鍵的是,性能提升最顯著的場景出現在雙方意見分歧極大的項目中——這些正是投資實踐中最棘手、信息最模糊的決策難點。在投資者行業(yè)知識或評估經驗不足的樣本中,“AI監(jiān)督人類”模式的效果最為突出,準確率較人類單獨決策高出13個百分點以上。
Alpha Arena引發(fā)的關注多集中于模型間的輸贏,但我們的研究揭示了更深層的洞察:人機協同的價值不在于單一主體的勝出,而在于系統性地尋找能力互補的最優(yōu)組合。
AI模型的表現分化反映了不同算法在信息維度上的專業(yè)化分工。有的擅長市場情緒解析,有的對技術信號更敏感,有的善于趨勢跟蹤,這表明不存在“一統全局”的通用模型。人類投資者憑借直覺與經驗,能夠捕捉算法難以量化的隱性信號,但在面對陌生領域或大規(guī)模判斷時,容易受到疲勞、偏見與投入度波動的影響。因此,只有構建能夠充分利用“分歧信息”的協同機制,投資團隊才能從復雜的市場信號中提煉出可靠的決策依據。
這一協同范式具有廣泛的應用潛力。雖然實驗場景集中在加密貨幣市場,但動態(tài)協同模型可拓展至諸多高不確定性領域。在新藥研發(fā)與科技投資中,它能實現AI數據驅動與專家知識的深度融合;在醫(yī)療急診分診中,可借助AI輔助識別醫(yī)生可能遺漏的危重癥指征;在大規(guī)模服務與客戶優(yōu)先級分配中,則能通過AI監(jiān)督系統性規(guī)避人工決策盲區(qū)。這表明,人機協同的價值已超越投資范疇,成為提升復雜決策可靠性的通用方法。
如何實施?
實際落地建議與組織變革
為有效推動人機協同決策模式在組織中落地,我們提出以下建議:
建立動態(tài)加權的協同評估流程
企業(yè)應構建“人類+AI雙軌評估”機制,確保每個項目均由人類專家與AI系統獨立完成評估。系統根據信任模型,自動識別雙方判斷分歧,并為不同決策主體生成動態(tài)的“信任權重”。在分歧顯著或風險較高的場景中,決策主導權靈活分配——或由AI發(fā)起判斷并由人工復核,或由人類提出初步意見并由AI進行可信度校驗。該流程的核心在于,根據具體情境動態(tài)判定“何種決策主體在當前任務中更具效力”,實現權重的場景自適應調整。
將分歧管理納入組織學習系統
組織應組建具備多元背景的投資團隊,使其與AI系統共同參與項目評估,借助模型能力識別并彌補團隊的認知或經驗短板。同時,高度重視“分歧項目”的復盤分析,將模型輸出的信號差異轉化為團隊培訓與案例學習的核心素材。此外,AI系統可持續(xù)監(jiān)測人類決策者的狀態(tài),識別因疲勞、投入不足或認知偏見導致的判斷質量下降,據此實現權重的實時干預與校準。

配套激勵與績效評價機制
為保障協同機制的有效運行,組織需對激勵與績效評價體系進行相應升級。例如,可引入“準確率提升獎勵”機制,對由人機協同帶來的決策精度提升及其產生的實際經濟價值予以專項獎勵。在復雜標的、陌生行業(yè)或新興領域的投資決策中,應優(yōu)先采用AI與人類協同篩選機制,系統性降低因經驗缺失導致的誤判風險。
AI與人類投資者的協同,不是“算法替代人類”,而是一場認知分工與能力整合的變革。正如Alpha Arena所展示的,不同AI風格各異、各有所長,沒有任何單一模型能夠始終領先。正因如此,只有系統性地利用決策分歧、建立動態(tài)信任機制,投資團隊才能在高度不確定的市場環(huán)境中保持競爭優(yōu)勢。
我們提出的“分歧驅動協同”模型,已在風險投資場景中初步驗證其價值。當然,將理論模型全面引入真實投資決策流程,仍面臨諸多挑戰(zhàn),需要在更多元、更復雜的實際場景中開展進一步研究。
正如Alpha Arena通過公開實盤將AI決策推向大眾視野,我們相信,未來的人機協同決策研究也將走向更開放、更透明的實驗場。隨著算法透明度的提升與人機交互機制的深化,一個由人類智慧與機器智能共同進化的投資新范式正在形成——那將不再是“誰更擅長投資”的競爭,而是“如何更好地共同決策”的探索。
教授簡介
陳卓博士是中歐國際工商學院戰(zhàn)略學助理教授。在加入中歐前,她曾在位于美國華盛頓特區(qū)的美利堅大學(American University)科歌德商學院(Kogod School of Business)擔任管理學助理教授。陳卓博士畢業(yè)于美國萊斯大學,并獲得戰(zhàn)略管理學博士和碩士學位,她在美國杜克大學獲得經濟學碩士學位。
陳卓博士的研究聚焦于企業(yè)戰(zhàn)略和創(chuàng)業(yè)創(chuàng)新,尤其是企業(yè)并購、企業(yè)風險資本和知識產權等行為在企業(yè)技術采購,融資和創(chuàng)新中的作用。
(本文轉載自中歐國際工商學院 ,如有侵權請電話聯系13810995524)
* 文章為作者獨立觀點,不代表MBAChina立場。采編部郵箱:news@mbachina.com,歡迎交流與合作。
備考交流
- 【MBAChina 官方社群矩陣】
- 涵蓋 199管理類聯考備考 · 復試調劑 · 博士申請 · 中外合辦學 四大板塊。
- ??2027 MBA/MPA/MEM/MPAcc /EMBA聯考備考群
- ??2026 管理類聯考復試調劑群
- ??博士項目交流群
- ??中外合作辦學項目群
- ?? 添加微信:MBAChina001
- 備注【報考項目】,邀請您加入專屬交流群
最新動態(tài)
活動日歷
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 06/01 6月1日直播預告:香港理工大學SPEED學院_全新碩士課程專場!26fall入學!
- 06/03 6月3日活動報名 | 北大光華-凱洛格國際EMBA項目Coffee Chat@上海
- 06/03 【活動報名】中國科學技術大學科技商學院專題講座重磅開啟!
- 06/04 6月4日 席位鎖定中 | 香港中文大學(深圳)MBM2027級招生說明會
- 06/06 長春理工大學2027級工商管理碩士(MBA)考生見面會
- 06/06 重磅!上財滴水湖高金2027級全日制金融碩士“新興金融探索日”活動通知
- 06/06 深圳場 | 清華-康奈爾雙學位金融MBA公開課暨2027級招生說明會報名中!
- 06/06 上海 | 紫荊課堂暨2027級清華MBA招生咨詢會報名開啟!
- 06/06 浪潮已至|南科大科創(chuàng)MBA 2027級招生啟動大會來了
- 06/06 活動報名 | “迅策科技”校友企業(yè)參訪暨清華五道口金融EMBA深圳招生說明會
熱門資訊
掃碼關注 MBAChina
掃碼關注
EMBA









