歐陽(yáng)雜談 | 外行視角看AI的發(fā)展(下):從工具到未來(lái)

?智能總結(jié)歐陽(yáng)雜談 | 外行視角看AI的發(fā)展(下):從工具到未來(lái)
在上期推送,歐陽(yáng)教授使用Deepseek R1 671B模型生成“外行視角看AI的發(fā)展”一文。本期歐陽(yáng)教授結(jié)合chatGPT就同話題進(jìn)行了對(duì)比生成。

人工智能(AI)近年來(lái)取得了令人矚目的進(jìn)展,尤其是大語(yǔ)言模型(LLM,Large Language Model)的崛起,使其成為科技競(jìng)賽的核心領(lǐng)域。然而,對(duì)于外行而言,理解AI的發(fā)展往往伴隨著誤解與夸大。本文將從外行的視角分析大語(yǔ)言模型的本質(zhì)、應(yīng)用前景、技術(shù)瓶頸及未來(lái)方向。

歐陽(yáng)良宜
北京大學(xué)匯豐商學(xué)院副院長(zhǎng)
北京大學(xué)匯豐商學(xué)院EMBA項(xiàng)目主任
特別提示
?本文大綱:歐陽(yáng)良宜
?文本生成:chatGPT
?本文未作事實(shí)查證(fact check)
大語(yǔ)言模型的本質(zhì):基于概率預(yù)測(cè)的數(shù)字序列
大語(yǔ)言模型的核心原理是將人類文獻(xiàn)轉(zhuǎn)換為數(shù)字序列,并通過(guò)概率計(jì)算預(yù)測(cè)下一個(gè)最可能出現(xiàn)的數(shù)字。在訓(xùn)練過(guò)程中,模型通過(guò)大量語(yǔ)料庫(kù)學(xué)習(xí)語(yǔ)言的統(tǒng)計(jì)規(guī)律,并通過(guò)參數(shù)權(quán)重調(diào)整優(yōu)化預(yù)測(cè)能力。然而,這種方法的局限性在于,它并不真正“理解”語(yǔ)言,而是基于統(tǒng)計(jì)規(guī)律進(jìn)行預(yù)測(cè)。
這種基于概率的預(yù)測(cè)方式導(dǎo)致了“幻覺(jué)”(hallucination)現(xiàn)象,即模型可能在看似合理的情況下生成錯(cuò)誤或荒謬的內(nèi)容。例如,GPT-4在回答復(fù)雜問(wèn)題時(shí),可能因訓(xùn)練數(shù)據(jù)的局限性或隨機(jī)性而犯低級(jí)錯(cuò)誤。這表明,無(wú)論如何優(yōu)化,大語(yǔ)言模型的本質(zhì)決定了其永遠(yuǎn)無(wú)法完全避免幻覺(jué)。

大語(yǔ)言模型的知識(shí)掌握能力與應(yīng)用價(jià)值
盡管存在幻覺(jué)問(wèn)題,大語(yǔ)言模型在知識(shí)掌握方面已經(jīng)超越了絕大多數(shù)普通人。其預(yù)訓(xùn)練參數(shù)中包含了大量來(lái)自互聯(lián)網(wǎng)、書籍、論文等的結(jié)構(gòu)化知識(shí),使其在多種領(lǐng)域表現(xiàn)優(yōu)異。例如:
?寫作應(yīng)用:企業(yè)公函、市場(chǎng)營(yíng)銷文案、法律合同初稿等,都可以通過(guò)大語(yǔ)言模型快速生成,提高效率。
?編程助手:GitHub Copilot 已經(jīng)能幫助程序員自動(dòng)補(bǔ)全代碼,提高開(kāi)發(fā)速度。
?教育與咨詢:LLM 可以充當(dāng)私人導(dǎo)師,提供數(shù)學(xué)、歷史、經(jīng)濟(jì)等多方面的解答。
根據(jù)OpenAI的數(shù)據(jù)顯示,使用GPT-4.0的用戶在撰寫商務(wù)郵件時(shí),效率提升了30%以上,部分企業(yè)通過(guò)AI客服系統(tǒng)減少了超過(guò)40%的人工成本。這表明,盡管AI尚未達(dá)到真正的智能,但在實(shí)際應(yīng)用中,它已經(jīng)成為高效的生產(chǎn)力工具。

強(qiáng)化學(xué)習(xí)的發(fā)展:尚未迎來(lái)“AlphaGo 第37手”時(shí)刻
目前,大語(yǔ)言模型的核心技術(shù)仍然以自回歸生成(Autoregressive Generation)為主,而強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)則處于相對(duì)早期的發(fā)展階段。強(qiáng)化學(xué)習(xí)的代表性突破是AlphaGo在2016年對(duì)戰(zhàn)李世石時(shí)的第37手,這標(biāo)志著AI在圍棋領(lǐng)域超越人類的關(guān)鍵時(shí)刻。然而,在大語(yǔ)言模型的領(lǐng)域,這種突破尚未發(fā)生。
當(dāng)前,強(qiáng)化學(xué)習(xí)主要用于微調(diào)LLM,如OpenAI 采用“強(qiáng)化學(xué)習(xí)獎(jiǎng)勵(lì)模型”(RLHF)優(yōu)化ChatGPT,使其更符合人類偏好。然而,在更廣泛的非規(guī)則場(chǎng)景中,如開(kāi)放式問(wèn)題解答、跨學(xué)科推理,RL仍面臨巨大挑戰(zhàn)。例如:
?強(qiáng)化學(xué)習(xí)依賴高質(zhì)量的反饋數(shù)據(jù),但人類標(biāo)注數(shù)據(jù)成本高昂,規(guī)模有限。
?語(yǔ)言模型的行為空間遠(yuǎn)大于圍棋、國(guó)際象棋等固定規(guī)則游戲,導(dǎo)致優(yōu)化難度更高。
?當(dāng)前的強(qiáng)化學(xué)習(xí)模型在通用認(rèn)知推理方面仍未展現(xiàn)超越人類的能力。
因此,我們?nèi)栽诘却鼳I的“AlphaGo 第37手”時(shí)刻,即AI在復(fù)雜開(kāi)放環(huán)境中做出真正超越人類直覺(jué)的創(chuàng)新決策。
多模態(tài)模型的挑戰(zhàn):數(shù)據(jù)與計(jì)算的雙重限制
目前主流大語(yǔ)言模型的訓(xùn)練數(shù)據(jù)仍然主要依賴結(jié)構(gòu)化的文本數(shù)據(jù),而對(duì)圖片、視頻等非結(jié)構(gòu)化數(shù)據(jù)的整合仍在早期探索階段。多模態(tài)模型(Multimodal Model)如GPT-4-Vision和Gemini 1.5 嘗試將文本與圖像結(jié)合,但仍面臨巨大挑戰(zhàn):
?數(shù)據(jù)需求指數(shù)級(jí)增長(zhǎng):相比于文本數(shù)據(jù),圖像和視頻的token化需要更高的存儲(chǔ)和計(jì)算資源。例如,訓(xùn)練一個(gè)多模態(tài)模型所需的token數(shù)量可能比文本模型高出幾個(gè)數(shù)量級(jí)。
?計(jì)算成本高昂:目前GPT-4級(jí)別的模型訓(xùn)練需要數(shù)千張A100/H100 GPU,而如果擴(kuò)展到大規(guī)模視頻數(shù)據(jù),算力需求將呈幾何級(jí)數(shù)增長(zhǎng)。
?能源消耗問(wèn)題:據(jù)估算,訓(xùn)練GPT-4的碳排放可能相當(dāng)于10萬(wàn)輛汽車行駛一年的排放量,而更大規(guī)模的多模態(tài)模型將進(jìn)一步加劇能源問(wèn)題。
如果沒(méi)有方法論上的創(chuàng)新,比如更高效的架構(gòu)、更優(yōu)的訓(xùn)練策略,那么大規(guī)模多模態(tài)模型的成本將會(huì)達(dá)到難以承受的地步。

輕量化大語(yǔ)言模型與智能硬件的結(jié)合:制造業(yè)的機(jī)會(huì)
盡管大模型訓(xùn)練面臨算力瓶頸,但輕量化大語(yǔ)言模型(如Gemini Nano, Mistral, LLaMA-3小型版本)在邊緣計(jì)算領(lǐng)域展現(xiàn)了巨大的應(yīng)用前景。相比于云端部署,邊緣計(jì)算的優(yōu)勢(shì)包括:
?本地運(yùn)行,降低延遲:在手機(jī)、智能音箱、車載系統(tǒng)中運(yùn)行LLM,可以提供即時(shí)響應(yīng),而無(wú)需依賴云端。
?數(shù)據(jù)安全性更高:本地AI助手可以減少用戶數(shù)據(jù)外泄風(fēng)險(xiǎn),提高隱私保護(hù)能力。
?成本可控:相比動(dòng)輒數(shù)億美元的GPT-4級(jí)模型,小型LLM可以運(yùn)行在成本更低的芯片上,如蘋果M系列芯片或高通Snapdragon AI引擎。
對(duì)于中國(guó)企業(yè)而言,智能硬件制造能力和工程優(yōu)化能力都是全球領(lǐng)先的,這使得中國(guó)公司有能力在“輕量級(jí)AI+硬件”的賽道上取得競(jìng)爭(zhēng)優(yōu)勢(shì)。例如,華為、小米等公司已經(jīng)在智能手機(jī)、智能家居領(lǐng)域布局AI助手,而未來(lái)智能汽車、可穿戴設(shè)備也可能成為大模型應(yīng)用的重要場(chǎng)景。

結(jié)語(yǔ)
大語(yǔ)言模型的發(fā)展已經(jīng)進(jìn)入了深水區(qū)。其本質(zhì)仍然是基于概率預(yù)測(cè)的數(shù)字序列,因此無(wú)法完全避免幻覺(jué)問(wèn)題,但這并不影響其在商業(yè)、教育、編程等領(lǐng)域的實(shí)際價(jià)值。強(qiáng)化學(xué)習(xí)的突破尚未到來(lái),但在規(guī)則明確的領(lǐng)域仍有望超越人類。多模態(tài)模型的進(jìn)展受限于數(shù)據(jù)和算力的挑戰(zhàn),而輕量級(jí)模型則為智能硬件的發(fā)展提供了新機(jī)遇。
對(duì)于普通人而言,理解AI的局限性與機(jī)遇同樣重要。未來(lái),AI將繼續(xù)深度滲透各行各業(yè),而擁有制造和工程優(yōu)勢(shì)的國(guó)家和企業(yè),將在這場(chǎng)科技競(jìng)賽中占據(jù)更有利的位置。
(本文轉(zhuǎn)載自北大匯豐EMBA ,如有侵權(quán)請(qǐng)電話聯(lián)系13810995524)
* 文章為作者獨(dú)立觀點(diǎn),不代表MBAChina立場(chǎng)。采編部郵箱:news@mbachina.com,歡迎交流與合作。
備考交流
- 【MBAChina 官方社群矩陣】
- 涵蓋 199管理類聯(lián)考備考 · 復(fù)試調(diào)劑 · 博士申請(qǐng) · 中外合辦學(xué) 四大板塊。
- ??2027 MBA/MPA/MEM/MPAcc /EMBA聯(lián)考備考群
- ??2026 管理類聯(lián)考復(fù)試調(diào)劑群
- ??博士項(xiàng)目交流群
- ??中外合作辦學(xué)項(xiàng)目群
- ?? 添加微信:MBAChina001
- 備注【報(bào)考項(xiàng)目】,邀請(qǐng)您加入專屬交流群

掃碼關(guān)注我們
- 獲取報(bào)考資訊
- 了解院?;顒?dòng)
- 學(xué)習(xí)備考干貨
- 研究上岸攻略
最新動(dòng)態(tài)
活動(dòng)日歷
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 06/01 6月1日直播預(yù)告:香港理工大學(xué)SPEED學(xué)院_全新碩士課程專場(chǎng)!26fall入學(xué)!
- 06/03 6月3日活動(dòng)報(bào)名 | 北大光華-凱洛格國(guó)際EMBA項(xiàng)目Coffee Chat@上海
- 06/03 【活動(dòng)報(bào)名】中國(guó)科學(xué)技術(shù)大學(xué)科技商學(xué)院專題講座重磅開(kāi)啟!
- 06/04 6月4日 席位鎖定中 | 香港中文大學(xué)(深圳)MBM2027級(jí)招生說(shuō)明會(huì)
- 06/06 長(zhǎng)春理工大學(xué)2027級(jí)工商管理碩士(MBA)考生見(jiàn)面會(huì)
- 06/06 重磅!上財(cái)?shù)嗡呓?027級(jí)全日制金融碩士“新興金融探索日”活動(dòng)通知
- 06/06 深圳場(chǎng) | 清華-康奈爾雙學(xué)位金融MBA公開(kāi)課暨2027級(jí)招生說(shuō)明會(huì)報(bào)名中!
- 06/06 上海 | 紫荊課堂暨2027級(jí)清華MBA招生咨詢會(huì)報(bào)名開(kāi)啟!
- 06/06 浪潮已至|南科大科創(chuàng)MBA 2027級(jí)招生啟動(dòng)大會(huì)來(lái)了
- 06/06 活動(dòng)報(bào)名 | “迅策科技”校友企業(yè)參訪暨清華五道口金融EMBA深圳招生說(shuō)明會(huì)
熱門資訊
掃碼關(guān)注 MBAChina
掃碼關(guān)注
EMBA







