蛋播视频一区,无码鲁丝一区二区,精品 久久 五月天,国产老熟女,五月草草在线观看,中文日韩欧美,情色一区二区三区,欧美日韩亚洲激情在线,亚洲制服在线香蕉

歐陽(yáng)雜談 | 外行視角看AI的發(fā)展(下):從工具到未來(lái)

北京大學(xué)匯豐商學(xué)院
2025-02-12 16:25 瀏覽量: 3102
?智能總結(jié)

歐陽(yáng)雜談 | 外行視角看AI的發(fā)展(下):從工具到未來(lái)

在上期推送,歐陽(yáng)教授使用Deepseek R1 671B模型生成“外行視角看AI的發(fā)展”一文。本期歐陽(yáng)教授結(jié)合chatGPT就同話題進(jìn)行了對(duì)比生成。

人工智能(AI)近年來(lái)取得了令人矚目的進(jìn)展,尤其是大語(yǔ)言模型(LLM,Large Language Model)的崛起,使其成為科技競(jìng)賽的核心領(lǐng)域。然而,對(duì)于外行而言,理解AI的發(fā)展往往伴隨著誤解與夸大。本文將從外行的視角分析大語(yǔ)言模型的本質(zhì)、應(yīng)用前景、技術(shù)瓶頸及未來(lái)方向。

歐陽(yáng)良宜

北京大學(xué)匯豐商學(xué)院副院長(zhǎng)

北京大學(xué)匯豐商學(xué)院EMBA項(xiàng)目主任

特別提示

?本文大綱:歐陽(yáng)良宜

?文本生成:chatGPT

?本文未作事實(shí)查證(fact check)

大語(yǔ)言模型的本質(zhì):基于概率預(yù)測(cè)的數(shù)字序列

大語(yǔ)言模型的核心原理是將人類文獻(xiàn)轉(zhuǎn)換為數(shù)字序列,并通過(guò)概率計(jì)算預(yù)測(cè)下一個(gè)最可能出現(xiàn)的數(shù)字。在訓(xùn)練過(guò)程中,模型通過(guò)大量語(yǔ)料庫(kù)學(xué)習(xí)語(yǔ)言的統(tǒng)計(jì)規(guī)律,并通過(guò)參數(shù)權(quán)重調(diào)整優(yōu)化預(yù)測(cè)能力。然而,這種方法的局限性在于,它并不真正“理解”語(yǔ)言,而是基于統(tǒng)計(jì)規(guī)律進(jìn)行預(yù)測(cè)。

這種基于概率的預(yù)測(cè)方式導(dǎo)致了“幻覺(jué)”(hallucination)現(xiàn)象,即模型可能在看似合理的情況下生成錯(cuò)誤或荒謬的內(nèi)容。例如,GPT-4在回答復(fù)雜問(wèn)題時(shí),可能因訓(xùn)練數(shù)據(jù)的局限性或隨機(jī)性而犯低級(jí)錯(cuò)誤。這表明,無(wú)論如何優(yōu)化,大語(yǔ)言模型的本質(zhì)決定了其永遠(yuǎn)無(wú)法完全避免幻覺(jué)。

大語(yǔ)言模型的知識(shí)掌握能力與應(yīng)用價(jià)值

盡管存在幻覺(jué)問(wèn)題,大語(yǔ)言模型在知識(shí)掌握方面已經(jīng)超越了絕大多數(shù)普通人。其預(yù)訓(xùn)練參數(shù)中包含了大量來(lái)自互聯(lián)網(wǎng)、書籍、論文等的結(jié)構(gòu)化知識(shí),使其在多種領(lǐng)域表現(xiàn)優(yōu)異。例如:

?寫作應(yīng)用:企業(yè)公函、市場(chǎng)營(yíng)銷文案、法律合同初稿等,都可以通過(guò)大語(yǔ)言模型快速生成,提高效率。

?編程助手:GitHub Copilot 已經(jīng)能幫助程序員自動(dòng)補(bǔ)全代碼,提高開(kāi)發(fā)速度。

?教育與咨詢:LLM 可以充當(dāng)私人導(dǎo)師,提供數(shù)學(xué)、歷史、經(jīng)濟(jì)等多方面的解答。

根據(jù)OpenAI的數(shù)據(jù)顯示,使用GPT-4.0的用戶在撰寫商務(wù)郵件時(shí),效率提升了30%以上,部分企業(yè)通過(guò)AI客服系統(tǒng)減少了超過(guò)40%的人工成本。這表明,盡管AI尚未達(dá)到真正的智能,但在實(shí)際應(yīng)用中,它已經(jīng)成為高效的生產(chǎn)力工具。

強(qiáng)化學(xué)習(xí)的發(fā)展:尚未迎來(lái)“AlphaGo 第37手”時(shí)刻

目前,大語(yǔ)言模型的核心技術(shù)仍然以自回歸生成(Autoregressive Generation)為主,而強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)則處于相對(duì)早期的發(fā)展階段。強(qiáng)化學(xué)習(xí)的代表性突破是AlphaGo在2016年對(duì)戰(zhàn)李世石時(shí)的第37手,這標(biāo)志著AI在圍棋領(lǐng)域超越人類的關(guān)鍵時(shí)刻。然而,在大語(yǔ)言模型的領(lǐng)域,這種突破尚未發(fā)生。

當(dāng)前,強(qiáng)化學(xué)習(xí)主要用于微調(diào)LLM,如OpenAI 采用“強(qiáng)化學(xué)習(xí)獎(jiǎng)勵(lì)模型”(RLHF)優(yōu)化ChatGPT,使其更符合人類偏好。然而,在更廣泛的非規(guī)則場(chǎng)景中,如開(kāi)放式問(wèn)題解答、跨學(xué)科推理,RL仍面臨巨大挑戰(zhàn)。例如:

?強(qiáng)化學(xué)習(xí)依賴高質(zhì)量的反饋數(shù)據(jù),但人類標(biāo)注數(shù)據(jù)成本高昂,規(guī)模有限。

?語(yǔ)言模型的行為空間遠(yuǎn)大于圍棋、國(guó)際象棋等固定規(guī)則游戲,導(dǎo)致優(yōu)化難度更高。

?當(dāng)前的強(qiáng)化學(xué)習(xí)模型在通用認(rèn)知推理方面仍未展現(xiàn)超越人類的能力。

因此,我們?nèi)栽诘却鼳I的“AlphaGo 第37手”時(shí)刻,即AI在復(fù)雜開(kāi)放環(huán)境中做出真正超越人類直覺(jué)的創(chuàng)新決策。

多模態(tài)模型的挑戰(zhàn):數(shù)據(jù)與計(jì)算的雙重限制

目前主流大語(yǔ)言模型的訓(xùn)練數(shù)據(jù)仍然主要依賴結(jié)構(gòu)化的文本數(shù)據(jù),而對(duì)圖片、視頻等非結(jié)構(gòu)化數(shù)據(jù)的整合仍在早期探索階段。多模態(tài)模型(Multimodal Model)如GPT-4-Vision和Gemini 1.5 嘗試將文本與圖像結(jié)合,但仍面臨巨大挑戰(zhàn):

?數(shù)據(jù)需求指數(shù)級(jí)增長(zhǎng):相比于文本數(shù)據(jù),圖像和視頻的token化需要更高的存儲(chǔ)和計(jì)算資源。例如,訓(xùn)練一個(gè)多模態(tài)模型所需的token數(shù)量可能比文本模型高出幾個(gè)數(shù)量級(jí)。

?計(jì)算成本高昂:目前GPT-4級(jí)別的模型訓(xùn)練需要數(shù)千張A100/H100 GPU,而如果擴(kuò)展到大規(guī)模視頻數(shù)據(jù),算力需求將呈幾何級(jí)數(shù)增長(zhǎng)。

?能源消耗問(wèn)題:據(jù)估算,訓(xùn)練GPT-4的碳排放可能相當(dāng)于10萬(wàn)輛汽車行駛一年的排放量,而更大規(guī)模的多模態(tài)模型將進(jìn)一步加劇能源問(wèn)題。

如果沒(méi)有方法論上的創(chuàng)新,比如更高效的架構(gòu)、更優(yōu)的訓(xùn)練策略,那么大規(guī)模多模態(tài)模型的成本將會(huì)達(dá)到難以承受的地步。

輕量化大語(yǔ)言模型與智能硬件的結(jié)合:制造業(yè)的機(jī)會(huì)

盡管大模型訓(xùn)練面臨算力瓶頸,但輕量化大語(yǔ)言模型(如Gemini Nano, Mistral, LLaMA-3小型版本)在邊緣計(jì)算領(lǐng)域展現(xiàn)了巨大的應(yīng)用前景。相比于云端部署,邊緣計(jì)算的優(yōu)勢(shì)包括:

?本地運(yùn)行,降低延遲:在手機(jī)、智能音箱、車載系統(tǒng)中運(yùn)行LLM,可以提供即時(shí)響應(yīng),而無(wú)需依賴云端。

?數(shù)據(jù)安全性更高:本地AI助手可以減少用戶數(shù)據(jù)外泄風(fēng)險(xiǎn),提高隱私保護(hù)能力。

?成本可控:相比動(dòng)輒數(shù)億美元的GPT-4級(jí)模型,小型LLM可以運(yùn)行在成本更低的芯片上,如蘋果M系列芯片或高通Snapdragon AI引擎。

對(duì)于中國(guó)企業(yè)而言,智能硬件制造能力和工程優(yōu)化能力都是全球領(lǐng)先的,這使得中國(guó)公司有能力在“輕量級(jí)AI+硬件”的賽道上取得競(jìng)爭(zhēng)優(yōu)勢(shì)。例如,華為、小米等公司已經(jīng)在智能手機(jī)、智能家居領(lǐng)域布局AI助手,而未來(lái)智能汽車、可穿戴設(shè)備也可能成為大模型應(yīng)用的重要場(chǎng)景。

結(jié)語(yǔ)

大語(yǔ)言模型的發(fā)展已經(jīng)進(jìn)入了深水區(qū)。其本質(zhì)仍然是基于概率預(yù)測(cè)的數(shù)字序列,因此無(wú)法完全避免幻覺(jué)問(wèn)題,但這并不影響其在商業(yè)、教育、編程等領(lǐng)域的實(shí)際價(jià)值。強(qiáng)化學(xué)習(xí)的突破尚未到來(lái),但在規(guī)則明確的領(lǐng)域仍有望超越人類。多模態(tài)模型的進(jìn)展受限于數(shù)據(jù)和算力的挑戰(zhàn),而輕量級(jí)模型則為智能硬件的發(fā)展提供了新機(jī)遇。

對(duì)于普通人而言,理解AI的局限性與機(jī)遇同樣重要。未來(lái),AI將繼續(xù)深度滲透各行各業(yè),而擁有制造和工程優(yōu)勢(shì)的國(guó)家和企業(yè),將在這場(chǎng)科技競(jìng)賽中占據(jù)更有利的位置。

內(nèi)容編輯:梁萍

(本文轉(zhuǎn)載自北大匯豐EMBA ,如有侵權(quán)請(qǐng)電話聯(lián)系13810995524)

* 文章為作者獨(dú)立觀點(diǎn),不代表MBAChina立場(chǎng)。采編部郵箱:news@mbachina.com,歡迎交流與合作。

收藏
訂閱

備考交流

  • 【MBAChina 官方社群矩陣】
  • 涵蓋 199管理類聯(lián)考備考 · 復(fù)試調(diào)劑 · 博士申請(qǐng) · 中外合辦學(xué) 四大板塊。
  • ??2027 MBA/MPA/MEM/MPAcc /EMBA聯(lián)考備考群
  • ??2026 管理類聯(lián)考復(fù)試調(diào)劑群
  • ??博士項(xiàng)目交流群
  • ??中外合作辦學(xué)項(xiàng)目群
  • ?? 添加微信:MBAChina001
  • 備注【報(bào)考項(xiàng)目】,邀請(qǐng)您加入專屬交流群
免費(fèi)領(lǐng)取價(jià)值5000元MBA備考學(xué)習(xí)包 購(gòu)買管理類聯(lián)考MBA/MPAcc/MEM/MPA大綱配套新教材

掃碼關(guān)注我們

  • 獲取報(bào)考資訊
  • 了解院?;顒?dòng)
  • 學(xué)習(xí)備考干貨
  • 研究上岸攻略

最新動(dòng)態(tài)

    MBAChina 掃碼關(guān)注

    掃碼關(guān)注 MBAChina

    EMBA 掃碼關(guān)注

    掃碼關(guān)注
    EMBA

    宝兴县| 安塞县| 吴旗县| 临邑县| 山西省| 红原县| 开远市| 清苑县| 乌鲁木齐市| 霞浦县| 灵璧县| 娄烦县| 青冈县| 桑日县| 东方市| 太保市| 潜山县| 华坪县| 揭阳市| 吉隆县| 溧水县| 改则县| 分宜县| 成都市| 泰顺县| 林州市| 临沭县| 蓝山县| 齐河县| 苍山县| 阿拉善左旗| 荣昌县| 新绛县| 延长县| 剑河县| 淳化县| 宣恩县| 新津县| 兴城市| 阳高县| 齐齐哈尔市|