Meta首席AI科學家Yann LeCun:批評當前AI技術,構想未來願景

"在矽谷某些資訊泡沫中,有人宣稱大型語言模型非常強大,只需要在更多資料上訓練它們,最終它們就會達到人類水平的智能。甚至有人說,在兩年內,我們將擁有具有博士級能力的AI系統...這是錯誤的,過去70年中一代又一代的AI科學家都犯過這個錯誤,現在仍然錯誤。"
—— Yann LeCun

在4月27日,新加坡國立大學120周年慶典活動中,Meta首席AI科學家Yann LeCun分享了近期的研究和見解。作為深度學習奠基人之一,被譽為AI三大教父之一,當全世界都在追捧大語言模型時,Yann LeCun卻說我們走錯了路,並直言當前的AI技術仍與真正的通用智能相去甚遠,甚至提出了令業內震撼的觀點:"幾年內,我們將不得不拋棄整個生成式AI的概念。"

本文將結合當天演講內容,解析Yann LeCun的核心觀點,探討他對未來AI發展的前瞻性思考,以及他所提出的具有挑戰性的研究方向。

“虛擬人類助理”願景:不造人類替代品,只作人類的超級助理

Yann LeCun開場就定下了基調:做AI不是為了“造人”,而是幫人“開外掛”。

“我們要建造的,不是替代人的AI,而是放大人類智能的‘虛擬人類’。終極目標是讓每個人都像政治家一樣,身邊圍著一群比自己還聰明的虛擬助理。”

他以Meta最新的智能眼鏡舉例,未來每個人的數字生活都將由AI助手貫穿,無縫協同。但,理想與現實之間,AI還存在著巨大的瓶頸。

一、為什麼LLM無法達到人類級智能?

  • 機器學習的根本缺陷

LeCun用一句頗具爭議性的話來描述當前的機器學習:"Machine learning sucks." 為什麼一位機器學習領域的先驅會對這一領域持如此苛刻的態度?我們來拆解一下他的核心“槽點”:

1.只有文字:LLM再大,也只是“文字接龍”高手,對物理世界和嘗試性推理連貓都不如。

2.無法創新:人類和動物都能夠“零樣本”應對新情境,LLM最多隻能“復讀”訓練過的答案。

3.海量樣本不及幼童直覺:4歲幼童的感官和運動資料量,竟然等同於訓練一個最大LLM所需文字的量級。可見,僅依靠擴巨量資料規模無法實現人類水平的智能:

LLM訓練資料:約30兆tokens (10^14字節)

人類視覺系統4年接收資料:約10^14字節

Yann LeCun揭示了LLM的本質侷限性:它們被訓練為預測下一個token的機率分佈,這種方式在長文字生成中存在指數衰減的精度問題。簡單來說,越長的文字輸出,出錯的機率就越高,這是一個統計學上的必然結果。

這也解釋了為什麼LLM可以通過律師資格考試或解複雜方程,但無法像嬰兒那樣理解物理世界或像青少年那樣快速學會開車。我們在象棋和圍棋上擁有超人類水平的AI,卻無法開發出能像貓一樣靈活的家用機器人。這正是AI領域的“莫拉維克悖論”

  • 真正的智能系統應當能夠

- 快速學習新任務

- 理解物理世界(而非僅僅是文字和語言)

- 具有常識推理

- 擁有持久性記憶

- 能夠推理和規劃

  • 機器要像嬰兒一樣認識世界——靠直覺物理和抽象感知

Yann LeCun強調,真正的智能,不是靠“死記硬背”大樣本,而是像嬰兒或小動物一樣,從感知“玩”出來:

- 獲得物體永久性和三維空間知覺

- 自主建立物理模型與因果推理

- 逐步習得抽象認知和目的導向的計畫能力

"我們永遠無法僅通過在文字上訓練LLM來達到人類水平的AI",Yann LeCun斷言。我們必須能夠從高頻寬的感官輸入中訓練系統,但當前用於文字的架構無法有效處理視訊等更複雜的資料形式。

二、世界模型&能量基礎模型,Yann LeCun眼中的未來AI架構

Yann LeCun認為,未來AI架構的核心不在於生成文字、圖片本身,而在於能夠像科學家一樣建構抽象的"世界模型"(World Models),並以規劃推理能力自主達到目標

  • 世界模型:是一種能夠預測行動後果的系統給定當前世界狀態和行動,世界模型可以預測採取該行動後世界的狀態

這種能力是規劃和推理的基礎,使系統能夠通過搜尋確定那些行動序列會導致特定結果。這一概念源自機器人學和最優控制理論,但Yann LeCun認為,未來的AI系統需要通過觀察和互動來學習這種模型,而非由工程師手動建構。

  • 能量基礎模型(Energy-based Model,EBM):通過最佳化“相容度能量”來選擇合理輸出。推理過程變成在表示空間中“搜尋”最優解,而不是一條路走到黑的喂若干層神經網路就出答案。

- 系統“做夢”:可多步在自己腦中設想行為結果,彷彿在大腦中模擬“未來演練”。

- 層次化規劃:像人一樣,先定宏觀目標(去巴黎),再分解到中層行動(打車、打包行李),再到具體運動(走路、開門)。

- 通用性:不僅適用於機器人、自動駕駛,同樣適用於抽象領域:物理、化學、生物、醫療等。

  • 層次規劃:AI的終極挑戰

人類在規劃時會自然地分解任務。如上例,從紐約前往巴黎涉及多個層次的子目標:前往機場、登機、抵達巴黎等。每個子目標又可以進一步分解為更細的步驟。Yann LeCun認為,這種層次規劃的能力是真正智能系統的核心特徵,而當前的AI系統根本無法實現這一點。

Yann LeCun非常關注研究這一方向,半開玩笑地表示:"如果你正在讀博或者剛成為教授,想對AI產生實際影響,就來研究這個問題吧。如果你有好想法,我立馬招你。"這表明了他對這一研究方向的高度重視,也表明了該領域的挑戰性和潛在影響力。

三、聯合嵌入預測架構:告別生成式AI的新範式

Yann LeCun的最核心主張是放棄生成式AI,轉而採用"聯合嵌入預測架構"(Joint Embedding Predictive Architecture, JEPA)。

  • 生成模型的根本缺陷

Yann LeCun指出,嘗試預測視訊中所有像素等級的細節是徒勞的,就像預測一個翻倒的物體會向那個方向倒下是不可能的一樣。當系統嘗試預測無法預測的細節時,會產生模糊的結果並浪費計算資源。

  • JEPA的工作原理

JEPA的核心思想不是在像素層面上預測,而是在抽象表示空間中進行預測:

1. 將原始輸入(如視訊)通過編碼器生成表示向量

2. 將修改後的輸入(如部分遮擋的視訊)也生成表示向量

3. 訓練系統在表示空間中預測完整輸入的表示

這與科學方法的本質相似——尋找適當的表示方式使預測成為可能。就像物理學只需要六個數字就能預測木星100年後的位置,好的表示方式忽略了無關的細節,捕捉本質。

LeCun的團隊已開發出如Dino和iGPT等實現這一原理的系統,它們在自監督學習任務中展現出驚人的效果,甚至在某些領域超過了監督學習方法。

認知架構:多層次的理解與規劃

基於這些原則,LeCun提出了一個完整的認知架構,該架構結合了:

- 感知模組

- 記憶系統

- 世界模型

- 目標函數

- 規劃最佳化演算法

這些元件協同工作,使系統能夠通過最佳化搜尋一系列能夠滿足特定目標的行動。

四、開源與多樣性:AI未來發展的社會維度

除了技術層面的思考外,Yann LeCun還強調了開源和多樣性對AI未來發展的重要性。

為什麼我們需要開源基礎模型?

Yann LeCun預見未來我們與數字世界的大多數互動將通過AI助手來完成。如果這些AI助手只來自美國西海岸或中國的少數幾家公司,將會產生嚴重的文化單一性和資訊過濾問題。

"我們需要能說世界上所有語言、理解所有文化和價值體系的AI系統,這不可能來自少數幾個AI助手,而必須來自多樣化的AI助手生態系統。"

全球合作的願景

Yann LeCun提出了一個全球合作的願景,不同地區的研究機構和企業可以共同訓練基礎模型,應對訓練成本高的問題。在這個願景中,新加坡等國家可以作為亞洲的關鍵節點,貢獻區域特有的語言和文化資料。

"從歷史來看,軟體基礎設施最終都走向了開源。AI的未來也將如此,開源在AI領域勝出只是時間問題。"

結語:AI研究的未來方向

無獨有偶,昨天三大教父中的另一位——Geoffrey Hinton在CBS的訪談上,也談到現在的AI“不如貓”的判斷,也提到過他從小對直觀物理學的著迷。對於對當前被過度熱炒的LLM和生成式AI,他們都冷靜的提出來這種文字的高度推理,距離物理世界的模擬還相差甚遠。

如果LeCun的預測是正確的,那麼我們可能將在未來3-5年內見證AI領域的又一次範式轉變。這將為我們帶來能夠理解物理世界、進行複雜推理和規劃的AI系統,而這些能力,正是實現真正有用的智慧型手機器人和更廣泛AI應用的關鍵

QA摘要

Q1:LLM沒價值嗎?

Yann LeCun:不是。LLM很實用(比如程式碼、文件、自動生成等)。但如果要追求“機器智能真正登堂入室”,LLM還遠不夠。它們可以作為輸出層、語言翻譯器,但核心的認知和推理基座,要靠其他架構來實現

Q2:AI會讓大部分人失業嗎?作為年輕人該學什麼?

LeCun:不會讓所有人“失業”,但職業會改變。建議大家多學“長半衰期”的底層能力,比如物理、數學、計算思維。技術更迭是常態,有技術深度+快速學習能力,就能與AI共舞。

Q3:自動科學家、AI自動推動AI研究靠譜嗎?

LeCun:LLM類模型對科研有幫助,但在“理解”能力上很有限。AI自動產生新科學發現還遠遠不夠,必須有能建構世界模型的系統,而不僅是做NLP。

Q4:RL到底還值不值得做?

LeCun:強化學習樣本效率太低。可以作為微調,但指望RL實現通用智能,就是走偏了。

Q5:開源大模型對全球AI有多重要?

LeCun:極其重要。AI基礎架構不能只掌握在少數美中巨頭手中,否則就無法實現語言、文化、理念的多樣性。要形成全球合作開源社區,讓所有地區、群體都能定製自己的AI系統。 (JER學家)