65歲圖靈巨頭離職創業!LeCun憤然與小扎決裂,Meta巨震

AI圈爆出大瓜!65歲圖靈巨頭LeCun即將離職Meta,與小扎正式決裂。接下來,他將投身「世界模型」開啟創業下半場。

圖靈巨頭LeCun真的要跑路了!

剛剛,FT獨家爆料,現任Meta首席AI科學家LeCun,決定將在未來幾個月離職。

下一步,開啟人生創業的第二階段。

消息一出,瞬間引爆全網。此前,坊間傳聞稱,LeCun因不滿內部架構調整想要離職。

如今,65歲的圖靈巨頭,終於做出了這個決定。

據稱,LeCun將要成立的新公司主要推進「世界模型」,目標直指真正的人類級智能。

目前,他正在進行早期的融資洽談。

網友盲猜,LeCun離職可能和會見吳恩達有所關聯

任職12年,從創辦FAIR實驗室,到拿下圖靈獎,再到篤定的世界模型,LeCun出走對於Meta來說,是一次巨震。

或許,小扎的超級智能夢,真的要碎了。

有網友表示,這並不意外。另有人調侃道,「要始終向一個孩子匯報工作,LeCun的自尊心怎麼不會受到傷害呢」。

不得不說,這事兒來的太突然,但卻早有苗頭。

當前,正值Meta對公司AI業務進行大刀闊斧的改革之際,希望開發出更強大的AI,挑戰OpenAI、Google等競爭對手。

今年初,Llama 4發佈翻車,且性能遠不及ChatGPT、Gemini等模型。而且,Meta AI聊天機器人推出後,許多人並不買帳。

在認定Meta在競爭中落後之後,小扎的戰略重心也隨之改變——

從LeCun領軍的FAIR實驗室,轉向更快推出模型和AI產品。

先是今年4月,小扎斥資143億美元聘請了28歲Alexandr Wang,去領導全新「超級智能」團隊。

在此過程中,他親自組建TBD Lab,開出高達1億美元的薪酬包,從Google、OpenAI搶人。

其中包括,ChatGPT的核心研究員Shengjia Zhao,被挖來出任MSL首席科學家。

目標很簡單,推動其下一代大語言模型的開發。

僅在今年,Meta內部就進行了超4次架構調整和最佳化,並將MSL分立出四大部門,全部由Alexandr Wang掌舵:

1. TBD Lab (To Be Determined,待確定,負責探索/先導研究)

2. FAIR (Fundamental AI Research,長期前沿研究)

3. 產品和應用團隊 (含Meta AI助手等)

4. 基礎設施 (訓練與推理的算力、資料與平台)

因此,此前向首席產品官Chris Cox匯報的LeCun,現在轉而向Wang匯報。

不僅如此,LeCun長期領導的FAIR也逐漸被邊緣化,向比他小30多歲的Wang匯報,包括論文,也需得到審批後才可發表。

另一方面,LeCun認為小扎置於其戰略核心的LLM雖然「有用」,但永遠無法像人類一樣進行推理和規劃。

在FAIR內部,LeCun也一直專注於開發「世界模型」,但在短期內,是看不到KPI的。

而小扎現在要的是,立即就能變現的AI產品。

看得出,LeCun所堅持的路線和個人觀點,與Meta的AI願景出現了明顯的分歧。

種種因素的疊加,早已成為LeCun離職的導火索。而現在,就是最好的時機。

全力押注「世界模型」

慶幸的是,LeCun終於可以在「世界模型」上大展身手了。

一直以來,他堅信大模型最終沒有出路,永遠學不會真正的推理和規劃,也根本無法通往AGI。

LLM不如阿貓阿狗,LeCun已在多種公開場合中多次提出。

在他看來,AI的終局就是「世界模型」。

前段時間,他在MIT訪談中直言,未來3-5年內,「世界模型」會成為AI架構的主流模型。

這話可讓我在矽谷得罪了不少人,包括某些巨頭公司。

到那時候,但凡頭腦清醒的人,都不會再用現在這種生成式LLM的路子了。

世界模型不僅僅學習語言,還通過視訊和空間資料,來理解物理世界。

直白講,它讓AI可以像嬰兒一樣,從觀察中學習世界的規律。

不過,LeCun表示,開發出這個架構需要十年的時間才能成熟。

即便時間漫長,他終於可以堅定按著目標方向前進了。

未來幾個月,LeCun將正式離職Meta,下一步計畫將專注於深化在「世界模型」領域的研究。

AI掌舵人出走,這意味著,FAIR實驗室就徹底被邊緣化了。

圖靈巨頭,開啟AI革命

1960年7月8日出生的Yann LeCun,在法國巴黎的郊區長大。

他的姓氏原本是Le Cun,但他發現美國人常對此感到困惑,將Le誤作他的中間名,於是便去掉了中間的空格。

他的父親是一名工程師,在LeCun充滿修補創造的童年中,將自己對電子和機械的熱愛傳給了他。

青少年時期,LeCun既喜歡在樂隊中演奏,也熱愛科學與工程。

後來,他在法國精英工程師學校之一的巴黎高等電子與電工工程師學院(ESIEE Paris)獲得了相當於碩士的學位。在那裡,他專注於微晶片設計與自動化。

他從本科時代就開始獨立進行機器學習研究,並將其作為他在索邦大學(當時稱為皮埃爾和瑪麗·居里大學)博士階段的核心工作。

LeCun的研究與Geoffrey Hinton獨立做出的發現高度相似。

  • 與Hinton一樣,他被當時尚屬非主流的神經網路人工智慧方法所吸引;
  • 也與Hinton一樣,他發現可以通過使用後來被稱為「反向傳播」的演算法來有效訓練輸入和輸出節點之間中間層的「隱藏」神經元,從而克服簡單神經網路眾所周知的侷限性。

1985年在法國阿爾卑斯山區舉辦的一場研討會,首次讓LeCun與從事相關研究的國際學術界有了直接接觸。

正是在那裡,他結識了Hinton的密切合作者Terry Sejnowski。當時,Sejnowski關於反向傳播的研究尚未發表。

幾個月後,Hinton到訪巴黎,並主動向LeCun作了自我介紹。

再之後,LeCun則受邀參加卡內基梅隆大學的夏季研討會,並在多倫多Hinton新成立的研究小組進行了一年的博士後研究。

1988年,博士後研究結束時,LeCun加入了著名的電腦科學研究中心——貝爾實驗室。

在貝爾實驗室,LeCun的工作專注於神經網路架構和學習演算法。

他影響最為深遠的貢獻是一種名為「摺積神經網路」的新方法。這是他早期成就的延伸,因為摺積網路依賴反向傳播技術來訓練其隱藏層。

除了開髮捲積方法,LeCun還率先將其應用於「圖Transformer網路」,用於識別印刷體和手寫文字。這項技術被用於一個廣泛部署的系統,以讀取支票上的手寫數字。

他在貝爾實驗室的另一項主要貢獻是開發了「最佳腦損傷」(Optimal Brain Damage)正則化方法。

這個名字生動的概念旨在通過移除神經網路中不必要的連接來簡化網路。如果操作得當,這種「腦損傷」可以產生更簡單、更快速的網路,其性能與完整版本相當甚至更優。

1996年,在電腦行業未能立足的AT&T公司,將貝爾實驗室的大部分業務及其電信硬體業務分拆成立了一家新公司——朗訊科技。

LeCun留在了AT&T,負責一個專注於圖像處理研究的實驗室小組。

在那裡,他的主要成就是DjVu圖像壓縮技術。

2003年,LeCun離開工業界,前往紐約大學庫朗數學科學研究所擔任電腦科學教授。

在紐約大學,LeCun負責計算與生物學習實驗室,繼續他在機器學習演算法和電腦視覺應用方面的工作。

他至今仍在紐約大學任教,儘管隨著聲譽日隆,他又增添了幾個新頭銜和額外職位。

到2010年代初,各大科技公司競相部署基於神經網路的機器學習系統。與其他頂尖研究人員一樣,LeCun也受到了科技巨頭的青睞。

2013年12月,他加入Facebook並建立了FAIR(Facebook AI Research),同時,他也還兼顧在紐約大學的工作。

2018年,他卸任主任一職,轉任Facebook首席人工智慧科學家,專注於戰略規劃和科學領導力。

同年,他與Geoffrey Hinton和Yoshua Bengio,共同獲得了圖靈獎。


時至今日,LeCun一直保持著對動手創造的熱愛,他的愛好包括製造飛機、電子樂器和機器人。

或許,這也是他在65歲時,毅然決定下海創業的動力之一。 (新智元)