【新智元導讀】Yann LeCun的AI故事,紀錄片回顧了這位元深度學習先驅的四十年曆程。從索邦大學的孤獨探索,到貝爾實驗室發明摺積神經網路、推動支票識別商用,再與Hinton、Bengio共創深度學習革命,他始終堅信機器應學會學習。
在AI的璀璨星空中,有一位傳奇人物始終閃耀——Yann LeCun。
他不僅是深度學習的開創者之一,也是Meta的首席AI科學家。
當祖克柏敲定28歲的Alexander Wang出任Meta的首席AI官後,所有人同時想到一個問題。
Yann LeCun去那裡了?
就在最近,Yann LeCun最新的個人紀錄片上線了!
影片中,這位Meta FAIR實驗室的首席科學家,在巴黎回顧了他早期在神經網路領域的工作、與Hinton的合作,以及深度學習和開源AI的演進歷程。
LeCun認為,AI領域的真正競賽無關國界,而在於開放與封閉之爭。
「我們看到的並非地區間的競爭,而更多是開放研究、開源世界與閉源生態之間的較量。」
在LeCun看來,AI的真正進步,源於能夠讓創新成果普惠大眾的開放系統。
這一發聲的時機頗為微妙,因為祖克柏最近暗示,Meta可能會重新考慮其Llama型的開源策略。
倘若此事成真,Meta是否還是LeCun的容身之所,將打上一個問號。
在塞納河畔的巴黎,一座美麗的建築靜靜矗立,它是法蘭西科學院的殿堂。
Yann LeCun,作為其成員之一,站在這裡,彷彿能看到自己學術生涯的起點——不遠處的索邦大學。
如今,他被譽為「AI教父」之一,是Meta的首席科學家和紐約大學的教授。
Yann LeCun出生於1960年,是法國裔美籍電腦科學家、人工智慧和深度學習領域的先驅人物。
他因在光學字元識別和電腦視覺中引入摺積神經網路(CNN)而聞名於世,被譽為「摺積網路之父」。
作為「深度學習三劍客」之一,他與Geoffrey Hinton、Yoshua Bengio一道推動了神經網路的復興,並在2018年共同獲得了圖靈獎這一電腦領域的最高榮譽。
值得一提的是,Yann LeCun在博士期間提出了一種早期形式的反向傳播(Backpropagation)演算法,用於訓練多層神經網路 。
這項工作為日後深度學習中廣泛使用的誤差反向傳播技術奠定了基礎。
但故事的開端,卻是一段孤獨而堅定的探索之旅。
時間回到上世紀80年代,當LeCun還是索邦大學的一名博士生時,他對機器學習,特別是「神經網路」產生了濃厚的興趣。
這在當時是一個極其冷門的領域,以至於他在整個法國都找不到同路人。
「人們當時在取笑我們,那些研究神經網路的人,」他回憶道。
但這並未動搖他的信念。他堅信,機器真正的力量在於學習,而非被動地執行預設的程序。
他埋首於John Hopfield、Geoff Hinton、Terry Sienowski等寥寥幾位先驅的論文中,並意識到,破解多層神經網路的訓練難題,是開啟未來的鑰匙。
命運的轉折點發生在1985年。
在一場研討會上,他結識了另一位AI巨擘Terry Sejnowski。
回到美國後,Sejnowski興奮地告訴Hinton:「有個法國的小夥子,正在做跟我們一樣的事情!」
幾個月後,Hinton來到巴黎。
憑藉著對法語的粗淺理解和清晰的數學公式,Hinton讀懂了LeCun的研究。
當即,他向這位即將畢業的年輕人發出了邀請:「你何不來多倫多,跟我做博士後呢?」
博士畢業後,Yann LeCun前往加拿大,從1987年開始在多倫多大學跟隨Hinton教授從事為期一年的博士後研究。
一段傳奇的合作就此開啟。
在多倫多的博士後經歷使Lecun有機會與辛頓直接合作,並深入瞭解深度神經網路的最前沿思想。
1988年,LeCun加入了群星璀璨的貝爾實驗室自適應系統研究部門。
當時貝爾實驗室是電腦科學和通訊技術的聖地,匯聚了眾多頂尖研究人員。
這裡是現代科技的搖籃,也成為了他將理論付諸實踐的舞台。
僅僅一兩個月,他便在一項手寫數字識別任務上取得了前所未有的成果。
「我們有了一個可演示的系統,」LeCun生動地描述道,「只需將一張紙放在攝影機下,按一下鍵,它就能以每秒幾個字元的速度識別所有字元。」
這個看似簡單的演示,催生了AI最早的商業應用之一:一個能自動讀取支票金額的ATM系統。
LeCun的這些創新成果很快在實際中得到驗證。
貝爾實驗室與銀行業合作開發了支票手寫體識別系統,利用摺積網路技術自動讀取銀行支票上的數字資訊。
該系統在1990年代末投入商用後,被NCR等公司部署,據估計讀取了全美超過10% 的支票,大大提高了金融票據處理的自動化水平。
摺積神經網路(CNN)
在貝爾實驗室,LeCun受生物視覺系統的啟發,設計出一種層級結構的圖像識別模型,即摺積神經網路。
他開發的CNN架構被稱為「LeNet」,最初用於識別手寫數字。
1989年,他發表了著名論文《利用反向傳播演算法識別手寫郵政編碼》, 展示了摺積網路在手寫數字識別上的卓越性能。
這項工作證明,多層摺積結構可以自動從圖像像素中學習特徵,有效地執行字元識別任務 。
LeNet是深度學習歷史上的里程碑,被廣泛視為現代深度摺積網路的開端。
然而,成功的道路佈滿荊棘。
儘管技術領先,但要說服世界接受它卻異常艱難。「這個系統很難復現,」他解釋說,「每個人都用著不同的電腦、不同的作業系統。」
他們手握著未來的鑰匙,卻難以分享給世界。
進入21世紀,神經網路的名聲依然不佳。
2003年,已成為紐約大學教授的LeCun決定,必須改變這一切。
他和同道們做出了一個影響深遠的戰略決策:「我們改了名字,稱之為『深度學習』」。
真正的爆發點來自他的導師Hinton策劃的一場天才「陽謀」。
Hinton將他的三名學生作為實習生,分別「安插」進了當時擁有頂級語音識別引擎的三家巨頭——微軟、Google和IBM。
他們的任務只有一個:用深度學習系統替換掉傳統引擎中的「聲學建模」部分。
「結果他們都取得了更好的成績,」LeCun笑道,「這手策劃真是高明!」
在那之後不到18個月,深度學習就佔領了幾乎每一部智慧型手機的語音識別功能。
革命,就這樣悄然完成了。
如今,站在巴黎這個歐洲最大的創新溫床,LeCun的思考已超越了技術本身。
他認為,AI領域的真正競爭,並非國與國之間,而是「開源世界與封閉專有世界之間的競爭」。
以Meta的Llama模型為例——這個誕生在巴黎、下載量高達8億次的開源模型,正在賦能全球無數的開發者和企業。
LeCun說選擇在Meta工作是因為Meta對開源有著堅定的承諾。
2018年,Yann LeCun的頭銜進一步提升為首席AI科學家(Chief AI Scientist),負責統籌Meta平台下所有與AI相關的研究計畫。
這意味著他不僅領導FAIR研究院的學術研究,還參與公司AI戰略的制定。
「那個國家處於領先並不重要,」他說,「重要的是,開放研究和開源社區的迭代速度和進步,要比那些選擇閉門造車、秘不示人的公司更快。」
對於甚囂塵上的「AI威脅論」,LeCun則展現了一位工程師的務實與樂觀。
他認為,AI失控並非不可避免的宿命,而是一個需要解決的工程問題,就像製造安全的飛機一樣。
「認為智力與統治慾望正相關的觀點是錯誤的,」他犀利地指出,「看看政界,情況甚至恰恰相反。」
他提出了「目標驅動架構」的設想,即為AI設定目標和不可踰越的「安全護欄」,讓它們為人類服務。
他甚至預言,未來將是「我的正義AI對抗你的邪惡AI」的制衡局面。
「我相信社會最終會做出正確的選擇,因為民眾會提出這樣的要求。」
脫下「教父」的光環,Yann LeCun是一個擁有多元愛好的有趣靈魂。
他從工程師父親那裡繼承了動手能力,痴迷於製造各種飛行器,「我們把它們飛上天,再把它們摔下來——當然不一定是故意的。」
他對動物的智慧充滿好奇,也熱愛音樂,從巴洛克到硬波普爵士,品味廣泛。
他懷念巴黎的美食,尤其是外祖母家鄉阿爾薩斯的傳統燉菜,那是一種對根的眷戀。
LeCun說他有四分之一的阿爾薩斯血統。
而這一切,都構成了他完整的人格——一個既能建構複雜演算法,也能在生活中尋找樂趣與靈感的創造者。
在他的故事結尾,LeCun將目光投向了更年輕的一代,言辭懇切而充滿力量:
「不要讓那些負面或聳人聽聞的故事阻礙你前進的腳步。要認識到自己的力量,主動去塑造你所期望的未來。
即使是一個簡單的想法,只要它對你意義重大,只要你篤信不疑,就能帶來改變。未來,取決於你。」
這或許就是Yann LeCun最核心的信念。
他相信,AI的真正意義在於增強人類的智慧,就像15世紀的印刷機一樣。
他所預見的,不僅僅是一場技術革命,更是一場全新的、由每個人共同書寫的「文藝復興」。
而他,正是這場復興的奠基人與引路者。
(新智元)