李飛飛在巴黎人工智慧峰會演講:關於AI的大部分討論都充斥著誇大其詞和聳人聽聞



2月10日,“AI教母”李飛飛在巴黎人工智慧峰會上發表開幕式演講。李飛飛系統闡述了人工智慧(AI)的發展歷程、核心要素及未來方向,並強調了以人為本的倫理觀與治理原則。其核心觀點如下:

AI的歷史與三大支柱:AI的進化根植於生命起源,視覺感知的演變推動了智能的誕生。現代AI的崛起依賴三大關鍵要素——感知演算法(如深度學習)、認知科學(揭示人類學習機制)和計算能力(如GPU的突破)。三者融合催生了ImageNet等項目,開啟巨量資料驅動AI的新時代。

從感知到行動的轉型:當前AI正經歷從“感知智能”向“行動智能”的跨越,空間智能(3D環境互動)與具身智能(物理世界行動)成為新方向。大語言模型(如ChatGPT)和生成式AI的突破,標誌著AI從被動理解轉向主動執行,甚至參與複雜任務規劃。

以人為本的AI倫理:AI發展需以尊嚴(保障人類自主性)、能動性(增強而非取代人類)和社區(建構包容性社會)為核心價值。案例包括AI輔助醫療、教育及殘障人士賦能,凸顯技術應服務人類福祉。

治理原則與生態建構:提出三大治理原則——科學為基礎(避免誇大技術風險)、務實導向(聚焦實際應用與風險防控)、多元生態(避免資源壟斷,鼓勵學界、企業、開源社區合作)。呼籲全球協作,確保AI技術向善發展。

李飛飛認為,AI的真正挑戰並非技術本身,而是如何引導其成為推動社會進步的力量。其演講融合歷史視野與前沿洞察,為AI的倫理框架與治理路徑提供了重要參考。

以下是本次對話完整實錄,經翻譯編輯:

主持人:女士們先生們,各位國家元首和政府首腦,尊敬的部長們,親愛的朋友們和同事們。我很高興歡迎各位來到巴黎舉行的這次前所未有的人工智慧峰會,本次峰會由馬克宏總統和莫迪總理共同主持。

我謹代表人工智慧行動峰會團隊,歡迎來到巴黎!歡迎來到大皇宮!歡迎參加人工智慧行動峰會!感謝各位。現在,有請李飛飛博士發言。

李飛飛:謝謝,歡迎大家。早上好。

李飛飛:我正在等待幻燈片載入。希望各位在巴黎度過一個美好的早晨。請問可以播放我的幻燈片了嗎?好的,非常感謝。大家早上好!我非常榮幸和激動能與各位相聚於此,並作開幕致詞。我期待著接下來幾天富有成效的討論,甚至能達成一些重要決策。


01

人工智慧歷史根基

李飛飛:對我們許多人來說,人工智慧通常被視為一個關於技術和現代世界的故事,當然也是一個關於未來的故事。這就是我們今天齊聚於此的原因。但對我而言,這更是一個可以追溯到生命起源的故事,一個開始於5億年前的故事。

那是極其遙遠的時代,視覺的概念甚至還不存在。事實上,眼睛尚未進化,沒有任何生物親眼目睹過這個世界,所有生命都處在各位在螢幕上看到的黑暗之中。

當然,要用大約10分鐘的時間來回顧5億年的歷史有點長。所以我在這裡做一個概括。當進化賦予螢幕上這些簡單的生物感知周圍世界並做出反應的能力時,那怕這種感知非常微弱,一場進化“軍備競賽”便拉開了序幕。最初,這還只是一種被動的體驗,即簡單地讓光線進入,但很快就變得更加豐富和活躍。神經系統開始進化,視覺發展為洞察力,“看到”演變為“理解”。理解力進而催生行動,所有這些共同孕育了智能。而這一切,將永遠地重塑地球生命的本質。

今天,快進到5億年後,人類的智慧已經引導我們去構想和塑造工作和生活的方方面面。我們不再滿足於僅僅擁有大自然賦予的智能。現在,好奇心驅使我們去創造像人類一樣智能,甚至超越人類的機器。

因此,我們本周探討的這項開創性技術的探索之旅,始於20世紀中期。英國偉大的數學家艾倫·圖靈極具遠見卓識,甚至在電腦誕生之前,他已經開始思考如何賦予電腦媲美人類的認知能力。在我看來,他的著作始終是一種挑戰,激勵著人類大膽想像,去創造他所設想的智慧型手機器。

同樣的好奇心和雄心也深深吸引著早期的美國電腦科學家。他們不僅發起了首個探索智慧型手機器可能性的研究項目,更在1956年那個悶熱的夏天,在“人工智慧”這個術語被大眾熟知幾十年前,創造了這個術語本身。這張幻燈片展示的,正是他們為那次研討會撰寫的最初的研究論文。

坦率地說,有趣的是,他們當時認為只需兩個月就能解決這個問題的絕大部分,並揭開智能之謎。或許他們有些樂觀,但他們的膽識令人欽佩。今天,這個“兩個月項目”已經過去了820個月,但我們確實取得了顯著的進展。


02

現代人工智慧崛起的三大支柱

李飛飛:人們對人工智慧的另一個誤解是,它僅僅是電腦和工程學的問題。但事實是,人工智慧始終是一個充滿活力的多學科交叉領域。我們今天所處的現代人工智慧時代,是三項意義深遠且又各具特色的技術和科學進步融合的成果。

首先是對感知演算法的研究,即生物如何理解周圍的世界。最終,在艾倫·圖靈提出大膽猜想以及達特茅斯人工智慧夏季研討會召開幾年後,數學模型的建立成為可能。神經生理學家Hubel和Wiesel率先揭示了哺乳動物視覺皮層神經元處理的分層結構,從而榮獲諾貝爾獎,並徹底改變了我們對視覺處理的理解。大約在同一時期,心理學家Frank Rosenblatt建構了最早的神經網路原型之一,即感知器。

這些研究成果持續激勵著後來的電腦科學家,特別是早期的先驅者,如Kunihiko Fukushima、Jeff Hinton、Yann LeCun、JoshuaBengio等,去設計日益精密的模型,並最終催生了我們今天熟知的深度學習神經網路演算法,使機器獲得了不可思議的能力。

與此同時,第二個發展脈絡開始顯現。認知科學家深入探索人類自身的思維,揭示了我們感知周圍環境能力的驚人深度和複雜性。他們得出的一個明確結論是,我們的大腦與塑造其進化的環境是密不可分的。大腦不僅僅是禁錮在我們頭顱中的機器,更是孜孜不倦的學生,從生命最初的時刻起,就渴望從每一絲光線、每一縷觸感、每一聲細語中學習。對我個人而言,作為一名在21世紀初成長起來的科學家,那時感知演算法幾乎是我研究領域的唯一焦點。認知科學給我帶來的啟示之一是“規模”。生物的進化和發展處理程序,受益於海量的資料來驅動自身學習。我和我的合作者及學生們推測,機器的學習也是如此。

但這一次,資料不再通過生物感測器採集,而是來自現代數字裝置和網際網路。這啟發了我的實驗室開展ImageNet項目,即首個網際網路規模的人工智慧訓練和評估資料集。我們提出的“資料是神經網路等高容量演算法的關鍵”這一假設,使這些演算法重獲新生,性能達到前所未有的水平,並由此掀起全球範圍內利用巨量資料發展人工智慧的熱潮,這也就是現在被稱為人工智慧scalinglaw的一部分。

最後,所有這些成就的取得,都離不開算力強大的電腦。沒有它們,一切都不可能實現。這一切始於20世紀40年代提出的電腦架構範式——馮·諾依曼架構等里程碑式的發展,這一架構至今仍被沿用,並催生了20世紀70年代初的首批微處理器。有趣的是,正是視訊遊戲推動了硅晶片原始速度的飛速發展。20世紀90年代初,為了製作更精細的遊戲畫面而興起的“家庭手工業”,在短短二十年內發展成全球產業巨頭,輝達等公司製造出越來越強大的圖形處理器(GPU)。GPU最終補上了最後一塊拼圖,使神經網路演算法能夠從網際網路規模的巨量資料中進行學習。因此,在座如果有遊戲玩家,我們都要感謝你們。


03

人工智慧的新階段

李飛飛:接下來的內容不僅僅是回顧歷史,更是建構未來的藍圖。早在2012年的ImageNet挑戰賽上,我的實驗室就率先將演算法、資料和算力這三大要素整合起來,首次實現了如此大規模的融合,幾乎在一夜之間徹底改變了我的研究領域。這是機器首次能夠理解並可靠地描述圖像內容,而且是數百萬張圖像。

如今,我們對此習以為常,但在當時,這是一個尚未解決的難題,這項能力簡直宛如科幻小說一般。這是人工智慧發展歷程中倒下的第一塊多米諾骨牌,隨之而來的是一連串的里程碑,而且這些里程碑的到來速度似乎一年快過一年。如今,十多年過去了,我們仍在探索這一切的深遠影響。這項最初源於學術界的好奇心,如今正受到商業領袖、企業家、行業分析師乃至政治家們經久不息的熱切關注,而且這股熱潮方興未艾。

我們現在所處的時代,歷史學家們無疑會將其定義為人工智慧的第一個真正時代。無論從那個指標來看,例如電腦科學學位、人工智慧項目、投資、新興創業公司等等,人工智慧革命都在不斷擴展其規模和範圍。在過去的幾年裡,無需我贅言,隨著大語言模型的問世,人工智慧領域再次迎來一次更加驚人的飛躍,大語言模型將現代人工智慧的演算法、資料和算力這三大要素推向了前所未有的高度。Transformer這種新型架構,利用海量的網際網路資料進行訓練,並由數量驚人的最先進晶片提供算力支援。正如大家所見,其結果是機器能力實現了比過去十年更加巨大的飛躍。

如今,我們已經習以為常地認為,AI可以用流利的自然語言與我們對話,回答幾乎任何領域的問題,甚至可以生成各種複雜的圖像、聲音、音樂和視訊。ChatGPT的巨大成功,創下了使用者採納速度的新紀錄,這充分證明了這項創新對我們日常生活的深刻影響。而且,這些AI的能力絕非只是表面功夫。從圖表上可以看出,近年來,AI模型在從手寫識別到博士級科學問題等一系列benchmark上的性能都呈指數級增長,在某些對人類極具挑戰性的任務中,AI的性能提升曲線近乎垂直。

李飛飛:在語言理解能力的基礎上,大語言模型開始在解決問題中扮演更積極的角色,它們能夠分解任務,並為實現現實世界的各種目標規劃步驟。正如許多人在2025年所稱的“AI智能體”,是這項對使用者和企業都至關重要的技術的最新篇章。但精彩遠不止於此,除了語言智能,還有更廣闊的天地。請思考一下人類,我們作為一個整體的智能生物。一個嶄新的篇章正在開啟,在這個篇章中,視覺感知的應用將擴展到更積極主動的層面。在我的研究領域,也就是相機和機器人技術中,人工智慧開始在數字或物理的3D空間中進行創造、理解、推理和互動。它可以用於與人或物進行互動,我們稱之為空間和具身智能。



例如,看這張圖片。我們的視覺智能使我們能夠輕鬆識別圖中的一切:貓、盆栽、桌子,當然還有那杯牛奶。但這真的是我們通過感知獲得的所有資訊嗎?我敢說,你們在座的各位,看到這張照片時,恐怕不只是理解了圖像的內容,肯定還有不少人迫切地想要伸手抓住那杯牛奶,以免它掉在地上摔碎。這只是一個簡單的例子,但它突顯了從觀察到行動的巨大轉變。我相信我們正處在一個轉折點,人工智慧將從觀察者轉變為與我們並肩行動的執行者。事實上,對於我所敬佩的艾倫·圖靈,我現在認為他對未來人工智慧的願景可能過於狹隘和內向了。進化本身就清晰地表明,智能的真正力量不僅僅在於思考,更在於運用思想驅動行動。

想想人類的空間智能,從古代金字塔到工業革命,從科學發現到藝術表達,它為人類文明的建設貢獻了何等巨大的力量。當AI擴展了我們的空間和具身智能後,我們與周圍世界的關係又將發生怎樣的深刻變革?它將幫助我們創造什麼,發現什麼?我們又將共同建構怎樣的未來?



現在,讓我們快速瞭解一下快速發展的空間智能技術。我將展示我的斯坦福學生和WorldLabs同事完成的四個案例,分別是:左上角,複雜日常視訊的語義標註;右上角,藝術風格遷移;左下角,生成式AI演算法根據文字提示生成視訊;右下角,根據圖像建立3D世界。沒錯,大家看到的就是梵高鍾愛的畫作《法國咖啡館》,它通過我們的生成式AI模型被栩栩如生地展現在一個想像中的3D世界中。

同樣令人振奮的是,機器人技術,作為具身智能的一種形式,也在快速發展。這兩項來自我們實驗室的研究,代表著將機器人學習與大語言模型和視覺模型相結合的最新進展,與上一代高度程式設計和預先設定動作的機器人相比,這些機器人能夠在更加開放和真實的執行日常的人類任務。


04

以人為本的人工智慧

李飛飛:這些都展現了令人振奮的可能性。但是,如果AI不僅能思考,更能行動,成為真正的“行動機器”,那麼我們引導這項技術的集體責任就變得更加緊迫和重要。我認為,說這一切已將我們帶到一個具有劃時代意義的時刻,也絕不為過。那麼,我們該如何應對人工智慧發展帶來的挑戰?

我認為,這也是我們本周齊聚一堂的目的所在。多年來,這個問題一直指引著我的工作。我深知這絕非易事,但有一個核心主題始終貫穿於我的所有研究工作。那就是我所倡導的“以人為本的AI”,它包含三個樸素而重要的價值觀:尊嚴、能動性和社區。

首先是尊嚴。面對日益強大的技術,我們人類常常需要反思一個根本問題:究竟是什麼定義了我們人類自身?拋開我們能夠完成的各種任務,作為人類的自豪感,以及自主決策和行動的能力,仍然是我們存在的核心價值。如果AI技術能夠幫助保護,甚至幫助所有人重拾這份尊嚴感,特別是那些弱勢群體,那將令我無比欣慰。

例如,我們正在進行的一個項目就展示了機器人和AI技術如何在未來幫助那些重度癱瘓的患者重獲自主性。在斯坦福大學,我的合作者和學生們正在進行一個研究項目,通過非侵入式腦電圖技術收集腦電波,AI演算法能夠解碼患者的意念和指令,並控制機械臂完成一系列精細動作,例如製作一份完整的日式壽喜燒料理。

第二點是能動性。我們實驗室的核心宗旨一直是探索AI的應用,以增強人類能力,而非取代人類。正如歷史上每一次重大技術變革都會重塑勞動力市場,AI的進步也必將對就業產生深遠影響。但我們不應將AI視為替代勞動力,而應充分利用AI來增強人類自身的能力,從激發創造力到提升醫療健康水平,從加速科學發現到賦能智能製造,AI的應用前景無比廣闊。

AI的諸多技能與人類技能形成互補,這意味著我們擁有大量機會,可以借助AI這種數字或物理的合作來實現自身能力的躍升。在過去十年中,我們實驗室在AI醫療健康領域的研究表明,AI在提升醫療質量、減輕醫護人員負擔方面具有巨大的潛力。例如,以下列舉了三個應用場景,展示了如何利用AI演算法驅動的智能攝影機來幫助醫院:1)提升臨床醫生的手部衛生規範;2)輔助記錄患者的康復鍛鍊情況;3)協助手術器械跟蹤管理。

但另一條道路則通向一個由AI助力建構的更美好世界,在這裡,AI幫助我們建設更完善、更宏大、更有凝聚力的社區。例如,AI教育輔助工具可以為越來越多的人群,包括兒童和成年人,提供學習機會。下面是兩個例子:左側,我們利用AI和VR技術,為患有閱讀障礙的大學生提供個性化學習工具;右側,美國布法羅大學建立了一款AI專家系統,旨在緩解言語語言病理學家的短缺,以便及早干預3至10歲兒童的言語和語言障礙問題。


05

人工智慧治理的三大原則

李飛飛:以上種種引出了我今天想與大家分享的最後一個思考。在這個具有劃時代意義的關鍵時刻,我們應如何同心協力,以理性、務實和負責任的態度治理AI,從而最大限度地發揮其巨大潛力。

首先,至關重要的是,AI治理必須以科學為基礎,而非科幻想像。縱觀Main Street和Wall Street,如今關於AI的大部分討論都充斥著誇大其詞和聳人聽聞的論調,導致AI治理政策誤入歧途。因此,我們需要用更科學的方法評估AI的能力和侷限性,從而制定更精準、可執行、且基於現實的政策。

其次,AI治理應採取務實態度,而非意識形態先行。AI是一項強大的技術,善用AI,將有助於改善我們的生活和工作。因此,我們不應限制對這項新興技術的探索和上游研究,而應將重點更多地放在AI的實際應用上,確保AI的良性發展,並防範其潛在危害。

最後,我們需要建構一個更健康、更具活力的AI生態系統,在這個生態系統中,學術界、創業者、開源社區、公共部門和大型企業都應積極參與,各自發揮關鍵作用,共同推動AI技術向前發展。既然AI將改變世界,就需要各行各業的人都參與到塑造這場變革中來。正如我之前提到的,演算法、資料和算力是現代AI的三大關鍵要素。如果這些資源過度集中在少數公司手中,AI生態系統將因缺乏好奇心驅動的研究、頂尖人才、開源力量和跨學科探索而活力受損。

75年前,艾倫·圖靈預見未來,大膽提出製造思考機器的挑戰。今天,我們取得的進展已遠超圖靈的想像。AI時代的科技進步令人歎為觀止。我認為,現在我們需要提出新的挑戰:與其僅僅關注我們是否能創造AI,不如思考如何讓AI成為一股向善的力量。總而言之,今天,我想向大家發出挑戰,共同建構以人為本的AI!謝謝大家! (藍血研究)