#智能AI
黃仁勳最新Milken萬字訪談:AI 是生產智能的工業革命;算力需求暴漲 1000 倍,人類野心也放大了 1000 倍
重塑智能邊界:黃仁勳談代理式AI與兆級工業革命自 ChatGPT 問世以來的兩年間,人工智慧的演進速度超乎了所有人的想像。當業界還在討論生成式 AI 如何改變創作時,NVIDIA 創始人兼首席執行長黃仁勳(Jensen Huang)已經將目光投向了更深遠的未來:從“生成”到“推理”,再到能夠自主規劃和執行任務的“代理式 AI”(Agentic AI)。在今天發佈的Milken大會現場訪談中,黃仁勳不僅揭示了算力需求即將迎來一千倍躍遷的邏輯,還以一位實用主義者的姿態,重新定義了 AI 時代的工業版圖、網路安全與人類勞動的價值。核心議題邏輯的質變:從檢索時代邁向生成時代代理式 AI:通往千倍算力需求的階梯AI 工廠:數兆美元的再工業化機遇非對稱防禦:開源是網路安全的唯一答案駁“滅絕論”:職業的本質是解決問題結語:野心的規模化目錄全域摘要和核心觀點革命的起點:從 ChatGPT 到生成式思維代理式 AI 與計算量的千倍躍遷重塑電腦產業:從檢索到生成工業與能源:AI 工廠的崛起投資邏輯:基石投資與生態循環安全與恐慌:實用主義者的辯護全球競爭與經濟安全開源防禦:網路安全穹頂監管與務實派的話語權駁 AI 滅絕論:任務、目的與就業社會斷層與野心的規模化加州情懷與稅收觀企業責任與未來展望全域摘要本次訪談中,NVIDIA 首席執行長 Jensen Huang(黃仁勳)與 CNBC 主持人 Becky Quick 深入探討了生成式 AI 的革命性影響。黃仁勳闡述了從生成能力到推理能力、再到代理式 AI 的演進過程,強調了計算需求千倍增長背後的邏輯。訪談還涵蓋了 AI 驅動的美國再工業化、能源與電網現代化、網路安全中的開源防禦策略,以及對 AI 安全論和就業重塑的務實見解。核心觀點生成即推理:AI 的生成能力(Tokens)是實現思考與推理的基礎,標誌著電腦從“檢索模式”轉向“生成模式”。算力需求呈指數級增長:代理式 AI 所需的計算量比生成式 AI 高出約一千倍,這導致了 GPU 需求的急劇飆升。再工業化的機遇:AI 產業不僅是軟體革命,更通過晶片廠、電腦廠和 AI 工廠推動數兆美元的實體再工業化。開源是網路安全的穹頂:防禦 AI 威脅的最佳方式不是單一更強的武器,而是利用開源模型建立海量的“白細胞”進行叢集防禦。任務自動化不等於職業消失:工作的目的是解決問題而非執行特定任務。AI 將通過提高生產力,讓人類追求更宏大、更有野心的目標。01. 邏輯的質變:從檢索時代邁向生成時代過去十五年,黃仁勳精準預判了深度學習的崛起,而今他指出電腦的運作邏輯正發生根本性倒置。傳統模式下,計算是基於“檢索”的——資訊被預錄並儲存在雲端,使用者點選後被提取。但在 AI 驅動的未來,絕大多數互動將是即時生成的。02. 代理式 AI:通往千倍算力需求的階梯如果說過去兩年是生成式 AI 的普及期,那麼未來幾個月將是“代理式 AI”的爆發期。黃仁勳提到了 Anthropic 的 Claude 程式碼等突破,標誌著 AI 開始具備理解、推理、規劃並使用工具完成實用任務的能力。這種能力的進化對底層基礎設施提出了極其嚴苛的要求。“為了讓 AI 實現理解、推理、規劃並使用工具採取行動,其所需的計算量相比生成式 AI 要高出約一千倍。”黃仁勳對此給出了直觀的類比:在短短兩年內,這種算力需求的缺口就像全球對汽車或飛機的需求突然翻了一千倍。這就是為什麼 NVIDIA 的 GPU 依然供不應求,甚至連四五年前的二手硬體價格都在攀升。他認為,AI 已經從一個簡單的應用程式演變為一個開創性的新產業,其核心是生產“智能”的基礎設施。03. AI 工廠:數兆美元的再工業化機遇在宏觀經濟層面,黃仁勳將 AI 視為實現再工業化的催化劑。他構想了一個由“晶片廠、電腦廠和 AI 工廠”組成的三位一體架構。這不僅僅是矽谷的繁榮,更是數兆美元實體資產的重組。04. 非對稱防禦:開源是網路安全的唯一答案面對 AI 武器化的擔憂,黃仁勳展現出了鮮明的實用主義態度。他並不認同“以更強的 AI 武器對抗 AI 威脅”的軍備競賽思維,而是主張建立一個基於開源技術的“網路安全穹頂”。“防禦超級力量的方法不是用另一種超級力量,而是利用大量的群體力量。”他將開源模型比作人體內的“白細胞”:“只要它們是開放原始碼的,我們就能擁有眾多的防禦者。開源模型訓練出的‘白細胞’可以探測威脅並關閉入口。我們不一定能保證自己的 AI 比對方更強,但我們可以確信我們擁有的 AI 數量比對方更多。”這種非對稱防禦策略,被他視為保護數字社會安全的關鍵。05. 駁“滅絕論”:職業的本質是解決問題針對 Geoffrey Hinton 等學者提出的 AI 可能終結人類文明的憂慮,黃仁勳給予了直接的反駁。他認為這些預測忽略了人類社會各界在安全防護上的巨大投入,並用放射科醫生的案例闡述了 AI 與就業的真實邏輯。“十年前人們預測放射科醫生將被淘汰,因為電腦視覺更出色。事實是,100% 的放射學領域如今已被 AI 滲透,但放射科醫生的工作並沒有消失。”黃仁勳觀察到,AI 提升了效率,讓醫院能接診更多患者、進行更精準的診斷,醫院反而需要僱傭更多醫生。“軟體工程師的宗旨並非編寫程式碼,而是解決問題。打字和交談可以自動化,但創造新事物的野心無法被自動化。”他堅信,AI 將迫使人類從繁瑣的任務中解脫,去追求更宏大、甚至需要提高 100 倍規模的目標。06. 結語:野心的規模化在對話的最後,黃仁勳流露出對科學發現和工業革命的極致熱忱。他每天與科學家交流,見證 AI 將數月的研發周期縮短至一天。這讓他意識到,人類面臨的唯一限制是想像力。“無論你現在的目標有多高,都還遠遠不夠。我們必須做出的根本性改變是,將對未來的期望提高約 100 倍。”這位執掌兆市值帝國的舵手最後說道。在他看來,AI 帶來的不僅是效率的提升,更是一場關於人類野心的規模化革命。完整訪談 (天空之城全文圖解)革命的起點:從 ChatGPT 到生成式思維Becky Quick歡迎 NVIDIA 創始人、總裁兼首席執行長 Jensen Huang,以及 CNBC Squawk Box 主持人 Becky Quick。謝謝。黃仁勳女士們、先生們,Becky Quick。大家好。Becky Quick下午好,晚上好。我很高興能與大家共聚一堂,但我尤其高興能與 Jensen Huang 在一起。如果說現在有什麼人是我最想交流的,那一定是他,因為他懂得如何在人工智慧領域洞察先機。NVIDIA 目前正處於靜默期,但我認為我們想從他那裡聽到的是更宏大的願景。那麼 Jensen,讓我們先退後幾步開始吧。大家都想知道人工智慧未來會怎樣。這是我們所見過的最快的一場技術革命。事情的發展不再以年、以十年為單位,而是以周、以月為單位,變化極其劇烈。你是 Wayne Gretzky。請告訴我們冰球將向何處移動。黃仁勳首先,讓我先告訴你冰球從何而來。那麼就在過去幾年裡,發生了什麼。我覺得我正坐在一件導致所有這一切發生的事情上。是我嗎?Becky Quick可能是我。稍等。黃仁勳好點了嗎?所以發生的事情是兩年前,ChatGPT 發佈了。而讓 ChatGPT 成為一場革命的原因是,它具備生成能力,即生成式 AI。你給它一個提示詞,它就能為你寫一個故事;你給它一個提示詞,它就能為你製作一張圖片;你給它一個提示詞,它就能為你生成一段視訊。你給它一段視訊,它就能生成一個故事;你給它一張圖片,諸如此類。你輸入一張 2D 圖它就能生成一張 3D 圖像。因此,生成式 AI 的生成能力具有兩項深遠的意義。第一,為了進行思考,你必須在頭腦中生成標記(tokens)。Becky Quick你指的標記是什麼?黃仁勳標記。就是你必須生成思維。因此,我們思考和推理的能力要求我們必須能夠生成思維。所以,當我們讓 AI 具備生成能力的那一刻,我們就意識到它現在可以思考了。它現在可以進行推理了。代理式 AI 與計算量的千倍躍遷黃仁勳第二點是,為了使用外部工具,你必須生成指令。因此,當你使用瀏覽器時,你必須生成文字來控制其他事物。當這兩個概念出現的那一刻,整個行業便競相探索如何利用生成式 AI 來實現推理——這在去年已經實現,隨後便是現在所說的代理式 AI(agentic AI),即 AI 理解、推理、規劃並使用工具去完成實用任務的能力。所以在過去幾個月裡,業界意識到並採用了 Anthropic 的 Claude 程式碼,這是第一個能夠進行真正高效工作(如軟體程式設計)的智能體系統。軟體程式設計是一個很好的切入點,但請記住程式設計的本質是什麼。程式設計就是將你想要自動化的事物進行程式碼化。世界上有多少公司、多少人不想把自己想要反覆執行的任務編寫成程序呢?事實證明,程式設計不僅對軟體工程師很重要,對所有公司而言都至關重要。而這一切都發生在過去的幾個月裡。因此,AI 在過去幾個月變得切實好用了。這就是核心觀點。第二個核心觀點是,為了讓 AI 實現理解、推理、規劃並使用工具採取行動,其所需的計算量相比生成式 AI 要高出約一千倍。展望兩年後,細思極恐。在兩年時間裡,全球所需的汽車數量增長了一千倍。在兩年時間裡,全球所需的飛機數量增長了 2,000 倍。無論你用什麼指標來衡量,一千倍的差距都是令人難以置信的。但隨後你再將其乘以現在想要使用它的人數(增長了一百倍),這就是為什麼 GPU 的消耗量正在急劇飆升。而且,甚至連我們四五年前售出的 GPU,現在的價格上漲速度都超過了優質葡萄酒。Becky Quick因此,這已經打破了所有人的預期,擁有 NVIDIA GPU 就像是在投資藝術品。這定義了每個人曾經預言會發生的事情。如果過去一年的算力需求增長了一千倍,那你如何看待明年的情況?以及你試圖將這些事情推演到多遠的未來?重塑電腦產業:從檢索到生成黃仁勳關於這個問題的考量在於,你需要回歸本質並捫心自問:第一,自動化智能的效用是什麼,以及誰能從中受益?從中獲得什麼,以及你將如何從中受益?這是第一點。第二點,生產智能需要什麼樣的基礎設施?這是電腦科學中的核心理念之一,也是我曾經深入思考過的問題。現在我正在和你們交談,我正在一步步地進行邏輯推理。15 年前,我推演了深度學習將會帶來的變革,這促使 NVIDIA 在相關領域進行了全面投入,而今天我們已見證了成果。目前的情況是,未來電腦的運作方式與你現在使用電腦的方式將產生差異。你只需要拿起手機,當你點選新聞時,請記住那篇新聞報導或關於 Becky 的視訊是預先錄製好的。它是提前錄製並儲存在雲端的某個位置,當我點選時,我便將其檢索出來。在未來,你仍然會進行很多此類操作。然而,在你與電腦互動的大部分時間裡,你將以特定的方式向電腦下達指令。你在提問嗎?你想做點什麼嗎?你在思考某些事情嗎?你想找個人和你辯論嗎?是否有某個大型規劃是你想要完成的,比如度假、籌備婚禮或其他什麼事情?然後你只需像與人交談一樣告訴電腦你的需求,它就能理解你的意圖,推理出解決問題的方案,制定計畫,使用它所需的任何工具,訪問各種網頁瀏覽器,使用 Excel 甚至 Photoshop,為你創作出精彩的作品,生成一系列圖,最後交給你一份宣傳冊。因此,你必須問問自己,如果這是你使用電腦的方式——從最初基於檢索的方式,到現在一切皆為生成式,並且具有上下文相關性,這意味著我剛才所說的一切都無法預先錄製。因此,世界上的電腦數量將出現驚人的增長。這就是我為什麼說 AI 不僅僅是一個應用程式,AI 實際上重塑了電腦行業,AI 開創了一個全新的產業。對於在座的許多人來說,你們正與我們在能源層面、晶片層面、基礎設施層面、土地、電力、雲服務、NeoCloud 等領域合作;然後是模型層,大多數時候我們討論的是模型,但事實是,沒有底層的基礎設施,就不會有有用的模型。其次,最重要的是應用層。醫療保健、交通運輸、零售,以及你提到的金融服務等各個行業,其應用層都不會被人工智慧所徹底顛覆。因此,當我們從這個角度進行剖析和推論時,可以非常確定的是,就像網際網路無處不在一樣,電腦也將無處不在。Becky Quick計算能力,比如 NVIDIA 的 GPU,實際上將無處不在,以便你每次使用電腦時,它都能對你的輸入做出正確的響應。你提到我們將擁有如此多的電腦,我所考慮的是需求量會有多大,以及我們該如何應對這些需求。你剛才提到了“堆疊”,也就是你談論已久的五層架構,那麼在滿足這些需求的過程中,那裡存在弱點?那裡是限制因素?工業與能源:AI 工廠的崛起黃仁勳這些因素一直在變化。兩年前,我們的能源供應尚且充足,但晶片卻嚴重短缺。這取決於我們討論的是那一類晶片。大多數人認為 NVIDIA 是一家 GPU 公司,因為我們發明了 GPU。但如果你審視我們今天所打造的系統,你會發現其中包含了七種不同類型的晶片。我所說的這種電腦,其寬度大概是這個舞台的兩倍。當我們提到 Vera Rubin 時,它的寬度是這個舞台的兩倍。每一個機架的造價大約在四到五百萬美元,重三噸,內部包含一百五十萬個零部件。在一個資料中心內部,擺放著足球場那麼大的此類機架。因此,這些系統內部採用了矽光子技術。它擁有最先進的記憶體、三維封裝、液體冷卻,並且極其靈敏。到處都是電子裝置,所以這確實是非常複雜的東西。我們與世界上幾乎所有的晶片公司和系統製造商合作,我們擁有全球最大的供應鏈,所以總會在某個環節出現瓶頸,因此要解決所有這些問題需要付出巨大的努力。當然,如今最大的挑戰之一,也是人們對 AI 不瞭解的部分,就是 AI 目前正在創造海量的就業崗位。Becky Quick事實就是 AI 在創造就業。黃仁勳AI 是美國實現再工業化的最佳機遇,因為它需要三類工廠:晶片廠、電腦廠,以及我們所在的這種 AI 工廠。因此,通過這三種類型的製造工廠,我們或許能夠實現數兆美元的再工業化。沒有什麼比利用市場力量來推動再工業化更有效的了。例如,在上屆政府期間,曾出台過一項名為 Chips Act 的法案,當時大家都不願在美國進行建設。當 President Trump 上任後,我們進行了交談,我說,我打算提供五千億美元的訂單。我打算向這些供應商提供五千億美元的訂單,我敢打賭他們會來到美國。砰的一聲,他們全都來到美國在這裡設廠了。因此,利用市場力量來推動美國的再工業化,在接下來的四五年裡創造了數十萬個就業崗位。最後,AI 是世界上實現電網現代化的最佳機遇。如果現場有從事相關行業的人,你們應該知道,美國的電網確實有些陳舊了。你們對此心知肚明。所以我們現在第一次有機會利用市場力量來投資可持續能源。如果你想投資核能,或者任何你選擇的可持續能源方案,現在都有大量的客戶願意為此買單。Becky QuickNVIDIA 會投資能源領域嗎?因為你們一直在確保對沿途發現的任何層面、任何瓶頸進行投資。你最近提到,你們目前對 OpenAI 的這項投資很可能是最後一次,因為 OpenAI 和 Anthropic 未來會上市。他們將不再需要你們這種形式的支撐。他們會有自己的資金,也會有其他來源。但你們所做的是找出瓶頸所在,並嘗試將 NVIDIA 的資金投入到這些領域。能源領域是你願意投入的地方嗎?還是說那是一個巨大的投資黑洞,必須由其他地方來填補?黃仁勳如果有好的想法,並且我們能做出獨特的貢獻,我很樂意這樣做。但大多數投資能源領域的人,他們的周期,他們的時間跨度相當長,尤其是我們真正感興趣的那些項目。我們需要在能源方面進行投資的地方,可能更接近美國本土,而且在時間上更緊迫,以確保土地、電力和外殼設施得到充足的資金支援。也許我們可以為其提供一些後盾,以便他們能夠啟動融資並接入電力。而且,這正是我們的關注點所在。但你說得對,我們對整個五層架構進行投資,並且正在審視其中的戰略要點;如果我們投入 1 美元,可能會撬動 100 美元的 AI 價值。因此,如果我們能為整個生態系統實現這种放大效應,那將是巨大的成就。投資邏輯:基石投資與生態循環Becky Quick那麼,你現在在那個五層架構中的關注重點是什麼?如果說對大型語言模型的關注期可能已接近尾聲,你認為目前最大的瓶頸在那裡,以及那些領域是你能夠發揮作用的地方?黃仁勳這是一個非常、非常棒的問題。你可能注意到了我們投資了基礎設施層,起初人們還有點疑惑,不知道為什麼我們要投資像 CoreWeave 和 Nebius 這樣的公司。他們說這是循環交易。Becky Quick為什麼你們要這麼做?這根本講不通。黃仁勳沒錯。假設我們投資了一美元,他們仍然需要去籌集另外九美元。因此,我們投入了一定金額,我們的基石投資讓所有投資者相信我們是這家公司的堅強後盾。所有那些曾與我一同在 CoreWeave 進行投資的人,顯然都非常高興。所有那些曾與我一同在 Nebius 進行投資的人,都感到無比高興。任何曾與我一同在 N-scale 進行投資的人,都感到無比高興。之所以如此,是因為我們能夠預見到市場需求,並看到了他們未來即將迎來的機會管道。在很多方面,我們是資訊高度靈通的投資者,這就是為什麼我想知道你下一步打算投資那裡,就像我剛才說的。你看 Becky 多機警,當我被問到一個不確定是否想回答的問題時,我就會講些歷史背景,而她卻想瞭解未來。好了,未來要來了,我開個玩笑。這就是我的第一點。第二點,我要告訴你一件非常重大的事情。當然,我們投資了 OpenAI,我們投資了 Anthropic。但過去三到六個月裡發生的最重要的事情是,這兩家公司以及大多數 AI 原生公司都已經實現了轉型,它們的毛利率變得非常可觀。Becky Quick沒錯,它們已經扭虧為盈了。黃仁勳確實如此。當你在製造產品且毛利率很高、盈利能力很強時,你的目標就是擴大產能,這正是 OpenAI 和 Anthropic 都在競相提升算力的原因,因為對於它們所產生的 Token、這些數字以及智能而言,利潤空間非常優越。所以利潤空間很優越,Cursor 也是如此,縱觀整個 AI 原生生態系統,所有人都是這樣。而這背後的原因在於,AI 終於變得實用了。這就是核心理念。所以我希望 AI 生態系統現在能夠獨立發展。Becky Quick蛋糕的每一層嗎?黃仁勳我們拭目以待。如果我發現了一些好的投資機會,我不會先告訴你們任何一個人。安全與恐慌:實用主義者的辯護Becky Quick好的,讓我們回到 AI 非常驚人這一觀點。它確實做了很多了不起的事情。未來它還將成就更偉大的事業。但與此同時,也存在著許多危言聳聽的言論。人們對此有著諸多憂慮。你可以將其劃分為兩個陣營。即 AI 悲觀論者和 AI 樂觀論者。而你或許正是看好這一技術未來前景的領軍性樂觀派。黃仁勳我是一個實用主義者。我是一個實用主義者。首先,Becky,作為行業的一員,確保 AI 的安全性是我們的責任。原因在於,只有我們才懂得如何實現這一點。Becky Quick你具體是怎麼做到的?黃仁勳你需要發明很多技術。Becky Quick這與確保飛機安全的過程並無二致,所以你得有冗餘系統,還要有相當多樣的感測器系統。但這又有所不同,因為飛機不會決定自己墜向地面。你是否考慮過在這些大型語言模型中植入母性本能,或者還有什麼方法能讓它們變得像我們一樣?我正想說,還有防護欄機制。黃仁勳請記住,今天的聊天機器人與兩年前的相比,其防護欄機制已經有了質的飛躍。而且,當然,作為一名工程師,你不可能預想到某種事物可能發生故障的所有潛在方式。所以你必須在市場中進行試用。沒有比讓人們親自使用更好的方法來成為一家更好的公司或打造更好的產品了。這很遺憾,但卻是事實。現今的飛機、汽車以及醫療保健系統,如果不是因為人們的實際使用,是不可能達到如此安全可靠的水平的。因此,目前的防護欄系統已經非常出色了。它們仍存在一些地方,人們可能會誘導它做出你意想不到的事情。但每當有人這樣做時,公司就會去修復它。所以我認為我想表達的重點是,確保其安全性是科技行業的職責。當然,我們必須確保人們瞭解這項技術的能力,並以安全的方式使用它。我們也需要與其他國家建立聯絡,以便我們達成共識:這項技術非常強大且具有影響力,我們不應將這些技術用於相互對抗。我們在許多其他領域,如化學和核能領域也是這樣做的,所以我們當然可以在這種情況下也這樣做。但我想強調的核心觀點是,作為行業,我們的職責不是恐嚇大眾,而是讓大家知道這是一項重要的工作,我們致力於此,態度嚴謹,並且必須承擔起責任。我唯一擔心的是,對於 AI 而言,對於我們國家而言,最糟糕的結果並不是另一個國家擁有了 AI。每個人都應該擁有 AI。全球南方國家也應該擁有 AI。每一家公司,每一家公司,每一個國家,每個人都應該擁有 AI。它賦予他們力量,提升他們,昇華他們,並給予他們超能力。當然,每個人都應該擁有它。我最大的擔憂是,我們對美國民眾,以及所有那些我們向其講述這些科幻故事的人們,造成了過度的恐慌,以至於 AI 在美國變得極其不受歡迎,或者人們對它感到如此恐懼,導致他們根本不去接觸它。Becky Quick導致我們作為一個國家失去了領先地位。黃仁勳確實如此。歸根結底,你要記住,美國從上一次工業革命中獲益良多,這有充分的理由,並非因為我們發明了它,而是因為我們應用了它。全球競爭與經濟安全Becky Quick關於這一點,還有許多值得深入探討的內容。首先,我理解您的觀點,即我們需要與其他國家保持接觸,我想您指的應該是中國,具體來說,我們需要有能力與他們進行往來。我知道您的立場一直是認為我們應該向他們提供 H-200 晶片,不必是最新、最頂尖的,但我們應該提供晶片,使他們在某些方面依賴於美國公司。這很有道理,我們應該在全球範圍內展開競爭。美國理應始終保持領先優勢,他們是否應該擁有最新、最頂尖的晶片?不應該。美國擁有確保這一點的權利,我們對此感到非常高興,並且全力支援,即美國必須擁有第一、最多和最好的技術。但與此同時,所有美國公司都應該在全球範圍內競爭,因為請記住,歸根結底,我們是在努力實現出口最大化,我們是在努力實現美國出口最大化,我們是在努力增加我們的收入,而通過增加收入和稅收,我們能夠提升我們的國家安全。黃仁勳經濟安全有助於國家安全。稅收有助於我們的國防。所有這些都有助於提升國家安全。美國技術必須在世界範圍內的每一個層面都取得勝利。如果我們能出口能源,我們就應該出口。如果我們能出口晶片,我們就應該出口。如果我們能出口基礎設施,我們就應該出口。如果我們能出口模型,我們就應該出口。如果我們能出口應用程式,我們就應該出口。Becky Quick我們不會向許多國家出口我們最好的防禦性產品,特別是當對方並非我們的盟友時。AI 在其中處於什麼位置?它是一種武器嗎?黃仁勳不是。你可以通過這種方式來檢驗。一個簡單的測試。在座的每一位觀眾,雖然我看不清大多數人,但我可以斷定,你們百分之百需要 AI。而你們之中沒有任何人應該擁有核武器。我剛剛完成了這個測試。Becky Quick這話說得真好。黃仁勳這就是測試本身。這就是那個簡單的測試。我覺得你們都不需要 F-35。行吧。開源防禦:網路安全穹頂Becky Quick有沒有武器化的 AI 版本,我們暫且稱之為 Methos。我們現在應該把它提供給所有人嗎?因為政府確信,目前我們或許應該把它保留在這個較小的群體內。關於更廣泛地推廣它,確實有一些討論。而且存在一些顧慮……關於把它提供給所有人,因為我們要確保在它落入不法分子手中之前,我們的公司有能力保護自己。黃仁勳首先退一步問問自己,什麼是 Methos?Methos 是一個非常、非常出色的模型。但真正重要的是,Mithos 是一個專為編碼而設計的模型。現在,記住什麼是網路安全。程式碼。既然 Methos 能夠偵錯軟體、測試軟體並編寫軟體,那麼它為什麼不能偵錯網路安全、測試漏洞等等呢?因為這本質上只是程式碼。Becky Quick但如果駭客在白帽駭客之前獲取了這些權限,會發生什麼?他們會發現我們的弱點並可能加以利用。黃仁勳事實證明,解決這個問題的辦法並不是引入另一個 mythos。防禦超級力量的方法不是用另一種超級力量。而是利用大量的群體力量。因此,對於 mythos 而言,最好的方案其實是開源。開源是為了讓我們擁有叢集,擁有海量的白細胞。我們擁有海量的白細胞。而這些白細胞經過訓練,能夠探測威脅並向我們發出警報。一旦檢測到威脅,它就會判斷出。威脅來自何處並關閉入口。所以我們不能寄希望於自己的 AI 一定比對方的 AI 更強,但可以確信的是,我們擁有的 AI 數量比對方更多。這一點是可以肯定的。原因在於,公司數量和入口數量遠多於任何威脅。威脅必須決定重點攻擊那一個入口。因此,只要它們是開放原始碼的,我們就能擁有眾多的防禦者,因為開放原始碼的成本很低。如今的開源模型表現非常出色。我們可以運行所有這些經過訓練用於自我防禦的開源模型。這就是蜂群,也就是所謂的穹頂,即網路安全穹頂。這就是答案。但末日論者想要恐嚇你。我擁有世界上最強大的武器。那麼你的答案是什麼?而你可能會想,我唯一的答案就是另一種更強大的武器。事實證明,你需要尋找的是非對稱性。監管與務實派的話語權Becky Quick關於誰應該對此做出決定。我知道業界最瞭解正在發生的事情。政府在參與這種自我監管方面是否應發揮作用,不僅是自我監管,還包括政府監管。黃仁勳絕對是這樣。在每一個應用場景中,AI 在醫學影像系統中的應用,毫無疑問,未來每一個醫學影像系統本質上都會內建一名醫生,即內建一個 AI 系統。它將知道如何精準地為你進行掃描。並且,在掃描的同時,它還能即時發現疾病並進行診斷。因此,該儀器需要受到監管。而且,必須以監管醫療器械完全相同的方式來監管這種 AI。對於汽車,我很驚訝竟然到現在自動駕駛汽車還不必獲取執照。Becky Quick這是一個,這是一個問題,你不覺得嗎?是的。黃仁勳如果你的女兒需要考取駕照,你肯定不會認為你的自動駕駛汽車也應該去考取駕照。直接讓她上路就行。讓她上路,看看它能否通過所有測試,讓考官坐在副駕駛位上對著它大吼大叫,這樣你就不會相信矽谷那種“快速行動,打破常規”的做事方式了,因為很多技術似乎就是這樣被推廣開來的。不,我認為你應該快速行動,但不應該打破常規。沒錯,快速行動的好處在於,更先進的技術會更安全。比起 100 年前坐車,我更喜歡今天坐車,因為現在更安全。它擁有更多技術。Becky Quick是指由自動駕駛汽車駕駛嗎?黃仁勳我是說,由人類駕駛的汽車,或者說,由真正的人類司機駕駛。我想,我不明白為什麼這一點這麼難理解。Becky Quick那是一條毛巾。黃仁勳那太老套了。那真可愛。Becky Quick我們來談談 Doomers。我一會兒就從這個話題裡退出來。黃仁勳不,我樂意繼續深入探討。Becky Quick但我認為討論這些問題很重要,因為現在有 boomers,有 Doomers,而大多數美國人可能處於中間地帶。所以他們正在聽取雙方的意見,並試圖找出自己在其中的立場。黃仁勳務實派也需要一些話語權。Becky Quick如你所知,對於務實的人來說,除非你走極端,否則沒人會在意你說什麼。黃仁勳確實如此。然而,這才是世界真實的模樣。關於這個東西,我只想讓它沒有生命,沒有意識,我非常清楚它是什麼,它就是電腦和軟體。Geoffrey Hinton。我們知道它是如何建構的。如果我們不知道它是如何建構的,又怎能持續最佳化它呢?事實上,我們不知道它是什麼,不知道它是如何運作的,它即將產生意識,我們對這一切是如何發生的一無所知。那種言論只會讓人們感到恐慌,而且並非事實。這讓我們的工作顯得很神秘。駁 AI 滅絕論:任務、目的與就業Becky Quick聽著,我知道你看待其他 CEO 時會想,在某些問題上,我們或許不該聽信他們的言論。但是,被譽為 AI 教父的 Geoffrey Hinton 又如何呢?他聲稱 AI 有 20% 到 30% 的機率終結人類文明。他是完全錯誤的嗎?他關於完全沒有機會的論點是完全錯誤,還是僅僅是他的機率估算錯了?黃仁勳他是完全錯誤的。因為有大量聰明才智之士正在努力防止這種情況發生。因為你可以將他所說的一切套用到歷史上的任何情境中。這是因為有許多優秀的人在努力工作以防止這些事情發生。有許多人致力於讓汽車跑得更快。但有十倍以上的人在努力讓汽車變得更安全。有許多人致力於讓 AI 變得更智能。還有十倍以上的人在致力於確保它受到安全護欄的約束、保持安全,並且不產生幻覺並能產出有用的成果。所以我認為缺失的部分在於,他們傾向於認為只有自己一個人在擔心這個問題。他們忘記了世界上還有一大群人,一大群電腦科學家,正在努力讓世界變得更安全、更美好。所以,關於,關於,還有一些其他的說法。Becky Quick比如,我們必須保持謹慎。黃仁勳他們出於所有的良好意願,認為自己是在向我們發出警告。但我們必須小心,如果讓人們感到恐慌,實際上是在損害我們自身。那麼讓我給你們舉一個具體的例子。一個具體的例子,這就是最初的那個預測。一位非常知名且舉足輕重的電腦科學家曾說,第一個將被淘汰的工作是放射科醫生。原因在於電腦視覺在研究掃描件、查看圖像以及檢測我們無法發現的事物方面表現得極其出色。顯然,它確實能做到。因此,電腦視覺現在已經完全超越了人類。在這一狹窄的任務上,世界上沒有任何人能做得更好。能長時間保持專注。當時認為異常情況微乎其微,所以那位電腦科學家說得完全正確,十年後,100% 的放射學領域如今已被 AI 滲透,它已與放射學完全融合。這確實完全正確,然而完全錯誤的是,正如預測所言,放射科醫生的工作並沒有被取代。令人驚訝的是,其原因對我而言顯而易見:放射科醫生現在可以研究更多的影像,能夠接診更多患者,可以對患者進行更多的影像檢查,從而更好地診斷疾病;他們能接收更多患者,醫院因此賺取了更多利潤,放射科如今已成為醫院最大的利潤中心之一。結果就是,醫院現在反而想要僱傭更多的放射科醫生。如果當初大家都聽信了他的話,導致世界上沒有了放射科醫生,我們將面臨這種極其關鍵資源的短缺。我們應該告訴放射科醫生。你人生的目的不是坐在暗室裡盯著工作站看掃描影像。你人生的目的是與醫生協作,幫助治療患者,診斷疾病,讓人恢復健康。那才是你人生的目的。研究影像僅僅是你所執行的一項任務。因此,每個人都忽略了一個根本點——所有這些電腦科學家都說‘這個工作完了,那個工作完了’——他們誤解了工作的目的與工作的任務是相關聯的,但並非同一回事。如果你把這個邏輯應用到我身上,我百分之百的工作內容就是打字和交談。而交談和打字現在都已完全自動化,且水平遠超人類。我本應失業才對。然而你我都能觀察到,我們兩人現在工作得比以往任何時候都更加努力。Becky Quick這一點我百分之百同意你。我認為你是對的。這就是資本主義的目標,旨在提高我們的生產力,給予我們更多閒暇時間,讓我們去探索開發腦力的新途徑、新方式。我認為這就是資本主義社會的成功之處。黃仁勳去變得更有野心、更大膽,去追求更多目標。我認為一旦我們失去了野心——例如,如果我們今天所做的工作就是人類未來想要完成的全部工作,如果僅此而已,那麼我會承認這一點。自動化將導致越來越多的人失業。然而,如你所知,我們仍有許多人類苦難亟待解決。我們有太多的希望和夢想想要去追求。還有太多的事物是我們想要去創造的。所以,如果我能有更多時間,那麼,我終於將擁有更多時間了。社會斷層與野心的規模化Becky Quick我百分之百同意你的觀點,但由於這一處理程序發生得如此之快,是否會產生比過去更為嚴重的社會斷層,從而導致更大的不平等?而我們該如何應對呢?黃仁勳那麼,讓我給出一個務實的回答。首先,正如我們之前討論過的第一個不連續性,AI 並不是那個模型。AI 是那個五層蛋糕。首先發生的事情是它創造了大量的工作崗位。如你所知,軟體……Becky Quick資料中心嗎?黃仁勳建設資料中心、晶片工廠、電腦工廠、AI 工廠。所有的 AI 公司都在瘋狂招聘。去年,有 1000 億美元被投資到了這些初創公司中。這是人類歷史上規模最大的投資,這些資金全都轉化為了就業崗位。AI 原住民、AI 初創公司在不斷湧現,軟體工程職位的數量正在上升,而非下降。當我們坐在這裡討論 AI 的一面時,AI 做得最出色的第一件事就是軟體編碼。與此同時,我們正在招聘比以往任何時候都多的軟體工程師。試想一下這種衝突,其原因在於我們現在可以利用 AI 完成更多工作,我們擁有極大的抱負,因此也在僱傭更多的人才。我認為人們需要以更豐富的人生閱歷和更多的智慧去審視這些問題,而不是僅僅侷限於技術視角,畢竟現在我看到 AI 能夠完全獨立地編寫出一整套程序。我們便會感嘆,這就完了。軟體工程師的工作崗位消失了。這根本說不通。軟體工程師的宗旨並非編寫程式碼。軟體工程師的宗旨是解決問題,創造新事物。那才是他們的宗旨。在我成長的過程中,我從未說過,你知道我最想做的事情是什麼嗎?我想打字。要知道,我九歲時來到美國,當我踏上這片土地時,我說,你知道嗎?我爸,他把我們送到這裡來是為了讓我們打字。沒日沒夜地打字。我們只能坐在書桌前,佝僂著背對著這個微小的螢幕,然後不停地打字。每一天,我們都要打字。我想要從起床的那一刻起到睡覺的那一刻都在打字。這毫無意義。Becky Quick我知道。我只是在和你開玩笑罷了。這期間可能會出現一些錯位。我同意你的看法,未來將會創造出更多的就業機會。你將會在許多地方看到這些。黃仁勳就像我們從農業社會邁向工業社會時一樣,這很可能會產生一些社會震盪。每個人的工作都會受到影響。讓我舉個例子:如果你現在是一名大學畢業生,如果你畢業時還不是一名 AI 專家使用者,那麼你就無法從另一位同樣畢業但精通 AI 應用的學生手中搶到工作。這就是一種社會震盪,一種昨天還不需要的技能,今天卻變得至關重要。然而,如果你是一名年輕的大學畢業生,同時又是一名 AI 專家,告訴你難道不會被錄用嗎?Becky Quick我們肯定會招聘,難道不是嗎?黃仁勳所以突然之間,對於會使用 AI 的人和不會使用 AI 的人的需求差異,這就是典型的就業震盪。當然,現在有些工作本質上只是一些任務。也許你只是在接聽電話。現在你可以使用 AI 來接聽那個電話了。而且,就像現在當你給餐館打電話時,我想那全都是 AI 在處理,不是嗎?是的。所以,過去在接待處負責接聽電話以處理預訂的人,不再需要做這項工作了。這樣他們就可以直接接待顧客,而不必讓顧客在餐廳等候。所以,我不確定每一份工作都會受到影響。許多工作崗位會被創造出來,一些崗位會被淘汰,但每一份工作都會受到影響。加州情懷與稅收觀Becky Quick因為我們身處 California,我想提一下這個話題,我一直試圖探討這個觀點。我認識的大多數真正富有的人,對這裡及其他地方提出的財富稅提案感到恐慌。你卻不以為然,儘管這可能會讓你損失約 80 億美元。黃仁勳等等。我說,你剛才說了什麼?再說一遍。Becky Quick恐怕這會讓你損失 80 億美元。黃仁勳在我回答那個問題之前,讓我先核實一下事實。Becky Quick為什麼你不對此感到擔憂?是因為你擔心的事情太多了嗎?還是你認為這種回流的再分配是公平的,或者是你能解釋一下?黃仁勳首先,我更傾向於低稅收和高收入。然而,我也不介意納稅。我熱愛這個國家。我們並沒有行使那麼多的稅收漏洞。我想我們一年會收到一次帳單,然後支付它。儘管數額巨大,但我並不介意。我和 Lori 從未對此有過任何怨言。我們熱愛這個國家。在某種程度上,這就是我們回饋社會的方式。我希望 California 能變得更好。我希望 United States 能變得更好。如果他們能用我繳納的稅款中 10000 美元去修補 101 公路上的那個坑窪,我會很高興。但如果給我機會,他們允許的話,我會自己動手去修。不過說真的,這都沒關係,我從未因為繳稅的事動搖過。還有一點,我們剛畢業時並沒有去盤算:“各州都把你們的稅率表拿出來讓我看看”,然後對比一番說:“就選這一家,你贏了”。我們來到 California 是因為這是我們自己選擇的州。為什麼?我熱愛這裡曾經的學校。我曾來到學校,也就是這裡的 Stanford。我熱愛這裡曾經擁有的那些公司。我們熱愛這裡的文化。所以我們選擇來到這裡。這並不是因為,我們在低稅率的州之間權衡了利弊。但現在我有很多朋友,他們繳納的稅款很少,不過我是在開玩笑。Becky Quick你能把他們都列舉出來嗎?黃仁勳不能。不能。我熱愛加利福尼亞州,也更傾向於較低的稅收,但無論他們決定讓我支付多少稅款,我都會照付。企業責任與未來展望Becky Quick讓我問你一個關於 Anthropic 的問題,因為目前存在一種爭論,即他們現在已經與五角大樓產生了關聯。白宮似乎正在嘗試修補關係,以尋找在政府內部及政府承包商中應用 Anthropic 的途徑。你認為確保這一點至關重要嗎?確保這一點對於美國的競爭力至關重要嗎?黃仁勳絕對如此。我希望美國政府與 Anthropic 能夠達成共識。Anthropic 是一家令人難以置信的公司。他們擁有令人難以置信的企業文化。他們擁有一種根深蒂固的信仰體系。他們在 AI、Claude Code、Agentic AI 以及他們正在進行的所有工作中所做出的貢獻,令人驚嘆。我們與他們有合作。我們在技術層面與他們合作,也在商業層面與他們合作,對此我感到非常高興。我並不認同他們的所有立場,Dario 和我都非常明確,我們無需在這些問題上達成共識,依然可以保持文明互利的工作關係。因此,我們能夠將這些分歧與工作區分開來。這就是我的信念。我的信念是,如果美國政府決定將美國公司創造的技術用於保衛國家和保護我的家人,那麼只要他們是在憲法框架內、在法律範圍內且為了保衛國家而使用這些技術,他們就是在支援軍人。我深信他們會以正確的方式應用這些技術。而那些 CEO 並非民選官員,他們不是民選官員,我也不是民選官員。當我們行動時,當 United States 發動戰爭時,我真的不希望接到電話來詢問我的技術是否應該被使用。原因在於我會尊重他們的判斷,如果我不同意他們的做法,我可以在下次選舉中作為公民行使我的投票權。這就是我表達抗議的方式,我可以大聲疾呼,作為公民參與投票,也可以鼓勵他人發聲,但我們絕不會阻礙 United States 保衛我們的家庭。因此,我們並非民選官員。這就是我的信仰體系,我相信這就是民主的運作方式,也是這個國家應有的運作方式。但除此之外,這是其中一個...謝謝。Becky Quick這一次...黃仁勳不過,我得說明一下,這是一家非凡的公司。如果你從歷史長河的角度來看,此前從未有過這樣的公司。從大約 10 歲左右發展至今,我認為他們以這樣的商業速度,從零增長到了近兆美元的價值。對於一家軟體公司而言,目前能產生這樣的營收規模,年化運行率可能已經達到 400 億到 500 億美元。這在許多方面都是歷史性的,他們對電腦科學以及社會的貢獻令人難以置信。Becky Quick在我們結束之前,請告訴我們一件你目前正在思考的事情,一些我們還不知道,或者可能是過去幾個月裡讓你感到驚訝的事情。黃仁勳你完全有理由保持樂觀。之所以這麼說,是因為我每一天,比如今天早上醒來,我先是和一位教授交談,後來又和一位科學家交談,然後我飛到這裡來和你待在一起,這就是我的一天。在那段時間裡,我們討論了用於開放科學的 AI,以及 AI 最終能做到的工作,例如,過去研究人員探索一個新想法需要幾個月時間,現在他們可以利用 AI 在一天之內完成這項研究。過去需要幾個月的時間,現在只需一天。而且你也會得到同樣的成果,科學實際上是一個發現、探索和推動人類知識邊界的過程。所以,無論是能源科學、氣候科學,當然還有生物學,以及醫療保健、藥物研發和物理科學等所有領域,科學家們所取得的突破都是令人驚嘆的。如果你能親眼目睹我每天所見的一切,你一定會感到無比振奮和激動。對於未來,你會意識到無論你過去抱有怎樣的雄心壯志,你需要對自己說的唯一一件事就是:無論你現在的目標有多高,都還遠遠不夠。這就是唯一的改變。我們必須做出的根本性改變,以及我必須做出的改變是,無論我對公司有什麼期望,都必須將其提高約 100 倍。所以,如果有人告訴我他們能做到某事,我現在腦海中預想的目標是原來的 100 倍。所以我可以說,我已經被 AI 現在所能實現的能力徹底改變了認知。我迫不及待地想讓你們所有人都能享受到這一切。這一切很快就會到來。在科學和工業的每一個不同領域,它都將是徹底的革命。這將會非常棒。Becky QuickJensen,你說的話我深信不疑,因為儘管你所談論的事物看似遙遠,但在我看來,你通常是承諾得少而交付得多,而不是虛張聲勢。黃仁勳沒錯。而且 Becky,你也知道,回顧歷史,我的大部分預測都是精準的。主持人謝謝大家。謝謝 Jensen。希望大家享受這次討論。請務必使用移動端 App 以獲取最新的日程變更資訊。離場時,請記得帶好您的隨身物品。 (Web3天空之城)
一把188億!他,在美國輸光一切,卻在中國一戰封神
中國正從”世界工廠”,轉變為全球頂尖人才的”創新工廠”。3月29日,一則消息震動全球醫藥圈,AI製藥公司英矽智能宣佈與美國製藥巨頭禮來公司達成了一項重磅合作。其合作首付款高達1.15億美元,總價則達到27.5億美元,約188億人民幣,另外還包含產品上市後的潛在銷售分成。而格外引人矚目的是,這家名為英矽智能的公司,是由一個歐洲人在美國創辦,卻因為無法在美國生存發展,轉而遷移到中國香港,然後依託中國市場才獲得了今日的成功。資料顯示,英矽智能不過300多人的規模,它能撬動如此大的交易,關鍵靠了對AI的前瞻性佈局。在傳統製藥行業,人們用“雙十定律”來形容新藥研發的殘酷。投入10億美元,苦熬10年時間,成功率卻不足1/10。英矽智能則是全球最早利用AI製藥的先行者之一,它自主研發的軟體平台Pharma.AI,包含靶點發現、分子設計與生成、臨床試驗結果預測等模組,實現了全流程的智能化,可大幅縮短藥物研發周期,節省研發成本,提高研發效能。如,傳統方法從靶點發現到確定臨床前候選化合物,平均需要4.5年時間,而英矽智能僅用12~18個月。所需合成的測試分子數量及相應成本,更是降到了傳統方案的1/10。英矽智能創始人Alex因此宣稱,他們的50個人,比得上傳統製藥公司的5000人。多個權威媒體推測,英矽智能與禮來的交易核心是一款臨床前口服GLP-1藥物,也就是當下爆火的減重藥。借助AI的能量,英矽智能將這款藥物做到了“同類最佳”。作為世界上第一家市值兆美元的醫療公司,禮來選擇夥伴的標準極為嚴苛,這次27.5億美元的合作,堪稱行業最頂級的背書,也是傳統製藥巨頭對AI製藥的一次“官方認證”。而英矽智能成功的背後,則是一個歐洲人在美國和中國之間的夢碎與圓夢之旅。在Alex的辦公室裡,擺放著一張照片,照片上的人是中國醫藥巨頭藥明康德的創始人李革。正是這位伯樂,將Alex拉出了創業的泥潭。1979年出生於拉脫維亞首都裡加的Alex,是學霸中的學霸。他在加拿大女王大學攻讀電腦和商業雙學位,在美國約翰霍普金斯大學深造生物技術碩士學位,後來又在莫斯科國立大學獲得物理及數學博士學位。2006年,由於任職的公司被AMD收購,年僅27歲的Alex便實現財務自由,帶著幾百萬美元投入到熱愛的抗衰老研究領域。2012年前後,他注意到AI在圖像、語音和文字識別方面進步飛速,因而萌生一個大膽的想法:如果用數十萬篇醫學文獻、研究項目等資料訓練出醫學領域的AI,是不是能夠加快藥物開發的處理程序。2014年,感覺時不我待的Alex,在美國創立了英矽智能,成為了世界最早的一批AI藥物研發者。▲Alex,圖源:英矽智能創業的前幾年,Alex最常做的事情就是向外界展示AI在製藥行業的能力,但無人相信他的商業模式,更無人願意給他投資。英矽智能因此長期徘徊在低谷,最困難時期,是靠Alex賣了所有房產,才勉強維持運轉。直到2018年,Alex遇到了世界醫藥外包巨頭,中國企業藥明康德創始人李革。起初,李革對於AI技術也不敢信任,但他願意給Alex一個機會:如果英矽能在短時間內用AI演算法,針對一個激酶靶點設計出有活性的化合物,就給予投資。結果,Alex團隊僅用40多天就完成了,傳統模式下需要數年才能完成的任務。見證奇蹟的李革,果斷領投了英矽智能。見證了中國精神與中國速度的Alex,對比審視了美國和中國的創新創業環境,然後決定把未來押注在中國。2019年,Alex將公司總部遷到中國香港,隨後又在上海成立研發中心。讓他下定決心的還包括,中國在整個醫藥創新的產業與市場環境。雖然AI在靶點發現、小分子生成、虛擬篩選等方面擁有超能力,但光靠AI是無法製造出藥物的。中國有從實驗室創新到臨床驗證的全產業鏈,建立了宛如“熱帶雨林”般的生態,能夠更快地將AI發現的成果進行生物學和化學的驗證。中國政府所提供的創新創業支援,以及豐富的人才儲備,就更讓Alex感到超出預期的驚喜。最終,這一切都體現在英矽智能的命運逆轉之上。起初,英矽上海的研發中心只有財務、人事、生物學家寥寥數人。但Alex很快就找到了他的中國合夥人——擁有15年製藥行業資歷,曾在跨國製藥巨頭葛蘭素史克負責小分子藥物研發,還任職過上海美迪西生物醫藥公司副總裁,成功助力公司上市的任峰博士。在任峰的帶領下,僅僅兩年多時間,英矽上海研發中心就建立起近150人研發團隊,成為公司的絕對核心。原先主要提供AI平台服務的英矽智能,也從此擁有了藥物研發能力。▲諾貝爾獎得主邁克爾·萊維特擔任科學顧問,身後兩位分別是Alex和任峰為了更加融入中國市場,Alex還改變公司的組織架構,由他和任峰共同擔任公司CEO,他自己負責AI平台的迭代最佳化,任峰則負責藥物研發業務,一起推動公司駛入了快車道。2021年2月,英矽智能獲得了全球首例完全由AI驅動發現的,針對特發性肺纖維化疾病的新靶點,並設計了全新化合物。兩年之後,針對該靶點開發的候選藥物ISM001-055獲批進入II期臨床試驗,這也是中國第一例由AI研發並進入臨床階段的候選藥物。傳統藥企完成從靶點發現到提名臨床前候選化合物,通常需要4年半的時間,研發費用至少幾千萬美元。而英矽智能的這款藥物僅用時18個月,費用還不到270萬美元。截至目前,英矽智能已經建立了超過30條內部研發管線,其中10個項目獲批臨床試驗,涵蓋腫瘤、免疫、代謝等多個疾病領域。當越來越多的藥企開始正視並取經AI製藥,英矽智能也形成了多元化的商業模式。比如,一些藥企盯上了它的軟體平台Pharma.AI,全球排名前20的製藥巨頭中,已有13家購買了平台軟體的授權,以加速和最佳化自身的藥物研發流程。諸如復星醫藥、賽諾菲等,也與英矽智能達成了戰略合作,共同研發某些藥物。而其最核心的業務模式,則是諸如與禮來合作的BD交易,即將研發中的藥物授權給大藥企。至今,其BD對象還包括Exelixis、美納里尼等藥企,前者獲得了8000萬美元的預付款,後者的交易總額則超過5億美元。良好的業務前景,尤其整個產業的AI加速,也讓資本普遍看好英矽智能的增長潛力。2025年12月30日,英矽智能於港交所主機板成功上市,創下當年港股生物科技類股最大IPO紀錄,首日收盤市值約167億港元。Alex是因為對抗衰老的興趣和研究,走上了醫藥的道路,繼而再成為AI製藥的先驅。如今,當英矽智能已然走上坦途,他又把延緩人類衰老當成了自己的終極目標。而且,他相信,中國最能夠實現這一夢想。因為,這裡有龐大的市場和足夠的資本,有完善且高效的生態系統,有全球罕見的“一站式”資源和能力,支援從0到1的創新,以及從1到N的規模化跨越。▲圖源:英矽智能“在中國,我們可以快速合成分子、進行分子測試、開展小鼠實驗、猴子實驗,推進人類臨床試驗。這也是為什麼如今全球大多數新藥都源自中國。”他說。而若有人對此表現懷疑,英矽智能的成功,本身就是個例子。出生於南非的馬斯克,出生於台灣的黃仁勳等等“外國人”,最終都在美國創業,圓了所謂的美國夢,也助力了美國產業經濟的前進。當中國從“世界工廠”加速轉向“創新中心”,也必將吸引全球頂尖人才,吸引越來越多的“Alex”,到這裡創業,到這裡圓夢,到這裡,讓中國夢成為世界更多人的夢。 (華商韜略)
機器人賽道變天:宇樹智元爭搶C位,騰訊阿里字節打響「代理人戰爭」
CES 2026 歸來,小雷發現具身智能和機器人賽道的高人氣,絲毫不見衰減之勢。尤其是 Omdia 近期公佈的一項資料,更掀起了機器人行業兩大明星品牌宇樹與智元間的纏鬥。Omdia 資料顯示,2025 年全球人形機器人市場出貨量預計達 1.3 萬台,其中智元以超過 5100 台的出貨量,佔據 39% 的市場份額,位列第一;宇樹以 4200 台的出貨量,佔據 32% 的市場份額,位列第二;智元和宇樹,合計佔據全球人形機器人市場 71% 份額。就是這樣的一份「兩強爭霸」榜單,結果「居於人後」的宇樹不爽了,官方甚至特地發佈了一份資料澄清說明。宇樹透露,其 2025 全年人形機器人實際出貨量超 5500 台,2025 年本體量產下線超 6500 台,以上兩項資料均不含雙臂、輪式等其他機器人產品。宇樹還特別指出,「目前各種機器人形態多樣,請勿把不同類型機器人數量,直接合併在一起對比」。第三方市場調研機構公佈的出貨量資料,通常都會有一定的誤差區間,相對成熟的品類,誤差區間會偏小,例如手機、電腦等品類市場,而像人形機器人這類既處發展早期、市場規模又極小的品類,官方不給出明確資料的話,第三方市研機構也比較難給出相對精確的各廠商出貨量資料。下一步,就看智元會否給出 2025 全年確切的人形機器人出貨量資料,從而「再次力壓」宇樹。宇樹智元纏鬥,更多機器人「實幹派」不再低調宇樹、智元纏鬥的同時,更多機器人「實幹派」,開始不再低調,甚至開始頻繁刷臉。蛇年春晚,宇樹一家獨舞,引爆全民關注人形機器人的同時,品牌關注度和星光度更是得到全方位擴大。馬年春晚,更多機器人品牌開始爭搶這一頂流秀台入場券,甚至不惜豪擲億元。此前有消息稱,沒有一家機器人企業獲得馬年春晚獨家贊助權益,「最終大約有五家左右的具身智能公司一起上春晚,每家出資 1 億左右」。近日,就有兩家品牌企業搶先宇樹,率先官宣獲得馬年春晚贊助商資格:一家是魔法原子,一家是銀河通用,均非此前呼聲最高的品牌企業。雷科技 CES 2026 現場攝製有說法認為,之所以是這兩家機器人企業率先拿到馬年春晚入場券,更多是因其產品設計理念和場景應用更偏向「實用性」和「可落地性」。這種說法,有一定道理。作為 CES 2026 報導團成員,小雷在拉斯維加斯現場就見識到了這兩家品牌機器人的功用性,而非觀賞性。魔法原子的機器人,今年首次登台 CES,帶來從科研教育到工業生產,再到家庭生活應用場景的機器人產品系列矩陣,例如在工業場景下擁有高自由度仿人作業能力的機器人,能全程自主完成從點單到出餐的機器人,可完成物品遞送、開關門窗等日常家務的機器人,在複雜高危巡檢環境下的工業四足機器人等。顯然,魔法原子想把機器人可以實現的核心能力,盡快適配到更多實際應用和工作場景。圖源:魔法原子值得一提的是,成為馬年春晚首個機器人合作品牌的同時,魔法原子聯合創始人顧詩韜透露,公司將在今年衝擊 IPO。作為搶先官宣登台馬年春晚的另一家機器人品牌,銀河通用在去年 12 月完成新一輪超 3 億美元融資,打破國內機器人行業單輪及累計融資雙紀錄,公司估值也來到 30 億美元。在技術路線上,銀河通用同樣強調「實用主義」。在其 CES 2026 展台,小雷就看到醒目的「AI-Driven Autonomous Robots, Born for Productivity(AI 驅動的自主機器人,為生產力而生)」大標語。展台的機器人,則亮出了兩大核心技能:其一是從貨架取送商品,其二是搬運箱子,全流程自動化。圖源:銀河通用除了這兩家將要登上馬年春晚舞台的新創企業,機器人領域的一些老牌創業企業也在加大自身品牌宣傳和產品推廣力度。雷科技近期就留意到一家名為睿爾曼(RealMan)的機器人和具身智能企業,其成立於 2018 年。睿爾曼創始人鄭隨兵曾對媒體表示,「我們造機器人不是為了造一個人,而是為了造一個能在具體場景幹活的工具」。具體到企業發展上,睿爾曼目前擁有三大核心產品:全端自研一體化關節模組、超輕量仿人機械臂、遠端作業網路(GLN),均有清晰的商用落地場景。其中,睿爾曼在 CES 2026 完成了「北京-拉斯維加斯」跨洋即時遙操演示,即通過建構「北京人形機器人資料訓練中心-拉斯維加斯國際會展中心」的遠端勞動力網路,使在北京的具身訓練師可遠端精準控制在 CES 展台的 RealBOT 輪式折疊機器人,執行「遞送物品」「傳遞水果」等真實場景作業。睿爾曼之外,應該還有更多業內老牌創業企業在默默發力,以求能實現從量變到質變的突破,從而迎來真正的出人頭地日。具身智能賽道火熱,網際網路巨頭掀起「代理人」之爭馬年春晚舞台,魔法原子、銀河通用搶先宇樹官宣,多品牌機器人登台亮相,告別單品牌「獨角戲」。迎接馬年到來,具身智能和機器人賽道更多在場企業,正在怒刷存在感,例如在目前同樣火熱的創投市場舞台。近期,名不見經傳的自變數機器人完成 10 億元 A++ 輪融資,成立不到半年的至簡動力完成第四輪融資。具身智能和機器人賽道,新創企業躍躍欲試、新新企業層出不窮,這一市場格局遠未到定型時。值得注意的是,自變數和至簡動力背後均有多家網際網路巨頭企業的身影。其中,自變數是目前業內唯一同時被美團、阿里巴巴、字節跳動這三家網際網路大廠投資的具身智能企業,至簡動力則是同時被騰訊、阿里巴巴這兩家網際網路巨頭投資的具身智能企業。圖源:自變數為何網際網路巨頭此刻仍在瘋狂押注具身智能和機器人企業,尤其賽道新新企業?一、網際網路巨頭本身也是 AI 大模型平台企業,而具身智能正是 AI 大模型在硬體應用領域的「頂流」和「未來」賽道。主流觀點認為,通往 AGI(通用人工智慧)的道路上,AI 是大腦,機器人是身體,大腦和身體缺一不可。故而,這些 AI 大模型平台企業,不可能不涉足機器人尤其具身智能賽道。與此同時,現階段的具身智能和機器人市場整體規模偏小,網際網路巨頭需要戰略佈局,但又無法自身涉足其中,站台新創企業(尤其尚未成型的新新企業)自然也就成了唯一解。二、機器人亟待解決「大小腦」未同步發育以及批次化交付(快速上量)的難題,而這給了網際網路巨頭一個全面介入的契機。機器人企業,普遍更擅長的是硬體技術、運動控制,以及對應的軟體適配和最佳化,這就決定了多數機器人企業,只能從硬體和運動控制層面去打磨機器人產品。機器人的「小腦」,即控制其運動能力的功能模組;機器人的「大腦」,即控制其智能程度的功能模組。久而久之,就出現了目前機器人「大小腦」未同步發育,具身智能概念落地難的行業發展現狀。機器人行業這一普遍發展瓶頸,既是困難,也是機遇。具身智能賽道的新創企業,尤其是被網際網路巨頭選中的企業,自然不會錯過這一良機。自變數,主打具身智能基礎模型,即獨立於、平行於大語言模型、多模態模型等虛擬世界基礎模型的物理世界基礎模型。自變數的具身智能基礎模型,以所有機器人的感知資訊(例如視覺、觸覺、語音等)為輸入,直接輸出機器人的動作、視覺,以及語言等,讓機器人能夠具備即時處理非結構化、動態及隨機任務的能力。至簡動力,由理想汽車多位前高管共同創辦和帶隊,產品聚焦通用機器人而非人形雙足機器人,基於汽車智駕技術路線(核心成員出自理想智駕研發團隊),力求可以面向 B 端應用場景「快速上量」。圖源:理想這個速度究竟有多快呢?去年下半年才成立的至簡動力,計畫今年實現通用機器人的量產。網際網路思維中的一大要義,是快。也許正是這一點,打動了騰訊、阿里巴巴這兩大網際網路巨頭,並共同為其站台。三、機器人和具身智能賽道已經湧入不少新老企業,此刻還想連續/大額融資的新創企業,尤其新新企業,深信「最後一張船票」的網際網路巨頭,自然也就成了少數可選的慷慨買單者。當然,從根本上來說,軟體層面的 AI、硬體層面的機器人,以及打通兩者的具身智能,對於意欲全面轉型到 AI 大模型平台的網際網路巨頭企業而言,是一場不得不前瞻佈局的必打之戰。只要網際網路巨頭( AI 大模型平台)還沒有拿到足夠多的「船票」和資源,機器人尤其具身智能賽道的新創企業就會繼續躍躍欲試、新新企業就會繼續破土而生。四大勢力逐鹿未來,機器人大戰恐難避免伴隨網際網路巨頭的全面介入,目前中國機器人和具身智能賽道不僅顯得頗為擁擠,而且集合了多派勢力。對於這一「早期還早期」「藍海還藍海」的市場,似乎有點不可承受之重。總體來看,目前機器人和具身智能賽道有以下四大勢力:機器人硬體企業:智元、宇樹等明星品牌企業,銀河通用、魔法原子等躍躍欲試品牌企業,睿爾曼等默默發力型老牌創業企業。智能清潔和大家電企業,包括已經推出的通用機器人、陪伴機器人等產品,以及人形機器人等概念產品。汽車企業,尤其是智能汽車品牌(造車新勢力)企業正在密集入局的人形機器人領域。理想汽車就最新宣佈,一定會做人形機器人,而且將盡快落地亮相。具身智能企業,尤其是網際網路巨頭站台的相關新創企業、新新企業。目前來看,機器人和具身智能賽道這四大勢力,各有千秋,例如:機器人硬體企業擁有機器人關節(自由度)和運動控制領域的核心技術,智能清潔和大家電企業則在 AI 硬科技和居家場景應用有著天然優勢,智能汽車企業可以在機器人賽道全面外延甚至再造 VLA,網際網路巨頭站台的具身智能企業可以在解決機器人「大小腦」未同步發育的問題上發揮重要作用。具體到其中一派勢力,例如最典型的機器人硬體領域,目前的明星企業,或者說「頂流」企業,在業內的位置都遠未「坐牢靠」,而更多非明星企業以及老牌創業企業,在今年開年、春節期間正在掀起的「不再低調」行動,也證明其絕非一直願當「綠葉」之輩。機器人硬體行業的明星企業、非明星企業、老牌企業,智能清潔和大家電企業,智能汽車企業,網際網路巨頭(AI 大模型平台)站台的具身智能企業,這四大勢力各有優勢、各有所長,短期內也很難決出個勝負,但機器人賽道的一場大戰似乎也很難避免。而在即將來到的農曆馬年,四大勢力也將在機器人和具身智能市場掀起更加激烈、甚至慘烈的爭奪戰和卡位戰,尤其是各派勢力內部的企業較量。 (電車通)
2025年度AI創業公司TOP50
2026年1月13日,前釘釘副總裁王銘創立的攀峰智能正式對外宣佈完成數千萬元種子輪融資,2025年10月王銘創立攀峰智能,公司定位為“AI時代的Shopify”,致力於打造商業化視訊Agent。AI應用爆發的這一年,下海創業的遠不止王銘一人,一批曾深度參與釘釘從工具到生態、再到AI戰略轉型的核心高管,正密集走出大廠,投身AI原生創業浪潮。例如,釘釘前副總裁、智能硬體生態總經理林峰於2025年離職後計畫創業聚焦AI辦公硬體領域,釘釘前CEO葉軍也於2025年7月離職投身AI Agent賽道。不僅是中國大廠高管紛紛離職創業,前OpenAI首席技術官Mira Murati創辦的Thinking Machines Lab也已完成20億美元種子輪融資,前GoogleDeepMind資深研究員Andrew Dai與蘋果研究科學家Yinfei Yang聯手創立AI公司Elorian,種子輪融資目標高達5000萬美元。2025年創投圈焦點依然還是在AI、具身智能領域,年終最熱門的AI創投事件是以數十億美元的價格被Meta收購的AI agent公司Manus,Manus的爆火也可以看作是今年社媒流量改變AI創業生態的起點之一。在AI領域,還有更年輕的創業者。成立於2024年的首形科技,95後創始人胡宇航僅抖音平台粉絲量就達到了142.6萬(截至2026年1月25日),Pre-A輪融資高達上億,與手游《逆水寒》合作的角色“方承意”仿生機器人亮相杭州CP32Pre漫展,得益於雙目視覺系統,他能夠與面前的觀眾進行“眼神”交流,並通過搭載的AI仿生運動演算法,做出自然的表情與頭部動作。可以看到的是,越來越多不同AI垂直領域的創業公司湧現,讓AI應用正在從“工具”走向“夥伴”,從“功能”向“情境”轉變。AI在反映人類的需求與渴望的同時,也在重塑社會生產與消費的模式。2025年以來,頭部公司完成的融資額已經達到了數億甚至超十億的規模,技術競爭的壁壘正在被越築越高,AI應用落地也已經從概念驗證階段步入商業快速變現期。AI創業公司從誕生到規模化盈利的周期正在被極度壓縮,2025年真正跑出來的AI公司有一個共性:永遠在為下一個變化做準備,AI時代的創業邏輯是持續進化。結語當今的創業沒有冷門賽道,大家都在百花齊放,AI似乎能夠改變千行百業,但想要真正成長,更多的還是“專注”。 (DBC德本諮詢)
加速時代來臨:全球藥物研發已經被顛覆
在大眾的印象中,製藥研究往往發生在擺滿實驗台、充斥著冒泡液體,研究人員身著白色大褂的傳統實驗室裡。但在倫敦國王十字區,有一位不走尋常路的製藥研究員帕特里克·施瓦布,他的工作場景卻截然不同。這裡曾經是鐵路站場和工業建築的地盤,如今卻搖身一變,成了倫敦最時尚的街區之一。施瓦布博士全身黑衣,供職於製藥巨頭葛蘭素史克(GSK),他正在用電腦科學中同樣熱門的人工智慧(AI),重新構想製藥的未來,致力於將儘可能多的工作從玻璃器皿轉移到電腦上,開啟“矽基藥物設計”新時代。當Transformer遇上藥物研發製藥行業一直以來都面臨著高成本、高風險的困境。一種新藥從研發到上市,平均需要花費26億美元,耗時10 - 15年,而且臨床試驗階段的候選藥物失敗率高達90%。這就好比在黑暗中摸索,投入巨大卻往往收穫寥寥。不過,AI的出現,似乎為這片黑暗帶來了一絲曙光。波士頓的生物技術公司英矽智能(Insilico Medicine)率先將基於Transformer模型的新一代AI應用於藥物研發領域。2019年,他們的研究人員腦洞大開,想用AI從生物和化學資料中發明新藥,第一站就瞄準了特發性肺纖維化這種肺部疾病。他們先是用與該病相關的資料集訓練AI,找到了一個有潛力的目標蛋白。接著,另一個AI登場,給出了能與該蛋白結合併改變其行為,同時毒性和穩定性都不錯的分子建議。最後,人類化學家接力,對篩選出的分子進行合成和測試,最終得到了一種名為rentosertib的藥物,並且最近成功完成了中期臨床試驗。整個過程僅用了18個月,而以往通常需要四年半的時間。這就像是原本開著老牛拉的破車在崎嶇山路前行,突然換成了高速行駛的跑車,效率提升立竿見影。如今,英矽智能已經有40多種由AI研發的藥物正在針對癌症、腸道和腎臟疾病等進行評估。而且,這種AI驅動的藥物研發模式正在迅速擴散。有預測顯示,該領域的年度投資將從2025年的38億美元飆升至2030年的152億美元。製藥公司與AI公司的合作也日益頻繁,2024年就宣佈了十幾項合作交易,總價值達100億美元。去年10月,製藥巨頭禮來(Eli Lilly)與輝達(Nvidia)宣佈合作,要打造行業內最強大的超級電腦,以加速藥物的發現和開發。這就像是武俠小說裡的各路高手紛紛結盟,準備在藥物研發這個江湖裡大幹一場。AI如何顛覆傳統藥物研發流程?傳統藥物研發就像一場漫長而艱難的馬拉松,從篩選具有潛在生物活性的有機小分子開始,就充滿了挑戰。要從數十億個小分子中篩選出合適的,就如同在茫茫大海裡撈針。而AI的加入,讓這個過程發生了翻天覆地的變化。它可以通過軟體模擬,對數以百億計的小分子進行篩選,測試它們的效力、溶解性和毒性等特性,根本不需要真正的分子進入試管。阿斯利康(AstraZeneca)負責這項工作的吉姆·韋瑟羅爾表示,AI篩選的速度比以前快了一倍,該公司90%以上的小分子發現流程現在都有AI助力。這就好比以前是人工一粒一粒地篩選沙子找金子,現在有了一台先進的淘金機器,效率自然大幅提升。在臨床試驗設計方面,AI同樣大顯身手。比如GSK的AI負責人金·布蘭森展示的基於智能體的系統Cogito Forge,當被問及生物學問題時,它能編寫自己的程式碼來回答問題、收集合適的資料集、整合資料,還能製作帶有結論圖表的簡報。它可以就一種疾病提出假設,包括可測試的預測,並通過文獻檢索來驗證或證偽。它甚至會派出三個“智能體”,一個尋找支援假設的理由,一個尋找反對的理由,還有一個來判斷誰對誰錯。這就像是有一群聰明的助手,幫研究人員全面地思考問題,大大提高了研究的精準性和效率。AI在選擇臨床試驗患者方面也發揮著重要作用。它可以分析候選人的健康記錄、活檢和身體掃描等資料,找出最有可能從新藥中受益的人。這樣一來,臨床試驗的參與者選擇更精準,試驗規模可以更小,速度更快,成本也更低。這就好比在一場比賽中,挑選出最有潛力奪冠的選手參賽,比賽自然更容易取得好成績。而AI最讓人驚豔的應用之一,當屬建立合成患者(也叫數字孿生)作為真實參與者的對照。AI通過分析過往試驗資料,學會預測未接受治療的患者病情自然發展情況。當有志願者參加試驗並接受藥物治療時,AI就會建立一個具有相同特徵(如年齡、體重、現有疾病和疾病階段)的“虛擬患者”。這樣,通過對比真實患者和虛擬患者的情況,就能更準確地評估藥物的療效。舊金山的數字孿生公司Unlearn.AI在2025年發佈的研究顯示,這種方法在早期帕金森病試驗中可將對照組規模縮小38%,在另一項阿爾茨海默病研究中可縮小23%。而且,對於那些原本可能沒有對照組的早期試驗,現在也可以通過數字方式引入對照組,增強對藥物療效的信心,並改進後續試驗的設計。這就像是給每個真實患者都找了一個虛擬的“影子”,通過對比兩者,更清晰地看到藥物的效果。AI的“製藥瓶頸”與突破之路不過,AI在製藥領域也並非無所不能。許多蛋白質分子,作為越來越常用的藥物,但它們比傳統藥物分子大得多,還老是晃來晃去,確定它們的精確形狀可不容易。RNA分子,作為新型疫苗的基礎,同樣讓人頭疼,而細胞內部基於膜的複雜結構更是難上加難。但好在這個領域的研究進展迅速,研究人員正在訓練AI來模擬蛋白質與其他分子的相互作用、預測RNA折疊,甚至模擬細胞。鹽湖城的Recursion公司打造了一個AI“工廠”,在其中對數百萬個人類細胞進行各種化學和基因變化的成像,讓AI學習基因和分子通路之間的模式。紐約的AI生物技術公司Owkin則利用醫院患者的大量高解析度分子資料訓練模型。Owkin的老闆湯姆·克洛澤爾認為,通過做出人類無法做到的發現,這項工作正在朝著生物學領域的真正通用人工智慧邁進。隨著AI在製藥領域的深入發展,一個問題也隨之而來:傳統製藥公司會被新興的AI公司顛覆嗎?像OpenAI,它引領了被稱為大語言模型的Transformer的發展,還有從GoogleDeepMind分拆出來的藥物發現初創公司Isomorphic Labs,都在訓練能夠在生命科學領域進行推理和發現的系統,希望這些工具能成為出色的“生物學家”。目前來看,製藥公司擁有豐富的資料以及理解和使用這些資料的背景優勢,所以合作是當下的主流。例如,OpenAI正在與RNA疫苗先驅Moderna合作,加速個性化癌症疫苗的開發。但隨著新模型讓生物學變得更具可預測性,行業優勢的天平可能會發生傾斜。無論未來競爭格局如何變化,有一點是肯定的:AI已經給製藥行業帶來了巨大的改變。如果它能在後期臨床試驗中也取得像前期那樣的改進,那麼上市的藥物數量有望大幅增加。從長遠來看,AI為人類健康帶來的提升潛力是巨大的。也許在不久的將來,我們就能看到更多由AI助力研發的藥物,為無數患者帶來新的希望,就像一場全新的醫學革命正在緩緩拉開帷幕。 (跬步書)
矽谷炸鍋了! AI教母李飛飛萬字長文撕開行業“遮羞布”。
近期,一篇出自 “AI 教母” 李飛飛教授的萬字長文,在矽谷 AI 圈掀起軒然大波。作為曾掌舵史丹佛 AI 實驗室、憑 ImageNet 項目改寫深度學習視覺領域格局的華人頂尖專家,她此次的發聲格外重磅:“當下的 AI,不過是困在暗室裡的文字高手,能說會道卻脫離現實,本質上就是‘睜眼瞎說’。”一、李飛飛撕開AI“遮羞布”這番話看似犀利,卻精準點破了 AI 光鮮外表下的 “致命缺陷”。如今的大語言模型有多 “能打”?寫律詩、寫論文、聊量子物理,分分鐘模仿李白、杜甫的文風,邏輯縝密到讓人難辨真假。可一旦跳出文字的舒適區,面對真實的物理世界,AI 就立刻 “露餡”:讓它估算桌子到門的距離,全靠蒙;讓它預測杯子轉 90 度後的模樣,純屬猜;就連那些刷屏的 AI 生成視訊,仔細看全是破綻 —— 人物突然多根手指、物體莫名穿牆而過,說到底,都是 AI 不懂物理規律的必然結果。二、AI未來:不在大模型,在嬰兒本能李飛飛教授毫不避諱地指出:AI 行業已經走偏了方向。真正的突破口,從不是參數越來越龐大的語言模型,而是連嬰兒都有的 “空間智能”—— 這才是通往通用人工智慧(AGI)的唯一正道。那 “空間智能” 到底是什麼?其實就是人類理解、互動物理世界的本能。嬰兒靠抓、扔、咬,摸清物體的軟硬、輕重;你半夜摸黑起床倒水,不用開燈也能精準拿到杯子;朋友扔來鑰匙,你不用算拋物線就能穩穩接住。這些看似簡單的動作,背後藏著對空間、距離、物理規律的深層認知。更關鍵的是,人類文明的諸多重大突破,都離不開 “空間智能”:埃拉托斯特尼觀察影子長短,算出了地球周長;沃森和克里克搭 3D 模型,破解了 DNA 雙螺旋結構;建築師設計摩天大樓、科學家推演星體運動,本質上都是在運用對空間和物理規律的理解。而這些,是只會 “玩文字” 的大語言模型永遠做不到的。三、AI要“懂”世界:先建世界模型既然空間智能這麼重要,怎麼讓 AI 擁有它?李飛飛給出了核心方案:讓 AI 從 “語言模型” 轉向 “世界模型”。一個合格的世界模型,必須具備三大核心能力:首先,能生成符合物理定律的虛擬世界,不是天馬行空的虛構,而是遵循重力、摩擦力等基礎規律;其次,能整合文字、圖像、動作等多種資訊,不僅聽得懂你說的,還能看懂你做的;最後,也是最關鍵的,能精準預測互動結果 —— 比如知道推杯子會倒、扔球會落地,這才是 AI “看懂” 世界的關鍵。要做到這些,比訓練大語言模型難得多。語言是一維的、線性的,可世界是四維的 —— 三維空間加時間,還受無數物理定律約束。但一旦突破這個難關,AI 的能力將實現質的飛躍。四、空間智能AI:能幫人類做什麼?李飛飛團隊早已用實踐證明了空間智能的潛力:他們研發的 “抹布模型”,能讓電影製作人、遊戲設計師僅憑文字描述,就生成可互動的 3D 世界。不用學複雜的建模軟體,普通人也能當 “造物主”,搭建屬於自己的虛擬場景。這還只是開始。當 AI 真正擁有空間智能,生活將迎來巨變:機器人不再是笨拙的機器臂,能在模擬環境中學會上萬種技能,走進家庭做飯、照顧老人,走進醫院精準手術;教育領域,學生能 “穿越” 到古羅馬街道學歷史,“鑽進” 細胞裡看生物結構;科學探索中,AI 能模擬深海、外太空,幫人類探索無法抵達的領域。正如李飛飛所說:“AI 的終極目標從不是取代人類,而是為人類賦能。現在的大語言模型只是起點,真正的智能,是讓機器理解物理世界。”(AI行銷峰雲)
精讀筆記:李飛飛-從文字到世界:空間智能是AI的下一個前沿
李飛飛博士於 2025 年 11 月發表長文《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》。這是其深耕 AI 領域 25 年的重要思考結晶。全文以圖靈 “機器能思考嗎” 這一經典問題開篇,指出當前以大語言模型為代表的 AI 雖在抽象知識處理上成績斐然,卻存在脫離現實物理世界的短板。文章系統闡釋了空間智能的定義與核心價值,將其定位為支撐人類認知、創造力與文明進步的核心能力,同時提出建構具備生成性、多模態性和互動性的 “世界模型” 是解鎖空間智能的關鍵,還勾勒出空間智能從賦能創意到革新機器人技術,再到推動科學醫療突破的應用演進路徑,為 AI 下一個十年的發展指明了方向。In 1950, when computing was little more than automated arithmetic and simple logic, Alan Turing asked a question that still reverberates today: can machines think? It took remarkable imagination to see what he saw: that intelligence might someday be built rather than born. That insight later launched a relentless scientific quest called Artificial Intelligence (AI). Twenty-five years into my own career in AI, I still find myself inspired by Turing’s vision. But how close are we? The answer isn’t simple.1950年,當電腦還僅僅停留在自動化運算和簡單邏輯運算的層面時,艾倫・圖靈提出了一個至今仍能引發廣泛共鳴的問題:機器能思考嗎?他能洞察到常人未及的可能性,這需要非凡的想像力 —— 智能或許有朝一日能夠被創造出來,而非天生就存在。這一深刻見解隨後開啟了一場名為人工智慧的不懈科學探索。在我投身人工智慧領域的第二十五個年頭,圖靈的這一願景依舊在不斷給予我啟發。但我們如今距離那個目標究竟還有多遠?答案並非簡單就能說清。以 AI 領域的源頭性問題切入,奠定了全文的思辨基調。李飛飛通過回溯圖靈的經典疑問,既致敬了人工智慧的啟蒙思想,又巧妙地引出了核心矛盾 —— 經過數十年發展,AI 仍未完全實現 “機器思考” 的終極目標。她強調智能 “可被建構” 的核心觀點,既是對後續探討空間智能 “可被研發” 的理論鋪墊,也暗示當前 AI 發展尚未觸及智能的核心本質,為後文批判大語言模型的侷限性埋下伏筆。Today, leading AI technology such as large language models (LLMs) have begun to transform how we access and work with abstract knowledge. Yet they remain wordsmiths in the dark; eloquent but inexperienced, knowledgeable but ungrounded. Spatial intelligence will transform how we create and interact with real and virtual worlds—revolutionizing storytelling, creativity, robotics, scientific discovery, and beyond. This is AI’s next frontier.如今,以大語言模型為代表的前沿人工智慧技術,已經開始改變我們獲取和運用抽象知識的方式。然而,這些模型就如同在黑暗中雕琢文字的匠人:能言善辯卻缺乏實踐經驗,學識淵博卻沒有堅實的現實根基。而空間智能將徹底改變我們創造以及與現實和虛擬世界互動的模式 —— 它會給敘事創作、創意設計、機器人技術、科學發現等諸多領域帶來革命性變革。這,正是人工智慧的下一個前沿陣地。這裡點出,當前 AI 的核心短板並拋出全文核心論點。作者用 “黑暗中的文字匠” 這一形象比喻,深刻揭露了大語言模型的致命缺陷:僅擅長文字層面的資訊處理,卻脫離對物理世界的真實感知與互動能力。同時,她明確將空間智能定義為 AI 的下一個前沿,打破了當下 AI 研發集中於文字多模態擴展的侷限,為行業指出了從 “語言理解” 向 “世界感知” 跨越的全新方向。The pursuit of visual and spatial intelligence has been the North Star guiding me since I entered the field. It’s why I spent years building ImageNet, the first large-scale visual learning and benchmarking dataset and one of three key elements enabling the birth of modern AI, along with neural network algorithms and modern compute like graphics processing units (GPUs). It’s why my academic lab at Stanford has spent the last decade combining computer vision with robotic learning.自進入人工智慧領域以來,對視覺與空間智能的探索一直是指引我前行的北極星。這也是我耗費數年時間建構 ImageNet 資料集的原因 ——該資料集是首個大規模視覺學習與基準測試資料集,與神經網路演算法以及圖形處理器這類現代計算裝置一起,共同構成了催生現代人工智慧誕生的三大核心要素。同樣出於這個初衷,我在史丹佛大學的學術實驗室,在過去十年間始終致力於將電腦視覺與機器人學習相結合的研究。該段落通過結合自身學術經歷,增強了論點的可信度與說服力。李飛飛將自己建立 ImageNet 的行為、實驗室的研究方向與空間智能探索強繫結,既體現了她對這一領域研究的連貫性與執著,也從側面印證了空間智能的重要性 —— 畢竟 ImageNet 作為現代 AI 的三大基石之一,其核心價值正是為機器提供視覺感知的基礎,而這正是空間智能的重要組成部分。這一段落也為後文介紹 World Labs 的研發目標做了背景鋪墊,展現出其研究理念的一脈相承。Generative AI models such as LLMs have moved from research labs to everyday life, becoming tools of creativity, productivity, and communication for billions of people. They have demonstrated capabilities once thought impossible, producing coherent text, mountains of code, photorealistic images, and even short video clips with ease. It’s no longer a question of whether AI will change the world. By any reasonable definition, it already has.以大語言模型為代表的生成式人工智慧模型,已經從科研實驗室走進了人們的日常生活,成為數十億人用於激發創意、提升效率與日常溝通的工具。這些模型展現出了曾經被認為難以企及的能力,能夠輕鬆生成邏輯連貫的文字、海量的程式碼、高度逼真的圖像,甚至是短影片片段。如今,問題已不再是人工智慧是否會改變世界。以任何合理的標準來衡量,它都已經做到了這一點。李飛飛在此處先客觀肯定了生成式 AI 的巨大成就,避免了因強調空間智能而全盤否定現有技術的片面性。她列舉文字、程式碼、圖像等生成能力,既符合大眾對當前 AI 的認知,也為後文轉折做了鋪墊。這種先揚後抑的表述方式,能讓讀者更易接受後續關於 AI 短板的論述 —— 承認現有技術的價值,才能更好地理解為何需要向空間智能方向突破,而非停留在現有成果上。Yet so much still lies beyond our reach. The vision of autonomous robots remains intriguing but speculative, far from the fixtures of daily life that futurists have long promised. The dream of massively accelerated research in fields like disease curation, new material discovery, and particle physics remains largely unfulfilled.然而,仍有諸多目標至今我們仍難以實現。自主機器人的願景雖然充滿吸引力,但依舊停留在推測階段,與未來學家們長期以來描繪的、成為日常生活中常見設施的場景相去甚遠。而在疾病治療、新材料研發、粒子物理等領域借助人工智慧大幅加速研究處理程序的夢想,在很大程度上也尚未實現。該段落通過列舉具體場景,具象化了當前 AI 的能力邊界。李飛飛選取自主機器人、疾病治療、新材料發現等具有高關注度的領域,這些領域的共同特點是都需要 AI 具備對物理世界的感知、推理與互動能力 —— 而這正是大語言模型所欠缺的。通過指出這些大眾與行業期待已久的目標尚未達成,有力地論證了單純依靠現有技術遠遠不夠,進一步凸顯了研發空間智能的必要性與緊迫性。Spatial intelligence is the scaffolding of human cognition. It operates when we passively observe or actively create. It drives our reasoning and planning, even on the most abstract topics. And it shapes how we interact—whether through language or action—with others and our environment.空間智能是人類認知體系的腳手架。無論我們是在被動觀察世界,還是主動創造事物,空間智能都在發揮作用。它推動著我們的推理與規劃能力,即便面對那些極為抽象的事物亦是如此。同時,它還影響著我們與他人、與周邊環境互動的方式 —— 無論這種互動是通過語言交流還是實際行動來實現。此處是對空間智能核心價值的高度凝練。李飛飛用 “認知的腳手架” 這一比喻,精準概括了空間智能的基礎性作用 —— 如同腳手架支撐建築一樣,空間智能是人類所有認知活動的底層支撐。她打破了人們對空間智能僅侷限於 “空間感知” 的淺層認知,指出其對抽象推理、人際互動等多方面的深層影響,這一界定極大地提升了空間智能的理論高度,也為後文闡述建構空間智能 AI 的多元價值提供了理論依據。Unfortunately, today’s AI does not yet think this way. Despite significant advances in recent years—multimodal LLMs trained on vast troves of multimedia data have introduced basic spatial awareness, and state-of-the-art robots can manipulate objects in highly constrained settings—AI’s spatial capabilities remain far from human levels.遺憾的是,如今的人工智慧尚未具備這樣的思考模式。儘管近年來人工智慧取得了諸多重大進展 —— 經過海量多媒體資料訓練的多模態大語言模型已經具備了基礎的空間感知能力,最先進的機器人也能夠在高度受限的環境中操控物體 —— 但人工智慧的空間智能水平與人類相比,仍存在巨大差距。作者直面當前 AI 在空間智能領域的現狀,既不否認技術進步,也不迴避核心差距。李飛飛認可多模態模型和先進機器人在空間能力上的微小突破,體現了論述的客觀性;同時明確指出這些能力與人類水平相去甚遠,形成強烈對比。這種表述既避免了對現有技術的全盤否定,又為後文提出建構 “世界模型” 來突破這一差距的解決方案做了完美鋪墊,讓後續的技術路徑建議更具針對性。Building world models that unlock spatial intelligence requires something far more ambitious than LLMs: a new kind of generative model whose ability to understand, reason about, generate, and interact with semantically, physically, geometrically, and dynamically complex worlds—virtual or real—far exceeds that of today’s LLMs.要建構能夠解鎖空間智能的世界模型,需要開展一項遠比研發大語言模型更具挑戰性的工作:我們需要打造一種全新的生成式模型。這種模型在理解、推理、生成以及與語義層面、物理層面、幾何層面和動態層面均極為複雜的世界(無論是虛擬還是現實世界)進行互動的能力,都要遠超如今的大語言模型。這裡明確給出了突破空間智能瓶頸的核心方案 —— 建構世界模型,並凸顯了該方案的挑戰性。李飛飛強調這種新模型需跨越語義、物理、幾何、動態等多個維度,這一定位精準抓住了空間智能的核心需求:機器要像人類一樣綜合多維度資訊理解世界。同時,將其與成熟的大語言模型對比,既讓讀者清晰感知到研發難度,也暗示這一突破將帶來 AI 領域的下一次質的飛躍,為全文的技術構想劃定了核心方向。 (晚筀筆記)思維導圖參考:
王興興最新發聲!這將是具身智能的“ChatGPT時刻”
“未來1至2年,誰能實現這個目標,誰將擁有全球最領先的具身智能AI模型。”11月5日,宇樹科技股份有限公司創始人、董事長王興興在第八屆虹橋國際經濟論壇“人形機器人創新發展合作”分論壇上對具身智能的“ChatGPT時刻”何時到來作出前瞻判斷。在他看來,誰能在未來一兩年內實現“在80%的陌生場景中完成80%任務”的突破,誰就是全球最領先的具身智能。“比如到明年這個時候,隨便一台人形機器人到會場,你跟它交代任務,比如說‘幫我拿一杯水’或者說給某位記者朋友拿一份東西過去,它可以直接過去把這個任務完成。這個場景完全沒有預訓練過,你給的東西它也沒有看到過。”王興興舉例說。他認為,在完全陌生場景下,機器人能達到80%左右成功率,就已經掌握突破性技術了。“目前人形機器人(包括具身智能)最關鍵的還是機器人大模型(具身智能模型)的進展速度,我覺得稍微有點慢了。”王興興表示,相對去年來說,今年深度強化學習的全身運控的進步非常明顯,但在具身大模型,“端到端能幹活“的技術進步稍微慢了一點,但總體而言其對人形機器人的前景較樂觀。王興興稱,“具身機器人目前的發展階段類似於ChatGPT發佈前的1-3年左右,大家已經發現了方向,但還沒有做成可以突破臨界點的事情。為了早日實現“ChatGPT時刻”,更應該研究模型,還是收集更多的資料?王興興表示,目前在模型結構上大家做了很多嘗試,但泛化能力不夠,還需要創新。大家也需要收集更大規模的資料、質量更好的資料。但目前,對資料的採集、對資料質量的評判還非常困難。另外,他提出,模型和資料需要相輔相成,而不是一股腦採集大量資料,或者一股腦把模型做大。目前,具身智能主流模型有VLA(視訊語言動作)+RL(強化學習)模型和基於視訊生成的世界模型。王興興表示,前者可以用模擬環境做訓練,或者用真實場景做訓練,但泛化能力相對來說不是特別夠。因此,他更喜歡基於視訊生成的世界模型。然而,王興興也認為,該模型面臨比較大的挑戰。因為基於視訊生成的世界模型對算力的需求非常大,需要的算力卡比較多,所以中小型人形機器人公司往往“跑不動”,反而是一些大型AI公司、網際網路公司視訊模型的資源更加豐富,做出該模型的機率更大。 (金融時報)