#物理AI
兩個世界首富吵起來了!貝索斯融資 447 億復出搞 AI,馬斯克:跟屁蟲
本該是前世界首富傑夫·貝索斯的高光時刻,結果被一隻貓咪表情包攪了局。今天凌晨,當貝索斯要親自下場做 AI 公司的消息剛在網上發酵,馬斯克就火速轉發推文,並附帶一句話:哈哈,不可能。Copy cat(跟屁蟲)如果你關注科技圈,這劇情大概見怪不怪了。從衛星到火箭,這兩位科技圈的頂流已經互懟了整整二十年。只是,如今吵架的戰場,變成了眼下最火的物理 AI。62 億美元,貝索斯開啟史上最壕創業2021 年貝索斯把亞馬遜 CEO 的位置讓給了安迪·賈西,本以為他要專心當富豪享受人生。結果四年後,這位電商之王突然宣佈:我要重返一線,這次他瞄準的新項目,叫普羅米修斯計畫(Project Prometheus)。據紐約時報的報導,這個計畫一出場就拿了 62 億美元(折合人民幣 447 億元)的融資啟動資金,其中相當一部分是貝索斯自己掏的腰包。憑藉這筆巨款,普羅米修斯在矽谷展開了「人才大搶購」,已經挖來了近 100 名頂級研究員,這些人之前都在 OpenAI、Google DeepMind 和 Meta 工作。那讓貝索斯選擇二次創業的普羅米修斯到底要做什麼?簡單說,就是讓 AI 從虛擬世界走進現實世界。現在市面上的 AI 主要都是通過學習網上的文字、圖片來生成內容。它們很會寫文章、畫畫、聊天,但有個致命問題,它們不懂物理世界。舉個例子:你問 ChatGPT「怎麼設計一個更輕的飛機機翼」,它可能給你講一堆理論,但它自己從來沒摸過真實的機翼,不知道不同材料在風洞裡的表現。貝索斯要做的,就是讓 AI 真正動手做實驗。據悉,普羅米修斯預計探索一個類似超大型自動化實驗室的項目。在這個實驗室裡,機器人會 24 小時不間斷地進行物理、化學和工程測試。AI 會像科學家一樣,自己提出假設、設計實驗、觀察結果、得出結論,然後不斷迭代最佳化。目標領域非常明確:航空航天、汽車工程、電腦硬體製造。比如在航空領域,AI 可以自己跑成千上萬次風洞模擬,找出最優的機翼形狀;在汽車製造中,AI 可以規劃整條產線的機器人如何協作。此外,貝索斯選的搭檔也很有意思:維克·巴賈傑(Vik Bajaj)。他是個跨界科學家,有著物理和化學的學術背景,曾是神秘實驗室 Google X 的核心成員,參與過無人機送貨項目 Wing 和自動駕駛項目 Waymo 的早期開發。後來還創立了 Alphabet 旗下的生命科學公司 Verily。選這樣一個人當聯合 CEO,至少在技術層面也有一個把握航向的舵手。馬斯克為什麼說貝索斯「抄襲」?馬斯克這次發「Copycat」不是沒有原因的。最近幾年,馬斯克一直在強調:特斯拉已經變成了一家 AI 和機器人公司。現在貝索斯也要搞物理 AI,也投資了一堆機器人公司,在他看來,貝索斯進軍物理 AI 和機器人領域,更像是在抄特斯拉的作業。而兩者的恩怨,也由來已久。2019 年,亞馬遜宣佈要做 Project Kuiper 衛星項目,馬斯克當場開罵「Copycat」,因為 SpaceX 的 Starlink 早在 2015 年就開始規劃了。同年貝索斯發佈「藍月」月球著陸器,馬斯克又惡搞 P 圖把「Blue Moon」改成「Blue Balls」。2020 年,亞馬遜花 12 億美元收購自動駕駛公司 Zoox,馬斯克又發推:「@JeffBezos 是個跟屁蟲」。往前追溯,兩人的梁子結得更早。2004 年兩人首次見面時,就不歡而散。2013 年為了 NASA 的 39A 發射台打得不可開交。2014 年打專利官司,2021 年又因為登月合同鬧上法庭。不過話說回來,雖然兩人互懟了二十年,但在技術成就面前,馬斯克還是展現了一定的風度。當地時間 11 月 13 日,貝索斯旗下藍色起源的新格倫號重型火箭成功發射,並完美回收了第一級助推器。後續馬斯克在 X 上送上了祝福。而無論是貝索斯的普羅米修斯, 還是馬斯克的特斯拉和 Optimus, 他們都在做同一件事:讓 AI 真正理解物理世界, 能夠走出螢幕。所以,拋開「抄襲」的口水戰,更值得關注的是:當兩個頂級玩家同時押注物理 AI 時,這個賽道的爆發可能比我們想像的更快。 (APPSO)
貝索斯親自下場物理AI!
最新消息顯示,近年來以狂練肌肉和“夕陽紅”戀情引發關注的前世界首富傑夫·貝索斯,正在親身入局AI創業浪潮。據多位知情人士透露,貝索斯正參與創立一家名為“普魯米修斯項目”(Project Prometheus)的AI初創公司,並將擔任聯席CEO。得益於老闆是當今全球第三富豪,該創業公司種子輪就獲得62億美元(約合人民幣440億元)融資,堪稱資金最充沛的初創公司之一。這也是貝索斯2021年7月卸任亞馬遜CEO後首次擔任營運職務。儘管他也深度參與火箭發射公司藍色起源的營運,但官方頭銜只是創始人。據悉,普魯米修斯項目將與貝索斯“把人類送往外太空”的興趣相契合。創業公司將聚焦電腦、航空航天、汽車等領域助力工程與製造的人工智慧。貝索斯的聯席CEO是物理學家和化學家維克·巴賈傑(Vik Bajaj)。他曾在GoogleX部門與Google聯合創始人謝爾蓋·布林緊密合作,該部門主要孵化一系列雄心勃勃的初創業務,包括後來成為Waymo的自動駕駛汽車。巴賈傑的職場社交帳號也顯示,離開Google後他參與過多次創業,並從本月開始成為普魯米修斯項目的聯創和聯席CEO。普魯米修斯項目也延續了今年AI創業的熱門方向——將AI應用於物理任務。許多曾效力GoogleDeepMind、OpenAI和Meta等大公司的研究專家紛紛“自立門戶”,探索機器人、藥物設計,以及數學和理論物理領域取得重大突破。貝索斯也在去年投資過一家名為Physical Intelligence的初創公司,主攻將人工智慧應用於機器人領域。多位知情人士表示,普羅米修斯項目已僱傭近百名研究人員,其中不少是從OpenAI等大機構挖來的。與聊天機器人相比,這些公司的主營業務有著相近但顯著的區別:大語言模型通過分析海量的文字來獲取技能,包括模仿人類的語言系統、編寫電腦程序等。這些新公司正在幫助AI從物理世界中學習技能。今年夏天,一群從Meta等大機構離職的研究人員創辦名為Periodic Labs的公司,致力於建構能加速物理與化學等領域研究的人工智慧技術。這家獲得3億美元融資的公司計畫在北加州建立一處大型實驗設施,安排機器人進行“大規模科學試驗”。理論上,通過分析試驗過程中的對錯,AI將能學習如何“獨立完成試驗”。據知情人士透露,普羅米修斯項目也將展開類似的工作。 (財聯社AI daily)
從第二代VLA到全新一代人形機器人,小鵬的AI井噴時代
今天下午,何小鵬在小鵬汽車新總部,開了一場汽車味不濃的發佈會。這場發佈會其實四個字就能總結:物理 AI。發佈會上一切激動人心的成果,都基於物理 AI 展開:第二代 VLA 端到端輔助駕駛、小路 NGP、無需導航漫遊的 Super LCC、第二代人形機器人 IRON、前裝量產 Robotaxi...等等。三天前,何小鵬就在微博預熱:「當技術的要素積累到某個臨界點,過去那些孤立的技術難題,突然之間,貫通了。」屬於小鵬汽車的臨界點,正是將物理世界與矽基晶片,以大模型為媒介徹底貫通,然後一瞬天地寬。小鵬是國內極早開啟鑽研 AI 的汽車公司,早在車端算力僅有 30TOPS 的時代,何小鵬已經篤定,輔助駕駛會是人類進入 AI 終局的核心路徑。如今智能汽車的終端算力早已突破四位數,小鵬更坐擁目前量產車型第一梯隊的自研終端算力。於是從下午的發佈會開始,小鵬汽車正式將過去超過十年的技術積累和研發,投影到人類世界中不同場景。而在物理世界大模型的幫助下,今天發佈會的高光堪稱「井噴」——這也符合發佈會的主題:湧現。在汽車業務屢創交付新高的當下,小鵬汽車能否憑藉這樣的湧現和井噴,乘勢向下一個科技時代轉型?回顧完下午的發佈會,我們就能讀懂何小鵬的 AI 宇宙。物理 AI 打開新世界回到小鵬「湧現」的原點:什麼是「物理 AI」?這是一個沒有嚴格學術定義的概念,但幾個約定俗成的必要條件主要包括:多模態輸入處理(包括但不限於圖像、視訊、雷達、溫度、氣壓、IMU);時間建模與預測能力(通過學習歷史狀態預測未來狀態,比如車輛運動軌跡);自我監督學習(模型本身通過預測、對比、重建來訓練,無需大量人工標註);具身智能支援(適配包括機器人、自動駕駛等所有具身繫統)。或者可以這樣說:物理世界 AI 大模型的終局,就是不需要定語的「真·具身智能」,AI 思維與現實世界交融,0 和 1 構成的大腦,將會擁有人類同等的真實世界互動能力。也正因如此,如今業界已經普遍認同,掌握基於物理 AI 的基座大模型,就擁有了在下一個科技時代競逐的鑰匙。今天是何小鵬展示鑰匙的時刻,推開大門,高光湧現,技術井噴。在他看來,物理 AI 意味著數字世界和物理世界開始融合,新的趨勢下,將會誕生「擁有理解、互動和改變世界能力的機器」。聚焦到今天下午的小鵬全球新總部,何小鵬拿出了四款全新產品,它們都將小鵬的「物理世界模型」照進現實,也都代表著未來不止十年內,人類出行生態的大變局。第二代 VLA,全球更好開其中普通讀者,特別是螢幕前小鵬車主、准車主們感知最強的躍遷,也正是何小鵬第一個發佈,且即將量產的物理 AI 產品。基於物理世界大模型,小鵬汽車第二代 VLA 大模型今天正式發佈。和第一代相比的核心進化,在於「V-L-A」中的「L,language,語言」被徹底打通,或者說極大程度上被「拆掉」了。VLA 路線本身,依然脫胎自人類對「模型可解釋性」的需求,也就有了從 Vision 視覺到 Language 語言,再從語言到動作的兩層轉譯。但兩次轉譯,意味著車子從看到世界的那一刻,再到作出反應的那一下之間存在延時,兩層轉譯更帶來了資訊的耗損。何小鵬問了一個業界求索已久的問題:「能不能把 Language 語言拆掉」?然後他馬上給出了小鵬的答案:即將在 12 月底先鋒推送的小鵬汽車「創新 VLA」。「拆掉語言」,意味著不需要對場景做「描述」(包括人工標註和自動標註),而是讓模型直接理解真實世界,就像我們開車是「看路」,而不是旁邊坐著個人給你「讀路」。但這也同時意味著,小鵬需要從「大語言模型」向「物理世界模型」邁出艱難而關鍵的一步。何小鵬透露,直到今年二季度,自動駕駛團隊才迎來了第二代創新 VLA「巨大的跳躍」,隨即小鵬團隊才決定加大下一代 VLA 開發,並且停止第一代 VLA 開發。但就是半步的時間差,讓他認為小鵬的第二代 VLA,已經提前開始了「物理世界模型」的新範式。他也坦承今年小鵬的輔助駕駛更新其實偏向穩妥,因為從接下來的創新 VLA 開始,「一個全新的大門在打開,它很有可能成為以後自動駕駛行業更通用的方案」。何小鵬的自信,來源於創新 VLA 從原理上開始的高效率。節約中間轉譯過程後,輔助駕駛系統的時延更低、反應速度更高,模型影格率(類似於每秒響應的次數)更高,隨即而來的是安全上限也被拉高了。而從物理世界模型開始,何小鵬開始摸索新的 AI 方法論:「AI 燃料」。他表示,如果將物理世界模型比作 AI 時代的「引擎」,那麼資料就是這台數字引擎的「燃料」。和電力作為 AI 晶片的燃料一起,兩套動力共同驅動著小鵬的 AI 新階段。譬如,在創新 VLA 上,小鵬「燃燒」了接近 1 億的視訊 clips(片段),這也是目前車企官宣配合量產模型的第一個 9 位數輔助駕駛訓練片段,相當於 6.5 萬年的實際駕駛極限場景總和。而在車端運行創新 VLA 的實體「引擎」,則是三顆小鵬自研圖靈晶片,合計峰值算力達到了 2250TOPS。第二代 VLA 從車端推理到雲端訓練,都有著類似的「數字火力壓制」理念。3 萬張卡規模的阿里云云端算力叢集+720 億參數基座大模型,確保了小鵬可以以五天全鏈路迭代一次的速度,迎戰愈發激烈的輔助駕駛競賽。脫胎自基座大模型,第二代 VLA 在何小鵬看來,是屬於智能汽車的物理 AI「小腦」,擁有更強運動能力的作業系統。而越過真實世界資訊轉譯的奇點之後,小鵬的 VLA 模型迎來了能力湧現。譬如,第二代 VLA 將帶著「小路 NGP」全新模式上線,不僅從更細維度貫通高速-城市-小路/園區,更全面適應歐洲市場的路況。此外,滿足全球法律法規,真正「全球都能開」的「無導航自動輔助駕駛」Super LCC+人機共駕、讀秒時自動蠕動的「理解紅綠燈」、識別手勢「招手即停」等等...都是第二代 VLA 瞬間為小鵬打開的無窮想像力。這種湧現極其擬人,因為我們不會為一名駕校出來的人類司機安上「高速 NOA」、「城市 NOA」一個個單獨的技能包,人類司機天生就會觀察並總結經驗。「當你把模型、算力、資料,做到一個完全不一樣的情況之後,你就開始了湧現,因為解決一個問題之後,你發現同時解決了很多你(以前)完全沒有辦法解決的問題。」另一個好消息是,讓何小鵬一瞬天地寬的第二代 VLA,同樣會惠及全行業。小鵬不僅將第二代 VLA 正式開源,更將與大眾進一步合作,推動第二代小鵬 VLA 和圖靈晶片,在大眾品牌車型上落地。小鵬 Robotaxi,2026 見下一款即將落地的小鵬物理 AI 產品,是小鵬 Robotaxi。點亮物理 AI 技能樹之後,何小鵬上來就搞了個大新聞:2026 年,小鵬將發佈 3 款 Robotaxi 產品。這三款產品的具體命名和定位未知,不過可以確定的是,它們都將基於第二代 VLA 大模型,以及圖靈晶片提供 L4 級服務。其中小鵬 Robotaxi 標配了四顆圖靈晶片,合計高達 3000TOPS 的車端算力,其中一顆圖靈作為安全備份——事實上從算力、轉向、感知,再到能源、剎車、通訊,小鵬做了全安全的冗餘。基於二代 VLA+VLM 能力,小鵬的 Robotaxi 還具有更強的車外互動能力,不僅自己理解路人,路人也能理解 Robotaxi 本身。更有意思的點在於,三台 Robotaxi,既有面向商業營運的 B 端車,同時也有讓個人使用者「獨享 L4 級體驗」的 C 端車。而 Robotaxi 本身,也將成為小鵬汽車智能駕駛產品版型的最高級存在——單圖靈/雙 Orin 的 Max、三圖靈的 Ultra,以及四圖靈+全冗餘的「Robo」。何小鵬這樣解釋小鵬的 Robotaxi 商業模型:「我認為相當長時間內,很多人不會選擇純共享 L4 模式,還是會選擇自己買一台有 L4 軟硬體體驗的車,但是可以在我的家庭內共享,我們叫私享模式。」這樣從 L2 主機廠向 L4 Robotaxi 營運者進軍的路線,何小鵬認為從成本和泛化性來看都有優勢。譬如營運範圍更大、前裝成本更低等等。「我認為 Robotaxi 要想真正做到大規模商業化,並且從中國走向全球,必須要由整車廠親自投入」,何小鵬表示作為軟硬體一體開發製造的整車廠,小鵬天生適合 Robotaxi。伴隨著 Robotaxi 體系全面上線,小鵬汽車的無人駕駛出行試營運服務,也將從 2026 年開始推出,從廣州逐漸覆蓋到全國,甚至全球。AI 宇宙,機器人閉環無人出行,類人服務,這八個字可以簡單總結 AI 對人類生活的重塑。後面四個字,對應的是機器人。今天的第七屆科技日,正好也是小鵬機器人路線更新至第七世代。何小鵬也帶來了迄今為止,小鵬團隊最擬人的機器人作品:全新 IRON。新一代 IRON 標誌著小鵬徹底堅定了人形機器人的路徑,AI 時代的資料思維從中起到了明顯作用,何小鵬解釋稱「如果不擬人,你沒有辦法從人身上獲取有價值的資料訓練」。創業,往往就是這樣的選擇遊戲。小鵬並非唯一一家進入機器人行業的車企,但在何小鵬看來,沒有軟硬體、大模型、資料驅動等等能力的車企最終會發現,和傳統汽車行業軟體依賴供應商不同,「機器人軟體供應商就是機器人廠商本身」。而選擇擬人路線,才會倒推小鵬收集真正人類生活空間的資料,並且進一步發揮自己資料閉環能力的優勢。回到新 IRON 身上,它凝聚了小鵬一系列「擬人」成果,甚至具備了「骨骼-肌肉-皮膚」的人類基本「構型」。譬如號稱「行業尺寸最小」的骨骼尺寸、實現肌肉效果的晶格材料包覆、支援觸覺感測的無縫工藝材料、超大面積的 3D 曲面頭部螢幕,等等。最終走上舞台的新一代 IRON,收穫了可能是今天下午最不可思議的掌聲——因為除了形象擬人,IRON 的體態、步姿,相比前代有了極其顯著的進步。人類本身,就是自然科學的極限所在。何小鵬和團隊深知這一點,所以全新 IRON 身上傾注了大量資源,貼近人類的分毫細節。譬如 仿人脊椎、1:1仿人手結構,再到極其接近人類手臂靈活性、尺寸的 22 自由度機械手(人類 27 個)、可以聳肩、夾胸,借鑑汽車底盤的「反向仿生」全新肩背結構...等等。而回到「具身智能」這一品類本身,IRON 同樣參數可觀。三顆圖靈晶片 2250TOPS 算力驅動下,小鵬首次在機器人上推出了「VLT 大模型」的概念。T 代表 Task 任務,以及 Thinking 思考,對應著機器人的深度思考,甚至是自主決策能力。當然也不用過分擔心「智械危機」,程式設計師出身的何小鵬,今天還擴展了傳承八十多年的「機器人三大法則」。他加入的第四條,叫做「機器人不得洩露人類隱私資料,除非該命令與第一法則衝突。」除了軟體安全,IRON 的硬體安全同樣是重點。IRON 是首個發佈的、使用全固態電池驅動的機器人,何小鵬表示「人形機器人最有可能是推動全固態電池量產的產品」,原因很簡單——人形機器人是私密空間產品,一旦發生安全問題,遠比汽車危險。聊到量產,IRON 目前已經進入最緊張的量產準備階段,何小鵬給的時間表是「明年一季度末,軟硬體量產就將進入合圍階段」。他進一步預測,最快後年開始,以 IRON 為代表的人形機器人,就將帶來社會工作崗位的變化,譬如機器人訓練、指導等等。不過何小鵬認為, IRON 這樣的人形機器人,反而不適合輿論普遍期待的「打螺絲」,而是會優先進入導購、導覽、導巡方向。而如果明年年底,IRON 可以如期實現大規模量產,他表示這將讓小鵬徹底迎來「巨大的升維」。湧現與實現今天的何小鵬在台上越說越興奮,技術躍遷讓這位在新造車賽道上奔跑十年的創業者欣喜若狂。以至於,100 分鐘的發佈會本身資訊密度很高,還有太多亮點沒有說完。譬如匯天也帶來了全新的、搭載物理 AI 和第二代 VLA 技術的 6 人乘坐全傾轉固定翼飛行汽車「A868」,已經進入試飛階段;陸地航母也官宣將在 2026 年規模化量產交付,等等。當然,這樣高密度、廣維度,但依然需要時間等待量產的前瞻性發佈會,一定會遭遇這樣的問題:「為什麼現在就要發」?其實這個問題縈繞何小鵬,也伴隨著過去十年的新造車。2019 年,何小鵬說「智能汽車的核心在營運,營運的核心則在於軟體」;如今沒有任何一家車企可以在發佈會上忽視「軟硬一體」。2023 年科技日,何小鵬說車企以後每年要投入數億甚至數十億成本,培養更大的算力;如今每一家車企都被問「你們有多少卡」?21 世紀的第三個十年註定屬於 AI 和無人出行,何小鵬相信趨勢,而實現趨勢需要找到爆發點。今天小鵬科技日的主題是湧現,背後的趨勢是物理 AI,爆發點,則在於小鵬拿出來的一系列 AI 產品。這樣的湧現,能否讓小鵬實現下一回合的領先?我們會在接下來的量產中找到答案。 (電動星球)
【GTC】量子計算、機器人……黃仁勳勾勒AI宏偉藍圖
台北時間周三凌晨,全球市值最高上市公司輝達在美國首都舉辦GTC大會,公司CEO黃仁勳登台暢談AI產業的前沿展望。與以往有明確重點的發佈會不同,黃仁勳今天的演講涉獵甚廣,全球資本市場熱炒的6G、量子計算、物理AI和機器人、核聚變、自動駕駛全都有份。面對輝達直到2028年的技術路線圖和下一代Vera Rubin架構產品實機亮相,疊加黃仁勳炫耀“到2026財年的Blackwell、Rubin晶片訂單已經積攢5000億美元”。“全球股王”輝達收漲4.98%報201.03美元,公司總市值接近4.9兆美元。輝達的暴漲還帶動了部分晶片股走高,英特爾漲5.03%,博通漲3.02%。諾基亞漲22.84%,輝達官宣將向諾基亞投資10億美元,加速AI-RAN創新並引領從5G到6G的轉型。作為今天官宣的第一個合作協議,黃仁勳宣佈與諾基亞達成合作協議,除了10億美元股權投資外,兩家公司還將合作推出面向6G的電信計算平台NVIDIA ARC(Aerial RAN Computer),捕捉AI-RAN市場的機遇。NVIDIA Arc是運行在CUDA-X之上的無線通訊系統。輝達介紹稱,目前“AI流量”正處於爆發性增長的狀態,例如ChatGPT每周8億活躍使用者中,幾乎有50%的人通過移動裝置訪問該AI。借助AI-RAN系統,移動營運商可以提升性能和效率,增強AI應用的網路體驗,並用同樣的設施提供6G服務,為無人機、汽車、機器人以及AI眼鏡提供網路連線。在會後的新聞稿中,輝達也宣佈與T-Mobile、思科等合作夥伴打造美國首個面向6G的AI原生無線堆疊,並推出推進下一代無線技術的新應用。輝達同時展示了基於CUDA‑Q核心建構的NVQLink,用於連接傳統GPU和量子電腦,共同加速量子計算。目前的量子計算對環境噪聲高度敏感,且可用性有限。因此需要基於GPU的超級電腦承擔起量子處理器的部分負載,支援量子糾錯所需的控制演算法。黃仁勳隨後宣佈與美國能源部達成協議,將再建設7台超級電腦。這些超算將使用Blackwell和下一代Vera Rubin架構晶片,分別配置在阿貢國家實驗室和洛斯阿拉莫斯國家實驗室。其中名為Solstice的系統將配備10萬塊Blackwell GPU,將成為“美國能源部用於科學發現的最大AI超級電腦”。作為演講的保留節目,黃仁勳又展示了他的“晶片盾牌”——今天的盾牌由NVLink連接的72個GPU構成。黃仁勳特別強調,通過在更多GPU之間更好地分配推理任務,GB200 NVL72 AI超級電腦的性能提高了10倍,同時運行成本也降低了10倍——AI正變得對所有人更加可及。輝達也披露了新款BlueField-4資料處理晶片,可加速千億量級的AI基礎設施,支援800Gb/s吞吐量,並實現高性能推理處理。作為刺激股價表現的環節,黃仁勳在現場宣佈,截至2026財年末,公司帳上已經堆了超過5000億美元訂單。他也在現場展示了輝達截至2028年的GPU路線圖,和下一代Vera Rubin架構晶片的樣機。這款產品可能要到明年此時或更晚一些才能量產發貨。順便一提,現場也展示了輝達的液冷AI伺服器機架。黃仁勳比劃稱,1吉瓦資料中心需要8000個這樣的機架。單個機架重達2噸,由150萬個零部件構成。在備受投資者關注的“物理AI”方面,黃仁勳的演講主要放在Omniverse數字孿生技術上,包括利用該技術建構現代工廠,以及訓練和打造機器人。其中機器人初創公司Figure宣佈與輝達開展合作,加速下一代人形機器人研發。Figure正在使用輝達加速計算建構其Helix視覺-語言-動作模型,並採用Isaac平台進行模擬和訓練。輝達也推出了新一代工業級邊緣AI平台IGX Thor,旨在將即時物理人工智慧帶到邊緣端。與上一代產品IGX Orin相比,IGX Thor在整合GPU形態下能提供8倍AI算力,獨立GPU也能提供2.5倍算力,並提供翻倍的連接性,從而在邊緣側無縫運行大型語言模型和視覺語言模型。順便一提,核聚變反應堆也能用數字孿生來模擬。輝達透露,公司與General Atomics以及一系列國際合作夥伴打造了一個具有互動性能的高保真、AI驅動的數字孿生聚變反應堆。這個模型能夠以秒級速度預測電漿體行為。作為演講的壓軸環節,黃仁勳宣佈推出NVIDIA DRIVE AGX Hyperion 10,這是一套參考級量產計算平台與感測器架構。輝達宣稱,這套系統是面向“L4級自動駕駛”的通用平台,包括14個高畫質攝影機、9個雷達、1個雷射雷達和12個超聲感測器,以及兩台基於Blackwell架構的車載DRIVE AGX Thor平台。輝達也宣佈與Uber達成合作,使用該計算平台的車輛將可選接入Uber平台。 (財聯社)
算力狂飆7000倍,黃仁勳只用了10年
黃仁勳堪稱是當前手握全球AI算力命脈的男人。輝達最新推出的專為物理AI和人形機器人設計的計算平台Jetson Thor,包括開發者套件Jetson AGX Thor和量產模組Jetson T5000。黃仁勳盛讚新品,將它擺到了標竿級的位置:“Jetson Thor是推動物理 AI 和通用機器人時代發展的終極超級電腦。”自進入2025年以來,Jetson Thor就是人形機器人行業翹首以待的計算平台。回溯到2024年的輝達 GTC 開發者大會,黃仁勳正式敲響“進軍人形”的號角:在闊別線下舞台五年後,他擺出 All in 人形機器人的姿態,發佈通用基礎模型 Project GR00T,並讓九台搭載GR00T模型的頂流人形機器人同台亮相。與此同時,輝達還首次拋出了基於 NVIDIA Thor 系統級晶片(SoC)的人形機器人計算平台 Jetson Thor,由此正式殺入人形賽道。據輝達當時公佈的資訊,該平台同樣採用 NVIDIA Blackwell 架構,算力為800TFLOPS,憑藉整合的功能安全處理器、高性能 CPU 叢集和 100GB 乙太網路頻寬,能夠支援 GR00T 等多模態大模型的流暢運作。英國《金融時報》在2024年底曾透露,輝達計畫在2025年上半年重注機器人領域,推出Jetson Thor。然而,發佈時間一路推遲到今天。但從最終公佈的參數來看,姍姍來遲的 Jetson Thor,顯然沒有辜負行業的等待。性能跨越7.5倍,算力進入2000TFLOPS時代與五個月前GTC大會上首次亮相相比,最新發佈的Jetson Thor終於揭開了完整的性能面紗,算力、功耗和生態能力全面升級。作為黃仁勳口中的“機器人新大腦”,Jetson Thor直指人形機器人行業最核心的痛點:如何在有限功耗下,讓端側裝置能夠即時運行多模態大模型。Jetson Thor基於全新的NVIDIA Blackwell GPU架構,搭載14核Arm Neoverse CPU,升級至128GB LPDDR5X記憶體,視訊記憶體頻寬高達273GB/s。峰值AI算力實現跨代式飛躍,FP4精度下峰值算力可達 2070 TFLOPS,在性能大幅提升的同時,Thor仍將整體功耗控制在 40W至130W,在同等能耗下提供遠超前代的推理能力。Jetson Thor借助 4 個 25 GbE 網路、攝影機解除安裝引擎和 Holoscan 感測器橋接器,提取高速感測器資料以實現即時性能。根據輝達官網資料,Jetson AGX Thor開發者套件的定價為3499美元(約合人民幣25023元),量產模組 Jetson T5000 在採購 1000片及以上時單價為 2999美元(約合人民幣21447元)。作為對比,上一代 Jetson AGX Orin開發者套件的售價為 1999美元(約合人民幣14296元),AGX Orin 64GB模組在採購 1000片及以上時單價為1599美元(約合人民幣11435元)。與上一代Jetson Orin相比,Thor的跨代進化幾乎是“全維度”的:AI算力提升7.5倍、CPU性能提升3.1倍、記憶體容量翻倍、I/O吞吐能力提升10倍,並且在支援多路高速感測器並行互動的同時,將能效比提升至 3.5倍。這意味著,在過去需要兩到四顆Orin才能實現的機器人算力,如今一顆Thor就能完成。對人形機器人廠商來說,這一提升具有決定性意義。過去大多數機器人搭載1到2顆Orin,端側算力大約在 275至550TOPS。但多位技術負責人都曾表示,若想讓機器人原生搭載VLA大模型,端側算力至少需要逼近 3000TOPS 才能滿足即時性要求。Jetson Thor的出現,顯然讓端側算力焦慮被大幅緩解。Thor的算力冗餘還體現在它對大模型的原生支援能力上。它相容幾乎所有主流AI框架與推理模型,既能運行 Cosmos Reason、DeepSeek、Llama、Gemini、Qwen、Physical Intelligence等通用大模型,也支援 Isaac GR00T N1.5 等機器人專用模型。開發者可以在端側裝置上同時運行多個大模型,讓機器人直接完成視覺、語言與動作的一體化推理,大幅降低對雲端算力的依賴。輝達的CUDA生態系統也為Thor提供了長期最佳化的可能性。官方資料顯示,通過軟體升級,Xavier的性能提高50%,Orin提升100%。隨著後續軟體棧的持續最佳化,Jetson Thor在吞吐量和響應速度上還將進一步突破,為機器人帶來更長的生命周期紅利。在硬體進化的同時,Jetson Thor與輝達自研的全端軟體深度整合:資料中心的NVIDIA DGX 負責訓練大模型,Omniverse承擔3D模擬與驗證,Jetson Thor則在機器人進入物理世界後充當即時決策與推理的大腦。通過與 Isaac平台、GR00T基礎模型、Metropolis視覺AI和Holoscan感測器處理框架的協同,輝達正在建構一條從訓練到部署的閉環,顯著降低機器人開發、驗證與迭代的複雜度。這種“軟硬一體”的優勢,讓Jetson Thor在行業內幾乎無可替代。為Jetson Thor背書的客戶陣容幾乎囊括全球最有影響力的具身智能公司:從 波士頓動力、Agility Robotics、Apptronik、Figure、Skild AI,到國內的宇樹科技、智元機器人、銀河通用、眾擎機器人、優必選、傅利葉、靈初智能等,均已在研發中部署Thor。這也讓輝達在人形機器人產業鏈上的影響力被進一步放大。Skild AI在開箱Jetson Thor值得一提的是,1X、OpenAI與Physical Intelligence三家頭部企業仍保持觀望,尚處於評估階段。憑藉跨代的性能躍升與軟硬體生態的深度整合,Jetson Thor不僅徹底重塑了機器人算力平台的技術標準,也讓輝達在人形機器人產業鏈的控制力被推向新高。十年佈局:輝達在人形機器人的史前史Jetson Thor的發佈,是輝達在機器人計算平台上的一次重量級落子,而這一步棋,其實早在十年前就已埋下伏筆。2014年,輝達首次推出面向機器人領域的 Jetson 系列,同步發佈 Jetson TK1 晶片,正式拉開進軍機器人的序幕。此後十年,他們先後推出 TX1、TX2、Xavier、Orin,在硬體端逐步建構出完整產品矩陣。彼時,第一代TK1的算力僅為 0.3TFLOPS,而如今Jetson Thor的FP4精度下峰值算力已經達到 2070TFLOPS,十年間實現了 7000倍的性能飛躍。但在過去的十年,儘管技術體系逐漸完善,機器人市場卻遲遲未迎來爆發。輝達2026財年一季報資料,自動駕駛與機器人業務部門在收入同比暴增72%的情況下,季度營收仍僅為5.67億美元,佔總營收1.29%。換言之,這是一場輝達長達十年的戰略蓄勢。但從輝達在AI的成功中,他們深知,只有算力 + 工具鏈 + 開發者生態三位一體,才能在具身智能時代建立真正的護城河。正如他們在AI爆發前十餘年持續投入CUDA生態,輝達在機器人領域同樣提前播下種子:發佈通用機器人基礎模型 Project GR00T,打通具身智能大模型的底層能力;建構 NVIDIA Omniverse 模擬平台,為開發者提供高精度虛擬驗證與數字孿生環境;  推出專注視覺AI的 NVIDIA Metropolis 和針對感測器處理的 NVIDIA Holoscan,完善從資料到推理的工具鏈。借助這一系列基礎設施,輝達圍繞 Jetson 平台逐步形成了開放式開發者生態。官方資料顯示,Jetson及其機器人技術堆疊已吸引超過200萬名開發者,並與超過150家硬體、軟體和感測器夥伴建立合作,形成覆蓋演算法、資料、模擬和硬體的立體化網路。在軟硬體生態之外,輝達更直接地不吝真金白銀向具身智能創業者們砸去。近年來,他們頻頻出手,重倉投資新一代人形機器人企業:2024年2月,人形機器人頂流Figure AI宣佈完成新一輪6.75億美元的融資,輝達就出資5000萬美元;2024年9月,李飛飛創辦、專注於世界模型研發的World Labs宣佈成立並獲得2.3億美元融資,輝達參與其中;2025年6月,在機器人獨角獸企業Skild AI的B輪融資中,輝達投資了2500萬美元;2025年7月,具身智能創企Field AI宣佈完成兩輪共4.05億美元的融資,輝達正是領投方之一。可以說,Jetson Thor只是輝達十年佈局的冰山一角。通過工具鏈、開發者生態與資本協同,輝達已經把自己嵌入人形機器人價值鏈的每一環,在這場才剛開局的產業革命中,搶先站上了制高點。寫在最後過去十年,輝達在人形機器人上的每一步,都是在下一盤極為漫長的棋局:算力的躍遷、生態的編織、資本的下注。Jetson Thor的出世,也不過是棋盤上的又一次落子,但這一子,重到足以讓整個行業震盪。這不是輝達的第一次豪賭,或許也不是最漫長的一次,但極可能是回報最大的一次。因為他們賭的不只是晶片,而是未來具身智能格局的入口。然而,故事才剛剛開始。當輝達把底座搭好,兆級的具身智能市場正迅速升溫,越來越多的玩家從四面八方殺入戰場,算力、模型與生態的秩序正在被迫改寫。隨著中國企業的崛起,沒有人敢確定,這個棋局最終贏家會不會是輝達。 (高工人形機器人)
黃仁勳預言下一波AI浪潮:不是AGI,而是物理AI
我們驚嘆於ChatGPT 寫出的散文、Stable Diffusion 畫出的圖、語音助理的語速語調……但它們依然無法像人類一樣,擰開一瓶礦泉水,或者把地上的蘋果撿起來。這不就是一種「智慧錯置」嗎?我們正進入一個奇妙而矛盾的時代:AI的「腦」越來越像人,但「身體」還像一台機器。不過,這一切,正在改變。人工智慧的三波:從感知、生成到推理黃仁勳最近在一次訪談中講述了AI發展的四個階段。他沒有講“未來會怎樣”,而是告訴我們:“未來已經開始,只是我們還沒有完全意識到。”他將AI的歷史,分成三波已經發生、正在發生,甚至是即將到來的浪潮:第一波:感知AI ——讓機器看得見、聽得懂2012年,AlexNet在ImageNet大賽上橫空出世,它的背後,是NVIDIA GPU的運算力和深度學習架構的爆發。這是AI歷史上的「哥白尼時刻」──人們第一次看到:不靠人類手工提取特徵,也能辨識影像,比人類更準。這波浪潮讓「感知」成為現實——電腦視覺、語音辨識和自然語言理解突飛猛進。 AI不再是只能下棋的規則機器人,而是真正「能看、能聽、能懂」的助手。第二波:生成式AI -讓機器說得出、畫得出到了2020年代,感知不再稀奇。 AI開始「表達」:從GPT-3到ChatGPT,從DALL·E到Sora,AI不僅能理解,還能創造。我們進入了「文字到萬物」的時代——文字能生成圖片、音頻、視頻,甚至代碼。 AI第一次被賦予「表達的能力」。而這,也讓AI走出實驗室,走向大眾。第三波:推理AI-讓機器能思考、有邏輯現在,我們正在經歷的,是「推理AI」浪潮。你可能已經在用ChatGPT的「思考鏈(Chain of Thought)」功能,它會一步一步分解問題,推演邏輯。這不只是“說得漂亮”,更是**“會思考”**的表現。黃仁勳指出,這波AI最大的特徵,是:具備「常識」和「步驟性思考」。它甚至能自己查論文、分析文檔,然後得出結論。這使得「通用人工智慧」(AGI)的目標,第一次不再遙不可及。但真正的智能,還缺一條腿:行動力我們來想像一個場景:你對AI說:“請把桌子上的咖啡遞給我。”在今天,這句話對ChatGPT毫無意義——它不會移動,不知道「咖啡」在那,也不會明白「遞」是什麼意思。為什麼?因為今天的AI,還不懂「世界」。AI缺乏「物理常識」:不知道重力為何物、也無法理解「物體會移動但不會瞬移」。這些看似簡單的“常識”,其實是人類在嬰兒期就學會的知識。所以,第四波浪潮,正在醞釀。下一波浪潮:物理AI的覺醒黃仁勳預言,下一波AI浪潮將是“物理AI”——AI不只懂語言、不僅會推理,它還要“下得了地”,能與現實世界互動。這種AI將擁有:物理直覺:知道物體有慣性、有摩擦、有因果;運動能力:可操控機械手臂、移動機器人;感知與回饋迴路:能即時處理視覺、觸覺、空間等資訊。我們看到的Boston Dynamics機器人、Tesla的Optimus、Figure 01機器人,正一步步走向這個目標。AI的最終進化,是從“想得清”到“做得到”人類的智能,從來不是只有腦袋,還有身體。黃仁勳說:「所有這些能力的集合,將讓我們迎來下一波浪潮——機器人。」他口中的“物理AI”,正是將腦力與體力合而為一的智能新形態。那將是AI的「從人類大腦到人類行動」的躍遷。思考:如果AI真的有了身體,那些產業會先被改變?那些工作最難保留?面對未來的物理AI,我們該培養什麼樣的新能力? (或許是「人類獨有的情感與價值判斷」?)真正的智能,不只是“知道”,而是“做到”。 (AI森林物種圖鑑)
瑞聲科技掌握核心技術!淨利大漲145%,人形機器人“視覺中樞”,中國“隱形冠軍”!
2025年3月,全球資本市場掀起一股“物理AI熱”,而港股上市公司瑞聲科技憑藉股價單日飆升超10%、四日累計漲幅超16%的亮眼表現,成為這場技術革命的焦點。高盛在其報告中直言,物理AI(Physical AI)是“重塑製造業與物流業50兆美元價值鏈的核心技術”,而瑞聲科技憑藉其在光學感測器與車載鏡頭領域的技術壁壘,正在成為這一賽道的關鍵推動者。 物理AI的本質,是讓機器(如機器人、自動駕駛汽車)具備感知物理世界、理解三維空間關係並執行複雜操作的能力。這項技術的突破,不僅依賴演算法,更需硬體端的高精度感測器支援。瑞聲科技,這家以聲學業務起家的隱形冠軍,如何在實體AI浪潮中完成從「手機配件商」到「智慧機器視覺領導者」的蛻變? 一、全端式光學方案,定義物理AI的“視覺標準” 在現今高度競爭的智慧型手機與數位產品市場上,科技革新已成為推動產業前進的重要力量。近年來,隨著物理AI技術的快速發展,該領域正在迎來全新的轉機。瑞聲科技的核心競爭力在於其光學業務的全端式自研能力,涵蓋從設計、製造到系統整合的完整鏈條。目前自動駕駛、人形機器人等新興產業逐漸滲透。