#物理AI
特斯拉、輝達集體盯上的物理AI,中國玩家已亮出“王炸”
特斯拉的“世界模型”對手來了?這家中國公司用AI造了個無限試煉場。“物理AI的‘ChatGPT時刻’已經到來。”在2026年CES展上,輝達CEO黃仁勳斷言,那些能理解並規劃物理世界的AI模型將重塑千行百業,而“自動駕駛將是其首個大規模主流落地場景”。然而,在自動駕駛時代全面到來之前,那些1%的長尾場景成為了核心障礙。特斯拉CEO埃隆·馬斯克感同身受,就像他說的,“讓自動駕駛達到99%容易,解決剩下的‘長尾問題’卻非常困難。”但科技巨頭們已經達到了共識,必須建構一個無限逼近現實、甚至能主動創造未知的高保真的“數字宇宙”。這個虛擬世界不僅要能精準復現已知的各種極端路況,更要能主動合成未知的、甚至超出人類想像的複雜互動場景,讓自動駕駛系統得以持續進行“飽和式”的訓練與迭代。為此,特斯拉研發了世界模型,輝達通過高精模擬建構虛擬試驗場Cosmos,中國自動駕駛明星企業文遠知行則發佈了通用模擬模型WeRide GENESIS,它們都在教AI理解物理世界。不難看出,模擬模型正在成為推動自動駕駛跨越長尾鴻溝、駛向規模化落地的關鍵。01.模擬模型破局自動駕駛“最後一公里”自動駕駛汽車需要經歷多少測試才算足夠安全?業界的一份測算指出:至少110億英里(約177億公里)的測試里程,才能獲得高置信度的安全驗證。而傳統的實地路測因成本高昂、周期漫長、法規限制、極端危險場景難以復現以及安全風險高等問題,已成為自動駕駛商業化的主要障礙。在這一背景下,自動駕駛模擬憑藉其安全、可控、可無限重複的核心優勢,成為推動自動駕駛跨越商業化臨界點的關鍵“試金石”。國際調研機構Fortune Business Insights預示了模擬的廣闊前景:到2032年,全球模擬測試市場規模預計將達341.4億美元(約合人民幣2374億元),維持高速增長。全球科技巨頭已在此領域展開激烈角逐。Waymo推出了自動駕駛模擬軟體Simulation City,用以高效生成極端場景、訓練自動駕駛系統。特斯拉官宣了“世界模擬器”,旨在用AI直接模擬物理世界,擴充演算法應對邊緣場景的能力。然而,建構真正有效的“數字試金石”遠非易事,當前技術仍面臨幾大核心挑戰:1、保真度鴻溝:虛擬環境往往在關鍵細節上與真實世界存在差距。例如精確模擬暴雨對雷射雷達的干擾、夜間複雜的光影反射等場景,仍是技術難點。2、互動真實性不足:許多模擬系統中的交通參與者(車輛、行人)行為模型過於呆板,難以復現人類駕駛員的複雜決策,導致互動場景失真。3、閉環迭代難打通:打造能夠自動發現問題、精準診斷根因、持續最佳化演算法並即時驗證效果的自我進化體系,對許多企業來說仍是挑戰。這些侷限性共同導致了模擬在應對極端場景時的乏力,成為自動駕駛突破商業化落地的“最後一公里”阻礙。模擬模型必須進行一場從“場景復現”到“智能進化”的範式升級。換句話說,它不應是回放已知困難場景的“錄影機”,而需進化成為能夠主動發現系統未知弱點、生成高價值對抗性場景的“陪練”。02.WeRide GENESIS刷“副本”自己訓練自己面對“百億公里”的驗證鴻溝與長尾場景的現實挑戰,行業討論重心已從“是否需要模擬”轉向“需要多強的模擬”。有觀點認為,必須通過高保真、高效率的模擬技術,建構一個能無限逼近現實、甚至能主動創造未知的“數字宇宙”。文遠知行發佈的自研通用模擬模型WeRide GENESIS,正是朝這一方向進行的關鍵探索。▲文遠知行發佈WeRide GENESIS文遠知行的WeRide GENESIS模擬模型具備那些能力?WeRide GENESIS基於生成式AI技術,可在幾分鐘內生成高度真實的模擬城市環境,還原現實道路中罕見的極端長尾場景,高保真復刻任意現實路況。該模擬平台還允許自由編寫與組合任意場景,例如移除或增加特定的交通參與者,或模擬車輛變道博弈。在感測器層面,WeRide GENESIS可合成任意不同位置和視角的感測器資料,並適配從L2++到L4不同自動駕駛等級的任意感測器套件,確保了模擬與真實車輛配置的一致性。最終,這些能力可以擴展至模擬任意大範圍的數字街區,使自動駕駛系統在虛擬環境中完成充分訓練與測試,從而大幅提升演算法應對複雜場景的能力與迭代效率。這套能力是如何打造的?WeRide GENESIS將其核心能力拆解並內化為四個相互協同的AI模組,即AI場景、AI主體、AI指標、AI診斷。▲WeRide GENESIS的四大AI模組AI場景模組負責建構各類關鍵情境,通過生成式AI技術,它可以組合衍生出近乎無限的複雜情境,如臨車加塞、行人“鬼探頭”、火災地震、極端天氣以及其他稀有事件等,確保自動駕駛系統具備應對各種複雜邊界場景的能力。這相當於將測試從“在路上等待Bug出現”轉變為“在模擬中主動進行飽和式壓力測試”,系統性地觸探演算法的邊界。AI主體模組其實就是讓系統告別“呆板NPC”,擁抱複雜人性。傳統模擬中的交通參與者(車輛、行人等)行為往往簡單、平均,且可預測,這與現實世界中充滿不確定性和主觀意圖的複雜互動相去甚遠。GENESIS的AI主體模組則致力於為每一位交通參與者建構智能行為模型,使其能夠模擬從日常駕駛到高風險行為的全譜系反應。例如,它可以模擬在路口猶豫不決最終又突然加速搶行的駕駛員,或者在車縫中穿梭的外賣騎手。這種對客體不確定性互動的模擬,對自動駕駛系統提升在實際複雜交通流中的應變能力極為重要。▲自車駕駛表現對比如對比視訊所示,在左側“原始演算法+無AI主體”的組合下,自車表現猶豫,直至對向車輛完全通過後才開始通行,無法滿足效率要求;在中間“新演算法+無AI主體”的模擬中,自車僅按預設軌跡行駛,缺乏對周邊車輛行為的預測,最後發生碰撞,無法滿足安全要求;在最右側“新演算法+AI主體”的加持下,自車能夠即時判斷周邊車輛的行駛意圖,在確保安全的前提下流暢通過,實現了效率和安全雙重保障。當系統出現問題時,如何客觀評估其影響?AI指標模組建立了一套覆蓋安全、合規、舒適、效率的多維度量化評估體系。例如,一次急剎車帶來的乘客不適感,可以被轉化為舒適度評分;一次變道的流暢與否,可以通過軌跡平滑度、加速度變化等多個指標客觀衡量。▲舒適度曲線畫面中的舒適度曲線(Comfort Score)是“AI指標”模組的核心指標之一,動態量化了行駛過程中的乘客舒適度,為演算法評估和迭代提供了即時判斷依據。畫面均由WeRide GENESIS生成。這使得演算法迭代的效果變得一目瞭然,演算法最佳化有了精準的資料導航,而非依賴工程師的主觀經驗。當演算法在某個場景下表現不佳時,“AI診斷”模組會自動介入,像一位資深專家一樣進行問題溯源,更能進一步分析根本原因,並提供可執行的修復建議。隨後,修復後的演算法可被立即重新投入該場景進行驗證,形成“測試-診斷-修復-驗證”的快速閉環。值得注意的是,這四大AI模組並非孤立運作,而是構成了一個完整的自動駕駛研發閉環迭代體系。AI場景源源不斷製造高難度考題;AI主體在其中扮演狡黠的“考官”;AI指標進行毫秒級、全方位的“閱卷”;AI診斷則對錯題進行深度復盤並給出“解題思路”。原本需要耗時數年、耗費巨資的真實道路測試與演算法調優過程,可以在虛擬世界中以天為單位的高效迭代中完成。▲WeRide GENESIS為自動駕駛技術迭代提供“加速飛輪”03.加速全球商業化部署進度條對文遠知行而言,WeRide GENESIS已超越單一研發工具,成為實現規模商業化的戰略基石,它將從四個維度建構關鍵支撐:首先,破解泛化難題,為跨區域落地鋪平道路。面對全球不同城市路網、交通習慣、法規等差異,傳統一地一測的模式效率低下,WeRide GENESIS大幅提升了自動駕駛系統的泛化能力。通過虛擬模擬,WeRide GENESIS突破了真實路測在場景覆蓋、成本與效率上的侷限,為多城市、多場景的規模化商業落地提供了可靠支撐。其次,閉環迭代體系,提升研發效率與安全性。通過四大AI模組的協同,WeRide GENESIS實現了“生成場景-量化評估-診斷最佳化”的完整閉環。該系統能持續生成高價值場景、找到性能瓶頸並提供最佳化方向,將數百萬公里測試壓縮至數天的虛擬模擬,提升演算法迭代效率與行車安全性。此外,降低測試成本,加速技術落地。WeRide GENESIS在虛擬環境中進行自動駕駛測試,節省了車隊營運、人力等巨額邊際成本,為解決Robotaxi規模化盈利難題提供了技術前提。最終,建構可擴展的“數字宇宙”,支撐全球化部署。文遠知行CTO李岩將WeRide GENESIS視為可隨時生成、擴展的“數字宇宙”。它能為任何目標城市建構“數字副本”,讓自動駕駛系統可以進行超大規模的營運推演和演算法調優,為全球商業部署打下基礎。在這一能力底座的驅動下,文遠知行取得了一系列行業矚目的營運成果。其L4級Robotaxi服務已在北京、廣州、阿布扎比等全球超10座城市落地。截至2026年1月12日,文遠知行全球Robotaxi車隊規模達到1023輛,正式邁入“千輛時代”。▲文遠知行Robotaxi已進入全球超10座城市作為全球唯一在8個國家獲得自動駕駛牌照的公司,文遠知行已經在全球11個國家超40個城市開展自動駕駛研發、測試及營運,營運天數超2300天,持續驅動其商業版圖高效、快速地向全球新市場複製與落地。04.結語:全球自動駕駛商業化提速隨著WeRide GENESIS的不斷完善與應用,文遠知行自動駕駛技術正持續良性循環:更完備的模擬平台催生更強大的自動駕駛演算法,更強大的演算法加快了商業部署,而規模化營運產生的海量資料,又推動模擬平台迭代最佳化……在一個可以無限生成、無限測試的“數字宇宙”中,未來自動駕駛的成熟速度將遠超我們想像。文遠知行通過WeRide GENESIS,已經在全球自動駕駛競爭中佔據了有利位置,而全球自動駕駛商業化也正加速駛來。 (車東西)
黃仁勳預言落地,物理AI開年第一槍竟是中國公司打響
2026自動駕駛最熱黑科技——世界模型,開年第一個進展,來自中國明星企業文遠知行。當自動駕駛圈關於世界模型該放在車端還是雲端爭論不休時,文遠知行給出了一個大膽的答案——為什麼不直接做“上帝”呢?這正呼應了黃仁勳此前預言的物理AI“ChatGPT 時刻”已至——通過模擬建構可學習、可互動的虛擬世界,正成為自動駕駛進化的關鍵路徑。從特斯拉的世界模型到輝達借高精模擬打造的虛擬試驗場Cosmos,行業已清晰指向:誰能建構並掌控高度擬真的數字世界,誰就能加速駛向泛化與落地。文遠知行發佈的WeRide GENESIS是一個“通用模擬模型” ,它建構起物理AI(Physical AI)與生成AI(Generative AI)之間的融合橋樑:可以無限生成、回放和變化“長尾場景”的虛擬世界系統,可以在任何時間、任何地點、任何天氣,精準還原物理世界的法則、因果——如同駭客帝國中的Matrix世界。但WeRide GENESIS又超越行業常見的“自動駕駛版Sora”內涵,在建構世界之外,還給這個世界配齊了一整套自動化的反饋、調參、部署、驗證工具。簡單地說,“上帝”創造、修改虛擬世界的方式,也AI起來了。WeRide GENESIS,是什麼?文遠知行剛剛公佈的WeRide GENESIS,是一個自動駕駛模擬平台,但更加強調通用。這意味著和以前常見的自動駕駛卡車、Robotaxi、物流小車等專用模擬環境不同,WeRide GENESIS可以支撐各種自動駕駛產品研發。這本身就與文遠知行“搏二兔”——既有量產L2+,又有無人化L4——的戰略契合。對應不同產品,WeRide GENESIS既可以模擬量產一段式端到端的L2+車輛,也能模擬Robotaxi,當然還有各種無人小巴、清掃車等等。通用的另一個含義,是WeRide GENESIS本身對於環境的精準建構,幾乎能“一句話”無限生成、回放和變化“長尾場景”:△ WeRide GENESIS可模擬任意空間內的位移,自動生成新視角模擬,指數級擴大模擬世界範圍你可能會聯想到3D遊戲開發引擎,實現各種以假亂真的視覺效果:從“渲染場景”這個角度,它的確和遊戲引擎有相似之處,但除基本場景外,其他完全不同:WeRide GENESIS不關心材質、紋理細節,也不需要“光追”等級的計算資源,更加關心的首先是場景環境的物理法則:包括光照、重力、雨霧、碰撞力學等等。第二點,則是事物、事件之間的因果關係,生成的環境場景連續、低時延、可解釋,模擬測試中的任何bad case或good case,都能反映真實情況,而且能夠根據WeRide GENESIS的反饋資料迅速歸因。一句話概括:無限生成、回放和變化“長尾場景”,系統性地驗證演算法能力。WeRide GENESIS的核心包括四大AI模組,首先是AI場景,負責建構各類關鍵情境,模擬自動駕駛車輛可能遇到的多種場景,包括臨車侵入、無保護左轉、緊急避險、行人騎手闖入、火災地震、道路受阻、極端天氣以及其他稀有事件,全面覆蓋了數十億公里的自然駕駛資料。更重要的是,文遠知行超八年來從公開道路上採集的海量長尾和極端案例,也都成為WeRide GENESIS的“創作素材”。第二個模組是AI主體,針對駕駛員、行人、騎手等不同交通參與者建構了智能行為模型,能夠模擬從日常駕駛到高風險行為的全譜系反應,也就是讓模擬環境中發生的事永遠在真實範圍內,避免產生離譜的資料影響模型行為。如對比視訊所示,在左側“原始演算法+無AI主體”的組合下,自車表現猶豫,直至對向車輛完全通過後才開始通行,無法滿足效率要求;在中間“新演算法+無AI主體”的模擬中,自車僅按預設軌跡行駛,缺乏對周邊車輛行為的預測,最後發生碰撞,無法滿足安全要求;在最右側“新演算法+AI主體”的加持下,自車能夠即時判斷周邊車輛的行駛意圖,在確保安全的前提下流暢通過,實現了效率和安全雙重保障。高精度的智能實體建模其實是行業公認的技術難題,核心在於超越“平均化”的交通參與者行為模型,真實反映客觀世界中複雜且難以預測的互動行為,例如人類駕駛員突然魯莽加塞到自動駕駛車輛行駛的車道等場景:這兩個模組配合,可復刻任意路況、可編寫任意場景、可合成任意不同感測器位置視角、可適配任意感測器套件、可模擬任意大範圍街區……另外兩個模組分別是AI指標和AI診斷,前者建立了一套覆蓋安全、合規、舒適、效率等維度的量化評估體系,能夠將駕駛行為轉化為可對比、可分析的資料表現,從而自動判定演算法迭代的實際效果。後者則能夠自動捕捉不理想的駕駛行為、分析其根本原因,並提供可執行的改進方案。四大模組協同,WeRide GENESIS建構了完整的閉環迭代體系:自動生成高價值場景、自動量化性能瓶頸、自動定位弱點環節、自動給出最佳化方向。以經典科幻IP打個比方,文遠知行扮演了《駭客帝國》中“建築師”的角色,創造了一個供AI司機訓練、實戰的無限武器庫、訓練道場:AI司機在其中的體驗、經驗,和在現實世界沒有任何不同,一顆“藍藥丸”就能快速部署到實際任務中:不過,從基本能力來看,WeRide GENESIS算得上是熱門前沿的世界模型嗎?實際上,自動駕駛、智能汽車領域關於世界模型一直有爭論:有玩家認為世界模型就是單純後端的模擬器,用於資料生成模擬訓練。尤其是端到端、資料驅動成為共識後,訓練資料的分佈、質量直接影響模型能力,但關鍵少數的困難場景資料又很難在道路實測中碰到,所以世界模型的生成能力,被認為是解決corner case,降低接管率最重要的手段。但是,也有另一派玩家把車端的系統直接叫世界模型,任務是進行即時環境認知與決策,強調的車端“平行世界推演”能力,相當於“腦內小劇場”。其實,兩派並沒有根本矛盾,屬於工程落地與宣傳上側重點不同,因為AI行業對於世界模型是有階段性共識的:從海量資料中自主提煉物理與社會規律,形成對世界運作方式的抽象理解。從這個定義出發,WeRide GENESIS當然是世界模型。只不過文遠知行的WeRide GENESIS,意義又超越常見的“自動駕駛版Sora”。WeRide GENESIS給“Robotaxi第一股”上分家家都說世界模型,但大部分玩家都把重點放在“生成”能力,比如XX秒連續視訊、XX種目標模擬等等,不自覺對齊OpenAI宣傳Sora的套路。但對於自動駕駛而言,容易被忽略的重點其實是WeRide GENESIS後兩個模組——AI指標、AI診斷。因為這是“真·資料驅動”的最直接證據。也不瞞各位,自動駕駛圈很多資料閉環,其實是“偽閉環”。一種稍微好點的,是各個演算法團隊內部的“小閉環”,代表這支團隊完成了“模型化”,但還沒有建構起統一基座模型能力。這種模式最可能出現的場景是:使用者吐槽+工作群截圖,引發老闆的不滿……接到投訴反饋的研發,連夜加trigger試圖把bad case撈上來。這是問題驅動資料,而不是資料自動發現問題。真正的資料閉環應該是這樣的:首先系統能從海量運行的資料裡自動發現異常行為,然後將問題自動歸類、建成資料集,再針對性自動進行訓練/模擬,出瞭解決方案後,系統還能自動評估效果。資料能不能回來不是關鍵,而是bug、問題能自動走完從“被發現”到“被解決並被驗證”的路徑。比如現實中因急剎車引起的乘客不適,這一行為可在WeRide GENESIS模擬中被AI指標模組,量化為具體的舒適度評分,並即時反饋給演算法團隊,推動針對性最佳化與快速復驗。再比如,當自動駕駛車輛遇到複雜互動場景中識別感知延遲或預測偏差問題,WeRide GENESIS可通過“AI診斷”功能快速修復問題,並重新進行場景驗證,確保車輛行為始終符合預期標準。△ AI診斷模組的工作流程遵循了功能路測→問題檢測→問題歸類→根因分析→演算法改進→再測試與再驗證的閉環邏輯資料閉環的真正含義,應該是安全/體驗/效率等指標被持續量化、某項指標異常偏離後,系統自動報警,以及自動聚類對應封包,把相似問題聚成“問題簇”。研發中“人”的作用,是定義和監管、決策,而不是自己徒手標註、調參、評估、部署……“資料直接解決問題”,尤其是廣義端到端技術範式普及後,自動的資料處理、反饋能力成為持續迭代最關鍵的核心能力。這看似簡單,實際是自動駕駛行業最稀缺的能力,會直接影響泛化性、效率、成本。比如GENESIS實現的“生成場景-量化評估-診斷最佳化”完整閉環,可自動生成高價值場景、定位演算法弱點、提供最佳化方向,將數百萬公里測試壓縮至數天的虛擬模擬中。有“磨刀不誤砍柴工”的意思,高效資料閉環,直接影響的是自動駕駛玩家的產品泛化性、研發效率,以及整體營運成本。文遠知行能成功融合特斯拉路線和Waymo路線,成為全球唯一實現L4級無人駕駛和L2+級輔助駕駛規模商業應用——創始人、CEO韓旭所說的“搏二兔”——除了演算法能力之外,“資料閉環能力”也是關鍵因素。所以,綜合四個模組來看,WeRide GENESIS既是評價文遠知行研發能力現狀最好的指標,也是理解“Robotaxi第一股”的一個最直接切入點。文遠知行從容“搏二兔”眼下,文遠知行已經在全球10餘座城市部署了超過1000輛Robotaxi,其中,北京、廣州、阿布扎比已實現純無人商業營運。放眼整個L4賽道,蘿蔔快跑2025年11月公佈的所有Robotaxi的最新周訂單數是25萬單;小馬智行Q3財報顯示,其Robotaxi車隊數為961台,廣州單台車日均訂單量達到23單。北美“一哥”Waymo,“被”披露的資料是車隊2500輛、每分鐘就能完成45單。至於落地廣度,文遠知行則是整個L4賽道最早敏銳意識到海外需求和機遇的玩家,並且迅速付諸行動,率先在11個國家、40多座城市開展自動駕駛研發、測試及營運,也是行業唯一拿下8個不同國家自動駕駛牌照的科技企業。截至目前,文遠知行既是中國Robotaxi出海No.1,同時還是整個自動駕駛行業落地Robotaxi場景最豐富的玩家。另一邊,2023年文遠知行首次合作博世,幫助這家百年Tier 1追趕高階智能輔助駕駛方案:落地量產奇瑞旗下的星途星紀元車型。△ 奇瑞星途星紀元ES2025年年末,文遠知行又發佈了量產一段式端到端方案,同樣是幫助博世一夜間追趕上L2+最先進技術範式。從這個層面看,文遠知行首先是整個L4賽道唯一有穩定量產智能輔助駕駛項目的玩家;另一個角度,文遠知行也是整個自動駕駛行業內,唯一一家L4、L2技術堆疊覆蓋,且都有成熟落地案例的公司。從一段式量產節奏來看,文遠知行現在同樣也處於行業內的T0梯隊。也就是說,文遠知行現在明明白白在“搏二兔”,而且搏成了行業領先。L2+、L4落地場景、技術要求各不相同,海外迅速落地數十城,環境、路況、交通規則、基礎設施標準也各不相同。這樣的泛化性,除了演算法本身,背後離不開WeRide GENESIS建構的模擬測試、資料閉環體系——文遠知行“來時路”的一部分,現在終於清楚了。更進一步,WeRide GENESIS也可以解釋文遠知行為何能“搏二兔”,在量產智能輔助駕駛和Robotaxi這兩個看似尖銳對立的陣營遊刃有餘。L2陣營緊跟的端到端,本質不是一段式、兩段式、VLA,甚至不是絕對的模型化,而是資料驅動,是一種底層方法論。資料驅動下,可以純視覺,可以融合感知,可以一段式,可以多段式,可以世界模型,也可以VLA,甚至也可以有規則存在。所以對於L4陣營來說,探索世界模型根本談不上“轉軌”,甚至Waymo早就在做。文遠知行無意參與行業爭論口水仗,只是默默開啟探索規則+模型多元技術體系,自證自動駕駛L4的安全性、L2的泛化性可以共存,符合一貫的“行勝於言”。最後,從WeRide GENESIS,又能看出文遠知行未來的可能性。資料閉環能力之外,再次回到“生成”:WeRide GENESIS本身是物理AI(Physical AI)與生成AI(Generative AI)之間的融合橋樑,真正打通“現實物理世界”與“虛擬模擬世界”之間的能力通道。讓AI從海量資料中自主提煉物理與社會規律,形成對世界運作方式的抽象理解——而這是實現通用人工智慧(AGI)的關鍵路徑之一。黃仁勳預言物理AI的“ChatGPT 時刻”已至,從文遠知行的實踐來看,這個時刻很有可能最先出現在跑通通用自動駕駛的玩家身上。 (智能車參考)
【CES 2026】突發開源!NVIDIA 宣佈推出用於物理 AI 的全新開放模型、框架和 AI 基礎設施之深度洞察!
引言:CES 2026 引爆行業革命,機器人開發的“ChatGPT時刻”正式到來太平洋時間2026年1月5日,拉斯維加斯國際消費電子展(CES)現場,NVIDIA創始人兼首席執行長黃仁勳的一句“機器人開發的ChatGPT時刻已然到來”,為全球機器人產業定下了新的發展基調。當天,NVIDIA正式宣佈推出用於物理AI的全新開放模型、框架和AI基礎設施,同時展示了Boston Dynamics、Caterpillar、Franka Robotics等全球領先企業基於其技術打造的多款新型機器人與自主機器,涵蓋移動機械臂、人形機器人、工業作業裝置等多個品類。這一系列發佈並非孤立的技術更新,而是NVIDIA對機器人產業發展瓶頸的精準突破,更是對未來“專家級通用”機器人開發範式的全面重構。長期以來,機器人產業始終面臨三大核心痛點:一是缺乏理解物理世界的通用智能,傳統機器人依賴預設程序,難以應對動態環境變化;二是開發流程分散複雜,模擬與現實存在巨大鴻溝,技術迭代效率低下;三是軟硬體協同不足,AI算力與能效難以匹配機器人輕量化、高即時性的應用需求。NVIDIA此次推出的全端技術體系——從Cosmos與GR00T開放模型,到Isaac Lab-Arena模擬框架與OSMO計算框架,再到Blackwell架構驅動的Jetson T4000硬體模組,形成了覆蓋“模型-框架-硬體-生態”的完整解決方案,旨在打通機器人開發的全生命周期,加速新一代AI驅動機器人的規模化落地。本文將從技術核心解析、產業鏈重構影響、應用場景突破、產業趨勢展望四大維度,深度拆解NVIDIA物理AI技術體系的核心價值與行業變革意義。一、技術核心解析:物理AI如何重構機器人的“認知與行動”能力黃仁勳所言的“機器人開發的ChatGPT時刻”,核心在於物理AI技術的突破性進展。不同於傳統AI聚焦數字世界的資訊處理,物理AI的核心目標是讓機器理解物理世界的運行規律,具備感知、推理、規劃與行動的閉環能力,實現從“執行指令”到“理解並決策”的跨越。NVIDIA此次發佈的技術體系,正是圍繞這一核心目標建構的全端解決方案,其技術核心可拆解為“感知-推理-行動-訓練”四大核心模組。1.1 核心模型 Cosmos與GR00T建構物理AI的“認知大腦”要實現機器人對物理世界的理解,首先需要建構能夠建模物理規律、融合多模態資訊的基礎模型。NVIDIA此次推出的Cosmos系列與GR00T N1.6模型,分別解決了“物理世界認知”與“人形機器人全身控制”兩大核心問題,共同構成了物理AI的“認知大腦”。1.1.1 Cosmos系列模型:賦予機器人“物理直覺”傳統機器人的最大短板在於缺乏“物理直覺”——無法預判環境變化對自身動作的影響,也難以理解物體的物理屬性(如重力、摩擦力、材質特性等)。這導致機器人在執行簡單任務時,一旦遇到未預設的場景(如地面油污、物體重量變化),就容易出現失穩或任務失敗的情況。Cosmos系列模型的核心價值,正是通過生成式AI技術,讓機器人內化物理世界的基本規律,具備即時預測、跨場景遷移與多步推理的能力。Cosmos系列包含三大核心模型,形成了“感知-預測-推理”的認知閉環:NVIDIA Cosmos Transfer 2.5:作為轉換模型,其核心功能是打通模擬與現實的“域鴻溝”。傳統機器人訓練依賴大量真實場景資料,成本高昂且周期漫長,而模擬資料又因與現實環境差異過大,導致訓練出的模型難以直接遷移。Cosmos Transfer 2.5支援空間條件控制的風格遷移,可將Isaac Sim中的合成資料轉換為帶有真實世界噪聲、光照幹擾、鏡頭畸變的等效資料,同時保持物理參數不變;反之,也能將真實世界的稀疏資料增強為多樣化的模擬場景,大幅提升模型從模擬到現實的零樣本遷移成功率。相較於前代模型,其體積更小、運行更快,生成質量顯著提升,域間遷移的誤差累積大幅減少。NVIDIA Cosmos Predict 2.5:聚焦物理世界的即時預測,解決機器人的“快思考”問題。該模型融合Text 2 World、Image 2 World、Video 2 World等生成能力,可根據文字、圖像或視訊輸入,生成連貫的環境演化序列。與傳統電腦視覺模型逐幀處理像素不同,Cosmos Predict 2.5直接對物理狀態的演化軌跡進行推演,能夠在毫秒級內預測環境變化對機器人動作的影響。例如在“機械臂倒水”任務中,傳統方法需要複雜的流體動力學方程求解,難以滿足即時性要求;而Cosmos Predict 2.5通過學習海量物理視訊資料,可即時預測下一時刻的流體分佈與不確定性,為控製器提供“是否會濺出”的預判依據,支撐機器人的動態微調。NVIDIA Cosmos Reason 2:作為開放推理視覺語言模型(VLM),負責機器人的“慢思考”——跨時間尺度的理解、推理與決策。該模型引入了大語言模型中成熟的思維鏈(CoT)機制,並將其擴展到視覺-動作領域,能夠直接從圖像中理解語義與空間關係,完成多步任務分解與因果推理。在“清理廚房檯面”這類複雜任務中,傳統規劃器依賴預定義的PDDL(規劃域定義語言),難以應對場景變化;而Cosmos Reason 2可自主分解任務(如“先移開水杯→再擦拭油污→最後整理餐具”),並通過反事實推理預判不同動作的後果,主動規避高風險操作(如避免碰撞易碎物品)。這種將感知、推理與決策緊密耦合的能力,有效解決了傳統模組化架構中資訊層層傳遞的損耗問題。三者的協同邏輯清晰:Cosmos Predict 2.5提供即時物理狀態預測,支撐毫秒級的動態反饋;Cosmos Reason 2負責長周期的任務規劃與風險預判;Cosmos Transfer 2.5則打通模擬與現實的資料通道,為前兩者的訓練提供高品質資料支撐,形成“預測-推理-資料迭代”的認知閉環。1.1.2 GR00T N1.6:解鎖人形機器人的“全身控制”能力如果說Cosmos系列模型解決了機器人“認知世界”的問題,那麼Isaac GR00T N1.6則聚焦於“如何行動”,特別是為人形機器人提供開放式的推理視覺語言行動(VLA)模型,實現全身動作的精準控制與上下文理解。人形機器人的控制難度遠超傳統機械臂,其擁有數十個自由度,需要兼顧平衡、協調、精準操作等多重目標,傳統控制方法難以實現複雜動作的靈活適配。GROOT N1.6的核心突破在於兩大技術創新:一是採用MoE(混合專家)架構,實現“通專融合”的控制能力。該架構包含多個獨立的“專家”子網路,在處理不同任務時啟動對應的專家模組——例如理解自然語言指令時啟動“通用語言專家”,執行精密銲接時啟動“運動控制專家”,既保證了通用任務的適應性,又提升了專項任務的精準度。二是深度整合Cosmos Reason 2模型,強化上下文理解與推理能力。通過融合視覺語言推理與動作控制,GR00T N1.6可直接將人類自然語言指令轉換為全身協調的動作序列,例如將“把桌子上的檔案遞給我”拆解為“移動至桌前→識別檔案位置→調整姿態→抓取檔案→精準遞出”的連貫動作,無需人工編寫複雜的運動控製程序。目前,Franka Robotics、NEURA Robotics、Humanoid等企業已開始利用GR00T賦能的工作流,進行機器人新行為的模擬、訓練與驗證。Salesforce則通過整合Agentforce、Cosmos Reason與NVIDIA Blueprint,對機器人採集的視訊片段進行分析,將事件解決時間縮短了50%,充分驗證了該模型在提升任務效率方面的核心價值。1.2 支撐框架 Isaac Lab-Arena與OSMO打通開發全流程物理AI模型的落地,離不開高效的開發與訓練框架支撐。長期以來,機器人開發麵臨兩大流程痛點:一是模擬評估體系分散,基準測試依賴人工操作,難以實現規模化驗證;二是端到端工作流複雜,需要跨工作站、雲端等異構計算資源,協同難度大,開發周期漫長。NVIDIA此次發佈的Isaac Lab-Arena開源模擬框架與OSMO雲原生計算框架,正是針對這兩大痛點的精準解決方案,旨在實現“模擬-訓練-評估-部署”的全流程閉環。1.2.1 Isaac Lab-Arena:標準化模擬評估的“協作平台”模擬訓練是機器人開發的核心環節,其質量直接決定了機器人在真實環境中的性能。但當前行業缺乏統一的模擬評估標準,不同開發者採用不同的測試體系,導致技術成果難以對比,且模擬場景與真實環境的差異過大,大幅降低了訓練效率。Isaac Lab-Arena的核心目標是建構一個開放原始碼的協作系統,實現大規模機器人策略評估與基準測試的標準化。該框架的核心優勢體現在三個方面:一是模組化設計,其評估層與任務層通過與光輪智能的深度合作完成建構,支援靈活配置不同任務場景與評估指標;二是多基準相容,可直接對接Libero、Robocasa等業界領先的基準測試體系,實現測試流程的標準化,確保機器人技能在部署至物理硬體前具備穩健性與可靠性;三是開源協作,現已在GitHub上公開發佈,開發者可基於該框架共享測試場景、驗證演算法效果,加速技術迭代。1.2.2 OSMO:跨環境協同的“開髮指揮中心”機器人開發涉及合成資料生成、模型訓練、軟體在環測試等多個環節,需要跨越工作站、邊緣裝置、混合雲等多種計算環境,傳統開發模式下,各環節相互獨立,資源調度複雜,嚴重影響開發效率。OSMO作為雲原生編排框架,將機器人開發整合至單一易用的命令中心,實現了全流程的高效協同。OSMO的核心功能包括:一是跨環境工作流定義,開發者可通過統一介面,定義覆蓋多計算環境的工作流,實現合成資料生成、模型訓練、測試驗證的自動化執行;二是資源智能調度,根據不同環節的算力需求,自動分配工作站、雲端等資源,提升資源利用率;三是快速整合適配,現已開放使用,並被Hexagon Robotics等企業採用,同時整合至Microsoft Azure Robotics Accelerator工具鏈中,大幅降低了開發者的接入門檻。1.3 硬體基石 Blackwell架構驅動的邊緣AI算力革命物理AI模型的即時運行,需要強大的邊緣AI算力支撐。機器人尤其是人形機器人、移動作業裝置等,對硬體的輕量化、低功耗、高即時性提出了嚴苛要求。傳統邊緣計算模組難以平衡算力與能效,無法滿足複雜物理AI模型的運行需求。NVIDIA此次發佈的Jetson T4000模組與IGX Thor工業邊緣平台,基於Blackwell架構打造,實現了算力與能效的跨越式提升,為物理AI的邊緣落地提供了核心硬體支撐。1.3.1 Jetson T4000:機器人的“高效小腦”Jetson T4000是Blackwell架構下放至邊緣端的首款機器人專用計算模組,現已正式發售,千片起訂量下單價為1999美元,為Jetson Orin客戶提供了高性價比的升級路徑。相較於上一代Jetson AGX Orin,該模組在核心性能上實現了全方位突破:Jetson T4000的核心突破在於NVFP4 4位浮點精度推理技術。對於物理AI應用而言,感知環節的精度可適當降低,但決策與控制的即時性至關重要。該技術允許機器人在邊緣端直接運行複雜的VLA模型,無需依賴不穩定的雲端網路,既保證了即時響應,又提升了運行安全性。在70瓦的可配置功率範圍內,其可提供1200 FP4 TFLOPS的算力,足以支撐Cosmos與GR00T模型的即時運行,是能耗受限型自主系統的理想選擇。1.3.2 IGX Thor:工業邊緣的“安全算力核心”除了面向通用機器人的Jetson T4000,NVIDIA還宣佈IGX Thor將於2026年1月晚些時候上市,聚焦工業邊緣場景,提供高性能AI計算與功能安全保障。該平台將機器人技術擴展到工業生產、建築採礦等複雜邊緣環境,具備企業級軟體支援能力,可滿足工業級應用對穩定性、安全性的嚴苛要求。目前,AAEON、Advantech、ADLINK等眾多合作夥伴已推出搭載Thor的系統,覆蓋邊緣AI、機器人和嵌入式應用等多個領域。1.4 生態協同 NVIDIA與Hugging Face打通開源開發鏈路技術的規模化落地離不開生態的支撐。當前,機器人已成為Hugging Face平台上增長最快的領域,而NVIDIA的開放模型與資料集在該平台的下載量持續領先。為進一步加速開源物理AI的開發,NVIDIA與Hugging Face達成深度合作,將開放原始碼的Isaac與GR00T技術整合到領先的LeRobot開源機器人框架中,建構了“軟硬體一體化”的開源開發生態。此次合作的核心價值在於打通了兩大開發者社區:NVIDIA的200萬機器人開發者與Hugging Face的1300萬全球AI開發者,實現了技術、工具與資源的雙向流動。具體來看,GR00T N系列模型與Isaac Lab-Arena已正式上線LeRobot庫,開發者可直接基於該框架進行模型微調和策略評估;同時,Hugging Face開放原始碼的Reachy 2人形機器人與NVIDIA Jetson Thor機器人電腦實現完全互操作,可運行包括GR00T N1.6在內的任何VLA模型;Reachy Mini桌面機器人則與NVIDIA DGX Spark實現相容,支援開發者基於NVIDIA大語言模型及本地運行的語音、電腦視覺開放模型打造自訂體驗。這種開源生態的協同,大幅降低了機器人開發的門檻,讓中小企業與個人開發者能夠快速接入頂尖的物理AI技術,加速了創新應用的孵化。正如Hugging Face首席技術官所言:“與NVIDIA的合作將徹底改變開源機器人開發的格局,讓更多開發者能夠聚焦應用創新,而非基礎技術建構。”二、產業鏈重構:從“碎片化”到“生態化”的全鏈路變革機器人產業鏈傳統上呈現“上游高壁壘、中游低利潤、下游分散化”的碎片化格局。上游核心零部件(控製器、伺服系統、減速器)佔據工業機器人總成本的60%以上,利潤分配比例超過40%,但技術門檻高,長期被海外企業壟斷;中游整機製造依賴上游零部件,同質化競爭激烈,毛利率普遍偏低;下游應用場景分散,不同行業的需求差異大,難以形成規模化效應。NVIDIA此次發佈的全端技術體系,將通過“技術賦能-生態整合-成本最佳化”三大路徑,重構機器人產業鏈的價值分配與協作模式。2.1 上游核心零部件 AI驅動的技術升級與國產化機遇上游核心零部件是機器人產業的“卡脖子”環節,也是利潤最集中的領域。NVIDIA的物理AI技術體系,將對上游零部件產業產生兩大關鍵影響:一是推動零部件的“智能化升級”,二是為國產零部件企業提供彎道超車的機遇。在智能化升級方面,傳統零部件以“高精度執行”為核心目標,而物理AI時代的零部件需要具備“感知-反饋-協同”的智能能力。例如,伺服電機需要即時採集運動資料,並與AI模型協同調整參數,以適應動態環境下的動作需求;減速器則需要具備更高的動態響應速度,配合機器人的即時微調動作。NVIDIA的GR00T模型與Jetson硬體平台,為零部件的智能化升級提供了標準介面與算力支撐,推動上游零部件從“被動執行”向“主動協同”轉變。在國產化機遇方面,長期以來,國內零部件企業受制於核心技術不足,難以與海外巨頭競爭。而NVIDIA的開放模型與框架,降低了零部件企業的智能化研發門檻。例如,國內控製器企業可基於NVIDIA的CUDA架構與GR00T模型,快速開發具備物理AI能力的智能控製器,無需從零建構演算法體系。伺服系統企業可借助Jetson平台的算力,實現運動資料的即時分析與參數最佳化。同時,隨著國內機器人產業政策的支援(如廣西出台的機器人產業發展政策,對核心零部件企業給予最高300萬元的年度獎勵),國產零部件企業將在技術升級與市場拓展中獲得更多助力。此外,NVIDIA Jetson T4000的量產與普及,將帶動上游晶片供應鏈的發展。該模組採用的Blackwell架構晶片,其國產化替代(如封裝測試、配套元器件)將為國內半導體企業提供新的市場機遇,進一步完善機器人產業鏈的國產化生態。2.2 中游整機製造 從“組裝整合”到“應用創新”的價值躍升中游整機製造是傳統機器人產業鏈的“薄弱環節”,長期依賴上游零部件進口,以組裝整合為主,缺乏核心技術,毛利率普遍低於20%。NVIDIA的全端技術體系,將徹底改變中游整機企業的發展模式,推動其從“組裝商”向“應用解決方案提供商”轉型。首先,降低研發成本與周期。傳統整機企業需要投入巨額資金建構AI演算法、模擬平台與硬體適配體系,研發周期長達1-2年。而基於NVIDIA的Cosmos模型、Isaac Lab-Arena模擬框架與Jetson硬體,整機企業可直接復用成熟的技術模組,聚焦行業應用場景的定製化開發,研發周期可縮短至3-6個月,研發成本降低50%以上。例如,智元機器人基於NVIDIA技術推出的面向工業和消費行業的人形機器人,以及配套的Genie Sim 3.0模擬平台,正是借助NVIDIA的技術賦能,快速實現了產品落地與迭代。其次,提升產品競爭力。借助NVIDIA的物理AI技術,中游整機企業的產品將具備“通用智能”能力,能夠適配更多場景,擺脫同質化競爭。例如,NEURA Robotics推出的第3代人形機器人(由保時捷設計),基於GR00T模型與Jetson Thor平台,具備精細化控制能力,可同時適配工業裝配、服務接待等多個場景;Richtech Robotics的移動人形機器人Dex,借助NVIDIA的導航與操作技術,能夠在複雜工業環境中實現精細操作與自主導航,大幅提升了產品的市場競爭力。最後,推動商業模式創新。隨著產品競爭力的提升,中游整機企業將從“賣裝置”向“提供服務”轉型,例如通過機器人租賃、按效果收費等模式,提升客戶粘性與長期盈利能力。例如,智元機器人推出的國內首個機器人租賃平台“擎天租”,正是基於其技術領先的機器人產品,開啟了新的商業模式探索。2.3 下游應用場景 從“單一化”到“規模化”的全面滲透下游應用場景的分散化是制約機器人產業規模化發展的關鍵因素。傳統機器人主要應用於汽車製造、電子加工等少數標準化場景,而醫療、建築、消費等領域的應用相對有限。NVIDIA的物理AI技術體系,通過提升機器人的環境適應性與任務通用性,將推動下游應用場景從“單一化”向“規模化”全面滲透,尤其是在工業、醫療、建築採礦、消費四大領域實現突破性進展。在工業領域,機器人將從“固定工位操作”向“全流程協同作業”升級。例如,富臨精工工廠引入的近百台遠征A2-W機器人(基於NVIDIA技術),已實現與AMR的協同作業,自主完成周轉箱的搬運、轉移與精準放置,覆蓋三條不同裝配線,涉及20余種物料,承載重量提升至14千克,且未發生一起物料傾倒事故。隨著NVIDIA技術的普及,更多製造企業將實現“機器人+智能製造”的升級,推動工業機器人的規模化應用。在醫療領域,物理AI技術將推動手術機器人與輔助診療裝置的精準化升級。LEM Surgical借助NVIDIA Isaac for Healthcare和Cosmos Transfer模型,訓練Dynamis手術機器人(搭載Jetson AGX Thor與Holoscan),大幅提升了手術操作的精準度;XRLabs則利用Thor平台與Isaac for Healthcare,為手術內窺鏡提供即時AI分析支援,幫助外科醫生精準判斷手術部位,降低手術風險。這些應用將推動醫療機器人從“高端試點”向“常規應用”普及。在建築採礦領域,Caterpillar與NVIDIA的深化合作將推動自主作業裝置的規模化落地。建築與採礦行業屬於典型的“危險、骯髒、枯燥”場景,對機器人的需求迫切,但環境複雜,傳統裝置難以適配。Caterpillar將借助NVIDIA的物理AI技術,開發具備自主導航、精準作業能力的重型裝置,提升作業效率與安全性。在2026年1月7日的CES主題演講中,Caterpillar CEO Joe Creed與NVIDIA高管將披露更多合作細節,預計將推出多款基於Blackwell架構的自主作業裝置。在消費領域,人形機器人將從“高端玩具”向“家庭助手”轉型。LG Electronics發佈的全新家用機器人,基於NVIDIA技術,可執行各種室內家務,具備動態環境適應能力,能夠應對家庭中的複雜場景(如躲避障礙物、處理不同材質的物品);宇樹科技推出的小型人形機器人Unitree R1,起售價僅2.99萬元,借助NVIDIA的輕量化AI技術,實現了低成本與高智能的平衡,大幅拉近了與人消費市場的距離。2.4 價值分配重構 生態主導者引領的利潤再平衡隨著NVIDIA全端技術體系的普及,機器人產業鏈的價值分配將發生重大變化:從“上游零部件企業主導”向“生態主導者+應用創新者”共同主導的格局轉變。NVIDIA作為生態主導者,將通過“模型授權+硬體銷售+生態服務”獲取穩定的利潤回報;而中游整機企業與下游應用解決方案提供商,將通過場景創新與服務增值,提升利潤佔比;上游零部件企業則需要通過智能化升級,維持其利潤優勢。這種價值分配的重構,將推動產業鏈從“零和博弈”向“共贏發展”轉變。NVIDIA通過開放模型與框架,幫助上游零部件企業實現智能化升級,提升其產品附加值;中游整機企業借助NVIDIA技術推出高競爭力產品,帶動上游零部件的需求;下游應用場景的規模化落地,又將反哺中游整機與上游零部件企業的發展,形成良性循環。據行業預測,隨著這種生態化格局的形成,2027年將成為中國機器人產業的“大規模商業化元年”,整個產業鏈的規模將突破兆級。三、應用場景突破:物理AI技術的落地案例與價值驗證技術的價值最終需要通過應用場景來驗證。NVIDIA此次發佈的物理AI技術體系,已在工業、醫療、消費、建築採礦等多個領域實現落地,通過一系列標竿案例,充分驗證了其在提升效率、降低成本、保障安全等方面的核心價值。本節將重點解析四個典型應用場景的落地案例,深入探討物理AI技術的實際應用效果。3.1 工業製造 富臨精工的“人形機器人+智能製造”升級富臨精工是國內領先的汽車零部件製造商,其生產車間涵蓋多條裝配線,物料搬運、上料等環節傳統上依賴人工操作,存在效率低、誤差率高、勞動強度大等問題。為實現智能製造升級,富臨精工與智元機器人達成合作,引入近百台基於NVIDIA Jetson Thor與GR00T模型的遠征A2-W人形機器人,建構了“智能中樞平台+人形機器人+AMR”的協同作業體系。該體系的核心優勢在於三個方面:一是全流程自動化,智能中樞平台即時監控線邊物料剩餘量,當觸及預設水位線時,自動觸發配送任務,人形機器人與AMR協同作業,自主完成周轉箱的搬運、轉移與精準放置,無需人工干預;二是動態適應性強,借助NVIDIA Cosmos Reason 2模型的推理能力,人形機器人能夠應對車間內的動態環境變化,如躲避移動的工人與裝置、調整物料放置角度等;三是規模化擴展能力,從最初的1個搬運工位擴展至4個,覆蓋三條不同裝配線,涉及物料種類從4種增至20余種,承載重量從5-6千克提升至14千克,且線邊上料場景至今未發生一起物料傾倒事故。據富臨精工相關負責人介紹,引入該體系後,物料搬運效率提升了60%,人工成本降低了40%,同時物料配送的誤差率降至0.1%以下。這一案例充分驗證了NVIDIA物理AI技術在工業製造場景的規模化應用價值,為其他製造企業的智能化升級提供了可複製的方案。3.2 醫療健康 LEM Surgical的精準手術機器人訓練體系手術機器人是醫療領域的高端裝備,其訓練需要大量的臨床資料與模擬場景,但傳統訓練方式存在資料稀缺、風險高、周期長等問題。LEM Surgical作為專注於手術機器人研發的企業,借助NVIDIA Isaac for Healthcare和Cosmos Transfer 2.5模型,建構了高效的手術機器人訓練體系,用於其Dynamis手術機器人的研發與最佳化。Dynamis手術機器人搭載了NVIDIA Jetson AGX Thor與Holoscan平台,具備高精度的手術操作能力。其訓練體系的核心的是Cosmos Transfer 2.5模型的域遷移能力:通過將Isaac Sim中的模擬手術場景,轉換為帶有真實手術環境噪聲、光照條件的等效資料,大幅提升了模擬訓練的真實性;同時,將少量真實手術資料增強為多樣化的模擬場景,解決了臨床資料稀缺的問題。借助這一體系,LEM Surgical的研發團隊能夠快速驗證手術機器人的操作策略,最佳化運動控制參數,大幅縮短了研發周期。此外,XRLabs利用NVIDIA Jetson Thor與Isaac for Healthcare,開發了智能手術內窺鏡系統。該系統通過外接手術內鏡採集即時圖像,借助Cosmos Predict 2.5模型的即時預測能力,分析手術部位的解剖結構與操作風險,為外科醫生提供即時引導,降低了手術難度與併發症風險。目前,該系統已在多家醫院開展試點應用,手術精準度提升了30%,手術時間縮短了20%。3.3 消費服務 LG Electronics的家用智慧型手機器人家用機器人是消費領域的重要增長點,但傳統家用機器人功能單一,難以應對複雜的家庭環境。LG Electronics在CES 2026上發佈的全新家用機器人,基於NVIDIA的Cosmos系列模型與Jetson T4000模組,具備全方位的家務處理能力與動態環境適應能力。該機器人的核心優勢在於其強大的物理AI能力:通過Cosmos Reason 2模型,能夠理解自然語言指令,並分解為具體的家務任務,如“清理客廳檯面”可拆解為“整理物品→擦拭灰塵→分類收納”;借助Cosmos Predict 2.5模型,能夠即時預測動作後果,如避免碰撞易碎物品、調整拖地力度以適應不同地面材質;依託Jetson T4000的高效算力,實現了即時感知與決策,響應速度提升至毫秒級。此外,該機器人還具備自主充電、故障自診斷等智能功能,能夠適應不同戶型的家庭環境。LG Electronics相關負責人表示,這款家用機器人的目標是成為“家庭助手”,而非簡單的“家務工具”,其定價將控制在萬元以內,以實現規模化普及。該產品的推出,標誌著消費級家用機器人正式進入“通用智能”時代。3.4 建築採礦 Caterpillar的自主作業裝置升級建築與採礦行業是典型的高危、高勞動強度行業,對自主作業裝置的需求迫切。Caterpillar作為全球領先的工程機械製造商,正在擴大與NVIDIA的合作,將先進的AI和自主系統引入建築和採礦領域的裝置及作業現場。基於NVIDIA的Blackwell架構與物理AI模型,Caterpillar正在開發多款自主作業裝置,包括自主挖掘機、自主礦用卡車等。這些裝置具備三大核心能力:一是自主導航,借助Cosmos模型的環境感知與推理能力,能夠在複雜的施工現場與礦區環境中精準定位,躲避障礙物;二是精準作業,通過GR00T模型的動作控制能力,實現挖掘、裝載、運輸等作業的精準執行,提升作業效率;三是協同作業,多台裝置可通過OSMO框架實現資料共享與協同調度,形成自主作業車隊。據Caterpillar透露,其自主礦用卡車已在澳大利亞某金礦開展試點應用,借助NVIDIA的技術,作業效率提升了25%,事故率降低了80%,同時減少了人工成本。在2026年1月7日的CES主題演講中,Caterpillar CEO Joe Creed將與NVIDIA高管共同披露更多合作細節,預計將推出面向建築行業的首款自主挖掘機,計畫2027年實現規模化量產。四、產業趨勢展望:物理AI驅動下的機器人產業未來圖景NVIDIA此次發佈的物理AI技術體系,不僅解決了當前機器人產業的核心痛點,更勾勒出未來機器人產業的發展圖景。結合行業發展規律與技術迭代趨勢,未來3-5年,機器人產業將呈現“通用化、輕量化、開源化、規模化”四大核心趨勢,而NVIDIA將在這一處理程序中扮演關鍵的引領角色。4.1 趨勢一 從“專用機器人”到“專家級通用機器人”的跨越傳統機器人多為“專用裝置”,針對特定場景開發,功能單一,難以跨場景應用。而物理AI技術的發展,將推動機器人從“專用”向“通用”跨越,最終實現“專家級通用”的目標——即能夠快速學習多種任務,適配不同行業場景的需求。NVIDIA的Cosmos與GR00T模型,正是這一趨勢的核心驅動力。通過內化物理世界的通用規律,機器人能夠快速適應新場景、學習新任務,無需針對每個場景進行重新程式設計。一款基於GR00T模型的人形機器人,既可以在工廠完成精密裝配,也可以在醫院協助護理,還可以在家庭處理家務,只需通過少量場景資料微調即可實現功能適配。據行業預測,到2028年,專家級通用機器人的市場佔比將超過30%,成為機器人產業的主流產品形態。4.2 趨勢二 硬體輕量化與能效比的持續提升機器人尤其是人形機器人、移動服務機器人,對硬體的輕量化、小型化、低功耗提出了嚴苛要求。隨著Blackwell架構的普及與技術迭代,邊緣AI算力模組將實現“更高算力、更低功耗”的持續突破,推動機器人硬體的輕量化發展。NVIDIA的Jetson系列模組已展現出這一趨勢:從Jetson AGX Orin到Jetson T4000,算力提升4.3倍,而功耗控制在70瓦以內;未來,隨著晶片製程的進步與架構的最佳化,Jetson系列模組的算力有望進一步提升,功耗則持續降低,甚至可能出現50瓦以下、算力突破2000 TFLOPS的產品。這將推動機器人的小型化發展,如宇樹科技的小型人形機器人、松延動力的Bumi小布米等輕量化產品將成為消費市場的主流,進一步擴大機器人的應用範圍。4.3 趨勢三 開源生態成為創新核心驅動力機器人產業的創新需要大量的技術積累與資源投入,單一企業難以完成全鏈條的創新。開源生態將成為未來機器人產業創新的核心驅動力,吸引全球開發者共同參與技術突破與應用創新。NVIDIA與Hugging Face的合作,正是開源生態發展的重要里程碑。隨著LeRobot框架的普及,越來越多的開發者將接入NVIDIA的物理AI技術體系,孵化出更多創新應用。同時,開源生態的發展將推動技術標準的統一,降低行業的協作成本,加速創新成果的轉化。預計到2027年,全球將有超過50%的機器人創新應用基於開源框架開發,開源生態將成為機器人產業競爭的核心戰場。4.4 趨勢四 規模化落地與成本快速下降隨著技術的成熟與生態的完善,機器人的規模化落地將推動成本快速下降,形成“規模效應-成本下降-需求擴大”的良性循環。據資料顯示,2025年國內人形機器人出貨量預計達1.8萬台,2026年有望攀升至6.25萬台;多位行業專家預測,2026年國內人形機器人產量將突破10萬台,2028年有望達到百萬台級。成本下降的主要驅動力包括三個方面:一是核心零部件的國產化替代,如國內企業已實現減速器、伺服系統的批次供貨,成本較海外產品降低30%以上;二是規模化生產帶來的製造費用降低,隨著產量的提升,整機製造的單位成本將大幅下降;三是開源技術的應用,降低了研發成本。預計到2030年,人形機器人的售價將降至5萬元以下,消費級市場將全面爆發。4.5 挑戰與應對 技術、倫理與政策的協同推進儘管機器人產業前景廣闊,但仍面臨技術、倫理與政策三大挑戰。在技術層面,機器人的泛化能力、安全性仍需進一步提升,尤其是在複雜動態環境中的可靠性;在倫理層面,機器人的廣泛應用可能帶來就業結構變化、隱私洩露等問題;在政策層面,相關的法律法規、標準體系尚未完善,如機器人決策失誤的責任界定、資料安全規範等。應對這些挑戰,需要政府、企業與科研機構的協同推進:一是加強核心技術研發,聚焦泛化能力、安全性等關鍵痛點,推動技術標準的統一;二是建立健全倫理規範與法律法規,平衡技術創新與社會影響;三是出台針對性的政策支援,如職業培訓、資料安全保障等,確保機器人產業的健康發展。NVIDIA作為行業引領者,已通過開放模型與框架,推動技術標準的統一;同時,其與全球企業的合作,也在積極探索機器人應用的倫理邊界。五、結語:物理AI開啟機器人產業的“黃金十年”CES 2026上NVIDIA的系列發佈,標誌著機器人產業正式進入物理AI驅動的新時代。從技術核心來看,Cosmos與GR00T模型建構了機器人理解物理世界的“認知大腦”,Isaac Lab-Arena與OSMO框架打通了開發全流程,Jetson T4000硬體模組提供了高效算力支撐,形成了覆蓋“模型-框架-硬體-生態”的全端解決方案;從產業鏈影響來看,其推動上游零部件智能化升級、中游整機企業嚮應用創新轉型、下游場景規模化滲透,重構了產業價值分配模式;從應用前景來看,工業、醫療、消費、建築採礦等多個領域的落地案例,充分驗證了技術的實用價值。黃仁勳所言的“機器人開發的ChatGPT時刻”,不僅是技術的突破,更是產業範式的變革。未來十年,隨著物理AI技術的持續迭代、開源生態的不斷完善、成本的快速下降,機器人將從“工業裝備”全面走向“生活助手”,深度融入製造業、醫療健康、家庭服務等多個領域,成為推動經濟社會轉型的重要力量。對於企業而言,接入NVIDIA的物理AI技術體系,將成為把握產業機遇的關鍵;對於行業而言,建構開放協同的生態,推動技術標準的統一,將加速產業的規模化發展;對於社會而言,擁抱機器人技術帶來的變革,做好就業轉型與倫理規範,將實現技術創新與社會福祉的共贏。我們有理由相信,在物理AI的驅動下,機器人產業將迎來前所未有的“黃金十年”,為人類社會帶來更高效、更安全、更便捷的生活與生產方式。這些新模型均可通過 Hugging Face 獲取,包括:NVIDIA Cosmos™ Transfer 2.5和NVIDIA Cosmos Predict 2.5:開放、完全可定製的世界模型,為物理 AI 實現基於物理原理的合成資料生成與機器人策略評估的模擬支援。NVIDIA CosmosReason 2:開放推理視覺語言模型(VLM),使智慧型手機器能夠像人類一樣看見、理解物理世界並採取行動。NVIDIA Isaac™ GR00T N1.6:專為人形機器人打造的開放式推理視覺語言行動(VLA)模型,可解鎖全身控制能力,並借助 NVIDIA Cosmos Reason 增強推理和上下文理解。 (AI雲原生智能算力架構)
【CES 2026】CES上的“物理AI”拐點:Robotaxi走向規模化,人形機器人供應鏈悄然形成
德銀預測,今年是Robotaxi規模化與人形機器人部署的元年。人形機器人借力汽車供應鏈加速降本,Mobileye等廠商將成本目標鎖定在1萬美元;自動駕駛告別測試進入規模化,Waymo訂單激增,輝達推出Alpamayo平台助車企“即插即用”。物理AI正從實驗室走向量產。2026年或許是AI大規模進軍物理世界的開始——從行走的機器人到自動駕駛汽車,AI正在積累生態硬體。據追風交易台消息,德意志銀行1月13日發佈的研報顯示,該行分析師團隊在上周參加了拉斯維加斯的CES展會,感受到了市場熱度和相關性的顯著飆升。該行指出,車輛自動駕駛(Robotaxi + 消費級L4)以及最引人注目的人形機器人佔據了展會的中心舞台。德意志銀行在報告中總結道:“總體而言,我們預測2026年將是自動駕駛汽車日益從測試/驗證過渡到規模化的一年,而人形機器人將從實驗室實驗轉向小規模部署。”報告強調,人形機器人領域正在培育全新的供應鏈,供應商正試圖向該領域轉型以期未來實現大規模放量。與此同時,自動駕駛領域的Robotaxi部署勢頭強勁,輝達等晶片巨頭正在通過推出新平台重塑競爭格局。德意志銀行在報告中列出10點核心觀察:01類人機器人供應鏈在成形執行器成為“肌肉”入口德銀認為雖然仍在早期,但供應商已經在向類人機器人供應鏈轉向,路徑類似電驅動總成:既提供整合方案,也提供底層零部件。舍弗勒(Schaeffler)試圖成為類人機器人的主要“肌肉”,提供線性與旋轉執行器。其在CES展示了面向類人機器人的一體化行星齒輪執行器:兩級行星齒輪箱+電機+編碼器+控製器的緊湊整合。該單元具備高熱穩定性、60–250 Nm(牛米)扭矩範圍,且回驅能力很低,可承受外力並避免驅動部件意外反轉,適合連續工況。德銀提到NEURA已同意在其類人機器人上使用舍弗勒執行器,且看起來還有其他客戶已在用(至少部分元件)或未來會用。現代摩比斯(Hyundai Mobis)也宣佈將為波士頓動力Atlas供應執行器,意在讓機器人能借助汽車規模化供應鏈來製造。當供應鏈開始“汽車化”,最先被定價的往往不是概念,而是關鍵部件的滲透與規模化製造能力。02機載晶片格局輝達仍是首選,但分化開始出現德銀觀察到,類人機器人機載處理器上,輝達仍佔據主導,原因主要是性能與易用性。使用Jetson Orin或Thor的公司包括:1X、Agility、Apptronik、Boston Dynamics、Figure AI、Mentee、(目前)NEURA、UBTECH、Unitree等。對比之下:特斯拉與小鵬使用自研推理晶片。CES上高通推出面向機器人“全端架構”的下一代方案(Dragonwing IQ10 Series),但德銀表示尚不清楚能否獲得客戶大規模採用;同時VinMotion的Motion 2類人機器人使用IQ9 Series,IQ10最初面向工業AMR與更先進的全尺寸類人機器人。03“物理AI”從指令碼走向AgentVLA成為主線現場最顯著的範式變化之一,是從“預程式設計/指令碼化動作”轉向視覺-語言-動作(VLA),讓機器人能夠“推理”完成任務。Boston Dynamics用Google DeepMind Gemini Robotics的VLA模型替代傳統MPC(模型預測控制),使Atlas能理解此前未見過的環境(如非結構化工廠混亂場景)。其動作執行由TRI的大型行為模型(LBM)補充,類似Figure的Helix雙系統模型:System 1高頻快速響應,System 2低頻做高層推理與語言;德銀同時指出Figure似乎在自研兩套模型。04訓練之爭升級真實世界資料與模擬“閉環”才是重點德銀判斷,行業爭論已從“模擬 vs 真實誰更好”轉為“如何高效閉環”。NEURA採取更偏“物理優先”的路線,建設NEURA Gym大型實體訓練中心,認為模擬是“近似”,在複雜接觸(例如“穿針引線”)上會失真;其通過數百台機器人做分揀、裝配等真實任務收集高保真資料,再輸入“Neuraverse”,生成真實失敗的“合成孿生”在模擬中訓練,最後把修複方案推回真實機器人。另一家公司提到無法模擬物體“觸感”,需要人先示範:通過遠端操作,人穿VR服控制類人機器人執行如“撿起葡萄”等動作;用少量“完美示例”後,再用輝達 GROOT-Mimic在模擬中生成“100,000+”種動作變體,並用強化學習讓動作更順滑。相對地,Mobileye強調其Mentee將基本以模擬來訓練。05“通用”先讓位於“崗位”商業化證明優先德銀認為短期內,“通用類人機器人”更多會被匯入具體場景,以證明商業可行性,再談進入家庭。Keenon Robotics(中國):已擁有服務機器人全球40%市場份額,海外累計出口約10萬台;產品價格從低於1萬到約10萬,主打強任務定製。CES 2026重點是其旗艦類人機器人XMAN-R1,可做爆米花、倒飲料、擬人化手勢互動等;其“Brain”為Keenon Operator Model 2.0,VLA模型面向服務業,可理解如“找到4號桌客人並給他糖果”等指令。Keenon還提到在上海香格里拉酒店建構協作生態:MAN-R1做人機互動“門面”,W3送物到房間,S100搬重行李,C40/C55清潔。並且在日本等高人工成本市場,其機器人使用壽命達到8年,顯著高於行業常見的3–5年。Deep Robotics聚焦工業巡檢:以覆蓋距離衡量(最高63km),可在變電站、電廠、油氣設施等危險區域執行24/7自主巡邏監測;在應急場景用於救災、消防、有毒氣體檢測,並採用可更換電池降低充電摩擦。06降本公式很直接規模=成本下行的前提在類人機器人側,德銀把降本的主驅動歸結為:上量提升費用攤薄 + 供應商議價改善。有公司稱成本已從“20萬降至10萬”美元,並規劃在“未來幾年”降到“5萬”美元,前提是銷量達到數千台。波士頓動力與現代汽車宣佈目標是在2028年實現年產能3萬台;並且其2026年產量已全部提前分配給現代的汽車工廠。公司還指出執行器約佔BoM的~60%,而這部分將由現代體系內供應商Hyundai Mobis製造以加速規模化。Mobileye在收購Mentee背景下披露:若年產量5萬台,一個較簡化設計(無腱驅系統)的製造成本約“2萬/台”;若年產量“10萬台”,成本可降一半至“1萬/台”,並以2028年爬坡為目標,生產由Aumovio負責。07Robotaxi動能在堆疊2026年更像“商業化加速年”德銀認為,隨著特斯拉在2025年推出Robotaxi,2026年多家玩家的商業化動能會更強,CES上Waymo與Zoox的大規模存在就是訊號:Waymo:自成立以來已提供10m+付費乘車;最新披露顯示在2025年12月達到45萬次付費乘車/周,並擴張至休斯敦、邁阿密,以及東京、倫敦等國際市場。亞馬遜的Zoox:從拉斯維加斯公開測試走向“可上市產品”展示,主打面向密集城市的“車廂式”Robotaxi,完全沒有傳統駕駛艙。Mobileye與大眾:將在今年於洛杉磯用特別準備的ID. Buzz電動廂式車推出L4級Robotaxi服務。另有由合作夥伴Nuro、Lucid、Uber共同推進、基於Lucid Gravity的自動駕駛車輛計畫在2026年末於舊金山灣區啟動,並再擴張到更多城市。0820%輝達 Alpamayo把“腦+頭骨”打包給車企,但驗證仍在路上輝達宣佈推出面向自動駕駛的Alpamayo(“大腦”),並配合Thor(“頭骨”),試圖降低車企部署高階能力的門檻:像Lucid、Mercedes這類公司無需從零投入數十億美元搭建AI基礎設施,可直接“插入”輝達方案。德銀同時保持克制:這確實引發對特斯拉護城河的討論,但現在擔憂為時過早;輝達仍需要傳統OEM兌現承諾,且其模型能否覆蓋真實世界邊界案例仍待觀察。德銀指出,其訓練資料量僅為特斯拉改採集資料的一部分。即便Alpamayo效果理想,德銀仍認為特斯拉憑藉垂直整合(整車、晶片、AI基礎設施、網路等)存在結構性成本優勢;如果自動駕駛/Robotaxi趨於商品化,成本將成為最大分化點。09Aptiv:端到端AI ADAS + 連接與軟體平台講的是“跨行業”Aptiv展示核心是下一代端到端(E2E)AI驅動的ADAS平台:用新發佈的Gen 8雷達與PULSE感測器實現城市複雜環境下的L2++免手駕駛“類人邏輯”。軟體側推出與Wind River共建的雲原生中介軟體平台LINC,通過5G與C-V2X實現真正的軟體定義車輛;並與Verizon演示車輛通過共享即時資料實現“看見拐角後的行人/騎行者”。Aptiv還強調感測器向航天與協作機器人擴展——德銀認為這是“新Aptiv”要證明的敘事,以爭取估值倍數重評。10Visteon:700 TOPS域控、外掛式升級,主打“執行”Visteon在CES發佈SmartCore HPC域控製器,算力達700 TOPS,可把最多14個攝影機與多路高速資料連接整合到單一“中央大腦”。同時擴大與Mahindra合作,推出面向即將上市的XUV700的SmartCore Pro(三聯屏+360度視野)。為解決“存量平台”障礙,Visteon還推出由輝達 DRIVE AGX Orin驅動的AI-ADAS Compute Module外掛式方案,讓車企無需完全重構架構就能加裝AI助手或安全功能;德銀提到該產品已上到中國的極氪車型。此外,Visteon發佈面向7英吋以下螢幕的“Entry Cockpit”,把手機投屏與數字導航帶到兩輪車與入門車型。德銀評價其“外科式”的垂直整合有助於成本競爭力,並推動其在過往滲透較低的車企(尤其亞洲OEM)中進一步擴張。在德銀看來,CES 2026傳遞的資訊很直接:自動駕駛與類人機器人正在從“能不能做”轉向“能不能規模化、能不能把成本打下來”。當波士頓動力把執行器成本佔比點到約60%、把2026年產量預分配說出來時,產業已經開始用製造業語言定價;而Waymo的10m+付費乘車與45萬次/周節奏,則把Robotaxi從概念推向更硬的營運資料。對投資者而言,下一階段要跟蹤的不是更炫的demo,而是供應鏈繫結、產能爬坡與單位成本曲線。 (硬AI)
【CES 2026】黃仁勳最新CES演講提醒:AI正走進真實世界,孩子成功的分水嶺也變了
1月5日的CES2026大會上(全球科技圈的“開年大秀 + 趨勢風向標”),黃仁勳在拉斯維加斯又穿著那件熟悉的皮衣上台了,開口先丟出一句很狠的話:“The ChatGPT moment for physical AI is nearly here.”翻譯一下:語言AI(主要在數字世界工作,比如我們熟悉的各種大模型助手)負責把話說漂亮;但他真正興奮的是下一步:物理AI(physical AI)要開始走進真實世界,解決具體問題,把事做成。黃仁勳還提到,輝達下一代AI平台Rubin正在走向量產階段——因為,要讓AI真走進現實,不能只靠“一塊更強的晶片”,而要靠從晶片到系統與基礎設施的一整套平台,把迭代跑起來。AI如此,某種程度上,人其實也一樣。黃仁勳強調的分水嶺是“系統”:能讓AI把反饋變成更新,把試錯變成升級。放到教育裡:決定孩子長期上限的,不是當下的強,而是有沒有一套個人發展的系統——確保他們進了更複雜的世界,還能繼續變強。我們已經很擅長訓練孩子在“紙面世界”裡贏:刷題、拿分、做漂亮的成果展示。大多數學校和家庭培養孩子的方式,是把錯誤當成失敗:錯一道題,扣分;寫一篇文章,改得越少越“厲害”;做一件事,最好一次成型。久而久之,孩子很會避免失敗,也很會在標準評估系統裡拿高分。可一旦走進沒有標準答案的真實世界,面對更複雜的任務和選擇——要在不確定裡做判斷、要在挫折裡調整策略,要協作、要溝通——很多孩子反而會卡住。因為,真實世界不會給你標準答案,你只能在反饋裡調整,在碰壁裡迭代。在今天的美本申請裡,“紙面世界的能力”已經被捲到極致:高分、競賽、科研、活動——這些都越來越像一塊精緻的成就展示板。它當然重要,但它也越來越像:同樣的分數段、同樣的“優秀敘事”,放在同一個池子裡,區分度太低。所以招生官真正頭痛的問題是:我怎麼判斷這個孩子進入更複雜、更開放、沒有標準答案的大學環境後,仍然會繼續變強?這就是幫孩子建立個人發展系統的價值——它決定了兩件事:對於“展示板已經很漂亮”的孩子,它讓你的優秀更可信:不是偶然的結果,而是可持續的能力。對於“展示板看起來沒那麼漂亮”的孩子,它讓你的潛力能被預期:你也許不是起跑最快的人,但你已經有一套會持續加速的系統。所以,回到AIR,我們一直在做的,其實不是把孩子的“成就展示板”再擦亮一點——那條路大家都在卷,而且越卷越同質化。我們真正做的是另一件更底層、也更難的事:幫助孩子通過準備申請,建立起一套個人發展系統,並把它變成頂級大學讀得懂、信得過的申請材料。所以我們才說,申請不是一場“包裝競賽”,而是一段個人發展的加速期。當一個孩子的系統真的跑起來了,頂級大學當然更願意押注他的未來。如果你今晚已經在研究下一波physical AI的賠率——那我想提醒一句:最值得長期押注的資產,其實就在你家餐桌旁。教育也有浪潮,只是它的回報周期更長、波動更大、但一旦跑通,複利更可怕。AIR做的,就是把孩子那套“進了真實世界也會持續升級”的系統跑起來。浪潮已來,各位優秀的投資家,別只盯著市場,也盯盯你家那位“長期資產”。想瞭解怎麼跑通孩子的個人發展系統,歡迎來和我們聊聊。 (AIR氧氣工場)
【CES 2026】重大利多,黃仁勳給出AI新風口
01大家好,我是笑笑呀~黃仁勳又穿皮衣炸場了!在拉斯維加斯的2026年CES展會上,老黃給AI未來十年定調了:物理AI。2026年,是物理AI爆發的一年。如今,已邁向“ChatGPT”時刻。他甩出重磅:Cosmos世界基礎模型。這玩意兒不是聊天機器人,它能模擬真實物理世界——重力、摩擦、因果、慣性,全都懂。過去的互動性AI,堪稱百科全書,什麼知識都懂,但說白了就是個搜尋引擎。直到ChatGPT橫空出世,AI變得可思考、可分析、可推理了,離人類的“第二大腦”更進一步。而黃仁勳提到的物理AI,指的是AI開始理解物理世界與自然規律——我移開視線再回來,物體還在遠處;推動一個物體,物體就會摔倒。要讓AI和機器人理解這些物理規律,並不是植入一兩行程式碼這麼簡單,需要一整套開放模型和複雜AI智能體。過去AI為何會出現“幻覺”或者鬧笑話?因為AI對世界的感知與人類是截然不同的,它只依賴植入的知識庫,無法處理更複雜的環境和問題。而黃仁勳提到的“物理AI”,就是AI的下一步,讓AI真正理解物理世界。不管是生成式AI大模型,還是具身智能的訓練,都會大大節省成本。02這也是黃仁勳演講的重點:Vera Rubin平台給開發者帶來的價值。從根源上節省成本,從底層框架中提升AI性能。輝達不再只是賣鏟人。以前大家說它靠CUDA生態鎖死開發者。2000萬程式設計師、10萬應用,切換成本幾千萬刀,毛利率常年80%+。現在它直接把鏟子升級成整座金礦。這事兒聽起來爽,但細想有點嚇人。先說爽的,自動駕駛真要拐點了。能夠理解物理世界的AI,再加上雷達,L4級自動駕駛並不遙遠。輝達已經預告了會在今年第一季度和奔馳推出新的智能駕駛汽車。電車乃至出行領域,未來十年或許會迎來重大變革。在工業上,物理AI也極具想像空間。輝達與在西門子合作,採用輝達物理AI模型,覆蓋西門子工業軟體製作。再說嚇人的,美國人這是要用AI復興製造業啊!以老美目前的工業能力和教育水平,想再培養一批工人,幾乎是痴人說夢。但是如果是機器人呢?不怕苦不怕累,沒有加班問題,量產的邊際成本近乎為零。03黃仁勳的物理AI再加上Open AI的大模型,在工業上有極大想像空間。我們的工程師紅利、產業紅利,支撐著我們走到世界第二。我毫不懷疑東大也可以捲出對應的產品,但相對優勢會不會減弱,得打個問號。東大自然也有自己的底牌。第一,落地場景天下無敵。物理AI再牛,也得有真實的工廠、真實的駕駛場景,靠真實的資料來最佳化。老美在這方面,和我們有巨大的差距。機器人再厲害,也得有全套產業鏈讓它幹活吧。來我們的江浙滬、珠三角,工廠大把。第二,我們的AI大模型目前也處於第一梯隊。不管是Deepseek、阿里的Qwen,還是字節的豆包,目前世界排名都都不低。國內還卷,2026年只會更卷。誰能笑到最後?還早。但可以肯定的是,輝達確實開創了一個新賽道。這個賽道還很長,國內誰能捲出來,資本市場會給到答案。我們普通人,不做預測,只做跟隨,永遠把寶壓在風口產業和龍頭企業上。 (笑笑好友圈)
【CES 2026】黃仁勳演講核心觀點速覽(要點精煉,一眼抓重點)
“我們等的不僅是黃仁勳,更是在等一個答案——未來十年,人與機器將如何重新分工。”今天朋友圈轉發最多,討論熱度最高的莫過於黃仁勳CES的演講。他拋出核心判斷:“物理AI的‘ChatGPT時刻’,即將到來。”一、雙重平台遷移:計算範式重構計算核心轉移:從CPU轉向GPU加速計算,從“程式設計軟體”轉向“訓練AI模型”,軟體從“寫程式碼”變成“訓智能”。產業規模:約10兆美元傳統計算產業向AI驅動的“現代化重構”,進入“AI工廠”時代。二、物理AI(Physical AI):ChatGPT時刻已至核心突破:AI懂物理規律(重力、因果、物體恆存),從數字世界走向物理世界,賦能機器人、自動駕駛等自主系統。落地支柱:靠“訓練+推理+模擬”三台電腦協同,數字孿生與模擬系統讓AI安全試錯。標竿案例:Alpamayo自動駕駛AI端到端決策,可解釋軌跡,2026年量產上車。三、智能體(Agentic AI)全面普及2025元年:智能體具備推理、規劃、工具使用能力,如Cursor改變輝達開發模式。技術路徑:多模型+多模態+智能路由,定製技能與前沿能力結合,推動全民創新。四、開源模型生態爆發現狀:以DeepSeek R1為代表,雖落後前沿約6個月,但迭代加速、下載量激增。開放策略:NeMo工具鏈開放Cosmos(開放世界模型)、Earth 2(天氣)等,降低創新門檻。五、Rubin全端計算平台:算力新基石六芯一體:Vera CPU+Rubin GPU+NVLink-6等協同,訓練性能達Blackwell 3.5倍,推理5倍,HBM4頻寬22TB/s。核心價值:把推理成本降至Blackwell的1/10,支援AI長期“思考式推理”,2026年量產。六、輝達角色升級:全端AI體系建構者從晶片商升級為端到端AI底座提供商,靠“硬體+軟體+模型+生態”閉環,滲透機器人、自動駕駛等場景。演講PPT乾貨(網傳版,和現場英文版本有些許出入)(勞拉有話說)
黃仁勳2026首場演講:晶片已成配角,物理AI才是真霸主。
“每15年,這個行業就會重設一次。這一次,計算被徹底重塑了。”“開源模型正在縮短差距,現在它們距離最前沿模型的差距已經縮小到了6個月。”“物理AI是人工智慧的終極疆域。”——輝達CEO黃仁勳每年的CES,不缺新品,也不缺科技大佬的主題演講!新年伊始,輝達CEO黃仁勳就在CES 2026的舞台上發表了他2026年首場演講。在我看來,這不僅是一場硬體發佈會,更是一場關於物理AI的布道。從Vera Rubin的全面投產到Cosmos世界模型的開源,黃仁勳正式宣告:AI正在走出螢幕,接管物理世界。也展示了輝達正在從一家晶片公司向物理AI與機器人全端平台巨頭的徹底轉型。黃仁勳在開場拋出一個對未來的判斷:“每隔10—15年,計算行業就會重設一次,我們正處在這樣的節點上。”“這次不是只有一個平台變化,AI軟體和GPU加速計算同時正在重塑整個棧。他強調AI的發展已經深刻改變從底層硬體到高級軟體的整個技術堆疊。傳統CPU主導的軟體堆疊正在被以GPU為核心的加速計算堆疊取代。而且這次被重設的,不是單一產品,而是整個計算邏輯。過去是以CPU+通用軟體為核心,性能提升主要靠製程和主頻,但現在已經變成了以GPU+AI加速計算為核心,性能提升主要來自平行計算、模型規模和系統級協同。因此,在黃仁勳看來,AI已經不再是跑在電腦上的應用,而是決定電腦形態本身的核心力量。接著黃仁勳在演講中介紹了輝達全新一代AI平台Vera Rubin,這不僅是晶片,更是AI工廠的基石。Vera Rubin平台是由六片晶片組成的一個AI超級電腦。組合了Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-X網路元件,通過對這些的統合,構成一個AI超級電腦。所以,如果說Blackwell是AI時代的入場券,那麼Vera Rubin就是通往通用人工智慧(AGI)的高速公路。黃仁勳還在現場宣佈,Vera Rubin已進入全面生產階段。在性能方面,Vera CPU提供比當前最先進CPU高出2倍的能效比;Rubin GPU還專門針對推理進行了最佳化,性能較Blackwell提升了5倍。為瞭解決AI工廠日益嚴峻的功耗和散熱問題,整個系統採用45°C熱水冷卻,散熱能耗降至冰點。Rubin還採用了極致模組化設計,過去需要2小時組裝的伺服器,現在只需5分鐘即可完成。物理AI:讓機器像人一樣理解世界“這是物理AI的ChatGPT時刻,AI不只是生成文字,還要理解和作用於真實世界。”黃仁勳在演講中反覆強調一個詞:物理AI(Physical AI)。他認為,AI的下一波浪潮,是讓模型理解重力、慣性、碰撞等物理定律。因此AI的下一波浪潮就是物理AI。那什麼是物理AI呢?所謂物理AI,並不是生成文字或圖片或視訊,而是能理解三維世界、能感知物理規則、能做出即時決策、並直接作用於現實環境那物理AI的承載體就是三個領域:機器人、自動駕駛和智能製造。為此,輝達祭出了四大殺器:一是Cosmos基礎模型,這是一款能夠模擬物理規律的世界模型。專門為訓練機器人和自動駕駛設計。它能生成符合物理定律的合成視訊資料,讓機器人在虛擬世界中學習,極大降低了現實資料採集的成本。二是GR00T平台更新,用於人形機器人的通用基礎模型GR00T再次升級。未來的機器人不再只是執行指令,而是能通過觀察人類行為自主學習。三是Omniverse升級,Omniverse現在可以連接多台電腦進行大規模模擬,成為物理AI的煉丹爐。輝達與西門子達成深度合作,將Omniverse深度嵌入工業全鏈路,從工廠設計、模擬運行到維護,所有環節都在數字空間中先跑一遍。這將不僅僅能提高效率,還能消滅生產中的不確定性。四是Alpamayo推理模型,這是輝達發佈的首個面向自動駕駛的開源大規模推理VLA(視覺-語言-動作)模型。搭載Alpamayo的汽車不僅能開車,還能像人類教練一樣,向乘客解釋為什麼要變道。也就是說:這是第一個能進行推理和思考的自動駕駛模型。它不僅能看見,能識別,還能在複雜道路環境中進行多步推理和決策。2025款梅賽德斯-奔馳CLA將首批搭載這一技術,預計將於2026年第一季度在美國上市。此外,黃仁勳在演講中也提到了PC領域的變革,發佈了首款桌面AI電腦,這是就是台輝達專門為程式設計師設計的桌面工作站。還展示了多模態AI智能體如何跨雲端和邊緣裝置(PC)協同工作。雖然沒有發佈GeForce RTX 50系列的新顯示卡,但提到了RTX軟體生態的AI化。輝達的真實野心:不是賣晶片,而是定義AI基礎設施看完整場演講,我們會發現黃仁勳談論GPU的時間變少了,談論開源模型、物理模擬和AI Agent的時間變多了。那麼,如果把黃仁勳的這整場演講串起來,我們會發現一個非常重要的變化:那就是輝達已經不再把自己定位為晶片公司,而是AI計算平台提供者、AI工廠標準制定者以及現實世界智能系統的基礎設施商。這也是為什麼雲廠商在用輝達,大模型公司在用輝達,機器人、汽車、工業系統也在用輝達。所以,黃仁勳的這場演講,更像是一份未來的宣言,告訴我們AI不再只是工具,不再只存在於雲端,而是正在進入道路、工廠、城市和現實空間。 (科技圈觀察)