輝達對機器人下手了
黃仁勳的新棋局

春節前夕,黃仁勳照例開啟年會巡演,北京站成為各路CEO追星現場。大合照中,坐在黃仁勳左邊的是宇樹科技的王興興,第一排最右是銀河通用的王鶴。

三人曾在年初的CES展上有過一次“非正式會談”,當時黃仁勳演講到尾聲,人形機器人軍團壓軸登場,其中就包括宇樹在春晚轉手絹的H1、銀河通用的Galbot G1。

輝達年會與2025年CES展

發佈會現場,14台人形機器人一字排開,有波士頓動力這種老牌選手,有宇樹這樣的行業新貴,還有跨界玩家小鵬,唯獨缺席了一邊買黃總的晶片一邊悄悄搞自研的特斯拉。

在機器人軍團壓軸登場前,黃仁勳公佈了一系列大模型組成的機器人訓練平台Cosmos

Cosmos的作用可以簡單理解為在虛擬世界模擬真實的物理環境,瞄準的是當前人形機器人產業的真空帶、也是輝達圍繞人形機器人佈局的最後一環——模擬資料

三個月後的輝達GTC,機器人再度成為壓軸節目。除了Cosmos再度刷臉,輝達還發佈了一個人形機器人基礎模型Isaac GR00T N1,模擬物理模型Newton,並由小機器人Blue完成收尾。

機器人Blue(右)

如果把人形機器人視為人工智慧領域一條正在瘋狂施工的高速公路,那麼輝達正在做的事情,就是提前把收費站先修好。

五年高考三年模擬

從年初的CES到前兩天的GTC,輝達真正的關鍵詞是“物理AI”。

按照黃仁勳的說法,AI的新一波浪潮是物理AI,其關鍵環節是讓AI理解物理定律,人形機器人則是當下最重要的載體。

傳統的工業機器人大多基於特定的規劃執行特定的操作,比如運輸和分揀,與其說機器人,倒不如說是一種“自動化裝置”。

但人形機器人在理想狀態下,可以理解物理世界各種物體、語言和文字的含義,並自主規劃和決策。

2023年7月,《紐約時報》探班Google實驗室,記錄了一個基於RT-2模型的機器人智能閃現的瞬間:桌子上放著恐龍、鯨魚、獅子三個塑料玩具,工程師讓機器人“撿起滅絕的動物”,機器人拿起了恐龍。

這個案例很好的說明了人形機器人最大的變革:機器人不僅能識別三種動物,也能理解“滅絕的動物”的含義,還可以完成具體的操作。

基於RT-2模型的機器人

也就是說,兩者的核心區別在“智能”。判斷機器人的智能化程度,不是看它會不會前後空翻大劈叉,而是能不能像人一樣思考。

和大模型訓練一樣,讓機器人擁有思考能力的過程,同樣是對資料的消耗——換句話說就是刷題。

人工智慧泰斗級人物李飛飛曾對演算法的訓練過程有一個形象的解釋:讓演算法不斷觀察包含貓和其他動物的圖片,在每張圖片背後寫下正確答案。電腦每看一次圖片,就和背面的答案核對一次。只要次數夠多,演算法就能學會辨別貓。

但問題是,寫好答案的圖片並不是現成的。

和GPT等大模型爬取網際網路資料不同,機器人會和真實世界產生互動,因此需要遵循物理規則的真實資料來訓練演算法。但如果用真人動作捕捉來訓練,不僅成本高,也容易坐實“AI奴役人類”的地獄笑話。

之中的資料空白,就成為了模擬資料的實踐空間。所謂模擬資料,可以簡單理解為在虛擬空間建構遵循真實世界物理規則的場景,並輸出為可以被用來訓練的資料。

馬斯克就是模擬資料的鐵桿粉絲,2021年的特斯拉AI Day,馬斯克曾公開過自家資料模擬技術,當時生成並投入訓練的模擬資料規模就已經達到了37.1億張圖片和4.8億標註[2]。xAi最新發佈的Grok 3,也投喂了大量模擬資料用於訓練。

自動駕駛尚且可以蒐集車主真實的行駛資料用於訓練,機器人尚未大規模投入應用,對模擬資料的需求更為迫切。

真實資料和模擬資料就像“五年高考”和“三年模擬”,一個是真題,一個是模擬題。真題的參考價值更高,但數量有限,模擬題量大管飽,但參考價值要看它與真題的相似程度。

至此,輝達湊齊了人形機器人開發“三大件”——超級電腦DGX(訓練算力)、融合了Cosmos的模擬平台Omniverse(訓練資料)、終端晶片Jetson Thor(推理算力)。

除了沒下場造機器人,能幹的活基本全幹了。

物理騙術和算力遊戲

在虛擬世界建構物理規則這件事上,輝達的積累恐怕比大部分人想像的深厚。

一項技術的應用並不取決於技術本身,而是能否繫結一個高商業價值的場景,實現自我造血的良性循環。在機器人和自動駕駛大規模產業化之前,最匹配這項技術的輝達的老本行:遊戲。

大多數遊戲都是對現實世界的模擬,但虛擬世界並不遵循現實世界的物理規則,小到遊戲世界草木樹葉飄動的方向、服裝布料的褶皺,大到刀劍揮砍的力度和反饋效果,都會影響遊戲的“沉浸感”。

一種改進思路由此產生:為什麼不用物理公式計算物體的即時運動狀態、設計運動軌跡呢?

當時,一家名叫Ageia的初創公司開發了物理引擎PhysX,通過對遊戲畫面中的物體做“受力分析->代入運動方程->更新位置資訊->輸出”的即時循環計算[3],讓遊戲中的場景儘可能貼合真實世界的物理規則。

由於PhysX需要消耗大量算力,Ageia還專門開發了配套的硬體PPU(Physics Processing Unit)專門負責物理運算。可惜PPU銷量慘淡,Ageia瀕臨倒閉,黃仁勳騎著白馬就來了。

收購完成後,輝達干的第一件事就是砍掉PPU產品線,將PhysX的計算工作交給自家的GPU,並推出針對遊戲開發的軟體工具箱PhysX APEX,降低使用門檻。

由於PhysX的特性是對物理規則的模擬和模擬,此後幾年,輝達還推動了PhysX在醫療手術、影視特效等工業場景的應用。

2019年,輝達在GPU架構中引入RT核心,推出了光線追蹤功能。

和PhysX類似,光線追蹤的核心同樣是對真實物理規則的模擬——根據物體和光源、障礙物間的相對位置,即時計算出光線反射至人眼的狀態[4],每束光線的即時計算結果組合成一幀的畫面,讓輝達狠狠秀了一把算力的肌肉。

伴隨自動駕駛、人形機器人這些新產業的出現,“在虛擬世界模擬物理規則”的需求也越來越大。

Cosmos和Omniverse等軟體工具的出現,相當於輝達給人形機器人建了個可以沉浸式訓練的“健身房”,接下來就可以賣“私教課”了——你看我的晶片怎麼樣?

輝達的野心

過去二十年,輝達的經營思路可以用一句話來概括:讓高性能計算不斷覆蓋高價值的場景。

GPU是高性能計算的載體,也是輝達的核心產品。2010年之前,雖然一些學者已經開始使用GPU訓練神經網路,但GPU對應的高價值場景其實只有遊戲一個。

按照黃仁勳的說法,遊戲市場“既代表著最棘手的技術難題,又具備驚人的市場規模,同時擁有這兩個特質的市場非常罕見。”

輝達開拓的第一個新場景是移動裝置。2013年小米3發佈,處理器採用高通驍龍800和輝達的Tegra系列混搭,是輝達切入手機市場,開闢顯示卡之外第二戰線的絕佳機會。

當時,英文不好的雷軍和中文不好的黃仁勳罕見同台,黃仁勳現場還當了一回米粉。

小米3發佈會,2013年

可惜Tegra晶片因為製程和外掛基帶問題,能耗失控發熱嚴重。輝達的移動業務此後也未見起色,Tegra系列只能在任天堂Switch上發揮餘熱。後來黃仁勳去台大演講,稱輝達“主動放棄”了智慧型手機市場。

第二個場景是自動駕駛。最先吃螃蟹的是特斯拉,Model S/X都曾搭載過輝達的方案。黃仁勳也從米粉變成特斯拉車主,跟馬斯克如膠似漆。

黃仁勳在社交媒體上分享自己的Model X

雖然特斯拉後來用自研方案替代了輝達,但有了榜樣的力量,輝達還是順利打入造車新勢力內部。不過汽車業務在輝達的版圖中遠不如遊戲和資料中心耀眼,營收佔比幾乎從未超過5%。

第三個場景是人工智慧。ChatGPT的橫空出世讓輝達徹底打開收入天花板,電腦視覺、大語言模型等前沿電腦科學統統都離不開輝達的晶片,也讓後者成為了全球市值最高的半導體公司。

2016年,馬斯克作為OpenAI董事長簽收輝達DXG-1

第四個場景就是人形機器人,以及更加廣闊的“物理AI”。按照黃仁勳的說法,“我們正處於生成式人工AI階段,將走向智能體AI時代,隨後是物理AI時代。”

而在具體思路上,輝達不僅提供晶片,還會開發對應的軟體工具箱和配套服務。換句話說,輝達不僅賣鏟子,也提供全套的保養工具和防護裝置,但必須搭配輝達牌的鏟子。

在遊戲業務裡,光線追蹤、DLSS等功能必須搭配輝達的GPU使用;類似的邏輯,輝達不僅向大模型和雲端運算公司出售GPU,還會提供NVLink這類通訊連接方案、CUDA程式設計平台與之牢牢繫結。

隨著今年GTC演講結束,Cosmos、Newton等軟體和模型的發佈,一個圍繞GPU與“物理AI”的收費站也宣告落成。

如果黃仁勳中文水平夠高,多少也得來一句“輝達不造機器人,幫助機器人公司造好機器人”。

參考資料

[1] 未來簡史,尤瓦爾·赫拉利
[2] 萬字長文詳解特斯拉自動駕駛體系,自動駕駛之心
[3] 給我一個物理引擎,我也能“預測”世界盃?中科院物理所
[4] “光線追蹤”雜談,電子報
[5] Unimate 機器人:工業自動化的起源,AGV (遠川科技評論)


最近長文
關於鉅亨號
「鉅亨號」是《Anue鉅亨網》以AI 大數據和推薦引擎所推出具影響力的自媒體社群平台,從投資理財為主題擴展到金融財經、房地產、汽車、數位虛擬貨幣、影音視頻及Podcast的數位生活圈。讀者可透過一面牆及個人化功能關注一天的大小事;對創作者而言更是一個直接能與1,000萬用戶互動的舞台。
最好用的投資平台,幫你找到最適合自己的標的
看真實的投資分享文章,跟隨達人腳步取得最佳利益
多元投資社群平台,掌握最新市場動態熱門議題