輝達重新定義自動駕駛


Cosmos世界基礎模型降低了實體AI的開發門檻,而DRIVE Hyperion平台正在拉高自動駕駛的上限。一個完全自動駕駛的時代正被以輝達為首的科技公司推動加速到來。

輝達在2024年掀起了一場AI風暴,不僅市值超越蘋果、特斯拉站上了世界之顛,也讓他的創立者黃仁勳一直處於暴風眼的中心。

世界願意傾聽他對未來世界的判斷與預言。

在2025年年初CES的開幕演講中,黃仁勳斷言:

「機器人技術的ChatGPT時刻即將到來。」

他總結說AI的發展經歷了三個階段:

初始階段是感知式AI,即理解圖像、文字和聲音;

之後是生成式AI,可以創造文字、圖像和聲音;

現在,我們正在進入物理AI的時代,即能夠運行、推理、計畫和行動的AI。這為包括自動駕駛汽車、遊戲、機器人在內的多個行業帶來了突破性發展。

機器人和智駕是黃仁勳認為物理AI的兩大應用場景。

皮衣愛好者老黃在2025年一手推開了物理AI的大門。

▲圖源:NVIDIA

相較於AI算力最高可達2375 TOPS的RTX 50系列GPU,全新物理AI模型Cosmos的推出有望迅速彌合物理AI的數字鴻溝,而在智駕方面,這一模型為眾多落後一步的汽車企業和規模相對較小,資料擁有不足的智駕公司開發基於端到端的高階智駕方案提供了一款高效、強大的工具。

所謂物理AI模型是相對認知AI、理解語言的基礎模型GPT而言。

Cosmos平台由生成式世界基礎模型、高級tokenizer、護欄和加速視訊處理管線組成。最大的Cosmos模型參數規模大概140億(也就是14B),用2000萬小時的真實世界人類互動、環境、工業、機器人和駕駛資料訓練而成。

它將推動自動駕駛汽車(AV)和機器人等物理AI系統的發展。

不過,並非有了這個模型,就可以省去真實世界的資料。

這個方法仍然需要真實的司機收集資料,但數千個司機的資料完全能夠在簡單的命令下產生數十億公里的新資料。

▲圖源:NVIDIA

Cosmos的邏輯是先投入大量資源,先打造一個靠譜的世界模型(透過大量圖像、音訊、視訊和文字資料訓練,讓機器對世界運作方式能夠進行推理),然後部分結合現實司機駕駛資料,與Omniverse數字孿生相關的各種資源結合,最終產生幾何倍數於真實資料的虛擬駕駛資料。

Cosmos與Omniverse合作,可以將兩個系統連接,形成物理落地的基礎框架,從而控制生成過程,成為未來機器人產業發展的關鍵起點。

也就是說一家年銷量僅有幾萬台車輛的主機廠一樣可以實現幾十萬台車輛的資料。

「與大語言模型一樣,世界基礎模型是推動機器人和自動駕駛汽車開發的基礎,但並非所有開發者都擁有自主訓練模型所需的專業知識和資源。我們建立Cosmos是為了普及物理AI,讓每一位開發者都能接觸到通用機器人技術。

這對於在中國市場在高階智駕領域佈局起步均晚一步的合資品牌以及高階智駕開發者無疑都是一大福音:既可以降低開發成本,又可彌補資料量的不足。

黃仁勳在談及推出Cosmos的原因時提到:

「隨著基礎AI的不斷改進,業界也意識到,推動人工智慧發展的關鍵是實體人工智慧。物理AI同樣需要基礎模型,正如認知AI依賴基礎模型一樣,GPT-3開啟了強大能力的新篇章。

「那麼,我們能用這個模型做什麼?自動駕駛汽車需要理解物理世界,機器人也需要理解物理世界。因此,Cosmos這樣的模型是實現多模態的起點。」

簡單理解即是,Cosmos就是打通認知大模型和空間智能大模型的工具,最終推動VLA(視覺語言動作模型)的落實。

這對於智慧駕駛和具身智慧手機器人來說無疑都是一大突破。

▲圖片來源:Merca2.0

在2025年的CES上,媒體和資本的焦點都聚焦在了機器人身上,智駕的關注度似乎在下降。

不過在黃仁勳對於物理AI的定義之下,智慧汽車本質上已是實體AI的實用場景之一,或者說是自主機器的一個分支。 ‍‍‍‍‍‍‍

而事實上短期可以窺見利潤和應用前景的恰恰是智慧駕駛,具身智慧從技術成熟到商業模式落地還需要時間。

談到2025年的技術創新時,黃仁勳表示:

「未來所有的交通工具都會具備自動駕駛能力,或至少能夠實現自動化操作。五年前,關於技術的成熟度我們還不確定。但現在可以非常肯定,感測器技術、電腦技術和軟體技術已經非常成熟,我們將能夠實現這一目標。

外界對於輝達近年來在智駕市場的表現一直有不同看法。

一是雖然市場份額一直維持在40%以上,但沒有吃到智駕市場的紅利,智駕領域的收入只佔其總收入的不到2%,二是具有革命意義的Thor晶片一再跳票,而在全球最大的智駕市場中國正面臨來自本土科技公司地平線、黑芝麻的激烈競爭,而英特爾、高通也在進入其領地,提供更具性價比的方案。

不過自2015年輝達正式佈局智駕業務始,在第十個年頭圍繞自動駕駛的實現路徑,輝達在雲端、軟體側、工具煉等方面都進行了全方位、多角度的佈局,甚至在安全驗證方面都已有了相對成熟的方案。

今天的輝達在智駕行業的角色早已不僅僅是車端算力平台的提供者,更是通過從雲端訓練到車端推理的一系列的整體佈局,實現了對自動駕駛行業的底層賦能。

在2025 CES上,跳票經年的Thor終於有了明確的量產交貨時間——今年上半年。

▲圖來源:NVIDIA 直播截圖

輝達在CES展示了基於Thor打造的全新自動駕駛汽車平台NVIDIA DRIVE AGX Hyperion。

DRIVE Hyperion被稱為業界首個也是唯一一個端對端自動駕駛平台,它包括DRIVE AGX系統級晶片(SoC)、參考板設計、NVIDIA DriveOS汽車作業系統、感測器套件以及主動安全和L2+ 駕駛堆疊。

NVIDIA DriveOS軟體平台則包含了建構、偵錯、分析和部署自動駕駛汽車和自動駕駛汽車應用程式所需的所有軟體、庫和工具,能夠令車企快速推進自動駕駛技術的研發和應用。

目前,DRIVE Hyperion已通過兩家業內權威的汽車功能安全和網路安全認證評估機構-TÜV SÜD和TÜV Rheinland的行業安全評估。

黃仁勳表示,梅賽德斯-奔馳、捷豹路虎、沃爾沃汽車等都已開始部署該平台。

採用模組化設計的DRIVE Hyperion平台,使用者可以方便地按需選用他們所要的功能,該平台同時具有可擴展性,可升級並相容於未來各代DRIVE系統級晶片。

依照黃仁勳的預測:

「全球約有十億輛汽車,每年的總行駛里程可達數億英里。自動駕駛汽車是最大的機器人市場之一,隨著該市場的興起,NVIDIA Blackwell驅動的平台將推動這場變革進入快車道。

NVIDIA DRIVE背後有三個關鍵運算平台:

NVIDIA DGX平台用於在資料中心訓練基於AI的堆疊;

運行在NVIDIA OVX平台上的NVIDIA Omniverse平台,用於模擬和合成資料的生成;

車載計算平台NVIDIA AGX,用於處理即時感測器資料以實現安全駕駛。

目前Cosmos已經加入到上述三個計算平台方案之中,輝達表示,對於開發者將獲得一個資料飛輪,它能將數千英里的人類駕駛里程轉化為數十億英里的虛擬駕駛里程,從而提升訓練資料的品質,從而加速端到端自動駕駛汽車開發和大規模部署。

NVIDIA全球副總裁,汽車事業部負責人吳新宙表示,隨著開發人員利用生成式AI的進步成果,自動駕駛車輛(AV) 的性能將變得更加強大。

是的,面向乘用車市場的自動駕駛終於將走進現實。

▲圖來源:NVIDIA 直播截圖

在與輝達最新合作的汽車廠商名單中,豐田已明確採用輝達DRIVE AGX Orin平台打造下一代汽車,並運行DriveOS作業系統。

在L4方面,Aurora、大陸集團和NVIDIA三方已宣佈建立戰略合作夥伴關係,運行DriveOS的NVIDIA加速計算平台將整合到Aurora Driver中,大陸集團已計畫在2027年量產L4級自動駕駛系統。

Cosmos世界基礎模型降低了實體AI的開發門檻,而DRIVE Hyperion平台正在拉高自動駕駛的上限。

建構實體AI模型需要數PB(petabytes)的視訊資料以及數萬小時的計算來處理、整理和標記這些資料。

而Cosmos世界基礎模型使開發者能夠輕鬆生成大量基於物理學的逼真合成資料,以用於訓練和評估其現有的模型,他們還可以通過微調Cosmos WFM建構自訂模型。

Cosmos世界基礎模型的應用,一方面可以節省大量時間,提升研發效率;另一方面可以明顯減少經濟成本的投入,官方資料顯示,開發者能夠使用NVIDIA Blackwell平台在14天內處理、整理和標記2000萬小時的視訊,如果單純使用CPU,則需要3年以上。

而NVIDIA DRIVE端到端自動駕駛汽車開發平台已成為自動駕駛技術研發領域的天花板級的平台之一。

▲圖源:NVIDIA

輝達在智駕領域已打造了一個工具齊全的「廚房」。

而這註定將改寫由中國智駕供應商主導的自動駕駛市場,關於L3落地的頭牌之爭,生成式AI已經給了這個行業更多的想像空間,一個完全自動駕駛的時代正被以輝達為首的科技公司推動加速到來。 (智慧型駕駛網)