#L4自動駕駛
輝達開源最新VLA,能否破局L4自動駕駛?
隨著大模型深度融入汽車行業,行業競爭正從功能實現轉向高階智駕能力的比拚,而VLA(Vision-Language-Action Model,視覺語言行動模型)被視為下一代技術競爭的關鍵變數。圖片由AI生成當地時間12月1日,輝達(NVIDIA)宣佈正式開源其最新自動駕駛“視覺—語言—行動”(VLA)模型 Alpamayo-R1,該模型能夠同時處理車輛攝影機畫面、文字指令,並輸出行車決策,已在GitHub和Hugging Face平台開源,並同步推出Cosmos Cookbook開發資源包。這是行業內首個專注自動駕駛領域的開源VLA模型,輝達此舉旨在為L4級自動駕駛落地提供核心技術支撐。值得注意的是,輝達Alpamayo-R1相較於傳統黑盒式自動駕駛演算法,主打“可解釋性”,能夠給出自身決策的理由,有助於安全驗證、法規審查與事故責任判定。而輝達同時發佈“Cosmos Cookbook”等配套工具,能夠支援企業和開發者快速訓練、評估與部署。業內認為,輝達試圖通過開放核心技術,降低自動駕駛開發門檻,加速軟體棧標準化,打破原來Robotaxi昂貴的“全端自研”模式,從而轉變為可快速組裝的“Android式”生態。不過也有業內人士向筆者表示,此次輝達Alpamayo-R1開源與百度Apollo開源類似,對自動駕駛領域的入門選手來說有價值,但對專業公司來說意義不大。目前,VLA正成為智能駕駛領域公認的下一代核心技術,相關企業都在加碼佈局。國內理想汽車、小鵬汽車、長城汽車(已搭載於魏牌藍山)、元戎啟行等都已在VLA上實現量產落地。解決傳統“端到端”模型痛點傳統的端到端模型像一個“黑盒”,可能“看得見但看不懂”,在面對違規左轉、行人闖入等長尾場景時容易“翻車”。而相較於傳統“端到端”模型,VLA通過引入語言模態作為中間層,將視覺感知轉化為可解釋的邏輯鏈,從而具備了處理長尾場景和複雜突發狀況的潛力,讓機器像人類一樣“觀察、推理、決策”,而不僅僅是海量資料的簡單對應。自動駕駛領域的VLA(視覺-語言-動作)大模型,代表了將視覺感知、語言理解與決策控制深度融合的技術方向。它能直接輸出車輛的駕駛動作,其核心好處是,讓機器有了更強的環境理解與推理能力、更高效的一體化決策、更強大的長尾場景應對、更透明的人機互動與信任建構、更自然的車控方式等。此次輝達開放原始碼的VLA模型Alpamayo-R1,基於全新的 “因果鏈”(Chain of Causation, CoC) 資料集訓練。每一段駕駛資料不僅標註了車輛“做了什麼”,更註明了“為什麼這樣做”。例如,“減速並左變道,是因為前方有助動車等紅燈,且左側車道空閒”。這意味著模型學會的是基於因果關係的推理,而非對固定模式的死記硬背。同時,基於模組化VLA架構,輝達Alpamayo-R1將面向物理人工智慧應用預訓練的視覺語言模型Cosmos-Reason,與基於擴散模型的軌跡解碼器相結合,可即時生成動態可行的規劃方案;以及多階段訓練策略,先通過監督微調激發推理能力,再利用強化學習(RL)最佳化推理質量——借助大型推理模型的反饋,並確保推理與動作的一致性。輝達公佈的資料顯示:Alpamayo-R1在複雜場景下的軌跡規劃性能提升了12%,近距離碰撞率減少25%,推理質量提升 45%,推理-動作一致性增強37%。模型參數從0.5B擴展至7B的過程中,性能持續改善。車載道路測試驗證了其即時性表現(延遲99毫秒)及城市場景部署的可行性。也因此,輝達Alpamayo-R1有望給L4自動駕駛帶來能力的躍遷,Robotaxi有望安全地融入真實、混亂的公開道路。成為自動駕駛賽道的“Android”從這次開源Alpamayo-R1,可以再次看出輝達在自動駕駛領域的野心,已經不滿足於只是“硬體供應商”,而是要做成自動駕駛賽道的“Android”。其實,早在今年10月份,輝達就對外低調發佈了Alpamayo-R1大模型。而在華盛頓GTC大會上,輝達發佈了自動駕駛平台——NVIDIA DRIVE AGX Hyperion 10。Hyperion 10被認為是輝達自動駕駛的“身體”,而Alpamayo-R1則是自動駕駛的大腦。值得注意的是,Hyperion 10實現了“從模擬到實車”的閉環:在雲端,DGX超級電腦使用DRIVE Sim生成高保真模擬資料,用於訓練DRIVE AV模型;在車端,Hyperion 10的感測器資料與Thor晶片無縫對接。因此,如果一家車企想快速推出具備L4級能力的車型,不需要再分別組建龐大的硬體整合、軟體演算法和資料訓練團隊,採用輝達的整套方案可以快速實現上車。同時,輝達也在建構一個“Android式”的Robotaxi生態,並對外公佈了明確的落地時間表:2027年起部署10萬輛Robotaxi。目前,輝達已宣佈與Uber、奔馳、Stellantis、Lucid等公司合作,共同打造“全球最大L4級自動駕駛車隊”。截至2025年10月,輝達的雲端平台已積累超過500萬小時的真實道路資料。輝達的入場,正在將Robotaxi的競爭從單一的技術比拚,引向生態模式的對決。封閉模式除了導致重複的研發投入,更深刻的弊端是形成了“資料孤島”。Waymo的美國道路經驗難以惠及中國車企,每個玩家都在獨立而緩慢地跨越技術曲線。輝達的開放生態,有機會在確保資料隱私和安全的前提下,推動生態內玩家共享經過匿名化處理的特徵資料。例如,A車企在特定路口遇到的極端場景資料,可以轉化為脫敏後的訓練特徵,幫助B車企的模型更快地識別類似風險。如果輝達能夠成為自動駕駛領域的“Android”,將有望帶動整個生態的技術迭代速度從線性轉變為指數級提升。這不僅是技術共享,更是成本共擔。共同應對長尾場景這一行業最大難題的邊際成本,將隨著生態的擴大而持續降低。元戎啟行CEO周光預測,VLA帶來的可能是 “斷層式的領先”,並成為下一代競爭的關鍵變數。DeepWay深向CTO田山告訴筆者,VLA是目前自動駕駛行業非常火的一項技術,研究者眾多,能極好地提高自動駕駛模型的泛化能力及推理能力,輝達開源Alpamayo-R1,使得這項很火且很有前途的自動駕駛技術有更多的人可以參與研究並做出貢獻,能積極推進VLA技術的發展和落地,而這項技術也能應用在具身智能等物理AI的場景中。隱形門檻仍在前方不過,Alpamayo-R1目前要滿足車規級時延,還需要在RTX A6000 ProBlackwell等級的卡上運行——這張卡的INT8算力高達4000T,是Thor的6倍左右。輝達的商業模式決定了,其開源是為了更好地銷售其硬體和全端解決方案。Alpamayo-R1模型與輝達的晶片(如Thor)及開發平台(如Drive)深度繫結,能實現更高的算力利用率。這意味著,選擇輝達生態在獲得便利的同時,也意味著在核心算力上與其深度繫結。另外,DeepWay深向CTO田山向筆者指出,VLA是不是最佳的自動駕駛技術,目前還在實踐過程中,而Alpamayo-R1模型工具鏈基於輝達的平台,對很多開發者來說也是一種限制,所以也有很多其他的技術和其他的計算平台在推進自動駕駛技術發展。在田山看來,多數公司應該更聚焦技術落地,也就是技術的工程化實現,解決實際場景的問題,早日實現智駕技術的商業化閉環更有益於行業的長久健康發展。此外,L4自動駕駛的落地或者說Robotaxi的規模化商業化,還與政策與法規息息相關。同時,如何在合規框架內營運、如何通過安全評估、如何在資料利用與隱私保護間取得平衡,這些能力的重要性,並不亞於技術本身。輝達的黃仁勳一直將Robotaxi視為“機器人技術的首個商業化應用”,輝達一直要做的不是一輛無人計程車,而是讓所有玩家都能做出無人計程車的技術底座。如今,他正試圖通過開源VLA,為這個應用打造一條可以快速複製的生產線。但最終能否通過開源降低准入門檻,加速推動L4自動駕駛到來,讓技術的潮水湧向更廣闊的商業海岸,輝達Alpamayo-R1模型的開源,只是遊戲的開始,後面還有門檻要邁,還需要市場來驗證。 (鈦媒體AGI)
【上海車展】全球首輛!全球首款L4智駕來了,實現無條件完全自動駕駛?
上海車展如火如荼、人頭攢動,但今年的王炸只有一個——智能駕駛或說自動駕駛!而最讓人意外和驚喜的無疑是廣汽了。在2025年上海國際車展上,廣汽埃安與滴滴自動駕駛強強聯合,推出全球首款具備全球適應能力的前裝量產L4 高度自動駕駛車。這裡需要稍微解釋一下什麼叫“前裝”,就是從產線誕生的原生自動駕駛車,這與許多“後裝改裝”是完全不同的。為了達到L4級自動駕駛的安全要求,廣汽在該款前裝量產L4自動駕駛車搭載了33個感測器,比業界平均20個感測器的水平超出65%。同時,足足用了10顆光達,包括4顆長距雷達與6顆補盲雷達,最遠探測範圍200米,更是將最近探測距離由行業目前的30釐米升級至10釐米,實現360°無死角覆蓋,啟動時就算近距離跑來個小貓也能及時預判。另外,也首次搭載紅外線感測器,能夠透過溫度感知生命體,漆黑的雨夜馬路上穿梭的小動物也能精準辨識。廣汽為了實現L4級自動駕駛確實「堆料」誠意十足,再結合滴滴自動駕駛全新一代L4軟硬體技術方案和多維度安全冗餘體系,確實有望成為全球第一台L4全球車型。那實現L4級智駕,是不是可以無條件的完全自動駕駛呢?根據國際汽車工程師協會( SAE International )的劃分,將自動駕駛分為從L0到L5的六個等級。每個等級代表技術的逐步提升:L0至L5,從無自動化到完全自動化,每個數字背後都蘊藏著科技的飛躍。其中,L4為高度自動駕駛,也就是在預先設定的運轉條件內(如特定區域、道路類型、速度範圍、天氣條件等),車輛可以完全自主完成所有駕駛操作(轉向、加速、煞車、變換車道等),駕駛者無需監控系統或隨時接手。如果超出預設的運作條件(如極端天氣、未測繪區域等),系統會要求人類接管,但若駕駛未回應,車輛會採取安全措施(如靠邊停車)。也就是說,除非是特殊情況情況,L4級智駕已經可以做到完全自動駕駛了。因而,業界通常認為只有L4、L5級智駕才是真正的自動駕駛,其他都是輔助駕駛。也就是說,如果廣汽年底按時量產交付的話,意味著全球智駕第一次來到真正的無人駕駛。為了打消疑慮,廣汽同步承諾,廣汽將為未來L4車款的自動駕駛安全擔負兜底!這也是改變規則一個重大承諾,此前我們知道車輛發生事故,從責任認定上通常都是當事人承擔最大的責任,但廣汽將責任兜底。這意味著自動駕駛事故責任全面進入「車企全擔」時代。當然,除了廣汽之外,特別值得一提的是4月22日發佈的華為干昆ADS 4.0系統。據瞭解,該系統已率先通過工信部認證,支援駕駛員在高速公路場景下完全脫手,車輛能自主完成變換車道超車、匝道匯入等操作,最高適用時速提升至130km/h,雷射雷達與毫米波雷達融合感知方案,實現200米內障礙物識別精度達±5cm ,極大地提升了駕駛程度的便利性與智能化。有趣的是,廣汽傳祺在上海車展上發表了與華為干昆聯合打造的「雙智旗艦」傳祺嚮往S9與M8干昆系列,成為全球首批搭載華為干昆智駕ADS 4系統的車型。如此看來,廣汽2025年在智駕上確實是全面開花了。當然,除了廣汽之外,今年比亞迪、吉利、奇瑞以及新勢力的小鵬、理想、小米也都在「智駕」領域集中發力。因此,廣汽L4的量產不僅是技術突破,更是中國智慧汽車產業從跟隨到引領的轉捩點。當特斯拉執著於純視覺的全球化擴張,華為深耕多感測器安全壁壘,比亞迪掀起智駕平權革命,小鵬打磨使用者體驗細節,這場競賽已超越單車技術的範疇,演變為生態體系的全面對抗。在生態全面對抗中,中國智駕正從參與者蛻變為規則制定者。 (飆叔科技洞察)