端到端大模型的火爆,催化了新一輪智駕革命,也加速智駕晶片的產品和技術演進。
上周舉辦的科技創新日,蔚來發佈智駕領域最新世界模型(NIO World Model,以下簡稱NWM),超越端到端模型部署,號稱具備空間理解和時間理解的雙重核心能力。
官宣流片成功的智駕晶片神璣NX9031,則是為蔚來世界模型量身設計。神璣NX9031是蔚來自研的全球首顆5納米智駕晶片,按照蔚來的說法,一顆晶片相當於四顆業界旗艦晶片的性能(輝達Orin X)。
過去兩年,智駕晶片是車企重點破局的產品方向,蔚來和小鵬都在自研,理想的佈局稍微晚一些。以龍鷹一號為基礎,吉利旗下的芯擎科技也在自研的道路上走了多年。
李斌曾公開表態,去年蔚來購買了很多輝達晶片,耗費公司不少錢,考慮到採購成本,公司決定轉向自研晶片。官方的說法是,神璣NX9031大概一年左右可以回本。
自研晶片有很多理由,但目前晶片成功流片的“蔚小理”們,耗費巨資的目的之一,都是為了擺脫輝達的束縛。從業界報導的資訊看,大家自研的晶片都頗具前瞻性,將與智駕“端到端”等最新趨勢相匹配。
不過,“圍剿”輝達的中國陣營,不止“蔚小理”。本土晶片供應商今年也“捲入”端到端的競賽,上個月結束的中國汽車論壇上,地平線總裁陳黎明明確表態,端到端是目前通往自動駕駛終局的唯一可行方案。
愛芯元智車載事業部副總裁逯建楓認為,高階智駕的端到端化是必由之路,晶片設計周期和研發周期比較長,愛芯元智的戰略,是跳過其他模式,目前重點針對One Model模式來做,即佈局類似UniAD的技術架構來實現NPU設計。
從行業層面看,外采的高成本,不確定的國際形勢,以及此前特斯拉自研晶片嘗到的降本甜頭,都影響中國車企的晶片戰略和供應模式。
而端到端大模型的火爆,不僅催化了新一輪智駕革命,也加速智駕晶片的產品和技術演進。這不僅對車企自研晶片提出更高的要求,也倒逼紅海中的晶片供應商加速內卷。
車企為何自研?
一是,掌握核心技術,確保供應安全,不被供應商、特別是國外強勢供應商“卡脖子”。
李斌在接受媒體採訪時表示,晶片供給的國際影響,由於美國的限制,其實對中國的汽車行業已經形成了實際影響。
“我們在雲端的訓練晶片,去年10月以後,無法用到全球最先進的晶片。智駕團隊不光看雲端的能力,也看群體智能的能力,端側推理晶片目前風險不大,但也要應對各種變化。”
二是,定製化。
業內專家告訴《汽車公社》/《C次元》,造車新勢力自研智駕晶片,主要有幾個重點考量。其中之一,是提升產品競爭力,有差異化,自研晶片有利於自訂功能。
對於汽車製造商來說,自研晶片耗資巨大,但可以減少海外晶片供應依賴,雞蛋不用放在一個籃子裡。當然,自研的晶片,和自家演算法也能更匹配,這涉及演算法和晶片平台的耦合度問題。
過去,特斯拉144TOPS算力性能可以優於市面上400-500TOPS算力晶片,計算效率高,主要原因之一,這是針對特斯拉自己演算法設計。值得一提的是,特斯拉早在2019年發佈的144TOPS算力晶片(Autopilot HW3.0),至今依然能支援智駕端到端落地。
三是,降低成本。
蔚來李斌在發佈會上表示,去年購買了很多輝達晶片,耗費公司不少錢,為此,蔚來決定轉向自研晶片,一顆晶片可以頂採購輝達四顆,能降低成本。按照李斌的說法,神璣NX9031大概一年左右可以回本。
還有其他維度的考量。
業內人士表示,宣傳自研晶片,對外界進行承諾,立公司科技屬性的flag,可以對二級市場和品牌有正向作用。此外,自研晶片的確能帶來系統體驗的有效提升,戰略目的才能達成。
當然,更早一步佈局的特斯拉,當時自研晶片的理由非常樸素,即增加算力,讓方案更靈活。
據報導,小鵬自研智駕晶片的處理程序和緊跟蔚來,現階段已經送去流片,預計可在8月回片。
理想啟動晶片自研處理程序相對較晚,智駕晶片項目代號為“舒馬赫”,預計同樣在今年內完成流片。
“是手段,而非目的”
在輝達掌舵自動駕駛業務的吳新宙提出,自動駕駛發展可以歸納為三個階段,端到端是自動駕駛的最後一步。
第一階段,完全基於規則;第二階段,AI大模型慢慢取代人工規則,完成預測和規劃;第三階段,是徹底的端到端大模型,AI可以貫穿從感知到決策的全過程。
在自動駕駛的第三階段,智駕晶片頗具挑戰。愛芯元智車載事業部副總裁劉繼鋒,表達了同樣的思考,在他看來,真正的端到端,雲端用大模型進行訓練和驗證,訓練的結果做推理,落地到車端,晶片公司將肩負重任。
在地平線看來,端到端是手段,而非目的,體驗擬人、計算高效和交付敏捷,三者缺一不可。
端到端方面的積累,晶片公司需要從演算法迭代、工程基礎建設和軟硬結合能力三方面發力。其中,軟體和演算法扮演了核心作用。
地平線演算法平台總架構師穆黎森認為,端到端的本質能力,在於資料迭代。看上去,這是一種前瞻性的模型結構,但背後的資料迭代更為重要,能支援實驗室技術,或是論文層面的演算法,最終達到產品級的成熟度。
陳黎明也曾坦言,目前地平線遇到的困難,是很多車型和感測器的架構、感測器的佈置和採用等都在不斷變化。
雖然收集了很多資料,但這些資料不是高品質積累、且能持續使用的,這不是某家企業能解決的問題。
“特斯拉FSD V12.3版本,用了一千萬個樣本視訊訓練自動駕駛,這裡的一千萬個樣本,是從100億個樣本裡面提取出來的高品質資料,中國遠遠不夠。而且,100億的資料基於標準感測器的框架下收集,它有延續性,可以繼續用來訓練最新模型。”
還需要其它維度的護城河。
和地平線一樣,愛芯元智也多次強調只做Tier 2。該公司認為,端到端演算法對於智駕晶片的關鍵需求,主要有兩個,高記憶體、和多核大算力。
而要實現端到端自動駕駛,離不開關鍵的計算晶片的支援,包括架構的創新、核心IP的突破以及在性能上的飛躍。
地平線穆黎森則告訴《汽車公社》/《C次元》,端到端算力競爭的技術門檻,主要在於能否適應模型結構變遷帶來的算力需求,以及算子側重點的改變。
一方面,模型會變大,算力也會變大;另一方民,模型結構會變遷,以前CNN(摺積神經網路)為主,端到端基本上以Transformer為主。
“Transformer是大類演算法,用在大語言模型(如Chat GPT),或是智駕端到端,算子側重點略有不同。自動駕駛的端到端,除了基礎的矩陣運算等,都需要做算子支援,提出更高要求。”
還有華為系的勢力。
即使智駕晶片被輝達佔據高地,中國依舊有一個龐大的群體,被華為賦能,如問界、阿維塔、極狐以及智界等品牌。旗下車型的智駕系統,大部分使用了華為MDC810/MDC610計算平台。
伴隨著智駕晶片供應商的發力,以及蔚來們自研晶片加速落地,未來幾年,從車企陣營到供應商陣營,中國智駕晶片“不受制於輝達”的願望,將慢慢部分實現。 (C次元)