伴隨著AI大模型的快速上車,作為汽車大腦的晶片,也迎來了新一輪全面升級。
在輔助駕駛晶片領域,輝達Thor正式上車,今年5月起,第一批搭載輝達Thor U的新車開啟交付,包括理想L8、領克900等。雖然這款晶片並非“頂配版”Thor,屬於其衍生版中的中低配,但單顆算力仍高達700TOPS,是目前主流的輝達Orin X算力(254TOPS)兩倍還多。
座艙晶片領域,當前的“天花板”高通8295(最大AI算力為60TOPS),也將很快淪為“上一代”產品。據悉,高通第五代座艙晶片明年量產,AI算力高達360TOPS,且將更好適配大模型。
根據摩爾定律,處理器的性能大約每兩年翻一倍,同時價格下降為之前的一半。以此判斷,車規級AI晶片算力即將全面進入千級時代。
然而,經歷過前些年盲目卷硬體的階段,很多人都已經意識到了,算力其實“啥也不是”。相比算力翻了多少倍,真正能對汽車智能化水平起到重大作用的,是晶片換代帶來的架構革新,企業的軟硬體適配能力,以及國產晶片的快速追趕。
拼算力,輝達無疑“遙遙領先”,其2022年發佈的Thor晶片最高算力可達2000TOPS。目前,業內主流的輔助駕駛演算法正在從“端到端+VLM”向VLA進階,Orin X的算力難以支撐結構更複雜,參數成倍增加的VLA模型,因此Thor等千級算力晶片,被視為實現高等級自動駕駛和車內AI功能的關鍵。
而強大算力背後更值得關注的是,輝達引入了最新一代GPU架構和Transformer加速單元,能夠將過去汽車中分散的多個電子控制單元(ECU)功能整合在一起,例如,高級駕駛輔助系統(ADAS)、泊車、駕駛員監控、數字儀表盤和座艙娛樂等。做個簡單的比喻,汽車可以和人一樣,由一顆“中央計算大腦”統管全身所有功能,即我們之前分析汽車電子電氣架構發展趨勢時提到的“One Brain”。
由此帶來的好處是,集中算力支援更複雜的汽車軟體和功能,同時減少線束,實現更高效的通訊,降低功耗和製造成本,提升車輛性能和智能化體驗。
不過,在Thor為汽車插上智慧的翅膀前,車企必須先跨過幾條“深溝”。業內專家指出,採用新GPU架構和Transformer引擎的Thor晶片,在計算單元和指令集上都有變化。這意味著此前基於Orin開發的演算法和中介軟體,都要跟著重構和最佳化。雖然輝達也會提供對應的工具,但整車廠的軟體工程師仍需重新調校參數、適配驅動,才能發揮Thor的全部性能。
此外,如上所述,實現One Brain不只是為汽車裝上一個聰明的大腦這麼簡單,車企必須打造出真正的中央集中式電子電氣架構,相當於是對全身的神經系統進行徹底改造。這對車企的軟體架構設計、即時性保障、故障隔離等都提出了更高要求。如果適配不當,可能出現系統調度混亂或安全隱患。
與此同時,輝達自己的問題也困擾著車企。一方面是Thor晶片技術上的複雜性,導致其研發和生產都遇到巨大挑戰。有消息稱,Thor此前多次“跳票”,可能就是因為遇到了功耗控制、發熱管理、可靠性驗證等技術瓶頸。
這直接影響了車企的新車計畫。多個品牌曾向水滴汽車表示:“原本旗艦車型研發時計畫直接使用Thor晶片,但因為延期,最終選擇了雙Orin-X配置”。理想汽車也表示,這款晶片對於i8的性能和智能化水平至關重要,因此新車的發佈時間不得不從一季度推遲到今年7月。
另一方面,輝達等美國晶片巨頭,一直被美國政府的對華政策束縛,動不動就要限製出口。這顆嚴重威脅供應鏈安全的“不定時”炸彈,讓包括主機廠在內的中國企業,不得不未雨綢繆,減少對美國先進晶片的依賴。雖然尋找替代的道路充滿艱辛,卻是必須要吃的苦。
消費者往往會被帳面參數“蠱惑”,前兩年汽車圈盛行卷硬體,晶片算力和雷射雷達數量是車企重點宣傳的產品點,實際不過是“差生文具多”,技術不夠硬體湊。
如今,科技平權,AI技術到了拼量產上車的時候,當年的迴旋鏢卻正中眉心,車企不得不推翻自己一手設計的“唯算力論”,為使用者樹立新的智能化技術標準。
多位汽車智能工程師都對筆者表達了相似的觀點,算力只是衡量晶片能力的一個指標,還有很多其他因素甚至比它還重要。
首先,晶片根據定位和使用場景的不同,考量標準本身就不一樣。比如輔助駕駛晶片,就側重異構計算與即時性,算力分佈以NPU(神經網路處理單元)/TPU(張量處理單元)為核心,時延、可靠性等都是關鍵指標。
智艙晶片則側重通用計算與多媒體,CPU(中央處理器)/GPU(圖形處理器)是核心,關鍵指標為多工處理能力、圖形渲染影格率、介面相容性等。
老話說“好鋼用在刀刃上”,對於晶片亦是如此,算力有沒有用在正地兒上,直接影響著實際能力。
其次,系統頻寬、性能功耗等指標也非常關鍵。芯馳科技CTO孫鳴樂表示,算力再高,系統頻寬跟不上,計算單元就無法充分發揮性能。他指出,許多現有座艙平台源自手機晶片設計,記憶體頻寬通常為64位,總頻寬約六七十GB/s,不足以支援大模型運行。
不久前,芯馳科技發佈了自研智艙晶片X10,CPU 200k DMIPS,NPU算力40TOPS,系統頻寬高達154GB/s。在多工平行時,高頻寬如同多車道的高速路,具備更靈活的調度機制,可有效利用算力。
一般情況下,算力越大功耗越高,這讓高算力的輔助駕駛晶片成了一把鋒利的雙刃劍。雖然技術進步會提升晶片的性能功耗比,但像Thor這樣的“艙駕一體”晶片,一定會對功耗控制提出更大挑戰。
有媒體估算,擁有千級算力的Thor晶片,總功耗可能高達數百瓦等級,需要更好的散熱條件。理想汽車曾提到,他們將採用更先進的冷卻方案,以適應更高算力的晶片。
最後,也是最重要的,千級算力能不能得到有效利用。對於車企來說,選擇一種晶片不僅取決於算力高低,還取決於它能否無縫融入自己的技術路線圖。僅從Thor來看,企業要做的磨合工作不輕,需要相當長的整合測試周期,去匹配軟體生態。
如今市場內卷嚴重,產品迭代速度堪比電子產品,企業有沒有足夠的時間和能力,讓Thor自上車起就發揮出應有的實力,答案其實大家都心知肚明。
典型案例便是2021年1月發佈的蔚來ET7,其搭載了四Orin平台,智駕算力高達1016TOPS,這一數字至今無人超越,然而功耗超過300瓦的智駕系統,最終只給使用者帶來了一個“耗電大戶”,以及二流的輔助駕駛體驗。這再次提醒我們:晶片再強大,若沒有配套的軟體與支援體系,也是渣渣。
事實上在工程師眼中,不存在高參數的先進技術,有的只是兼顧成本、效率和實際體驗的更優技術。站在使用者需求的角度,要是你需要的只是自動泊車等L2功能,10TOPS其實就夠了,高速NOA最好有100TOPS,到了城市NOA,再要求500TOPS以上。按需選擇,沒必要花大價錢交智商稅。
在內部與外部多重因素的共同作用下,這兩年中國國產晶片如雨後春筍般蓬勃發展,整車廠與上游供應鏈企業,都在集體發力,並且已經拿出許多極具競爭力的產品。
諸如小鵬汽車加快了自研圖靈晶片的步伐,將於第二季度上車,算力達到700TOPS,不輸Thor U。廠家介紹,圖靈晶片的計算能力較當前主流的輝達Orin X晶片組合方案提升3.2倍,功耗降低40%。更關鍵的是,其具備大模型承載能力,可支援本地運行300億參數神經網路。
蔚來甚至更早推出了自研的神璣NX9031晶片,並且已經隨著ET9實現量產,性能對標輝達旗艦晶片。
去年底放話要轉型AI公司的理想,也加入了這場競爭。最新消息稱,理想自主研發的5nm製程輔助駕駛晶片,已開始流片。企業還在積極招聘晶片和訓練叢集方面的人才,並在香港籌建專門的晶片研發辦公室。
造車新勢力成果初現,傳統主機廠和供應鏈企業更是你追我趕。吉利、比亞迪、奇瑞、長城等頭部大廠均已深度佈局車規級晶片賽道。華為自研的昇騰晶片能力碾壓同級,已是得到市場驗證的事實;跑在前面的地平線J6P,今年三季度量產上車;芯擎星辰一號、芯馳X10等一眾國產輔助駕駛晶片和智能座艙晶片,量產節點鎖定明年。
筆者粗略觀察,國產輔助駕駛晶片的算力最高已在500~700TOPS,由於很多是專為AI大模型設計的,與企業的自研演算法適配性更高,因此在車端的實際表現上,不輸國際巨頭。
相似性能,更低成本,是中國企業百試不爽的競爭策略,在晶片領域同樣適用。輝達晶片採購成本在整車成本裡佔比5%~8%,而車企自研晶片能讓成本降低30%~50%。
如今,我們在人工智慧演算法上已經走在了世界前列,L3自動駕駛和AI大模型上車也是勢不可擋。在巨大的應用前景面前,國產晶片必然能借勢而起。
隨著消費者認知的不斷成熟,以及國產晶片口碑的逐漸累積,消費者的認知和信任也將快速建立起來,“只買對的不買貴的”。筆者相信,國產晶片大範圍替代的那天或許不會太遠了。 (水滴汽車)