馬太效應已成,收官階段開始。
“我甚至說所有行業、所有應用、所有軟體、所有服務都值得基於新型人工智慧技術、基於AIGC各方面技術支撐、大模型支撐重做一遍……”
2023年4月中旬,張勇在阿里雲峰會上如此暢言。這番講話的背景,正是當時風頭正勁的ChatGPT大語言模型。
張勇口中的“所有行業、所有應用、所有軟體”,自然也包含了當時正陷入理論和落地泥潭的智能駕駛概念。並非沒有企業對此躍躍欲試,然而算力的制約卻也是顯而易見的。
以目前的視角看,OpenAI採用“從人類反饋中強化學習”訓練方式,實際上頗有幾分日常大家戲謔那種“力大磚飛”的味道。
通過堆砌大量算力不惜能耗去訓練大模型,最終受益了能源企業,以及輝達這種算力晶片供應商。直到DeepSeek-V3的橫空出世。
與ChatGPT-4相比,DeepSeek-V3的訓練過程,算力消耗僅前者的16%,實際成本僅557.6萬美元,折合前者(7800萬美元)的區區7%。但兩個大模型在實際部署運用上,能力卻是近似的。
站在2025年初這個時間節點,值此國內乃至全球智駕行業進入收束狀態迎接收官階段的關鍵時刻,這是否意味著新的變數?
延續自本世紀第二個十年中期的自動駕駛技術,已經明確了依賴深度神經網路(DNNs)來處理特定任務,如感知、預測和規劃等。這些系統一般採用模組化設計——每個模組負責解決一個特定的問題,例如物體檢測、路徑規劃或速度控制。
這種架構的優點在於它允許工程師針對每一個子任務進行最佳化,並且便於偵錯和驗證。同樣的邏輯也體現在智駕系統的感測器系統設計上,而前述優點也是少部分企業堅決反對激光雷達,一直堅持所謂“純視覺路線”的根本原因。
然而,隨著大模型——即使用Transformer架構建構的模型的流行,尤其是那些具有大量參數的大規模預訓練模型,自動駕駛技術迎來了新的可能性。
大模型的基本特性之一,是能夠捕捉資料中的複雜模式,並通過大規模的資料集進行訓練,從而在多種任務上展現出強大的泛化能力,可以被用來增強系統的感知能力和決策制定過程。
在感知能力方面,能夠充分融合與處理更複雜的圖像、雷達和激光雷達資料,識別行人、車輛、道路標誌等。傳統多感測器融合所面臨的難題,在大模型面前得到了很好地解決,而且可以提升系統在極端天氣或複雜路況下的魯棒性。
此外,大模型在持續學習能力方面的優勢,這意味著其可以根據新收集的資料不斷改進自身的性能,適應不同的駕駛條件和環境變化。
更因為大模型明文羅列邏輯推導過程的特性,使得開發人員在分析系統決策時,徹底告別了以往的黑箱狀態。
通過透明化決策邏輯幫助偵錯和最佳化,並引入冗餘系統和風險預測機制,確保在突發情況下的安全性。
然而在2023年,ChatGPT的出世,並沒有立即對智駕行業帶來特別的觸動。究其原因,若是以ChatGPT為範本來倒推的話,以Transformer架構把現有的智駕系統“重做一遍”,重新訓練的代價將會非常巨大。
根據由OpenAl團隊發表於2020年的論文《LanguageModels日 are Few-Shot Learners》,訓練一次1746億參數的ChatGPT-3模型,需要的算力約為3640 PF-days。
輝達配備80GB快取的A100 GPU算力卡單卡的理論算力是 312TFLOPS,但考慮到tensor/pipeline parallel平行技術算力利用率僅略超過一半,則完成一個月訓練量需要接近千張80G記憶體規格A100算力卡。
而在2023年的時候,1000張80G A100的採購價格大約1.5億人民幣。
DeepSeek之所以被視為重大突破,乃是通過混合專家架構(MoE)與多頭潛在注意力(MLA)機制,不但提高預訓練中的算力利用率,還有效地降低了推理成本。
簡單粗暴描述大致可認為,是以OpenAI訓練ChatGPT所需代價的五分之一,實現了大致一樣效果。
然而這一切發生在2024年末,資本密集投資智駕企業的機會窗口已經關閉,甚至整個市場也被初步瓜分。
淘汰賽,已經啟動。
幾天前,曾經被譽為國內智能駕駛第一股的圖森未來,在去年初宣佈轉換娛樂以及影視製作賽道之後,終究是沒有能夠扛住壓力,企業因為“內訌”而解散。
人去樓空,只餘一地雞毛。
往前推,在這個春節長假剛結束那會兒,2024年末已宣佈進入“低功耗模式”的縱目科技,也傳出人去樓空的消息。
而僅僅兩年半之前,這家企業曾一度因為拿下問界M5/7智能泊車解決方案訂單,一時成為行業矚目的焦點。
往前追溯,去年的11月27日,成功登陸美國的小馬智行在首個交易日即跌破發行價。儘管這家企業在國內曾經有過“行業獨角獸”的光環,但在美譽之下卻是企業自2016年成立以來,已經連續虧損八年的事實。實際此番上市,多少也有點最後一搏的味道。
也是在去年的年末,曾經得到過長城汽車大力扶持的毫末智行,也傳出了裁員的消息。而若是追溯到2024年的年初,便是圖森未來從美股退市的大新聞——其市值最高時,曾經達到160億美元規模。
在2023年末,國內智駕行業有了所謂“地大華魔”的說法。並且在去年年末的時候,又進一步完善為頭部供應商的“華元魔大地”,外加自研整車廠的“蔚小理極米”之說。
在這個大趨勢下,DeepSeek的崛起如同給這股變革的浪潮注入了強大的動力。在訓練效率方面,經過其最佳化能進一步縮短推理響應時間。
這意味著在實際的智駕場景中,車輛對於各種複雜路況的判斷和決策速度會大大提高。
例如,當車輛在高速行駛中突然遇到前方有障礙物或者車輛變道時,能夠更迅速地作出反應,避免事故的發生。
另外,在資料標註這個環節,DeepSeek通過其獨特的跨模態遷移能力,有效地降低了訓練過程中對人工資料標註的依賴。
後者看似是對中小廠商的機遇,然而頭部企業憑藉自身已經積累的大規模資料,仍然在這個領域形成了一定的壁壘。
例如,頭部企業可能已經擁有了海量的真實路況資料,這些資料經過長時間的積累和整理,包含了各種各樣的駕駛場景,這是中小廠商短期內難以企及的。
通過模型蒸餾這種技術手段,一些廠商有可能實現“彎道追趕”。但是這僅限於那些具有大量自主資料的廠商來說,畢竟對於這行來說,演算法的性能不僅僅取決於模型本身,還與資料的質量和數量密切相關。
沒有足夠的自有資料,就很難對模型進行有效地最佳化和調整,從而導致在演算法性能上與其他廠商存在差距。
這種差距在行業競爭日益激烈的今天,可能會進一步被拉大,使得這些廠商在市場競爭中處於更加不利的地位。
既然提到了資料對於當前智駕技術發展的重要性,相信大家也能理解車企直接入場的理由了。
特別是隨著DeepSeek的橫空出世,又進一步降低了門檻。而這種已經呈現大趨勢的發展狀況,進一步衝擊了第三方供應商模式,使得所有未能擠入頭部行列的二線企業面臨出局的風險。
實際上,整個趨勢在2024年就已經啟動,其集中體現在資本和人才的流動上。
據統計,去年在所有投向智駕供應商的融資中,有超過八成流向了上述提到的頭部五強企業。
世人將DeepSeek,視為一場算力的平權運動。然而這場始於2023年,爆發於2024年末,並於不久前廣為人知的技術革新,對應到智能駕駛行業,卻幾乎成為了產業的“陷阱”。
當新架構將訓練成本壓縮到不足頭部企業年度電費支出的零頭時,真正的戰場早已從演算法研發轉向資料沉澱。
華為ADS積累的3000萬公里城區道路資料、小鵬汽車建構的3000小時極端天氣場景庫、比亞迪"天神之眼"系統背後200萬輛車的即時反饋,這些用真金白銀和時間壁壘堆砌的護城河,正在將後發者死死擋在門外。
即便有企業能通過開源框架快速搭建原型系統,缺乏實際道路資料的模型也終究是實驗室裡的“電子遊戲”。
這場變革的最大受益者並非技術新貴,而是躬身入局的整車巨頭。
產研閉環的碾壓優勢,使得博世、大陸等傳統Tier1供應商不得不將業務收縮至執行端,而曾經風光無限的演算法公司則陷入是否要賣身甚至是賣身無門的窘境。
站在2025年的門檻回望,智駕行業的終局輪廓已然清晰:這註定是一場屬於資料寡頭的遊戲。
當特斯拉宣佈FSD北美訂閱成本降至每車99美元,當華為ADS3.0開始向第三方車企開放訂閱,當蔚小理的使用者每天持續貢獻的智駕里程突破八位數,那些曾以“顛覆者”自居的初創企業終於明白,真正的革命從來不會發生在聚光燈下,早已在資料洪流的奔湧中完成了對舊秩序的審判。
留給落伍者的,只剩下資本市場雪崩般的估值重構,以及可以被書寫進商業教科書的全新警示——
技術可以彎道超車,但產業生態的進化從不等待遲到者。 (C次元)