11月25日,媒體報道,特斯拉已開始向員工推出全自動駕駛(FSD)V12版本,更新版本編號為2023.38.10。很快,特斯拉CEO馬斯克也在X上確認了這個消息。
本月早些時候,馬斯克宣布特斯拉FSD V12自動駕駛將在2週內上線試用,但市場普遍對此時間點表示懷疑。
現在看來,FSD V12版本正步入面向客戶前的最後一步,或許能夠在今年問世。
99%決策由神經網路給出
為何大家會如此期待特斯拉的FSD V12?
最重要的原因是,特斯拉反覆強調的,FSD V12將實現全新的「端到端自動駕駛」,第一次開始使用神經網路進行車輛控制,包括控制轉向、加速和製動,不再需要先前超過30萬行的程式碼,而是進一步依賴神經網絡,減少了對硬編碼程式設計的依賴。
馬斯克在先前的試駕直播中表示,FSD Beta V12是有史以來第一個端到端AI自動駕駛系統(Full AI End-to-End),從頭到尾都是透過AI實現。我們沒有編程,沒有程式設計師寫一行程式碼來識別道路、行人等概念,全部交給了神經網路自己思考。V12的C++程式碼只有2000行,而V11有30萬行。
簡單理解就是,V12把攝影機取得的影像資料輸入到神經網絡,網路能夠直接輸出車輛控制指令(如轉向、加速、煞車等),更像是一個人類的大腦, 99%的決策都是由神經網路給的,不需要高精地圖、不需要光達,只靠車身的攝影機視覺輸入,就能分析思考,輸出控制策略。
媒體分析認為,FSD V12版本的推出將成為特斯拉在AI和自動駕駛的關鍵時刻。這不僅是技術實力,還關乎將AI與人類行為如何更好融合。
對於新架構的技術細節和潛在影響,市場仍有較多疑惑和分歧。
根據特斯拉對外揭露的資訊及馬斯克在X上發布的信息,中信證券認為,特斯拉內部目前有兩條「端到端」路線同步在研:1)級聯式端對端神經網絡;2)World Model,而FSD V12是前者的可能性較大,預計明年初落地,以便更好地實現L3能力。
「端對端自動駕駛」有何不同?
在FSD V12之前,特斯拉的自動駕駛系統一直依賴規則判斷。
靠著汽車的攝影機識別車道、行人、車輛、標誌和交通號誌等,然後透過特斯拉工程師手動編寫的數十萬行C++程式碼來應對各種情況,例如紅燈停、綠燈行、在沒有足夠快的車輛衝撞時才通過十字路口等等。
但現在,作為特斯拉自動駕駛系統最重要的一次升級,FSD v12只是通過給神經網絡“餵”視頻,讓它不斷學習,優化參數,在分析數十億幀人類如何駕駛汽車的視頻自學了駕駛。
中信證券指出,從技術本質來看,級聯式端到端神經網絡,系統從輸入到輸出,全程使用神經網路演算法,無需任何人工規則介入。目前,自動駕駛模型多為模組化架構,感知預測、規劃、控制等不同任務分屬於多個不同的小模型,下游規控環節普遍仍以規則為主。
而「端對端」神經網路在輸入影像後,可直接輸出轉向、煞車、加速等控制指令。為提升訓練效果,「端到端」的大神經網路可能由多個小的子神經網路級聯而成。
但與傳統模組化架構以「規則」連接模組不同,級聯式神經網路的子模組是以「神經網路」的方式自行訓練堆疊,因此可透過資料驅動優化整個端對端模型,避免「局部最優,而非全局最優」的困境。
端到端/神經網路的核心好處在於模型迭代的關鍵由“工程師”改變了更易於規模化的“數據和算力”,因而訓練效率和性能上限有望得到顯著提升。落實處,中信證券認為,端到端方案所展現的性能潛力有望大幅提升自動駕駛系統的接管水平,從而實現真正無可爭議的L3能力(例如達到每週接管1次)。
但端到端模型的「黑盒」問題目前產業界尚未有十分成熟的解決方案,因此中信證券認為,其最終能否邁向追求極致安全性的L4全無人駕駛仍待觀望。(華爾街見聞)