#感測器融合
為什麼:特斯拉All-In純視覺?
在角逐自動駕駛的高風險競賽中,多年來逐漸形成了一道深刻的理念與工程分歧。一方是幾乎整個汽車與科技產業,他們推崇名為** 感測器融合(sensor fusion)** 的方案—— 一種「雙保險」 式的思路,將攝影機、雷達與雷射雷達(LiDAR)結合,建構出冗餘、多層級的環境感知系統。另一方則只有特斯拉孤身一人,它大膽且極具爭議地押注在單一感知模式上——純視覺、基於攝影機的感知方案。特斯拉主動拆除並停用雷達等硬體的決定,曾遭到廣泛質疑,但這項舉措源自於其對人工智慧與自然智慧本質的、基於第一原理的堅定信念。想要理解特斯拉為何下此重註,首先必須先弄清楚:特斯拉究竟否定了什麼。1.什麼是感測器融合?感測器融合的概念其實非常簡單。它的目標是利用不同類型感測器各自的獨特優勢,為車輛周圍環境建立一個單一、統一且高度穩健(穩定可靠)的模型。每種感測器都有其優缺點,理論上,將它們融合在一起可以彌補各自單獨使用時的短板。攝影機能提供最豐富、解析度最高的數據,像人類一樣以色彩和紋理感知世界。它們可以辨識路牌文字、區分交通燈顏色,並理解複雜的視覺場景。其主要缺點是:在惡劣天氣和低光照條件下表現會下降,且難以精確測量相對速度。雷達非常擅長測量物體的距離和速度,即使在極端天氣下也能正常運作。它能輕鬆「看穿」 雨、霧、雪,但缺點在於解析度較低。無論如何計算,想要在單一方向上達到單一攝影機的分辨率,需要一個12 英尺× 12 英尺、成本高達數百萬美元的雷達陣列。它能告訴你「有東西」 以及「它移動得多快」(前提是物體在移動),但很難判斷物體是什麼,也難以辨識靜止物體。光達(LiDAR) 工作原理類似雷達,但使用激光,能產生環境的精確3D 點雲地圖。它在測距和形狀感知上精度極高,可以建構極其精細的三維環境模型。主要缺點是:成本相對較高,且在惡劣天氣(尤其是霧、雪、雨)中表現會下降。光達還有一個短板:採集的資料量極大,光是第一步資料處理就需要龐大的算力。這是業界成熟的技術方案,Waymo、Cruise 等公司都在採用:將三類感測器的數據融合,打造一套具備內建冗餘的感知系統。2、特斯拉的起點:多感測器方案對許多人來說,這已是一段被遺忘的歷史,但特斯拉並非從一開始就採取純視覺路線。從推出到2021 年,早期的Autopilot 系統同時配備了攝影機和前向雷達,雷達由博世等專業汽車感測器廠商提供。這是一套常規的感測器融合方案:雷達作為主要感測器,用於測量前車距離與速度,從而實現交通感知巡航控制以及早期版本的FSD Beta 功能。多年來,這種多感測器方案一直是業界標準。即便特斯拉自研了專屬FSD 晶片,外界仍普遍認為雷達會繼續作為核心零件,成為不斷發展的視覺系統的安全兜底。然而在2021 年,特斯拉做出了一次極為激進的轉向。3.轉折點:特斯拉為何放棄雷達方案這項轉變始於2021 年夏天,特斯拉宣布將在新款Model 3 和Model Y 上移除雷達,全面轉向名為** 特斯拉視覺(Tesla Vision)** 的純相機系統。此舉源自於伊隆・馬斯克基於第一原理的核心理由:感測器資料衝突會帶來安全風險—— 這一觀點他至今仍在堅持。光達和雷達會因感測器衝突而降低安全性。如果光達/ 雷達與攝影機的資料不一致,該信誰?這種感測器資訊模糊帶來的是風險上升,而非下降。這就是Waymo 無法在高速公路上行駛的原因。我們在特斯拉上關閉雷達,就是為了提升安全性。伊隆・馬斯克的觀點是,感測器融合會催生一個全新且更危險的問題:感測器衝突。當兩種不同的感測器系統給出相互矛盾的訊息時,車輛該相信那一個?那一種感測器才算「更精準」 或「更安全」?是由車輛在當下即時判斷,還是由工程師事先設定好優先順序?感測器資訊的模糊性本身就存在風險,因為決策模組可能會因此陷入癱瘓,尤其是在安全優先的場景下。這並非單純的理論思辨,特斯拉的完全自動駕駛(FSD)工程師也給了具體實例。在同一討論中,特斯拉人工智慧工程師蔡允達指出,雷達存在根本缺陷:它無法正確區分無法產生頻率偏移的靜止物體、橫斷面細小的物體,或是雷達反射率低的物體。這正是過去困擾特斯拉的** 無故急煞車(幽靈煞車)** 問題的根源—— 車輛可能會把路邊靜止的天橋或丟棄的鋁罐誤判為停下的車輛,從而觸發不必要的煞車。在特斯拉看來,實現通用化自動駕駛的路徑,是攻克視覺感知。人類依靠雙眼這兩台「生物攝影機」 和強大的神經網路就能駕駛。他們的核心判斷是:如果能讓電腦視覺做到完美,那麼其他任何感測器往好了說是多餘幹擾,往壞了說就是危險歧義的來源。4.當下方向:純視覺路線的願景如今,每一輛全新特斯拉都完全依賴特斯拉視覺系統(Tesla Vision),由8 顆攝影機提供支援。該系統透過複雜的神經網路建構出三維向量空間的環境模型,車輛據此進行分析與行駛決策。關於純視覺路線,還有一段耐人尋味的插曲。當特斯拉推出第四代硬體(現稱為AI4)時,新款Model S 和Model X 都搭載了全新的高清雷達。但為堅定實踐純視覺路線,特斯拉從未在完全自動駕駛(FSD)功能中啟用這些雷達。事實上,FSD 表現最成熟的反而是特斯拉銷售最高的車型Model Y,而非配備額外感測器的車型。儘管特斯拉可能會從這些雷達收集部分資料、驗證系統性能,但雷達並未真正納入FSD 的感知體系。5、👉 二選一的結局:非成即敗特斯拉放棄感測器融合方案,是其自動駕駛路線與業界其他廠商最核心的差異。這是一場孤注一擲、高風險高報酬的豪賭,而目前來看,特斯拉明顯佔上風。特斯拉、伊隆・馬斯克、阿肖克及特斯拉AI 團隊一致認為:想要打造一套具備類人智慧、可規模化、通用型的自動駕駛系統,唯一路徑就是徹底攻克視覺感知難題。如果這項判決正確,他們將打造出比競品那些造價高昂、堆滿感測器的車型成本更低、擴充性極強的系統。如果判斷失誤,他們最終可能遭遇效能瓶頸,只能回頭加裝感測器—— 但到目前為止,這類瓶頸尚未出現任何端倪。如今,特斯拉已全力押注純視覺系統,技術進展與能力毋庸置疑。 (芯榜)