馬斯克認為激光雷達存在技術缺陷,但L4技術人員並不認可。
外界熟知特斯拉一直反對激光雷達的原因是覺得它太貴,但是從技術角度來看,特斯拉內部其實還有另一個說法,他們認為激光雷達的問題不只是貴,還在於跟攝影機的資訊融合上存在技術障礙。
在討論這個問題之前我們先來認識一個行業基本誤區。目前行業將沒有激光雷達的方案統稱為純視覺方案,但其實國內很多車企即便沒有激光雷達,大部分都有毫米波雷達,嚴格意義上來說,應該是攝影機為主的視覺方案。但特斯拉的純視覺是只有攝影機,除了激光雷達,連毫米波雷達都沒有,這才是所謂的純視覺。
這時候我們再來看馬斯克拋棄激光雷達的原因在那裡。馬斯克的邏輯其實很簡單,攝影機是人的“眼睛”,既然人眼能看清,相機也能看清。但是攝影機存在的基本事實無法忽視,缺少深度資訊的攝影機天然就存在“視覺欺騙”的缺陷。比如把白色車輛識別成白雲,將路邊的廣告牌上內容識別為汽車。
問題出在那裡,來看看前特斯拉工程師的回答:
“多個資訊流確實能提供更多的資訊,但是你要解答一個問題,難道攝影機本身的資訊不夠嗎?還是演算法挖掘資訊的演算法能力不足?比如說緊急剎車、在城市道路的時候有頓挫感,其實根源就是它對周圍物體的速度估計、它的角度估計不足,如果是這個原因,那確實激光雷達要比攝影機好很多,因為它能夠給你提供更直接的資訊,就是攝影機本身其實也給你資訊了,只不過我們的演算法不足夠好,能夠挖掘出這樣的資訊。”(摘自《矽谷101》)
這裡面存在兩個問題:在智駕系統裡,攝影機給的資訊夠不夠?演算法能不能很好地挖掘並處理這些資訊?
上述工程師的觀點顯然非常明確,對於第一個問題,他認為並不是攝影機收集到的資訊不夠,而是演算法的能力不行,沒有很好地挖掘和處理攝影機收集到的資訊,也就是第二個問題的答案。他的論證依據是,特斯拉V12端到端架構上來以後這些問題明顯改善,也就是大家常說的端到端的上限提高了。雖然現在V12依然存在很多問題,但他認為這些問題並非感測器不足導致的,核心問題依然出在演算法上。
至於為什麼拋棄雷達?我們可以來看一下特斯拉拿掉毫米波雷達的案例。
特斯拉之前的自動駕駛系統有毫米波雷達,然而感測器融合其實是一個很複雜的演算法,特斯拉工程師發現,毫米波雷達在智駕裡的作用小於攝影機,但是加上毫米波雷達就增加了演算法的複雜度,甚至可能帶來一些資訊干擾導致系統誤判。如果不能實現1+1>2的效果,感測器越多反而是累贅。
特斯拉的實踐似乎將了雷達企業一軍,來看激光雷達派是如何反駁的。
現在不管是Cruise、Waymo等主流L4公司都是激光雷達為主。以Waymo的Robotaxi來看,它的感測器組態可以說是武裝到了牙齒,裝了 5 顆激光雷達, 30 顆攝影機,6 顆毫米波雷達。僅攝影機就有好幾類,一類是正常攝影機,一類是專門提升夜視能力的攝影機,有看 LED 燈的,有熱成像的,還有盲區攝影機,外加紅外線的閃光燈。一共五類相機。
他們的理由是,激光雷達可以直接拿到位置資訊,對於演算法本身的要求相對會比較低一些,並且很多可以直接通過感測器來拿到這些3D的資訊,提升系統的安全性和魯棒性,解決很多長尾問題會更輕鬆。
攝影機需要大量的訓練資料去學出缺乏3D的資訊,這樣的話缺乏監管,因為沒有一個參照物,很難去拿到一個現實中的一個ground truth(真值資料),如果完全通過這種半監督的學習方法,想要達到系統的一個安全性難度很高。
馬斯克將攝影機等同於人的研究,但在很多L4技術人員看來,攝影機完全不能跟人眼相提並論。
首先,人眼的上限非常高,像素能夠達到5億,並且能夠自動聚焦收縮,但是攝影機是人為設計出來的產物,性能參數,探測距離都有其侷限性。目前像素最高的智駕視覺相機像素也才800萬,跟人眼完全不是一個數量級。
其二,在可視範圍內,人眼只需關注與自己駕駛行為相關的資訊,而智駕相機需要關注可視範圍內的所有元素,隨時排查可能的風險。這樣增加了相機本身和演算法的“工作量”。這些問題可以通過激光雷達來彌補。
一個有意思的事情是,雖然很多L4從業者並不認可特斯拉去掉激光雷達的說法,但是他們也認為,資訊並不是越多越好,因為太多額外的無效資訊會加劇演算法的負擔。
這一點讓視覺派有了“可乘之機”,試圖去找到激光雷達自身的“漏洞”。他們認為,激光雷達是通過發出光束來測距,雨雪天氣會影響雷射反射,這些對智駕就是干擾資訊,增加了演算法的壓力。
激光雷達派對於上述觀點反駁稱,現在的演算法技術已經非常成熟,激光雷達的降噪抗震動等問題並不會對系統產生太大的影響,激光雷達能夠產生的價值遠大於它的問題。
很多人關注到一個事情,今年激光雷達製造商Luminar在第一季度財報中透露特斯拉的訂單達到了10%,是其最大客戶。
對此特斯拉工程師解釋是為了讓激光雷達在測試車上採集訓練神經網路的ground truth(真值資料),因為人工無法標註物體距離,必須要用專門的感測器來標註。
在兩方battle之外,我們來看一些基本事實:
目前全球知名的L4公司清一色都是激光雷達的客戶,包括國內的百度,文遠,小馬,國外的Cruise、Waymo等。至少在L4公司的決策裡,激光雷達並不是備選項,而是必選項。
有意思的是,純視覺和激光雷達之間也在相互滲透。比如一直堅持雙目視覺的卓馭科技(原大疆車載)年初發佈了激目感測器,把激光雷達和攝影機融合在一起形成一個全新的感測器,並計畫於2026年上車。而蔚來,小鵬,華為等原來在激光雷達領域激進的企業也都在今年推出了純視覺方案,很大一部分原因得益於軟體演算法的進步。在L2企業看來,上不上激光雷達更多是商業上的考量。
值得注意的是,最近美國聯邦政府對特斯拉FSD展開了調查,理由是能見度降低情況下的檢測和響應能力,有分析將矛頭指向了沒有激光雷達導致資訊密度較低。
對於馬斯克來說,自證的辦法非常簡單,就是其最近新推出的Robotaxi,也採用沒有激光雷達的純視覺方案,如果馬斯克真能通過純視覺搞定了L4場景,那恐怕所有人都會閉嘴了。但這一天真的會來嗎,到底是什麼時候,沒人說得清楚。 (圓周智行)