對話何小鵬:強化學習已過時,具身智能不該以硬體為核心

具身智慧型手機器人發展史上的第一個圖靈測試時刻,是屬於小鵬的:

就像何小鵬本人回覆“感謝認可”,“皮套演員”質疑本身就是對小鵬技術的肯定。只不過回應方式出乎意料得“殘忍”:在直播中層層解剖,依次暴露出皮膚、肌肉、骨架…..

測試結束後,我們第一時間和何小鵬聊了聊:為什麼要用這麼悲壯的方式自證、機器人自己知不知道遭受傷害、為什麼一定要這麼擬人、機器人和自動駕駛怎麼融合打通…….

當然也有小鵬的新車新技術、年初的盈利承諾、和特斯拉高度“巧合”的相似性等等。

(訪談內容經閱讀流暢性編輯,不改變願意)

談機器人:採取這種方法自證,團隊挺傷心的

問:為什麼要用這種“悲壯”的方式自證?

何小鵬:昨天晚上到現在是波瀾起伏的24小時。我非常艱難地說服我們的機器人團隊,他們本不同意這樣做,因為他們覺得IRON就是他們孩子。

但我們想不僅僅讓1%的行業使用者,更是讓99%的非行業使用者都有更多的信心,有更多的認知,相信小鵬可以做出不一樣的東西,相信中國的科技企業能夠做出不一樣的東西。

即使切開了皮膚,切開了肌肉,IRON還是走的很優雅,我覺得這夠了。

能夠推動機器人更快速普及,我們就是勝利的。

問:在多遠的未來,機器人能自己感知到今天對它的操作是一種傷害?

何小鵬:直白說我不知道。如果機器人知道我們對它的操作,今天就不會讓我們把它切開了。我覺得很多年內都到達不了這麼High Level的情況,我覺得做不到。

問:IRON貓步火了,但網路上有大量機器人跳街舞打拳擊的素材瘋傳,動作都比“貓步”複雜得多,它們的實力比小鵬更強嗎?判斷具身智能玩家含金量標準是什麼?

何小鵬:我覺得還是要看針對什麼場景和用途,比如說小鵬想做的是高等級人形機器人,不是四足也不是小比例。

其次,我認為具身智能軟體應該和硬體1:1,而不是以硬體為核心。不光是光是全端自研,還更重要的是跨越融合,這樣才能夠把大腦、小腦、面部等等整個身體的平衡姿態融合起來。

強化學習的邏輯可以讓部分關節做的很不錯,但沒有辦法讓全身82個關節緊密協調

所以我們選擇了一條不同的道路,它更難,我現在還不知道這條路線能不能到終局。

問:小鵬造機器人為什麼堅持要做高度擬人化?高度擬人化對應著非常高的投入成本,小鵬汽車怎麼做權衡和取捨?

何小鵬:我認為未來高等級的機器人有不同形態,但是擬人的機器人有三大好處——第一,機器人要想做得聰明,不能用規則,要用AI驅動,而只有從人類世界可以學到最多的資料。

第二,這個世界上的多數場景,例如家庭、工廠,都是為了人去使用而去設計、建造、營運,越擬人越容易適應這個世界。

第三,從購買的角度來看,擬人的機器人更容易讓人有親和感,就有可能賣得很多,買得多更容易實現規模化,有了規模化成本就更低,會形成一個正向循環。

問:小鵬的新一代機器人與汽車在零部件上的復用比例達到多少?

何小鵬:我沒有精確的答案,但是很多工藝是一樣的,比如說感知、域控製器,AI 軟體有70%是一樣的,但機器人的關節、皮膚在汽車零部件上是沒有的。

談物理AI:機器人銷量會超過汽車

問:兩個頭部Robotaxi公司在港股同時掛牌,非常熱鬧。他們依然強調輔助駕駛跟自動駕駛有本質的區別,並且認為L4車型還帶司機是一件沒有意義的事,小鵬怎麼證明自己的路線是對的?

何小鵬:我覺得我首先不會去證偽別人,他也許對,他也許錯,選擇方向不同。

明年我們會出三款Robotaxi,真正把自動駕駛做到一個月接管一次,三個月接管一次,甚至六個月接管一次,ROBO車型需求量會非常的高。

技術的顛覆帶來體驗的顛覆,會創造全新的場景跟需求。

沒有對錯,不同公司向不同美好願景的不同選擇。

問:第二代VLA開源,小鵬想在行業標準的制定中扮演什麼樣的角色?

何小鵬:我們在第二代 VA 做了那麼多的事情,花了很多錢,走了非常多的彎路,在科技日上講出來,是想向行業說明,我們探索出來的也許是一條成功的道路,隨意借鑑,當然希望也有人欣賞。

小鵬肯定是現在軟體是比較強的公司之一。有很多公司擔心我懂硬體,我不懂軟體,將來我怎麼辦?小鵬開源VLAd啊模型能讓他們更放心。你得自己先做到這一點,才有可能讓別人願意開放新能力。

問:小鵬希望在物理AI業務與汽車營收的佔比達到多少?

何小鵬:汽車在全球是十兆美金的市場,一年生產9000萬台車,我個人認為機器人是20兆美金的市場,當然這可能需要10到20年的時間,不會那麼快。汽車的發展很多時候是偏低曲線的線性,因為汽車跟強安全監管相關、強政策相關,但機器人如果過了技術和產品的拐點會是一個非常高速度的增長。我沒有想過十年後我們一年能賣多少機器人,但我認為肯定應該超過汽車。

問:小鵬汽車在推進Robotaxi計畫的時候怎麼確保盈利,在商業模式上和其他Robotaxi公司有什麼不同?

何小鵬:小鵬可能是一個不一樣的Robotaxi公司,我們做了前裝量產的車,我們考慮的邏輯不是技術先行,而是做的事情有沒有商業價值,有沒有使用者價值,能不能形成技術拐點,政府和社會是否會接受。

小鵬還會推出Robo智駕版本車型,面向toC銷售,可以大幅度分攤BOM成本(汽車生產企業在產品設計、採購、製造和組裝過程中的關鍵成本組成部分)和研發費用;另外,小鵬的Robotaxi和小鵬汽車又可以分攤BOM和研發費用,這兩項費用比其他公司天然擁有百分之幾十甚至幾倍的優勢。

另外我們不需要高畫質地圖,不需要掃街,不需要雷射雷達,我們更像一個物理世界的人去思考,所以具備更廣度、更泛化,不需要部署費用。我非常堅信,未來四個輪子的交通工具一定是共享和私享的組合,我不認為所有的車都會變成Robotaxi。

在這樣的情況下,小鵬在Robotaxi選擇提供“工具箱”,有車有軟體,有SDK的介面,我們開放出來給各個國家各個區域的合作夥伴,我們開放能力,他們買我們的Robotaxi去營運。

問:小鵬Robotaxi為什麼率先和高德達成全球生態合作?

何小鵬:因為高德以前是我們管的,這個是老東家。第二,高德是中國非常大的出行生態平台,所以他來營運,我們提供工具箱,我覺得這符合兩家的戰略定位。

問:為什麼沒有提到L3,直接面向L4?

何小鵬:我認為將來一個是L2,一個是L4,沒有L3,因為L3既不L2,也不L4

問:小鵬第二代 VLA(Vision-Language-Action) 真的完全去掉了“L”嗎,還是轉換成了其他形式的token?

何小鵬:我們是V+L,我們沒有轉換成人類的語言和格式,而是變成了物理世界的新語言,它不是一個人類可見可認知的語言,效率很好,更豐富;第二,它能夠中間在decoding(解碼),我們完全可以推導中間的過程,例如為什麼他明明該往左,但是他沒有這麼做,這些我們都已經在物理世界模型的評測裡做到了。

問:小鵬汽車科技日發佈會上在不同的載體上應用Physical AI(物理 AI),你們對以後對Physical AI應用場景和載體還有什麼樣的設想?

何小鵬:先發展的公司優勢會大一點。今天的Physical AI有一個非常重要的點——First-mover優勢(先動優勢),在過去的物理世界看不到,在地球世界也看不到。

將來資料是最重要的保障,我們看到最近幾個月數字世界很多大模型公司的進展變慢,我認為根源不在於演算法,不在於模型,不在於算力,也不在於電力,在於資料。

在 Physical AI 裡面,我認為誰都有機會,核心是誰能夠先行把這個做好,誰能夠有好的工程能力,是好的落地工程代表,工程化之後需要好的體驗,更好的服務,這是形成一個巨大的循環。這也是為什麼包括小鵬一直都不太相信,只是把一個車做得越大、越漂亮、越便宜、越高品質就能夠勝利,這只是勝利的必要條件,但不是充分條件。

如何把硬體做好很重要,是基礎,但還需要把軟體做好。為什麼我在科技日上說了近2個小時的Physical AI,如何把物理的世界跟數字的世界有機的結合且滿足客戶體驗,我認為Physical AI的湧現才剛開始。

問:特斯拉近期也在探索飛行汽車,特斯拉和小鵬可能是全世界業務重合度最高的兩家公司,那麼,小鵬跟特斯拉最不同的地方在那裡?

何小鵬:我們跟特斯拉都是在跨域融合裡面找到了換維度的打法。

比如把VLA放到機器人裡面去,原來的機器人是用強化學習做腳部關節,所以機器人的腳、腰、手、頭、頸、肩完全不能協同,必須把這一套邏輯全部推翻。

具體我不太瞭解特斯拉怎麼做飛行汽車,但我認為都是換了另外一個維度來進行跨界。

特斯拉跟我們比較裡有兩個點挺值得關注:一個是相似的地方,我們都不會聚焦很小的細分點,都希望能夠達到量產的規模;不同的地方是小鵬的生態非常開放,這跟特斯拉是有區別的。

談增程:現在做不趕趟了?

問:現在有種說法認為一年增程器啟動不了幾次,不如去直接做純電,小鵬的大電池增程路線,邊界在那?油和電怎麼平衡?

何小鵬:第一,超級增程在明年有更大使用者範圍的銷售時候,就可以解使用者的行為,去揣測思考邏輯,畢竟使用者的表述有時不代表他真正的需求。

第二,中國、海外對有何點的平衡點要求不一樣。而大油箱可以給一個使用者加油可少可多的選擇,但小電池就不行,所以目前我覺得小鵬的大油箱大電池搭配是非常合適的。

問:從公告來看,除了X9 之外,P7、G6 都有增程版。增程動力系統的邊界是怎麼樣設定?是所有的車都要上嗎?

何小鵬:之前說過小鵬是一車雙能架構,從技術角度來說,每台車都能夠支撐。至於說是不是每台車都要做,我覺得取決於對於市場的判斷,對於車型的定位。

問:根據乘聯會的資料,新車種增程比例在下降,以至於有位新勢力大佬講純電的時代已經到來了。為什麼小鵬才入場做?會不會有點晚?

何小鵬:市場上不缺同樣的東西,我們應該做一些不一樣的事情。增程動力總成系統沒有特別高新的技術,而是能不能發現差異化的點在那裡,並在在合適的節奏把它推出來。

比如九合一的後橋,這麼小的空間,把後輪轉向、大油箱、高功率的電驅,然後還有一鍵入坑等等功能全部安排到位,沒有人能做到。

我不常關注市場的抖動,因為大家看到中國的油車的比例還是很高。後續其他廠商肯定也會推出下一代增程系統。

問:小鵬的純電到底給增程帶來那些優勢?

何小鵬:所有的核心的關鍵零部件,包括電芯、驅動系統、發電系統、熱管理系統,跟純電是同平台的。只有把純電把能耗做好,才能在超級增程上把續航做好,這是非常重要的基礎。

還有關鍵零部件的這個平台化,一車雙能能夠支撐把規模做大,這是非常重要的。

成本肯定不能透露,哈哈哈,但是今天給了一個我覺得非常不錯的預售價。

問:到底是有那一個細節做的比別人更好,足以去支撐能耗管理呢?

何小鵬:混合碳化矽同軸電驅系、11源熱管理系統、一體化壓鑄等等都是。

沒公開講的,是超級增程匯入了很多AI小模型,幫助工程團隊解決了以往基於規則和工程物理模型沒法突破的物理邊界。特別是控制系統的效率,得到了明顯提升。

問:今年四季度電池廠商的產能是一個緊缺的狀態,大家都在搶。小鵬這個新增的增程車型,電池需求其實非常大,有沒有額外措施?增程版什麼時候會在海外開始生產?

何小鵬: 我只能說我最近一兩周跟所有電池廠商老闆都喝過酒,大家應該懂了。

至於海外,我們純電生產效率滿足不了交付的需求(特指印尼市場),我首先要解決的是純電,還沒有考慮增程。

問:李斌之前說過,後悔沒有提前做增程,多賺點錢,有沒有類似的體會?

何小鵬李斌同學講那個話,其實是我在跟他聊完我們要做增程之後,他才說的。我也不知道他為什麼會突然會有這樣一個感悟。

每一家公司最後選擇的道和術看起來不一樣,但從很長時間來看可能會殊歸同途,條條道路通羅馬,對不對?

談盈利:走慢點好,不刻意追求速度

問:四季度盈利目標是不是穩了?科技日很多產品量產時間節點放在明年,是不是意味著還要設定明年全年盈利的目標?

何小鵬: 關於盈利,我不能直接答。本月會有第三季度財報。至於我們的目標,正在穩健的前行,這個我不能表明態度,你知道上市公司 CEO 不能亂講話。

未來的競爭,未來的科技,未來小鵬在市場上的定位……我都覺得小鵬需要重打很多基礎,包括技術、產品、組織、全球化。走慢一點,基礎打好一點,將來才能夠走得更遠,而不是說追求某一年的更快速。

這次科技日的東西在明年都能夠大放異彩,大家會看到小鵬的速度既穩,又會加速。

問:科技日展出的產品、技術還很吃現金的,但小鵬快要走到盈利的只有整車,意味著接下來幾年有很多花錢的地方,但是掙錢的地方不是特別多。所以今後怎麼辦?是融資,還是整車的現金流來支援反哺?

何小鵬:小鵬汽車今年研發費差不多要 100 億,這還不算飛行汽車。在中國大概是民營企業20名到25名之間。而我們有很多研發費用是在軟體上。硬體研發費比如說每年的更新換代、開模夾具,下一代基本上這些就沒了。

但是軟體它是有繼承的,有特別多的繼承。尤其是小鵬軟體研發也開始模組化,比如物理世界模擬模型,3年前就是按今天需求設計的。

今年對外我也說過一次,這麼大的研發要靠自己掙回來,所以我們不斷要自己的產品做好,收入做高、毛利做高。今年這麼高的研發情況下,還是能做到做到如今的利潤水平,相信明年後年小鵬的收入跟銷售規模會有明顯提高。

我是蠻堅信長期主義,雖然會流一些血。 (智能車參考)