“反擊”馬斯克,奧特曼說OpenAI有“好得多”的自動駕駛技術

OpenAI的CEO山姆·奧特曼和特斯拉CEO馬斯克的矛盾,已經是矽谷熱門的八卦。

兩人都是OpenAI的聯合創始人,但是奧特曼將OpenAI轉向商業化營運之後,馬斯克指責其背離初心,並起訴他違背創始協議。另外,馬斯克還成立xAI,和OpenAI直接競爭。

奧特曼也奮起反擊,公佈郵件顯示,馬斯克試圖掌控OpenAI,遭到拒絕後才不斷阻撓。

奧特曼可能還醞釀了一個“以其之道還施彼身”的反擊舉措,那就是研發自動駕駛,和特斯拉FSD競爭。

最近,奧特曼在做客了自己兄弟傑克·奧特曼的脫口秀,不知是否和兄弟聊天說漏了嘴。

他說:

我想我們有一些新技術,可以為普通汽車提供自動駕駛,而且比當前技術要好得多。

I think we have some new technology thatcould just do self-driving for standard carsway better than any current approach has worked.

這裡說比“當前技術”“好得多”,當然也包括馬斯克的FSD。

不過,奧特曼並沒有詳細介紹這一技術和推進的時間表。只是說:

如果我們的人工智慧技術真能駕馭汽車,那還是很酷的。

Ifour AI techniques can like really go drive a car that's still pretty cool.

根據紐約時報旗下DealBook的消息,該技術尚處於早期階段,商業化也還要很遠。

據其分析,這一技術涉及 OpenAI的Sora視訊軟體及其機器人團隊,但OpenAI 發言人沒有置評。

此前,OpenAI並沒有直接探索自動駕駛業務,只是通過投資佈局了一些自動駕駛、汽車智能化的公司。

當然,作為AI應用中最被看好的一個場景,自動駕駛擁有廣闊前景,也吸引了巨大關注。OpenAI如果真有絕招,是絕對不會放棄如此巨大的市場的。

如此看來,奧特曼和馬斯克以後大機率會吵得更凶。

01. 什麼絕招?

奧特曼上下嘴唇一碰,大家就要相信,OpenAI真有“好得多”的自動駕駛技術嗎?

畢竟當前自動駕駛也是強手如林,Google旗下Waymo、特斯拉、Moblieye、高通、博世、還有一大批來自中國的企業,都已經探索很久了。

OpenAI可能的技術路徑是什麼呢?

大家可能都會回想起2024年初,OpenAI發佈了Sora——文字生成視訊模型。

Sora生成的視訊

Sora可以根據使用者輸入的文字,快速製作長達一分鐘的高保真視訊,還能獲取現有的靜態圖像並從中生成視訊。

Sora生成的視訊一下子驚豔了世人,因為這一模型能夠理解複雜場景中不同元素之間的物理屬性及其關係,掌握物體在物理世界中的存在和運動方式,從而生成足以以假亂真的視訊。

幾乎在Sora一發佈,自動駕駛、智能駕駛業界就討論說,可將Sora用於自動駕駛的模擬和訓練,生成合成視訊資料,尤其是一些極限場景Corner Case,以彌補現實資料不足或成本高的問題。

然而,也有專業人士迅速指出,Sora生成的畫面,並不完全符合物理原理,也可能難以捕捉駕駛動態,如剎車或轉彎的物理行為。因此,並不能用來作為智駕模型訓練的視訊資料。

不過,後來很多的研究者和從業者認為,符合物理原理的模擬,還是能夠為資料訓練提供資料的。或者,也可以用於強化訓練模型。

近來,自動駕駛業界熱衷於搭建“世界模型”來作為自動駕駛模型的基座模型。而OpenAI一開始,就將Sora定義為可以生成視訊的世界模型。

像蔚來、小鵬等開發的世界模型,邏輯是讓AI系統建立心理上的世界地圖,以理解世界的運作方式,就像人類對世界的理解一樣,然後在此基礎上去駕駛車輛。

Sora的部分理念與世界模型模擬真實世界的目標有一定的契合度。

另外,當前自動駕駛開發的主流理念,都是“巨量資料-大模型-大算力”打法。OpenAI沒有駕駛資料,要想給出更好的自動駕駛技術,大算力沒問題,大模型也可以有,巨量資料則是無源之水——如果能靠模擬生成,至少邏輯上說得通。但不少專家認為,依賴模擬資料存在巨大風險。

02. OpenAI的汽車智能化業務

OpenAI自己沒搞過自動駕駛,也沒有過做過智能座艙,但是通過其投資,也有所設計。

2023 年OpenAI 向Ghost Autonomy投資500萬美元。這家自動駕駛公司還同時獲得了微軟的算力支援,也曾嘗試將AI語言模型應用於自動駕駛。但是,它在2024年就倒閉了。

Ghost Autonomy的自動駕駛車輛

2025年6月10日,OpenAI和汽車智能化公司Applied Intuition達成合作。雙方合作聚焦於把最新AI技術發展成果融入現代汽車,使其轉型為智能夥伴。

官方通告說,通過將大語言模型驅動的語音助手和智能體引入車內,下一代汽車將成為具備深度個性化體驗的生產力工具。

通告還說,合作的核心目標之一是實現移動裝置與私人車輛智能系統的無縫連接。此外,Applied Intuition 還將在多個部門部署 ChatGPT,助力員工提升工作效率、最佳化策略規劃,以更高效地實現公司目標。

從這些描述來看,合作更偏向於智能座艙的人機互動方面,而不是直接應用於自動駕駛。

03. 從語言模型到多模態模型、世界模型

業界曾有觀點認為,依託大語言模型的快速進步,自動駕駛一類的空間智能可能很快實現。但是,如今的AI大牛們,都認為,光靠語言模型,是不夠的。

OpenAI雖然以大語言模型震驚世人,仍以大型語言模型(LLM)為核心,但已逐步向多模態模型和世界模型領域延伸。

奧特曼也曾經表示,世界模型需具備“理解物理因果關係、預測事件發展” 的能力,這與 LLM 的推理能力結合,可能推動AGI(通用人工智慧)突破。

不僅僅是OpenAI這麼判斷。包括人工智慧教母李飛飛、Meta首席人工智慧(AI)科學家Yann LeCun(楊立昆)都有類似觀點。

楊立昆就說,當前AI雖在多個領域展現驚人能力,其仍缺乏理解物理世界、持久記憶、邏輯推理與分層規劃四大人類智能核心特徵。

而沒有這些能力的AI,是不可能駕駛汽車的。

解決方案,眾人所指,都是世界模型。

楊立昆在Meta開源世界模型V-JEPA 2是說,在世界模型的幫助下,AI不再需要數百萬次的訓練才能掌握一項新的能力,世界模型直接告訴了AI世界是怎樣運行的,這可以極大提升效率。

聽起來,有點奧特曼沒說出來的自動駕駛“大招”的影子。

實踐層面,AI時代“賣鏟子”的輝達已經遞上新“鏟子”。

在CES 2025上,輝達CEO黃仁勳說,“機器人的 ChatGPT時刻即將到來。與大語言模型類似,世界基礎模型(World Model)對推動機器人和自動駕駛汽車的開發至關重要。”

輝達發佈的Cosmos 世界基礎模型,就是專為物理互動、工業環境和駕駛環境的高品質生成而建構,具備生成逼真視訊、建立合成訓練資料等能力,幫助機器人和汽車更好地理解物理世界。

輝達Cosmos世界模型示意圖

意思是,Cosmos 世界基礎模型比起Sora來,是不是模擬,本來就是“真”。

對此,OpenAI肯定已經著手推進,將自己的AI版圖擴展到空間智能上。

其實,OpenAI很早就有機器人團隊,但2021年解散了。2024年,機器人團隊重新組建,並在 2025 年進一步擴大,並招聘不少硬體機器人相關職位。

此外,OpenAI還與機器人初創公司 Figure 建立了合作關係,為其人形機器人提供 AI 模型支援。

人形機器人的基礎模型和自動駕駛非常接近。在探索世界模型的過程中,OpenAI如果有所突破,並將其應用於自動駕駛,是順理成章的。畢竟,自動駕駛市場是毫無疑問的兆美元級市場。

奧特曼即便做不成自動駕駛,在馬斯克自以為傲的領域阻擊一下他,也算是報一箭之仇啊。 (賽博汽車)