世界模型教父教母創業,公司估值加起來近百億美元

AI 時代,獨角獸已經不稀奇了,但世界模型這塊還是有所空缺的。


從估值的變化上來看,李飛飛的World Labs,最有可能成為全球首個世界模型獨角獸公司。

根據報導,World Labs的估值已經突破了50億美元,並且擬融資5億美元。

而2024年9月的時候,這家公司才以10億美元估值完成2.3億美元融資,正式在公眾面前亮相。

從結果上來看,從登場到50億美元估值,李飛飛僅用了16個月的時間。

這個速度有多快?

OpenAI從2015年成立,到 2019年微軟首次投資,此時他們的估值也只有10億美元。

最接近World Labs速度的可能是Anthropic,但也花了25個月。

如果說李飛飛是世界模型教母,那麼楊立昆可以說是世界模型教父。

2025年12月,楊立昆在LinkedIn上確認離開Meta,結束了他在這家公司長達12年的職業生涯。

楊立昆創立的新公司名為Advanced Machine Intelligence Labs,總部設在巴黎。AMI Labs正在尋求以30至35億歐元估值融資5億歐元。

不過,這兩家企業高估值背後,並非對世界模型這一技術的吹捧,而是實打實的技術落地和商業化。

何為World Labs?

World Labs的投資方陣容包括Andreessen Horowitz、NEA、Radical Ventures(李飛飛本人是Radical Ventures的科學合夥人)、輝達風投部門、沙烏地阿拉伯Sanabil Investments和新加坡淡馬錫。

天使投資人包括GoogleDeepMind首席科學家傑夫·迪恩(Jeff Dean),以及圖靈獎得主傑佛瑞·辛頓(Geoffrey Hinton)。

World Labs的核心技術理念叫做空間智能,這是一種“升維”的概念。

目前的頂尖AI雖然看起來很聰明,但它們本質上是“二維”的。它們只是處理文字序列或者像素排列,它們並不理解體積、有重量、受重力影響的實體。

World Labs的空間智能技術,就是要賦予AI“對三維世界的認知能力”。

以生成視訊為例,空間智能是直接生成一個具有三維結構、且符合物理規律的虛擬環境,然後再在這個環境裡去模擬要生成的實體。實體不僅有長寬高,還有材質和物理反饋。

在傳統的AI訓練中,模型學習的是像素之間的機率關聯,比如藍天下面通常是綠地,綠地旁邊通常是小溪。

但World Labs的世界模型則是基於三維幾何與物理模擬的原理進行訓練的。

它在學習資料的過程中,得到的不僅僅是圖像的紋理,還有圖像背後的空間幾何資訊(比如深度、遮擋關係、透視角度)以及物理動力學規則(比如剛體如何碰撞、流體如何流動、光線如何反射)。

2025年11月,World Labs推出首款商業產品Marble,這是一個能夠從文字、圖像、視訊或粗略3D佈局生成持久化3D世界的模型。

Marble的技術底層採用神經輻射場(NeRF)和高斯點雲(3D Gaussian Splatting)技術,而非傳統的多邊形網格。

神經輻射場是一種利用神經網路表示三維場景的技術,它將場景表示為連續的體積函數,輸入三維空間坐標和觀察方向,輸出該點的顏色和體積密度。這種方法通過多層感知機學習場景的幾何和光照資訊,然後通過體積渲染生成逼真的新視角圖像。

相當於在相同場景內,從每一個角度對實體進行拍攝,這樣生成實體以後,使用者從那個角度看都符合物理規律。

高斯點雲則是另一種三維表示方法,它用數百萬個帶有位置、大小、形狀、顏色和透明度屬性的高斯橢球體來表示場景,渲染速度比神經輻射場快得多,同時保持了高品質的視覺效果。

類似於樂高,通過小積木塊最終搭建成完整的實體。

這使其能夠生成連續的輻射場,包含空間理解、光照和深度資訊的完整環境,而不是簡單地組裝多邊形。

在2026年CES大會上,李飛飛在AMD CEO蘇姿丰的主題演講中展示了Marble的能力。

李飛飛說:“將少數圖片變成連貫、即時的世界,不再是對遙遠未來的一瞥,而是下一章的開始。AI 正在給人們的生活帶來一些改變,將少數圖片或照片轉化為一個即時可探索的世界。空間智能需要極致算力支援,才能實現可互動級影格率和無限持久的世界互動。”

World Labs採用免費增值模式,免費版提供4次生成,20 美元每月可獲得更多生成次數,最高95美元每月提供75次生成和商業使用權。

目標客戶包括遊戲開發者、影視特效製作、虛擬現實應用。而且Marble還支援蘋果Vision Pro和Quest 3 VR頭顯,每個生成的世界都可以在VR中查看。

更重要的是,Marble可以匯出與Unreal Engine和Unity相容的格式,這意味著它可以無縫整合到現有的遊戲開發流程中。

李飛飛曾在訪談中表示,這項技術可能顛覆Unity和Epic Games的Unreal Engine等傳統遊戲引擎。

除了AIGC產業,World Labs還瞄準機器人訓練市場,通過模擬環境訓練機器人的自主導航軟體。世界模型可以為機器人提供一個安全的虛擬訓練場,讓它們在數字空間中學習物理互動、因果關係和長期規劃,然後再應用到真實世界。

AMI Labs的技術優勢是什麼?

但AMI Labs不像李飛飛的World Labs那樣擁有實際的產品,目前還只停留在技術概念階段。

潛在投資方包括Cathay Innovation、Greycroft、Hiro Capital(楊立昆是Hiro Capital的顧問)、20VC、法國公共投資銀行Bpifrance、Daphni和HV Capital。

要注意,楊立昆在AMI Labs裡擔任的是執行主席而非CEO。

該公司CEO職位由亞歷克斯·勒布朗(Alex LeBrun)擔任,他是醫療AI初創公司Nabla的聯合創始人兼前CEO。LeBrun的前一家公司Wit.ai被Meta收購後,他曾在FAIR直接向楊立昆匯報。

團隊還包括Meta歐洲副總裁勞倫特·索利(Laurent Solly),他於2025年12月離職加入AMI。

不僅如此,AMI Labs有法國總統親自背書。法國總統馬克宏對楊立昆選擇巴黎表示自豪,承諾將盡一切努力確保他從法國取得成功。

AMI Labs的核心技術是楊立昆多年倡導的聯合嵌入預測架構(JEPA,Joint Embedding Predictive Architecture)。

以往的AI,都是逐token生成輸出的,然而聯合嵌入預測架構能一口氣直接以抽象表示的形式來建立世界,能夠更好地預測未來狀態。

聯合嵌入預測架構的工作原理是,它不預測原始像素或token,而是預測高層次的嵌入表示。

系統有兩個編碼器,一個處理上下文資訊,另一個處理目標資訊,還有一個預測器在嵌入空間中進行預測。這種方法避免了生成模型的一個關鍵問題,生成模型必須預測每一個像素或token,包括那些不可預測的隨機細節,而聯合嵌入預測架構只關注可預測的高層次特徵,忽略無關緊要的細節。

楊立昆在哈佛演講中解釋,這類系統通過在嵌入空間中進行最佳化來實現規劃和推理。

AMI Labs公司將推進AI研究並開發可靠性、可控性和安全性真正重要的應用,特別是工業過程控制、自動化、可穿戴裝置、機器人、醫療保健等領域。

AMI Labs的第一個應用將是醫療保健。

具體來講,AMI Labs通過與Nabla合作,開發臨床護理AI助手。截止發稿,這個AI助手已獲得了1.2億美元融資,預計兩年內達到1億美元年度訂閱收入。

作為交易的一部分,Nabla獲得AMI世界模型的特權訪問權,而亞歷克斯從CEO轉為首席AI科學家兼董事長。

亞歷克斯表示,他加入AMI的一個重要原因是將世界模型應用於醫療保健的前景,因為醫療保健的複雜性和高風險性使其成為測試世界模型的理想場景。

FDA認證要求確定性、可解釋的推理,這正是LLM無法提供而世界模型承諾實現的。大語言模型存在幻覺問題,在醫療場景中可能導致嚴重後果,而世界模型通過建立對患者生理狀態的內部模擬,可以預測疾病進展,提供更可靠的決策支援。

2026年1月,楊立昆還加入了另一家初創公司Logical Intelligence,擔任技術研究委員會創始主席。這家公司推出了名為Kona 1.0的能量基礎推理模型,通過對約束條件評分來驗證和最佳化解決方案,尋找最低能量也就是最一致的結果。

這種非自回歸模型也和AMI Labs的聯合嵌入預測架構相似,能夠一口氣生成完整的推理軌跡。

能量基礎模型是一類通過能量函數來定義機率分佈的模型。在這個框架中,每個可能的輸出都被賦予一個能量值,能量越低表示該輸出越符合約束條件。

模型通過最佳化過程尋找能量最小的解決方案。這種方法的優勢在於可以同時考慮多個約束條件,並且可以進行全域最佳化,而不是像自回歸模型那樣只能做局部決策。

楊立昆表示,AGI的最終狀態不會來自單一模型類別,而需要能量基礎模型、LLM、世界模型等組成的相互依存的生態系統。

都是世界模型,

兩家又有什麼不同?

雖然李飛飛和楊立昆都在建構世界模型,但技術路線存在根本差異。

由於技術還處於早期,World Labs的Marble本質上還是傳統的生成式AI方法。它確實能生成3D世界,但這些世界本身還不具備物理知識。

World Labs聯合創始人在採訪中表示,Marble生成的羅馬拱門並不知道如果移除一塊磚,其他磚可能會掉落。它只是學會了羅馬拱門在視覺上應該是什麼樣子,而不是理解支撐它的物理原理。

這種方法在創意內容生成方面表現出色,可以快速產出視覺上令人信服的場景,但缺乏對因果關係的深層理解。

相比之下,因為楊立昆的聯合嵌入預測架構能夠直接生成完整的結果,它就能夠表示出來這裡面的因果關係。

但是在市場方面,World Labs已經獲得了早期客戶。World Labs透露已有多家組織採用了Marble API。這種先發優勢使其在融資談判中佔據有利位置。

World Labs明確瞄準創意產業,這些市場已經存在,客戶有明確的痛點,3D 內容製作成本高、周期長,Marble提供了立竿見影的價值。

遊戲開發者可以用Marble快速生成背景環境,然後在Unity或Unreal Engine中加入互動邏輯。影視製作團隊可以用它進行虛擬場景預覽,大幅縮短前期製作時間。

從商業角度看,World Labs的策略更加務實。它選擇了一個已經存在的市場,提供了一個可以立即使用的產品,並且建立了清晰的商業模式。

AMI Labs有點超前,它押注於一個尚未成熟的市場,追求技術突破,給這片全新的市場帶來需求。這種方法風險更高,但如果成功,回報也會更大。

李飛飛的World Labs紮根矽谷,投資方以美國VC為主,雖然也包括沙烏地阿拉伯和新加坡主權基金。這使其能夠充分利用矽谷的人才、資本和客戶網路。

反觀楊立昆,他選擇巴黎作為總部,這不僅是個人偏好,更是戰略選擇。

歐盟正在建立AI主權,減少對美國科技巨頭的依賴。AMI Labs獲得法國政府的高調支援,可能在歐洲監管環境中獲得優勢,特別是在醫療保健等高度監管的領域。

兩家公司的人才策略也有所不同。

World Labs主要招募的是大量電腦視覺和圖形學背景的研究者,這些人擅長處理視覺資料和渲染問題。AMI Labs方面則更傾向於招募有機器學習理論和物理建模背景的研究者,這些人更關注模型的數學基礎和泛化能力。

李飛飛相信通過大規模資料和計算,可以讓模型學會對空間的隱式理解,即使它不明確建模物理規律。這種方法在電腦視覺領域已經被證明有效,ImageNet項目就是最好的例證。

楊立昆則堅持認為,真正的智能需要顯式的世界模型,需要理解因果關係而不僅僅是相關性。他多年來一直批評純粹的生成式方法,認為它們無法達到人類水平的推理能力。

所以看下來,雖然兩個人的技術完全不同,然而實際上,這兩條路之間好像也沒有那麼水火不相容。

事實上,它們可能最終會融合。World Labs的生成能力可以為楊立昆的因果模型提供豐富的訓練資料,而聯合嵌入預測架構的推理能力可以增強Marble的物理一致性。

AI的未來可能不是選擇其中一條路,而是找到兩者的最佳結合點。

無論那條路徑最終勝出,世界模型都代表了AI從理解語言到理解物理世界的重要轉變。

它意味著我們不再滿足於讓AI模仿人類的語言能力,而是要讓它理解什麼才叫客觀規律。 (新浪科技)