#Marble
兆豪賭:年底AI大戰背後的三個趨勢
今天我們要關注的重點是AI。不知道你發現一件事沒有,每到年底,各路AI大廠的動作都特別密集。11月12日,李飛飛發佈了新的世界模型Marble。11月13日,OpenAI宣佈推出GPT-5.1。11月18日,Google發佈了Gemini 3,號稱是目前為止測試評分最高的大模型之一。從10月初到11月中旬,中國多家AI企業也在密集發佈模型更新。螞蟻、阿里、科大訊飛、字節、百度,幾乎是排著隊發佈。在年底的這一輪“AI熱點大爆發”裡,有那些消息特別值得留意呢?接下來,咱們就展開說說。01 AI的技術在分化回顧去年這個時候,山姆·奧特曼宣佈,OpenAI要連續12天發佈新品。12月也成了OpenAI一年中火力最猛的時期。而且幾乎是同時,Google發佈Gemini2,號稱是“專為智能體而生”。還有,李飛飛的第一個AI系統,World Labs也是在這個時間發佈的。而今年呢,情況與去年驚人地押韻。只不過,整體提早了大概一個月。我們大致給這些AI界的消息分了分類,可以用三個關鍵詞概括。分別是,技術的分化、資源的分化,以及“賭注”的極端化。第一,AI的技術分化。今天的AI公司看起來很多,怎麼快速瞭解它們的技術走向呢?關於這個問題,喻穎正老師做過一個分類。世界上的AI流派,大概可以分成三種:湧現派、訓鳥派、飛機派。湧現派,代表人物是奧特曼。他們相信“規模化就是一切”。只要喂足夠多的資料,AI就會自發“湧現”出智能。就像天才兒童看了足夠多關於鳥和飛機的視訊,就能自己發明空氣動力學一樣。目前的多數AI公司,包括Google在內,也都屬於這一派。訓鳥派,代表人物就是李飛飛。她認為AI需要“身體”,需要在物理世界中學習。所有抽象概念都源於身體與物理世界的互動經驗,沒有身體,就沒有真正的理解。所以AI需要的不是被動的視訊資料,而是通過機器人主動互動收集到的“動作資料”。飛機派,代表人物是楊立昆。他認為大模型只是“鸚鵡學舌”,AI需要先天架構才能組織經驗。人類不是通過模仿鳥學會飛行的,而是通過理解空氣動力學原理造出了飛機。AI必須通過一個全新設計的、非生成式的“世界模型”來學習抽象規則和因果。我們今天看到的多數AI技術的進展,在底層模型這個層面,都可以歸類到前面三者中的某一個。比如,李飛飛發佈Marble,是“訓鳥派”的實踐。她在為AI建構一個可以“練習飛行”的高保真模擬器。而Google發佈了Gemini 3。這個模型在評測平台LMArena上以1501分的歷史最高分登頂,成為首個突破1500分的模型。這是“湧現派”的延續,繼續在規模化的道路上狂奔。前面三個流派,都只是在基礎模型這個維度上的分類。而在基礎模型之上,目前AI領域還有另一個關鍵維度,應用層。現在有大量的公司,都把精力聚焦在了應用層。比如,從10月初到11月中旬,中國多家AI企業陸續發佈了大模型更新。10月9日,螞蟻集團推出兆參數通用模型,主打金融場景。10月15日,阿里巴巴開源支援256K超長上下文的視覺語言模型,主打視覺理解。11月初,科大訊飛發佈星火大模型X1.5版本,強調醫療領域優勢。這些模型的差異化,不再是參數規模,而是垂直領域的能力。大家都在強調自己在特定場景的優勢,而不是單純地比拚模型大小。當然,不只是AI的技術在分化,它背後的資本也在分化。02 AI背後資本的分化第二個關鍵詞,資本的分化。一邊是持續押注,另一邊是看衰做空。最近,關於AI泡沫的討論一直很激烈。11月19日,在美國—沙烏地阿拉伯投資論壇上,主持人直接向黃仁勳和馬斯克提問:“我們正在面臨一場AI泡沫嗎?”這個問題不是空穴來風。看幾個數字你就明白了。輝達從1兆美元市值漲到5兆美元,用時不到兩年半,漲幅400%。《經濟學人》統計顯示,自2022年11月ChatGPT發佈以來,AI概念股累計貢獻了美股標普500指數3/4的漲幅。整個2024年,美國家庭新增財富接近一半由AI概念股創造。更驚人的資料是,2025年上半年,美國有92%的GDP增長是AI產業支出貢獻的。但問題在於,這些投入能換來多少回報?OpenAI單周活躍使用者超8億人,但付費使用者比例僅5%。2024年營收不到40億美元,虧損卻超50億美元,但未來五年投資承諾高達1.4兆美元。摩根大通研報估計:到2030年,美國AI企業承諾的軟硬體投資額度,可能逼近每年7兆美元,即使只要求10%的資本回報率,每年也得尋求至少6500億美元營收。但整個2024年,美國AI產業實際營收僅500億美元,只有目標的一個零頭。麥肯錫調研顯示,近80%部署AI的企業沒能實現淨利潤提升,95%的生成式AI試點項目沒有帶來直接財務回報。比爾·蓋茲、IMF總裁格奧爾基耶娃都警告,美國當前正處於類似上世紀90年代末“網際網路泡沫”的AI投資熱潮,許多當下投資最終可能成為壞帳。前段時間,著名的“大空頭”麥可·貝瑞,還把13.5%的投資組合用於做空輝達。但是,與此同時,也有大量資本對AI依然充滿熱情。比如,巴菲特在今年11月建倉Google,這算是個直接訊號。當然,巴菲特對Google的投資並不完全是出於AI的考量,我們在這裡就不細說了。再比如,還有個值得留意的消息,只不過這個消息有點迂迴,需要多解釋兩句。前段時間,亞馬遜宣佈裁員1.4萬人。裁員消息公佈當天,亞馬遜股價不跌反漲1%。財報發佈後,股價更是暴漲13%,市值單日增加3000億美元。你看,華爾街不但不擔心亞馬遜裁員,反而覺得這是好事。因為外界對這件事的普遍解讀是,亞馬遜在通過裁員留出更多的預算,並且把這些預算用來投資伺服器與資料中心。說白了,這更像是在為AI投資騰出預算。外界看好亞馬遜,本質是在某種程度上看好AI。有人在瘋狂押注AI,有人在質疑泡沫,有人在調整結構為AI騰空間。這就是我們所說的,資本的分化。03 賭注的極端化第三個關鍵詞,賭注的極端化。技術在分化,資本在分化,但有一件事情是一致的:這個行業裡的賭注,正在變得越來越極端。11月6日,特斯拉股東大會上,超過76%的股東批准了馬斯克的新薪酬方案。假如目標達成,馬斯克將獲得最高1兆美元市值的特斯拉股票。但注意,馬斯克要拿到這筆錢,需要完成幾個極具挑戰性的目標:特斯拉的市值從1.5兆增長到8.5兆美元,同時實現累計交付2000萬輛汽車、100萬台人形機器人商用、100萬輛自動駕駛計程車上路。這幾個目標與AI的關聯度很高。換句話說,這筆錢不是在獎勵馬斯克過去的貢獻,而是在為特斯拉的未來下注,而且是個極端的賭注。賭對了,馬斯克拿走1兆美元,股東的財富也會暴漲。賭錯了,這個薪酬方案就是一張廢紙。再看人才市場。11月12日,被稱為“AI天才少女”的羅福莉在朋友圈官宣加入小米。根據相關報導,羅福莉的年薪在千萬等級。字節跳動最近也啟動了針對AI核心人才的激勵實驗。據說他們還為旗下Seed部門發放了每月10萬元左右的津貼,面向大模型方向的技術員工。根據中國獵頭機構的資料,AI相關崗位的薪資今年明顯上漲。很多演算法工程師在跳槽的過程中,年薪漲了一倍不止。而像清華、北大、浙大、上交這些頂尖高校出來的AI博士,頂尖人才的年薪可以達到200萬到400萬元之間。根據中國國務院發展研究中心預測,中國具身智能產業的市場規模,2030年將達到4000億元,2035年預計突破兆元。從馬斯克的兆薪酬,到AI人才的千萬年薪,再到兆級的產業預測,這些數字背後也許是一個共同的邏輯:AI不再是一個可以慢慢試錯的領域,而是一場必須全力以赴的豪賭。前面這些新聞乍一看好像很分散,但是,假如放在一起看,我們或許會產生一個總體的感受。這就是,AI正在從一個技術話題,變成一個關於選擇和押注的話題。技術路線在分化,沒人知道湧現派、訓鳥派、飛機派誰會贏。資本在分化,有人瘋狂進場,有人質疑泡沫。賭注在極端化,從兆薪酬到千萬年薪,每個數字背後都是一個關於未來的押注。李飛飛在《世界模型宣言》中說過一句話,講的是關於AI未來的可能性,我們放在最後,作為今天的結尾吧。這句話是這麼說的,“我語言的極限,意味著我世界的極限。我不是哲學家,但我深知,至少對AI而言,世界遠不止於文字。” (羅輯思維)
李飛飛團隊推出首款商用世界模型Marble
據科技媒體TechCrunch報導,人工智慧先驅李飛飛聯合創立的World Labs公司近日正式發佈首款商業化“世界模型”產品Marble,標誌著AI空間智能領域迎來重要突破。該產品支援文字、照片、視訊等多模態輸入,可生成可編輯、可下載的3D環境,現已開放免費增值與付費訂閱服務。此次發佈距World Labs結束“隱身模式”並完成2.3億美元融資僅一年有餘,使其在該賽道領先競品,目前Decart、Odyssey僅推出免費演示版,GoogleGenie仍處於有限研究預覽階段。作為業內首款原生整合AI編輯工具的世界模型,Marble核心優勢在於生成持久化3D環境,能減少場景變形與不一致性,支援匯出多種格式,區別於同類動態生成模式。其在創意控制上實現多重突破:輸入方式升級為多模態相容,可生成高逼真數字孿生環境;創新3D編輯器Chisel實現“結構與風格”解耦,支援直接操控3D對象;還新增世界擴展功能與合成器模式,可實現多3D世界無縫拼接。此前World Labs早期模型及Beta版已展現3D生成能力,正式版進一步最佳化邊緣形變等問題。Marble首批聚焦遊戲開發、影視視效、虛擬現實三大場景,同時在機器人領域潛力顯著。在遊戲開發中,針對行業對生成式AI的審慎態度及智慧財產權等關切,Marble作為資產生成工具嵌入現有流程,生成環境可匯入主流引擎;在影視視效領域,其3D資產解決AI視訊生成常見問題;在虛擬現實領域,產品已相容主流頭顯;在機器人研發中,能建構模擬訓練環境降低資料獲取門檻。為滿足多元需求,Marble推出四檔訂閱方案:免費版支援4次基礎生成,標準版(20美元/月)提供12次生成及高級編輯,專業版(35美元/月)含25次生成與商業使用權,旗艦版(95美元/月)解鎖全部功能與75次生成權限。World Labs 首席執行官李飛飛在《世界模型宣言》中表示,Marble 是建構 “真正具備空間智能的世界模型” 的關鍵一步。她指出,下一代世界模型將推動機器在空間智能層面實現質的飛躍,正如大語言模型教會機器 “讀寫”,Marble 這類系統將教會機器 “觀察” 與 “建構”。這種對三維空間中物體存在方式與互動規律的理解,有望讓機器智能突破現有應用領域,延伸至科學探索、醫療創新等更廣闊的領域。李飛飛強調:“若無空間智能,我們對真正智慧型手機器的憧憬便永無圓滿之日。” (環球Tech)
巨大進步!李飛飛“空間智能”最新成果,單個圖像生成大規模3D世界,更持久、可導航、可控制
今天,“AI教母”、斯坦福大學教授李飛飛創辦的AI公司空間智能(World Labs)發佈了一項重磅新成果:Marble模型,可從單個圖像生成持久的3D世界,比以往更大更好。李飛飛表示:“這是3D世界生成領域取得的巨大進步,它讓我驚嘆不已!”空間智能團隊在介紹部落格中提到,這次提高了模型生成清晰、連貫的幾何圖形來代表完整的3D環境的能力,並以多種多樣的風格想像世界。使用者只需要給定一個圖像或文字提示,Marble模型就能生成一個3D世界,還可以讓你隨心所欲地探索——沒有時間限制、沒有變形、沒有不一致性。借助World Labs提供的開源渲染庫Spark,愛好者和建構者可以將生成的3D世界匯出為高斯分佈圖,並將其用於後續商業項目,例如建構基於Web的3D體驗,在桌上型電腦、筆記型電腦、移動裝置和VR頭顯上進行高效渲染。目前該公司在Marble.worldlabs.ai推出Marble模型的有限訪問Beta預覽版,使用者可以在此頁面查看和建立3D世界。技術層面的大升級據瞭解,Marble模型採用了更優的幾何結構,通過建立可導航的3D場景解決方案,讓使用者能像電影製作人一樣在連貫一致的3D場景中規劃鏡頭。對於視覺創作者而言,在連貫一致的3D世界中自由導航與互動是眾多工作流程和應用場景的核心。Marble生成的3D世界支援在使用者瀏覽器中免費進行自由視點導航,與深度圖或點雲提供的有限3D體驗不同,該模型生成的世界具有更豐富的幾何複雜性,能生成更完整的3D世界,讓使用者可以窺見輸入視角之外的景象。不過,官方表示,當前的模型只專注於建立3D環境,處理孤立或核心物體例如人物或動物還不支援。一起來看看部分使用者生成的效果:其次,Marble支援的生成風格更加多樣化,既能生成超寫實的環境,又能創造風格化的動漫世界,為遊戲或創意工作提供更多可能。生成式AI最令人興奮的特質之一是在創意過程中能自由迭代視覺效果。Marble模型可將多種不同風格的輸入內容轉化為3D形式——從扁平色彩卡通到寫實細膩的圖像,讓創作者能通過探索迭代找到最適合項目的虛擬世界。最後一個技術特徵是實現了大規模持久化的3D幾何重建,初步展示了使用者將生成空間組合成更宏大環境時的可能性——憑藉模型實現的風格一致性與幾何連貫性,Marble模型現已能流暢導航、瀏覽此類擴展世界,並為宏大場景構想多種應用方案。產品發佈上線後,有使用者問這與Google Genie項目相比如何?李飛飛回覆說,Marble生成的世界將永久存在,使用者可以隨心所欲地在世界中導航,無需支付任何費用。不斷進化的空間智能有早期使用者表示Gen-AI讓將創意轉化為人們可以分享的體驗變得異常簡單,以前需要數週時間或收集現有素材才能完成的事情,現在只需使用幾個小時就能搞定了。前Google創意技術專家、獨立開發者Cristian Peñas表示,Marble是目前使用高斯濺射生成3D世界的最佳工具。也有使用者試用後稱讚,使用介面簡單,生成質量相當不錯且驚豔,細節清晰,沒有明顯的抖動或變形,光照氛圍感也很好。在當下日新月異的AI市場中,World Labs團隊更新產品和模型的速度並不算快,上一次推出首個能夠從單張圖片生成3D世界的AI系統還是在2024年12月初,去年9月World Labs曾宣佈完成一輪2.3億美元融資,不過具體估值並未公開。好在,World Labs的Marble模型在技術上仍處於全球第一梯隊,特別是在“從單圖像生成具有高度一致性的可導航3D場景”這一細分任務上表現突出。空間智能旨在讓機器不僅能“看見”世界,更能深度理解物理世界的結構、規律並進行互動和創造,完整的空間智能需要有機整合三維感知、空間推理以及多模態生成。李飛飛曾在其個人社交平台上表示,空間智能是AI中難以解決的一個問題,但這項技術可以賦能和實現創造、設計、學習、AR/VR、機器人等領域的無數可能。她認為“空間智能”(Spatial Intelligence)是人工智慧(AI)邁向通用人工智慧(AGI)的關鍵與核心,若AI不能理解三維世界,就無法實現真正的AGI。四面而來的市場壓力World Labs所主攻的空間智能方向目前正成為熱門技術賽道,國內外廠商正在紛紛佈局,從各個維度展開競爭。例如GoogleDeepMind近期發佈的超真實世界模型Genie 3,是首個允許即時互動的世界模型,在生成內容的連貫性上堪稱質的飛躍,同時在通用性、物理規律、視覺記憶方面實現全新水平。輝達專門設有空間智能實驗室(NVIDIA Spatial Intelligence Lab),該公司打造的Omniverse平台,逐步升級為支援工業協作、元宇宙、人形機器人等場景的空間智能平台,實現跨裝置、跨軟體的即時協同與物理模擬。國內廠商如崑崙萬維在8月份發佈了首個前饋全景3D場景生成模型Matrix-3D,具備場景全域一致、生成場景範圍大、生成高度可控等特點,能根據文字和圖像輸入生成幾何結構精準、遮擋關係自然、紋理風格統一的3D場景,還支援自訂範圍與無限擴展。騰訊在9月開放原始碼的HunyuanWorld-Voyager,宣稱是業界首個支援原生3D重建的超長漫遊世界模型,一張圖就能生成3D場景和移動視角視訊,在李飛飛團隊發佈的世界模型基準測試WorldScore上綜合能力出色。作為“杭州六小龍之一”的群核科技,在今年的技術開放日上推出了空間語言模型SpatialLM 1.5與空間生成模型SpatialGen,可根據文字描述、參考圖像和3D空間佈局,生成具有時空一致性的多視角圖像,並支援進一步生成3D高斯(3DGS)場景並渲染漫遊視訊。隨著競爭對手增多,World Labs想要獲得商業成功的挑戰正在加大。這不僅取決於能否持續保持原生空間智能技術的領先優勢,也在於相比競爭對手能否建構強大的開發者生態和產品整合,使其生成技術能輕鬆進入主流工具創作流程,並實現可規模化的商業落地模式。 (頭部科技)