#Marble | 熱門關鍵字 | 鉅亨號

今天我們要關注的重點是AI。不知道你發現一件事沒有，每到年底，各路AI大廠的動作都特別密集。11月12日，李飛飛發佈了新的世界模型Marble。11月13日，OpenAI宣佈推出GPT-5.1。11月18日，Google發佈了Gemini 3，號稱是目前為止測試評分最高的大模型之一。從10月初到11月中旬，中國多家AI企業也在密集發佈模型更新。螞蟻、阿里、科大訊飛、字節、百度，幾乎是排著隊發佈。在年底的這一輪“AI熱點大爆發”裡，有那些消息特別值得留意呢？接下來，咱們就展開說說。01 AI的技術在分化回顧去年這個時候，山姆·奧特曼宣佈，OpenAI要連續12天發佈新品。12月也成了OpenAI一年中火力最猛的時期。而且幾乎是同時，Google發佈Gemini2，號稱是“專為智能體而生”。還有，李飛飛的第一個AI系統，World Labs也是在這個時間發佈的。而今年呢，情況與去年驚人地押韻。只不過，整體提早了大概一個月。我們大致給這些AI界的消息分了分類，可以用三個關鍵詞概括。分別是，技術的分化、資源的分化，以及“賭注”的極端化。第一，AI的技術分化。今天的AI公司看起來很多，怎麼快速瞭解它們的技術走向呢？關於這個問題，喻穎正老師做過一個分類。世界上的AI流派，大概可以分成三種：湧現派、訓鳥派、飛機派。湧現派，代表人物是奧特曼。他們相信“規模化就是一切”。只要喂足夠多的資料，AI就會自發“湧現”出智能。就像天才兒童看了足夠多關於鳥和飛機的視訊，就能自己發明空氣動力學一樣。目前的多數AI公司，包括Google在內，也都屬於這一派。訓鳥派，代表人物就是李飛飛。她認為AI需要“身體”，需要在物理世界中學習。所有抽象概念都源於身體與物理世界的互動經驗，沒有身體，就沒有真正的理解。所以AI需要的不是被動的視訊資料，而是通過機器人主動互動收集到的“動作資料”。飛機派，代表人物是楊立昆。他認為大模型只是“鸚鵡學舌”，AI需要先天架構才能組織經驗。人類不是通過模仿鳥學會飛行的，而是通過理解空氣動力學原理造出了飛機。AI必須通過一個全新設計的、非生成式的“世界模型”來學習抽象規則和因果。我們今天看到的多數AI技術的進展，在底層模型這個層面，都可以歸類到前面三者中的某一個。比如，李飛飛發佈Marble，是“訓鳥派”的實踐。她在為AI建構一個可以“練習飛行”的高保真模擬器。而Google發佈了Gemini 3。這個模型在評測平台LMArena上以1501分的歷史最高分登頂，成為首個突破1500分的模型。這是“湧現派”的延續，繼續在規模化的道路上狂奔。前面三個流派，都只是在基礎模型這個維度上的分類。而在基礎模型之上，目前AI領域還有另一個關鍵維度，應用層。現在有大量的公司，都把精力聚焦在了應用層。比如，從10月初到11月中旬，中國多家AI企業陸續發佈了大模型更新。10月9日，螞蟻集團推出兆參數通用模型，主打金融場景。10月15日，阿里巴巴開源支援256K超長上下文的視覺語言模型，主打視覺理解。11月初，科大訊飛發佈星火大模型X1.5版本，強調醫療領域優勢。這些模型的差異化，不再是參數規模，而是垂直領域的能力。大家都在強調自己在特定場景的優勢，而不是單純地比拚模型大小。當然，不只是AI的技術在分化，它背後的資本也在分化。02 AI背後資本的分化第二個關鍵詞，資本的分化。一邊是持續押注，另一邊是看衰做空。最近，關於AI泡沫的討論一直很激烈。11月19日，在美國—沙烏地阿拉伯投資論壇上，主持人直接向黃仁勳和馬斯克提問：“我們正在面臨一場AI泡沫嗎？”這個問題不是空穴來風。看幾個數字你就明白了。輝達從1兆美元市值漲到5兆美元，用時不到兩年半，漲幅400%。《經濟學人》統計顯示，自2022年11月ChatGPT發佈以來，AI概念股累計貢獻了美股標普500指數3/4的漲幅。整個2024年，美國家庭新增財富接近一半由AI概念股創造。更驚人的資料是，2025年上半年，美國有92%的GDP增長是AI產業支出貢獻的。但問題在於，這些投入能換來多少回報？OpenAI單周活躍使用者超8億人，但付費使用者比例僅5%。2024年營收不到40億美元，虧損卻超50億美元，但未來五年投資承諾高達1.4兆美元。摩根大通研報估計：到2030年，美國AI企業承諾的軟硬體投資額度，可能逼近每年7兆美元，即使只要求10%的資本回報率，每年也得尋求至少6500億美元營收。但整個2024年，美國AI產業實際營收僅500億美元，只有目標的一個零頭。麥肯錫調研顯示，近80%部署AI的企業沒能實現淨利潤提升，95%的生成式AI試點項目沒有帶來直接財務回報。比爾·蓋茲、IMF總裁格奧爾基耶娃都警告，美國當前正處於類似上世紀90年代末“網際網路泡沫”的AI投資熱潮，許多當下投資最終可能成為壞帳。前段時間，著名的“大空頭”麥可·貝瑞，還把13.5%的投資組合用於做空輝達。但是，與此同時，也有大量資本對AI依然充滿熱情。比如，巴菲特在今年11月建倉Google，這算是個直接訊號。當然，巴菲特對Google的投資並不完全是出於AI的考量，我們在這裡就不細說了。再比如，還有個值得留意的消息，只不過這個消息有點迂迴，需要多解釋兩句。前段時間，亞馬遜宣佈裁員1.4萬人。裁員消息公佈當天，亞馬遜股價不跌反漲1%。財報發佈後，股價更是暴漲13%，市值單日增加3000億美元。你看，華爾街不但不擔心亞馬遜裁員，反而覺得這是好事。因為外界對這件事的普遍解讀是，亞馬遜在通過裁員留出更多的預算，並且把這些預算用來投資伺服器與資料中心。說白了，這更像是在為AI投資騰出預算。外界看好亞馬遜，本質是在某種程度上看好AI。有人在瘋狂押注AI，有人在質疑泡沫，有人在調整結構為AI騰空間。這就是我們所說的，資本的分化。03 賭注的極端化第三個關鍵詞，賭注的極端化。技術在分化，資本在分化，但有一件事情是一致的：這個行業裡的賭注，正在變得越來越極端。11月6日，特斯拉股東大會上，超過76%的股東批准了馬斯克的新薪酬方案。假如目標達成，馬斯克將獲得最高1兆美元市值的特斯拉股票。但注意，馬斯克要拿到這筆錢，需要完成幾個極具挑戰性的目標：特斯拉的市值從1.5兆增長到8.5兆美元，同時實現累計交付2000萬輛汽車、100萬台人形機器人商用、100萬輛自動駕駛計程車上路。這幾個目標與AI的關聯度很高。換句話說，這筆錢不是在獎勵馬斯克過去的貢獻，而是在為特斯拉的未來下注，而且是個極端的賭注。賭對了，馬斯克拿走1兆美元，股東的財富也會暴漲。賭錯了，這個薪酬方案就是一張廢紙。再看人才市場。11月12日，被稱為“AI天才少女”的羅福莉在朋友圈官宣加入小米。根據相關報導，羅福莉的年薪在千萬等級。字節跳動最近也啟動了針對AI核心人才的激勵實驗。據說他們還為旗下Seed部門發放了每月10萬元左右的津貼，面向大模型方向的技術員工。根據中國獵頭機構的資料，AI相關崗位的薪資今年明顯上漲。很多演算法工程師在跳槽的過程中，年薪漲了一倍不止。而像清華、北大、浙大、上交這些頂尖高校出來的AI博士，頂尖人才的年薪可以達到200萬到400萬元之間。根據中國國務院發展研究中心預測，中國具身智能產業的市場規模，2030年將達到4000億元，2035年預計突破兆元。從馬斯克的兆薪酬，到AI人才的千萬年薪，再到兆級的產業預測，這些數字背後也許是一個共同的邏輯：AI不再是一個可以慢慢試錯的領域，而是一場必須全力以赴的豪賭。前面這些新聞乍一看好像很分散，但是，假如放在一起看，我們或許會產生一個總體的感受。這就是，AI正在從一個技術話題，變成一個關於選擇和押注的話題。技術路線在分化，沒人知道湧現派、訓鳥派、飛機派誰會贏。資本在分化，有人瘋狂進場，有人質疑泡沫。賭注在極端化，從兆薪酬到千萬年薪，每個數字背後都是一個關於未來的押注。李飛飛在《世界模型宣言》中說過一句話，講的是關於AI未來的可能性，我們放在最後，作為今天的結尾吧。這句話是這麼說的，“我語言的極限，意味著我世界的極限。我不是哲學家，但我深知，至少對AI而言，世界遠不止於文字。” (羅輯思維)

科技

2025/11/14

•

李飛飛團隊推出首款商用世界模型Marble

據科技媒體TechCrunch報導，人工智慧先驅李飛飛聯合創立的World Labs公司近日正式發佈首款商業化“世界模型”產品Marble，標誌著AI空間智能領域迎來重要突破。該產品支援文字、照片、視訊等多模態輸入，可生成可編輯、可下載的3D環境，現已開放免費增值與付費訂閱服務。此次發佈距World Labs結束“隱身模式”並完成2.3億美元融資僅一年有餘，使其在該賽道領先競品，目前Decart、Odyssey僅推出免費演示版，GoogleGenie仍處於有限研究預覽階段。作為業內首款原生整合AI編輯工具的世界模型，Marble核心優勢在於生成持久化3D環境，能減少場景變形與不一致性，支援匯出多種格式，區別於同類動態生成模式。其在創意控制上實現多重突破：輸入方式升級為多模態相容，可生成高逼真數字孿生環境；創新3D編輯器Chisel實現“結構與風格”解耦，支援直接操控3D對象；還新增世界擴展功能與合成器模式，可實現多3D世界無縫拼接。此前World Labs早期模型及Beta版已展現3D生成能力，正式版進一步最佳化邊緣形變等問題。Marble首批聚焦遊戲開發、影視視效、虛擬現實三大場景，同時在機器人領域潛力顯著。在遊戲開發中，針對行業對生成式AI的審慎態度及智慧財產權等關切，Marble作為資產生成工具嵌入現有流程，生成環境可匯入主流引擎；在影視視效領域，其3D資產解決AI視訊生成常見問題；在虛擬現實領域，產品已相容主流頭顯；在機器人研發中，能建構模擬訓練環境降低資料獲取門檻。為滿足多元需求，Marble推出四檔訂閱方案：免費版支援4次基礎生成，標準版（20美元/月）提供12次生成及高級編輯，專業版（35美元/月）含25次生成與商業使用權，旗艦版（95美元/月）解鎖全部功能與75次生成權限。World Labs 首席執行官李飛飛在《世界模型宣言》中表示，Marble 是建構 “真正具備空間智能的世界模型” 的關鍵一步。她指出，下一代世界模型將推動機器在空間智能層面實現質的飛躍，正如大語言模型教會機器 “讀寫”，Marble 這類系統將教會機器 “觀察” 與 “建構”。這種對三維空間中物體存在方式與互動規律的理解，有望讓機器智能突破現有應用領域，延伸至科學探索、醫療創新等更廣闊的領域。李飛飛強調：“若無空間智能，我們對真正智慧型手機器的憧憬便永無圓滿之日。” (環球Tech)

科技

2025/09/17

•

巨大進步！李飛飛“空間智能”最新成果，單個圖像生成大規模3D世界，更持久、可導航、可控制

今天，“AI教母”、斯坦福大學教授李飛飛創辦的AI公司空間智能（World Labs）發佈了一項重磅新成果：Marble模型，可從單個圖像生成持久的3D世界，比以往更大更好。李飛飛表示：“這是3D世界生成領域取得的巨大進步，它讓我驚嘆不已！”空間智能團隊在介紹部落格中提到，這次提高了模型生成清晰、連貫的幾何圖形來代表完整的3D環境的能力，並以多種多樣的風格想像世界。使用者只需要給定一個圖像或文字提示，Marble模型就能生成一個3D世界，還可以讓你隨心所欲地探索——沒有時間限制、沒有變形、沒有不一致性。借助World Labs提供的開源渲染庫Spark，愛好者和建構者可以將生成的3D世界匯出為高斯分佈圖，並將其用於後續商業項目，例如建構基於Web的3D體驗，在桌上型電腦、筆記型電腦、移動裝置和VR頭顯上進行高效渲染。目前該公司在Marble.worldlabs.ai推出Marble模型的有限訪問Beta預覽版，使用者可以在此頁面查看和建立3D世界。技術層面的大升級據瞭解，Marble模型採用了更優的幾何結構，通過建立可導航的3D場景解決方案，讓使用者能像電影製作人一樣在連貫一致的3D場景中規劃鏡頭。對於視覺創作者而言，在連貫一致的3D世界中自由導航與互動是眾多工作流程和應用場景的核心。Marble生成的3D世界支援在使用者瀏覽器中免費進行自由視點導航，與深度圖或點雲提供的有限3D體驗不同，該模型生成的世界具有更豐富的幾何複雜性，能生成更完整的3D世界，讓使用者可以窺見輸入視角之外的景象。不過，官方表示，當前的模型只專注於建立3D環境，處理孤立或核心物體例如人物或動物還不支援。一起來看看部分使用者生成的效果：其次，Marble支援的生成風格更加多樣化，既能生成超寫實的環境，又能創造風格化的動漫世界，為遊戲或創意工作提供更多可能。生成式AI最令人興奮的特質之一是在創意過程中能自由迭代視覺效果。Marble模型可將多種不同風格的輸入內容轉化為3D形式——從扁平色彩卡通到寫實細膩的圖像，讓創作者能通過探索迭代找到最適合項目的虛擬世界。最後一個技術特徵是實現了大規模持久化的3D幾何重建，初步展示了使用者將生成空間組合成更宏大環境時的可能性——憑藉模型實現的風格一致性與幾何連貫性，Marble模型現已能流暢導航、瀏覽此類擴展世界，並為宏大場景構想多種應用方案。產品發佈上線後，有使用者問這與Google Genie項目相比如何？李飛飛回覆說，Marble生成的世界將永久存在，使用者可以隨心所欲地在世界中導航，無需支付任何費用。不斷進化的空間智能有早期使用者表示Gen-AI讓將創意轉化為人們可以分享的體驗變得異常簡單，以前需要數週時間或收集現有素材才能完成的事情，現在只需使用幾個小時就能搞定了。前Google創意技術專家、獨立開發者Cristian Peñas表示，Marble是目前使用高斯濺射生成3D世界的最佳工具。也有使用者試用後稱讚，使用介面簡單，生成質量相當不錯且驚豔，細節清晰，沒有明顯的抖動或變形，光照氛圍感也很好。在當下日新月異的AI市場中，World Labs團隊更新產品和模型的速度並不算快，上一次推出首個能夠從單張圖片生成3D世界的AI系統還是在2024年12月初，去年9月World Labs曾宣佈完成一輪2.3億美元融資，不過具體估值並未公開。好在，World Labs的Marble模型在技術上仍處於全球第一梯隊，特別是在“從單圖像生成具有高度一致性的可導航3D場景”這一細分任務上表現突出。空間智能旨在讓機器不僅能“看見”世界，更能深度理解物理世界的結構、規律並進行互動和創造，完整的空間智能需要有機整合三維感知、空間推理以及多模態生成。李飛飛曾在其個人社交平台上表示，空間智能是AI中難以解決的一個問題，但這項技術可以賦能和實現創造、設計、學習、AR/VR、機器人等領域的無數可能。她認為“空間智能”（Spatial Intelligence）是人工智慧（AI）邁向通用人工智慧（AGI）的關鍵與核心，若AI不能理解三維世界，就無法實現真正的AGI。四面而來的市場壓力World Labs所主攻的空間智能方向目前正成為熱門技術賽道，國內外廠商正在紛紛佈局，從各個維度展開競爭。例如GoogleDeepMind近期發佈的超真實世界模型Genie 3，是首個允許即時互動的世界模型，在生成內容的連貫性上堪稱質的飛躍，同時在通用性、物理規律、視覺記憶方面實現全新水平。輝達專門設有空間智能實驗室（NVIDIA Spatial Intelligence Lab），該公司打造的Omniverse平台，逐步升級為支援工業協作、元宇宙、人形機器人等場景的空間智能平台，實現跨裝置、跨軟體的即時協同與物理模擬。國內廠商如崑崙萬維在8月份發佈了首個前饋全景3D場景生成模型Matrix-3D，具備場景全域一致、生成場景範圍大、生成高度可控等特點，能根據文字和圖像輸入生成幾何結構精準、遮擋關係自然、紋理風格統一的3D場景，還支援自訂範圍與無限擴展。騰訊在9月開放原始碼的HunyuanWorld-Voyager，宣稱是業界首個支援原生3D重建的超長漫遊世界模型，一張圖就能生成3D場景和移動視角視訊，在李飛飛團隊發佈的世界模型基準測試WorldScore上綜合能力出色。作為“杭州六小龍之一”的群核科技，在今年的技術開放日上推出了空間語言模型SpatialLM 1.5與空間生成模型SpatialGen，可根據文字描述、參考圖像和3D空間佈局，生成具有時空一致性的多視角圖像，並支援進一步生成3D高斯（3DGS）場景並渲染漫遊視訊。隨著競爭對手增多，World Labs想要獲得商業成功的挑戰正在加大。這不僅取決於能否持續保持原生空間智能技術的領先優勢，也在於相比競爭對手能否建構強大的開發者生態和產品整合，使其生成技術能輕鬆進入主流工具創作流程，並實現可規模化的商業落地模式。 (頭部科技)

科技