#3D模型
速看!李飛飛最新訪談實錄:AI的終點不是寫程式碼,而是人類的尊嚴
在生命進化的漫長長河裡,“看見”世界比“談論”世界早了整整5億年。如今,AI正在補上這一課。這句充滿進化論智慧的判斷,正是李飛飛對當下AI浪潮的最新註解。在充斥著浮躁與噪音的矽谷,她的聲音始終代表著一種冷靜的遠見。台北時間2月4日凌晨,這位公認的“AI教母”帶著初創公司World Labs現身思科年度AI峰會(Cisco AI Summit)。作為曾經引爆電腦視覺革命的科學家,她沒有隨波逐流於大模型的語言遊戲,而是將目光投向了AI進化的下一塊拼圖:空間智能(Spatial Intelligence)。她認為,AI的下一個巔峰,不只是會寫程式碼和聊天,而是像生物一樣,真實理解並互動我們所處的這個三維空間。而超越技術維度之外,她更為AI的未來立下了一把人文標尺:“AI的成功,應當體現為文明的進步,讓每個個體都能由此追求幸福、繁榮和尊嚴。”以下是本次精彩訪談的解析,為你拆解“空間智能”將如何重塑我們的未來。01 進化論的啟示:感知先於語言很多人認為AI的終極形式是語言模型,但李飛飛提出了一個有趣的視角:從進化論來看,語言其實是“後來者”。她舉例說,在5億多年前的寒武紀,生命體最先發育出的並不是語言,而是感知系統。動物通過觸覺和視覺觀察環境,才開啟了那場讓生命變得更聰明的“進化軍備競賽”。李飛飛認為,“理解、推理並與3D物理世界互動的能力,與語言智能一樣,都是最基礎的底層能力。它是AI的下一個前沿。”這也是World Labs的核心邏輯:如果AI不能像人一樣理解空間,它就永遠無法真正進入現實物理世界。02 什麼是Marble? 它不只是視訊,而是一個“世界”訪談中,李飛飛詳細介紹了World Labs的第一代模型:Marble。很多人將其與Sora等視訊生成模型混淆,但李飛飛指出,二者有著本質區別。Marble是一種真正意義上的“世界模型”:·全場景互動:它能根據文字或圖片提示,生成一個完整的、可導航的、可互動的3D世界。·物理一致性:它具有幾何結構,不是一段“看起來像”的視訊,而是一個在物理邏輯上始終保持一致的空間。這意味著,它不僅能用來做遊戲,更能直接成為機器人訓練的“虛擬實驗室”。03 意想不到的用例:從機器人到心理治療空間智能的應用邊界在那裡?李飛飛給出的答案超出了很多人的想像:·遊戲與影視:開發者可以用它快速建構可穿行的虛擬世界,特效團隊能進行虛擬製片。·機器人訓練:與輝達等夥伴合作,為機器人提供高精度的模擬環境。·建築設計:設計師能瞬間將平面圖轉化為可步入的3D樣板間。最令人稱奇的是醫療科研。心理學家正利用Marble為強迫症(OCD)患者定製個性化的沉浸式環境,通過模擬特定觸發場景來進行科學干預。04 資料與算力:我們離通用機器人還有多遠?當被問及Marble是否像GPT-5那樣燒錢時,李飛飛顯得很坦誠。目前,Marble的訓練規模比頂級大語言模型要小幾個數量級。這一方面是因為這個領域尚處於“規模定律(Scaling Law)”的早期,另一方面也面臨著資料獲取的挑戰。李飛飛坦言,不同於網際網路上隨處可見的文字,高品質的3D物理資料非常稀缺。她透露,World Labs當下採用一種混合資料策略,綜合利用網際網路級的圖文視訊、模擬資料以及類似自動駕駛公司的“實景捕獲”資料。關於通用機器人,李飛飛也潑了一盆冷水:“汽車只是在二維平面上移動、儘量不去碰東西的‘方盒子’。但通用機器人要在三維空間裡完成靈活、精準的抓取和互動。這是一個極高維度的難題,我們不能亂開空頭支票。”05 拒絕“技術末日論”:AI的成功應關乎尊嚴作為AI領域的領軍人物,李飛飛對當下的兩極分化言論感到擔憂。“技術烏托邦”和“末日生存危機”在她看來都不夠負責任。她強調,技術是雙刃劍,人類必鬚髮揮主觀能動性去引導它。那麼,AI最終的成功標誌是什麼?李飛飛借用了“電力”的類比:電力的成功不在於電線本身,而在於它點亮了學校、溫暖了家庭、延長了人類壽命。“AI的成功,也應當體現在文明的進步,讓每個人都能追求幸福、繁榮和尊嚴。”06 結語從理解像素到建構世界,李飛飛正帶領團隊在空間智能的無人區探索。這不僅是技術的跨越,更是人類試圖賦予數字生命“感知力”的又一次嘗試。空間智能,或許就是我們通往AGI的那把“物理鑰匙”。(以下為發言實錄)主持人:好的。接下來,我們要聊聊3D模型,而不僅僅是語言模型。今天,我們有幸請到了被譽為“AI教母”的李飛飛博士。很榮幸,我們也是飛飛博士公司的投資者。讓我們用掌聲歡迎李飛飛博士上台。我今天該穿上World Labs的周邊T恤的,你之前送過我,真的很有心。李飛飛:是啊,我可還等著思科的周邊呢。主持人:沒問題,我們馬上安排。感謝你來到這裡。看到World Labs在過去一年取得的進展,真的令人欣喜。飛飛,先跟我們聊聊你們目前在做什麼,以及為什麼這件事如此重要?李飛飛:好。現在我每天醒來,腦子裡其實只在想一件事:空間智能(Spatial Intelligence)。這就是我大約兩年前和一群年輕的技術專家共同創辦的公司:World Labs的核心。如果從進化論的角度來看,在5億多年前,最先開啟神經系統發育的並不是語言,而是感知。早在語言出現之前,動物就開始通過觸覺和視覺感知光線、接觸環境。主持人:那你認為“本能”也屬於感知的範疇嗎?李飛飛:對我來說,“本能”是一個比較虛泛的詞。但從物理進化上講,正是視覺開啟了進化史上的“軍備競賽”,讓動物變得更加活躍和聰明。理解、推理、互動並在真實的3D/4D物理世界中穿行的能力,與語言智能一樣,都是最基礎的底層能力。而其中的關鍵技術就是“空間智能”,這是AI的下一個前沿陣地。主持人:聊聊Marble吧。前陣子剛發佈的Marble到底是什麼?李飛飛:Marble是我們的第一代空間智能模型。我們私下管它叫“世界模型”。它能接收多模態輸入:無論是文字、圖片、視訊,還是簡單的3D輸入,然後根據這些提示詞,生成一個可以完全穿行、即時互動、且具有永久一致性的3D世界。這與目前的視訊模型截然不同,它擁有完整的幾何結構,可以支撐機器人模擬訓練或遊戲程式設計。主持人:有一種觀點認為,如果不增強AI的物理特性,我們就無法實現通用人工智慧(AGI)。隨著時間的推移,這裡面最大的“突破口”會是什麼?除了機器人領域,五年後我們還能用它做什麼?李飛飛:其實都不用等五年。現在就已經有使用者在用Marble開發遊戲了,影視特效(VFX)客戶也用它進行虛擬製片。我們正與輝達以及一些初創公司合作,將Marble作為機器人的訓練環境。建築師和設計師用它做室內設計。還有一個令我意外的用例是臨床研究:心理健康研究人員利用它為強迫症(OCD)患者建立沉浸式的個性化環境,來模擬特定的觸發場景。主持人:你把整個人生都奉獻給了AI。在創辦這家公司、研究空間智能的過程中,最讓你感到驚訝的是什麼?李飛飛:過去幾年的發展速度簡直令人窒息。每個人都會感到焦慮,覺得“要讀的東西太多,發佈的模型太快”。這讓我時刻保持謙遜,意識到自己所知甚少。另一件讓我擔憂的事是那些極度兩極分化的言論:要麼是技術烏托邦主義,要麼是“生存危機”之類的末日論。這兩種觀點其實都不太負責任。技術是一把雙刃劍,我們必鬚髮揮主觀能動性,引導它走向善意化和精細化的應用。主持人:在你看來,未來幾年AI的成功標準是什麼?李飛飛:回看電力技術,它的成功在於點亮了學校、溫暖了家庭、推動了工業化,並延長了人類的壽命。AI的成功標誌應該是:文明因它而進步,每個個體都能由此追求幸福、繁榮和尊嚴。主持人:大型世界模型的計算量和語言模型一樣大嗎?李飛飛:目前,我們的模型規模還沒有最大的大語言模型(LLM)那麼大。GPT-5的訓練算力可能在10^26 FLOPS左右,而Marble要小幾個數量級。部分原因是這個領域還很新:Transformer論文發佈於2017年,而世界模型才剛剛開始進入Scaling Law的上升曲線。主持人:語言模型是用網際網路上的免費資料訓練的。但物理資料很難獲取,所以合成資料變得至關重要。資料的匱乏會減慢世界模型的發展嗎?另外,未來我們會擁有通用機器人,還是專用機器人?李飛飛:我們採取的是混合資料策略。語言資料相對幹淨且易於觀察,但像素和體素(Voxel)構成的物理世界則複雜得多。我們利用網際網路規模的文字、圖像和視訊,但也需要模擬資料和“現實世界捕獲”資料,這與特斯拉或Waymo等自動駕駛公司的做法類似。關於機器人:作為科學家,我不喜歡亂開空頭支票。汽車可以看作是一個在二維平面上移動的“方盒子機器人”,它的主要目標是避開障礙物。而通用機器人是一個三維實體,它必須觸碰並與物體互動,且不能損壞它們。這是一個維度高得多的問題,涉及極高的靈活性和空間精準度。主持人:在最後的一分鐘裡,企業端應該如何看待世界模型?李飛飛:空間智能是一項橫向通用技術。除了機器人和遊戲,它還可以應用於醫療、教育、外勤服務、金融服務、農業、製造業和城市規劃。它是下一個前沿領域,我邀請大家共同來探索這個課題。主持人:非常感謝。李飛飛:謝謝。 (網易科技)
AI戰略驅動估值重構,阿里股價年內飆升90%,螞蟻“靈光”與千問共拓生態
11月18日,螞蟻集團正式推出全模態通用AI助手“靈光”,支援使用者通過自然語言在30秒內生成可互動、可分享的輕應用(如健身計畫器、旅行規劃工具等),並實現3D模型、動態圖表等多模態內容的程式碼級生成。此舉標誌著螞蟻在AGI(通用人工智慧)場景化落地方面取得關鍵突破。而就昨天,阿里巴巴正式宣佈“千問”項目,全力進軍AI to C市場。當天,千問APP公測版上線,基於全球性能第一的開源模型Qwen3,憑藉免費以及與各類生活場景生態的結合,與ChatGPT展開全面競爭。此前,阿里CEO吳泳銘強調,將投入3800億元資本開支推進AI基建,目標實現超級人工智慧(ASI)。資本市場對阿里系AI佈局反應強烈:截至11月17日,阿里巴巴港股(09988.HK)年內漲幅已超90%,創下2021年8月以來新高。機構普遍認為,AI戰略正推動阿里從“電商估值邏輯”向“AI+雲估值邏輯”切換。南向資金持續加倉,9月單月淨買入阿里港股達757億港元,為騰訊的10倍。景林資產、ARK Invest(木頭姐)、貝萊德等全球頂級機構均在2025年大幅增持,看好其全端AI能力與商業化前景。“靈光對話”突破傳統文字問答模式,不是堆砌文字,而是像策展一樣設計每次對話:通過結構化思維讓AI回答邏輯清晰、表達簡練;通過生成可視化內容,如動態3D模型、可互動地圖、音視訊等,讓內容呈現更生動;最終以優質的資訊組織方式,讓使用者“秒懂”知識。這種兼具邏輯張力和資訊美感的設計,也體現了靈光的產品理念:讓複雜變簡單。比如在教育場景下,使用者諮詢靈光知識性問題,靈光能夠洞察並提煉知識點,有邏輯有層次地展示,並能生成3D實物動圖、可互動的示意表格等,讓複雜資訊一目瞭然。(圖說:靈光對話介面呈現極簡風格,同時又提供多元的資訊展示形式)這種可秒級生成、又極簡多元的可互動回答,背後是靈光實現了基於全程式碼生成的多模態輸出能力,所有呈現的結果,包括圖表、動畫,小應用等元件,都是由模型根據對話情境即時生成並呈現給使用者。同時,靈光建構了多智能體協作的Agentic 架構,能夠動態調度圖像、3D、動畫等專用 Agent 與工具,即時協作,為使用者提供更完整、更豐富、更沉浸的檢視體驗。值得一提的是,靈光開創性地面向普通使用者推出了“閃應用”功能。使用者在對話中說出或輸入一句話,靈光1分鐘以內、最快30秒就能生成一款AI應用。無論是健身計畫工具、旅行規劃器還是健康食譜生成器,均可實現一句話生成、參數自訂、即用即分享。這種快速生成日常生活小應用的功能,讓普通人也能零門檻享受AI Coding帶來的生產力變革。如使用者諮詢“溏心蛋要煮多久?”靈光可生成一個“溏心蛋時間計算器,使用者根據實際情況自己選擇“雞蛋大小”“要求的熟度”等條件,自己調整出一個最符合自己情況的答案;使用者想知道怎樣養車最划算,靈光可以生成一個“養車成本計算器”,使用者自由選擇里程、油費等,組合出極具個性化的養車方案。(圖說:靈光對話可喚起閃應用,最快30秒生成日常生活小應用)值得一提的是,靈光生成的閃應用不只是靜態前端頁面,而是可以直接呼叫大模型等後端能力,讓應用不僅能展示結果,更能即時與外部進行互動,顯著拓寬可實現的場景邊界。作為一款全模態通用AI助手,“靈光開眼”功能搭載了AGI相機技術,通過即時視訊流解析實現對物理世界的觀察和理解,並支援文生圖/視訊、圖生圖/視訊等多種創作模式。比如,在旅遊場景下,使用者用靈光對準想瞭解的建築,靈光可以即時“看見”並講解。作為螞蟻集團AGI(通用人工智慧)戰略的產品級探索,靈光精準把握2025年AI應用市場向場景化生產力工具轉型的趨勢,其核心理念“讓複雜變簡單”,通過將應用開發嵌入日常對話,重新定義了通用型AI助手的生產力邊界。據悉,螞蟻集團2025年以來加速AGI佈局,已發佈AI醫療管家AQ、佈局具身智能靈波科技,螞蟻百靈大模型也躋身了兆參數模型陣營。靈光的推出,進一步展現了螞蟻在通用人工智慧領域從技術突破到場景落地的全鏈路能力。 (證券之星)
Meta發佈簡易版Unity,AI全面整合,AI一鍵生成3D模型+紋理+天空盒
Meta發佈簡易版Unity,支援AI生成3D模型與紋理貼圖Meta推出對標Unity的全新3D創作工具,面向MR、空間計算、3D建模賽道從業者,並且還砸了5000萬美元搞了個Meta Horizon創作者計畫,幫你把創意變現。這個桌面編輯器針對Quest、Web和移動端遊戲/世界創作的工具,提供了資產匯入、TypeScript支援、NPC行為設定等功能,讓創作者可以打造更高品質的虛擬世界。並且還支援匯入3D資源、建立虛擬角色和複雜的遊戲邏輯,還可以生成音效、環境音訊......現在Meta 的 Horizon 桌面編輯器(Horizon Desktop Editor)現已新增 AI 生成功能,能夠自動生成3D模型、紋理貼圖和天空盒(Skyboxes),進一步擴展了此前已支援的音訊和 TypeScript 指令碼的AI生成能力。Horizon 桌面編輯器是一款基於 Windows 平台的平面屏 PC 應用,於今年 2 月開啟公開早期測試,取代了此前 Horizon Worlds 中廣受詬病、甚至被嘲諷過於簡陋的 VR 內建世界工具。新版本允許創作者匯入 3D 素材、圖片和音訊檔案,將它們放置在 3D 場景中,並通過 TypeScript(一種廣受歡迎的 JavaScript 衍生語言)實現遊戲邏輯和互動功能的開發。此次更新還在 Horizon Worlds 可用的多數國家上線了虛擬世界內的變現機制,使創作者可以通過創作內容獲得收入。創作者可以提供持久型商品(例如虛擬道具)或消耗型商品(例如增益道具、虛擬金幣等)進行售賣。自早期測試上線以來,美國的創作者就已經可以在 Horizon 桌面編輯器中使用 AI 自動生成音效和環境音,也可以通過 AI 生成TypeScript指令碼來擴展功能。而現在,Meta 正式開放3D Mesh、紋理貼圖(Textures)與天空盒(Skyboxes)的 AI 生成功能。這些生成式 AI 工具目前不僅在美國開放,英國和加拿大的使用者也可以使用。Meta 表示,這些生成式 AI 工具可以大幅減少建構虛擬世界所需的時間,從以往的數周縮短至短短數小時。生成 3D 模型的流程非常簡單:只需輸入你想要的描述,平均等待 3 到 6 分鐘,系統就會生成四個可選方案。你可以選擇其中一個,也可以進一步細化提示詞繼續生成。選定模型後,再輸入紋理風格的描述,即可生成匹配貼圖,最後將帶有紋理的 3D 模型放入你的虛擬世界中。生成天空盒時,系統提供六種不同的風格可選,包括:穹頂天空(Skydome)、寫實風格(Photorealistic)、數字繪畫風(Digital Painting)、開放世界風格(Open World)、動漫風格(Anime)和漫畫風格(Comic)。這些風格將影響你輸入提示詞的生成效果。由於所有 AI 生成功能都在 Meta 的伺服器上處理,因此每天的使用次數會受到限制,具體如下:TypeScript 指令碼:每天最多生成 1000 次音訊音效:每天最多生成 200 次3D 網格模型:每天最多生成 100 次天空盒:每天最多生成 50 次要使用 Meta Horizon 桌面編輯器,使用者需先下載 Meta Quest Link PC 應用,並在其中安裝 Horizon Desktop Editor。安裝完成後,進入“庫(Library)”,點選編輯器下方的“三個點”圖示,選擇“以桌面模式啟動(Start in desktop mode)”。此外,Meta 仍在運行其 5000 萬美元規模的 Meta Horizon 創作者基金(Meta Horizon Creator Fund),以資助創作出“有趣且吸引人”的世界的開發者。Meta 表示:“我們將每月向創作出有趣且具吸引力的移動端或混合現實(MR)世界的開發者發放獎勵。獎金分配將根據虛擬世界對整體生態系統的貢獻來決定,包括:使用者停留時間、留存率以及虛擬內購等。因此創作者有多種方式可以提升收益最大化。” (三次方AIRX)
拿下“AI 3D模型生成”世界第一,清華姚班大佬要給遊戲圈來場革命!
這幾年,AI技術的飛躍式發展已經成了助推遊戲圈進步發展的一股重要動力。從遊戲2D美術生產、動畫、程式碼程式設計、音樂音效、文案和本地化翻譯、智能NPC、遊戲測試,乃至廣告素材製作、客服……遊戲公司從研發到發行再到營運,幾乎每一個環節,如今都能由AI輔助下實現降本增效。但迄今為止,遊戲研發領域還剩一塊硬骨頭,沒有被AI推倒——那就是3D模型的生成。儘管不乏有騰訊(混元3D)、輝達(Edify)、Google(DreamFusion)等大廠和多家創業公司在這條賽道上發力研發,但3D模型本身的資料複雜性還是讓AI生成的3D模型距離實際在影視動畫和遊戲行業生產環節應用仍有相當距離。要麼AI生成的3D模型結構粗糙難看,且在模型拓撲、展UV階段需要花費模型師大量進行修改,AI生成模型品質不高、結構錯誤百出,這也導致,之前很多遊戲公司吐槽,“與其用AI生成的3D模型、還不如由模型師人工建模”。何時才會出現靠譜的 3D 模型生成AI,GameLook以及廣大遊戲開發者一直在關注。2024年開始,一家由中國人創立的AI創業公司Meshy.AI邁入了GameLook視野,其在2024年連續多次技術迭代後,最終在3D模型AI生成方向上率先形成了革命性的突破——目前Supercell、SEGA、Snap、Funplus已成為其客戶。在剛剛結束的2025 GDC大會上,Meshy.AI的創始人胡淵鳴還登上了講台,面向全球各地的開發者宣佈,3D生成模型如今已經相當接近生產預備(Production-Ready),也就是說,3D模型AI生成越來越靠譜了!在GDC線下展台,來自世界各地的開發者排起長龍,想要親自上手嘗試Meshy.AI的模型生成效果。毫不誇張地說,如果“生產級”3D AI模型生成真正被攻破,這將成為全球遊戲行業AI技術升級上的又一個重要奇點。而一如上一輪“DeepSeek”時刻一樣,這一輪產業變革的原初推動者,極有可能又是一家中國廠商!黃仁勳都看好,清華學霸創業如何打造“3D生成Top 1”?在GameLook觀察下,受制廣大遊戲公司對3D模型AI生成信任度還不高,Meshy.AI在國內遊戲行業內知名度也同樣有限,但在這個AI基礎研發的“低垂果實”被採摘殆盡的當下,能夠拿出突破性成果的企業必然實力遠強於運氣。事實上,早在成立Meshy.AI前,創始人胡淵鳴就已經在創投圈聲名鵲起。他本人作為“早慧天才”的代表,經過清華姚班和麻省理工學院學術訓練,成為全球頂級圖形學大牛。此前在MIT博士就讀期間就曾成立“太極圖形”,推出了專注圖形學、編譯器、高性能計算、人工智慧等相關技術的太極(Taichi)程式語言,並先後獲得GGV、紅杉數千萬美元的戰略投資。胡淵鳴2023年接受紅杉中國採訪如今的Meshy.AI,總部位於矽谷,其是胡淵鳴在受到生成式AI啟發後的第二次創業。這次組建起的公司成員團隊,幾乎全員都來自輝達、Google、Meta 等知名機構和MIT、哈佛大學等頂級學府,技術班底相當紮實。當然,創投領域不乏學歷光鮮的“天才”、更不缺倒在光鮮亮麗的PPT背後的失敗案例。但也有相當多的側面證據向我們佐證,行業對Meshy.AI目前取得的成果有著高度認可。比如在2025年初,Meshy.AI團隊就受到輝達邀請,被CEO黃仁勳和副總裁Maggie Liu等多位高層親自接見。在頂級創投基金a16z發佈的2024 AI工具調查裡,Meshy.AI作為唯一的3D生成工具上榜。甚至Meshy還相當不客氣地把“排名第一的3D生成工具”寫在了自己官網最顯眼的位置。在其官網首頁的客戶名單裡,世嘉、Supercell、FunPlus等遊戲行業大咖廠商的名字赫然在列。而Meshy還宣稱,有數百萬遊戲開發者、創作者和3D列印愛好者都曾使用Meshy,累計生成的模型數超過2000萬個。我們還能在YouTube上找到不少將Meshy融入Unity開發、UI設計、概念圖轉模型等環節工作流的教學視訊。不難從中看出,眼下成立不過兩年時間的Meshy已經先行斬獲了一批創作者的高度信任,並初步形成了生態。儘管此前Meshy沒有對外披露過接受融資的狀況,但GameLook認為其作為3D生成領域實質性的全球領頭羊、實際估值達到或接近獨角獸級,恐怕並不是什麼難事。AI生成3D模型,究竟是不是“望山跑死馬”?在Meshy開發者社區中,由各位創作者分享的3D模型案例也向我們力證為何Meshy能受到創作者的青睞。相比於早期AI 3D模型方案和同時期的其它SOTA(State-of-the-Art)競品,Meshy的生成3D模型的確在精緻度上有相當的飛躍。在不作二次模型修改的情況下,在觀感上已經可以與行業中游的3D模型品質齊平,GameLook認為、其生成的模型已經可以一部分替代遊戲和動畫中不太重要的角色,且Meshy還可以生成貼圖、和繫結動畫,極大提高了生產效率。GameLook觀察下,2024年對是Meshy突飛猛進的一年,2024年2月推出Meshy 2,2024年3月UI出Meshy 3,來到2024年8月推出了Meshy 4,也正是Meshy 4,讓GameLook開始感到3D模型AI生成的里程碑的到來。當頭部3A大作不斷推動遊戲品質基準線,與3D美術相關的研發成本也在水漲船高,AI現階段確實可以挑戰3D角色模型,但客觀上上說可能用於NPC、“雜兵”更為合適,對於頭部遊戲的玩家操作的主要角色,挑戰依然很大,但即便用途受限,依然能大幅降低遊戲公司的研發成本。在今年的GDC上,米哈游《崩壞星穹鐵道》項目團隊在分享中稱,目前遊戲中一名角色的建模面數達到4萬個面、而面部分配了1萬面。而按照行業標準,如《最後生還者》這類頂級3A,對一名主要角色的建模,前後歷經雕刻、拓撲、紋理、綁骨蒙皮等各個階段,精細到面孔上每一根汗毛的手工製作,工期可達上月時間,單個角色模型人工成本動輒以萬美元為單位計算,且角色除了遊戲測試外、遊戲商業模式還存在換皮膚的需求,投入人力物力更為龐大,在競技遊戲中,一個3D英雄角色研發周期動輒三個月以上。假如有朝一日,3D模型生成能在遊戲實際生產中走向廣泛應用,那麼它或許能夠成為真正打破 效率-成本-品質這個“不可能三角”的關鍵變數。AI輔助下,一名策劃能夠在概念階段離開美術的輔助,充分預演自己想要的遊戲世界和角色,而對2D概念美術師和3D模型師來說,也同樣可以依靠AI提前預演;在美術生產階段,AI無疑也能帶來大幅加速;甚至通過UGC等新的形式,具備“無限內容產出”能力AI還有希望讓元宇宙徹底誕生。從研發到體驗,整個遊戲體系都有被AI顛覆的潛力。而3D AI生成真正達到“Production Ready”,是這一切發生的前提。無論是胡淵鳴自身還是Meshy對外的宣發,都相當謹慎地表示目前距離可實際投產甚至“開箱即用”的這一目標尚有距離。要知道“一眼驚豔”,遠不是3D生成的終點。一個完整的3D模型中包含的資料類型極為複雜。看似同樣的外觀輪廓之下,頂點法線的數量和分佈狀況,直接決定了模型體素所需佔用的計算資源,進而連帶影響遊戲的性能最佳化。後續動畫師對模型進行處理時的效果和工作量,又和骨骼、蒙皮權重的設定息息相關。如果任何一個環節需要大量人工介入,那麼3D AI模型在實際管線中的可行都會大打折扣。還有貼圖繪製、多LOD下的模型資料等等,都決定了模型最終的實用性。圖源:Blender官網GameLook在Meshy開發者社區展示的實際模型案例中發現,由Meshy生成的AI模型面數普遍高達十萬面以上,這決定了Meshy生成的3D資產可能更適合不需即時渲染的影視類場景,而對於性能資源比金子還珍貴的遊戲開發者來說太過“奢侈”。30萬面的3D模型但毋庸置疑的是,如今的Meshy已經比同行走得更遠。經過兩年時間的迭代,Meshy已經更新到第五個大版本。它目前擁有的能力除了能夠涵蓋文字轉3D、圖像轉3D這些“常規”能力外,更能完成文字到紋理的生成,並將其直接應用在生成的3D模型中。包括模型動畫,也提供了一站式解決方案。在最新的Meshy–5前瞻裡,Meshy展示了其生成高品質貼圖的能力,可以為3D白模快速套上外皮的同時,保證在各種角度的光照下都能有出色觀感。不難想像,至少在項目前期的預覽階段,開發者如今已經可以活用Meshy來低成本地快速搭建項目原型,這就已經讓它在可用性上邁出重要一步。Meshy-5前瞻站在行業觀察者的立場,GameLook當然也熱切期待Meshy通過未來的持續版本迭代,真正從“實驗”走向“實際生產”的那一天。如今不少企業對Meshy的看好和入局,已經向我們提前預演那一場可能不久後就會到來的、席捲全球遊戲行業的變革風暴。商用3D AI前景預想:發揚光大,或是被彎道超車從官網資訊來看,目前Meshy已經進入較大規模的商用化階段。採用月費套餐和信用點結合的商業化模式,在允許免費試用的同時、最高等級的“無限流量”套餐也僅需每月698元人民幣,起步價相當親民,當然還有定製需求的報價。Meshy已經走在不斷接受市場檢驗、在使用者反饋中持續進化的步調之上,為未來的爆發醞釀動能。但目前的發展態勢雖好,擺在Meshy前方的仍有一個極大的變數——瞬息萬變的AI大爆炸時期裡,是否會出現超乎傳統的視覺圖形方案?比如此前Google和特拉維夫大學曾聯手推出GameNGen,直接採用了“偽3D”的渲染方案,完全使用擴散模型,以2D像素的形式重現了3D的《毀滅戰士》遊戲。GameNGen而微軟近期推出的MUSE大模型也採用了類似方案,通過AI生成的圖片序列幀,取代了3D建模的渲染,而同樣可以實現使用外部手把輸入操作的效果。MUSE包括OpenAI在推出AI生成動畫模型Sora時,也曾表示Sora並非簡單的視訊生成模型,而是基於生成式AI建構萬物物理模型的方式.假如這種全新視覺方案最終能夠在成本、可用性和商業化方面展示出優越性,那麼無異於是對基於3D模型引擎渲染的傳統“降維打擊”,讓包括Meshy在內的一系列廠商重新面臨路線考驗。而這樣一個新奇點或許不久後就會出現、或許要以年為單位等待,甚至也可能永遠不會到來。而等到真正成真的那一天,我們的遊戲行業或許已經做好了全面漸進轉型的準備,又或許不得不面對充滿血與淚的產業結構性變革“硬著陸”。不斷航向未知,持續拿出顛覆性的成果,最終推動人類文明向前發展,這或許就是科技的魅力本源。而諸如Meshy.AI這樣的AI新勢力,已經拿到了通向下一個時代的船票。 (GameLook)