騰訊混元深夜上新,再次開源

騰訊混元大模型迎來重要升級。

就在剛剛,CVPR2025(電腦視覺領域頂會之一)上,騰訊宣佈混元3D 2.1大模型對外開源,這是首個全鏈路開放原始碼的工業級3D生成大模型,達到了行業領先水平。

目前,混元3D模式在Hugging Face(知名的開源社區和技術平台)下載量已超過180萬,開源效果受到全球開發者認可。在此基礎上,混元3D 2.1模型進一步升級並繼續開源。

先看效果。上傳一張首飾盒的圖片:

模型生成的3D首飾盒,紋理清晰,質感細膩,光影保持一致性。

混元3D模型生成的首飾盒效果

遊戲裡的角色、電影中的道具、線上商城的產品模型,都用新模型可以生成3D版。

相較於混元3D 2.0模型,新模型既優化了幾何生成的質量,也開放了PBR(基於物理的渲染)材質生成大模型,進一步提升3D資產的質感和光影表現,告別“塑料感”。

打個比方,幾何學是3D模型的“骨骼”,定義了模型的形態、輪廓與細節精度;紋理是3D模型的“皮膚”,還原模型表面的顏色、光澤和細節表現。

混元3D模型生成的青銅面具鼎效果

對比看到,新模型優化了細節建模,使網格精度更高,具備更好的拓撲一致性,為後續紋理對應提供了基礎;還可生成基礎顏色、金屬度、法線、粗糙度等貼圖,支援皮革、木質、金屬、陶瓷等多種複雜材質的高品質渲染。

混元3D模型生成的青花瓷白馬效果

相較傳統RGB 貼圖技術,PBR技術透過模擬光線與材質的物理互動,提升模型在不同光照環境下的視覺一致性。在使用者盲測中,混元3D 2.1模型的PBR紋理相較於RGB貼圖,質感勝出率高達78%。

混元3D 2.1 模型與主流3D 模型紋理效果對比

這種物理真實性不僅滿足電影、遊戲等高要求渲染場景的需求,也為工業設計、虛擬模擬和數字孿生提供了可靠3D資產,不僅“好看”,而且工業級“好用”。

除了效果全面升級,開發門檻也降低了。

全鏈路開源。混元3D 2.1模型從模型權重、訓練程式碼,到資料處理流程上全鏈路開源。這對開發者來說,無疑是個好消息:可以自由地進行微調、二次訓練或優化,滿足各種定製化需求,也為學術研究提供了平台。

部署友好。混元3D 2.1模型適配於消費級顯示卡,在個人電腦也能“跑”,還在Github 等開源地址提供了詳細部署和使用教學,幫助企業、中小團隊及個人開發者輕鬆上手。

在實際應用中,輕遊夢工坊(騰訊旗下無程式碼遊戲編輯器)使用混元3D在多條美術管線完成提效,道具管線製作周期由2天/個降低至0.2天/個。

騰訊混元堅定擁抱開源,旗下圖像、影片、3D、文字等多種模態基礎模型已全面開源。

2024年11月:發佈初代3D生成模型並開源。

2025年01月:2.0模型在文字一致性與幾何精確度上超越主流模型。

2025年03月:一次開源5款3D生成模型,實現秒數資產生成。

2025年05月:V2.5模型精度提升超10倍​​,邁入超高畫質時代。

2025年06月:首個全鏈路開放原始碼的工業級3D生成大模型。

騰訊混元將持續透過開源協作,解決傳統3D建模耗時、成本高、資料稀缺等產業痛點,共同打造更繁榮的3D開源生態。 (騰訊)