12月17日,騰訊混元世界模型1.5(Tencent HY WorldPlay)正式發佈。使用者只需輸入文字描述或者圖片即可建立專屬的互動世界。據騰訊混元官方介紹,混元世界模型1.5(WorldPlay)首次開源了業界最系統、最全面的即時世界模型框架,涵蓋資料、訓練、流式推理部署等全鏈路、全環節,並提出了重構記憶力、長上下文蒸餾、基於3D的自回歸擴散模型強化學習等演算法模組。混元世界模型1.5具備三大核心能力:1、即時的互動生成:通過原創的Context Forcing蒸餾方案以及流式推理最佳化,模型可以按照24 FPS的速度生成720P的高畫質視訊;2、長範圍的3D一致性:通過重構記憶機制(Reconstituted Memory),模型支援分鐘級內容的幾何一致性生成,可用於建構高品質的3D空間模擬器;3、多樣化的互動體驗:混元世界模型可廣泛適用於不同風格的遊戲或者現實場景,以及第一和第三人稱視角,也支援即時文字觸發事件和視訊續寫等功能。此前,今年7月,騰訊混元團隊發佈混元3D世界模型 1.0,支援文字或單張圖片輸入生成相容圖形學管線的3D場景;10月,混元團隊發佈世界模型1.1,支援多檢視或視訊一鍵創造3D世界。 (荊楚網)