Google開放世界模型Genie 3試用:AI即時生成可玩世界,人人都能創造“我的世界”

剛剛,Google開放了世界模型Genie 3實驗性研究原型Project Genie的使用,此前在25年8月,Google曾初步預覽了Genie 3的世界模型,它能夠生成多樣化的可互動環境。早期測試者已經用它創造了一系列世界和體驗,並行現了全新的使用方式。現在,通過這個專注於沉浸式世界建立的互動原型,Google決定擴大其使用範圍

年滿18歲的美國Google AI Ultra訂閱使用者今天起可以率先體驗,這個原型,旨在讓使用者能夠建立、探索並重混屬於自己的互動世界

體驗地址:
https://labs.google/projectgenie

介面長這樣:

如何玩轉Project Genie

Project Genie是一個原型Web應用,由Genie 3、Nano Banana Pro和Gemini共同驅動,使用者可以通過它親身體驗世界模型帶來的沉浸式感受。

工作流程如下:

🔵 設計: 使用文字和視覺提示設計你的世界和角色。
🔵 預覽: Nano Banana Pro會生成一個圖像預覽,供你在進入前進行調整。
🔵 生成: Genie 3世界模型會隨著你的移動即時生成環境。
🔵 重混: 在作品庫中重新混合現有世界或發現新世界。

該體驗圍繞三個核心能力建構:

1. 世界草圖繪製 (World sketching)

通過文字提示以及生成或上傳的圖像,建立一個生動且不斷擴展的環境。你可以建立自己的角色和世界,並定義探索方式——從步行、騎行、飛行到駕駛,以及任何其他方式

為了實現更精確的控制,Google整合了“世界草圖繪製”與Nano Banana Pro。這讓使用者可以在進入世界前預覽其樣貌,並修改圖像以進行微調。你還可以定義角色的視角——如第一人稱或第三人稱——從而在進入場景前控制你的體驗方式

2. 世界探索 (World exploration)

你創造的世界是一個等待探索的可導航環境。當你移動時,Project Genie會根據你採取的行動即時生成前方的路徑。在穿越世界的過程中,你還可以調整鏡頭。

3. 世界重混 (World remixing)

你可以基於現有世界的提示詞進行建構,將其重混成新的詮釋。你也可以在作品庫或通過隨機功能探索精選世界以獲取靈感,或在它們的基礎上進行創作。完成後,你可以下載你的世界和探索過程的視訊

AGI與世界模型

世界模型用於模擬一個環境的動態變化,預測其演變方式以及行為所帶來的影響。儘管Google DeepMind在國際象棋或圍棋等特定環境中已擁有成熟的智能體,但建構AGI需要能夠駕馭現實世界多樣性的系統。

為此,Google開發了Genie 3。與靜態3D快照中的可探索體驗不同,Genie 3能夠在你移動和與世界互動時,即時生成前方的路徑。它能為動態世界模擬物理和互動,其突破性的一致性使得模擬任何真實世界場景成為可能——從機器人技術、建模動畫和小說,到探索地點和歷史場景。

基於與各行業和領域的信任測試者合作的模型研究,Google通過實驗性研究原型Project Genie邁出了下一步

寫在最後

Project Genie是Google Labs中的一個實驗性研究原型,由Genie 3驅動。由於Genie 3仍是一個早期的研究模型,存在一些已知的待改進領域:

生成的世界可能看起來不完全逼真,或不總是嚴格遵循提示詞或圖像,或不符合現實世界的物理規律

角色有時可能不太可控,或在控制時延遲較高

生成時長限制在60秒內

此外,去年8月宣佈的某些Genie 3模型功能,例如在你探索時可以改變世界的“可提示事件”(promptable events),尚未包含在此原型中。 (AI寒武紀)