刷屏的Sora 2,不是“AI抖音”時刻

從模型到 App:Sora 2 的全新亮相

今日AI圈無人放假。

OpenAI 在預告了一段之後,正式推出新一代視訊生成模型 Sora 2,而這一次的主角不再是模型本身。它首次將其以獨立 iOS 應用的形式發佈。

與一年前發佈的第一代 Sora 相比,Sora 2 不再只是 ChatGPT Plus 裡的“附加功能”,而是直接進入消費級產品賽道,成為一款帶有短影片流和互動機制的 App:

Sora by OpenAI

(因為Sora當初發佈後,這個名字就被很多人給佔去了,所以它後面帶上了By OpenAI)

這款名為 Sora 的應用目前在美國和加拿大率先上線,採用邀請制,使用者可生成並分享 10 秒視訊,瀏覽個性化推薦流,並通過點贊、評論和二次創作(Remix)與他人互動。OpenAI 把它定位為“超寫實動作與聲音”的創作工具,既是模型升級,也是產品形態上的徹底轉身。

上手實測:

雖然是邀請碼機制,但它分發的方式其實很容易讓人們拿到邀請,更重要的其實還是一個製造FOMO帶來行銷效果的策略。也就是說,OpenAI對這個產品的投入,並沒有擔心token——那怕ChatGPT都在悄悄通過“降智”來減少token使用的今天,OpenAI對這個產品以及向toC的市場衝刺的野心也體現出來。

打開app,輸入邀請碼後,會看到提示。

然後,是一個和今天所有短影片應用介面一樣的首頁。

抄襲致敬TikTok們的介面。

當你想製作視訊,點選“+”號,開始製作。

你可以選擇已經有的“人物”,描述視訊內容,生成他們彼此互動的視訊。

也可以製作自己的虛擬形象。

然後你就可以盡情虛構你的人生了!

Cameo:把自己放進視訊

Sora 2 的最大變化之一,是在生成畫面時實現了同步音訊。過去 AI 視訊往往只負責影像,聲音需要後期疊加,而現在使用者可以在同一次生成裡得到語音對白、環境音效和音軌,帶來更完整的沉浸式體驗。

OpenAI 在研究博文中強調,Sora 2 在物理一致性、動作連貫性和指令跟隨上都有明顯提升,並配合安全過濾機制,限制錯誤資訊或不當內容的生成。業內分析認為,這一功能正是與 Google Veo 3 等競品正面競爭的關鍵點。

如果說 Sora 2 的視訊+音訊一體化是“底層能力”的升級,那麼 Cameo 功能則是“玩法邏輯”的變革。

在 Sora App 裡,使用者可以通過一次性的錄入來確認身份,並上傳肖像和聲音的樣本。只要完成了這個步驟,App 就會為你生成一個“可授權的虛擬分身”。從此,你不僅能生成一個抽象的角色,還能讓視訊裡的主角就是“自己”:你會出現在 10 秒的短片裡,唱歌、演戲、跳舞,甚至在虛擬場景裡和 AI 生成的角色互動。

這種體驗被 OpenAI 形容為“超寫實 Cameo”,強調的是本人同意、本人形象。它的設計邏輯就是 “只生成願意出現的人”。因此,公眾人物、未經授權的第三方形象都被禁止使用,使用者也可以隨時撤銷授權。

在 OpenAI 的官方頁面中,有文字描述:使用者可通過一次錄製,將自己以 Cameo 形式插入模型生成的視訊場景中。OpenAI 表示,這一功能在內部測試階段就已經被團隊頻繁使用,能夠在任意場景中重現面部、聲音與動作一致性。

提示:大腳怪對他真的很好,有點太好了,像奇怪的好。大腳怪想一起玩,但他他太想一起玩了。

Prompt:薩姆·奧特曼走進火車站,讓每個人都和他一起跳舞

官方展示案例:AI 拍出的“日常生活”

OpenAI 展示了幾組由 Sora 2 生成的視訊:

提示:花樣滑冰運動員在頭上放著一隻會貓,完成三周跳

提示:兩位穿著亮麗技術外殼的山地探險家,臉上結著冰霜,眼睛因緊迫而眯起,在雪地裡輪流大聲呼喊

這些案例展示了 Sora 2 不只是“生成影像”,而是第一次讓 AI 視訊在動作、環境和聲音上趨近真實世界。

版權與合規:爭議與防護並存

路透社報導稱,OpenAI 對 Sora 2 的版權管理可能採用“版權所有者選擇退出(opt-out)”機制。換句話說,如果權利人沒有明確聲明退出,其作品可能被模型用作生成資料。這一做法立刻引發好萊塢關注,迪士尼等大型內容公司已經宣佈選擇退出。

與此同時,Sora App 還同步上線了 家長控制功能,允許為青少年帳號設定非個性化內容流、關閉私信和限制連播。這也是 OpenAI 在內容安全上的防護措施之一。

從 Sora 到 Sora 2:應用場景的轉變

去年底的 Sora 1 主要服務於 ChatGPT 使用者,強調“文字到視訊”的突破,最長支援 20 秒片段,並在微軟 Bing 裡落地成工具。但它始終是工具屬性更強的“創作模組”。

而 Sora 2 則直接轉向消費級應用:一方面通過 App 降低門檻,讓更多使用者體驗 AI 視訊;另一方面通過短影片流、點贊、評論與二次創作,激發社交屬性。這種“模型 + 平台”的組合,使得 AI 視訊不再只是技術炫技,而是進入日常內容生態。

不是“AI抖音”,而是musical.ly時刻

OpenAI帶來的明星效應,繼續讓這個產品被廣泛關注。那怕在此之前已經有大量同樣設計的產品,甚至玩法更花樣的產品。但人們依然選擇第一時間稱呼這個產品為“AI版抖音”。

然而當人們稱 Sora 2 是“AI 抖音”時,其實隱含了一個預設:它已經具備了大規模的使用者沉浸和內容爆發的條件。但事實上,現在的 Sora 2 更接近於當年的 musical.ly——這個產品可能已經被很多人忘了,但它被收購是抖音等產品真正風靡的關鍵轉折點。

它展示了一種新媒介的可能性,卻還未真正融入到大規模的日常社交場景中。musical.ly 在 2014 年首次讓人們看到短影片不只是“視訊版的微博”,而是一種全新的表達語言:

配合音樂、用鏡頭和動作創造氛圍。這種創作範式的創新才是後來抖音得以崛起的土壤。

同樣,Sora 2 的意義也不在於今天就能帶來爆炸性的流量或商業化,而在於它讓大眾第一次直觀地感受到:AI 生成的視訊可以像 musical.ly 的 lip sync 一樣,創造出一種全新的敘事風格,意識到“視訊不一定是拍攝的結果,也可以是生成的起點”。

這是一種從“拍攝”到“想像”的思路遷移,就像短影片從“記錄”到“表演”的轉折。

如果說抖音的關鍵在於建立了規模化分發和使用者沉浸的基礎設施,那麼 musical.ly 的關鍵則是教育了使用者:原來短影片是可以用來玩、用來表達自我、用來社交的。Sora 2 今天所扮演的,或者說今天只有OpenAI下場才會帶來的,正是這種“教育角色”。它會讓更廣泛的人直觀地玩起“AI 視訊”,產生了最初的“哦,原來還能這樣講故事”的感受。

同時這也意味著另一件事:Sora2開啟的商業和更多的可能性,並不一定就是OpenAI最終全部吞下,這只是起點,大家都還有機會!

至於現在,那肯定是趁著假期先玩起來吧。 (鈦媒體AGI)