刷屏的Sora 2，不是“AI抖音”時刻

2025/10/02

•

從模型到 App：Sora 2 的全新亮相

今日AI圈無人放假。

OpenAI 在預告了一段之後，正式推出新一代視訊生成模型 Sora 2，而這一次的主角不再是模型本身。它首次將其以獨立 iOS 應用的形式發佈。

與一年前發佈的第一代 Sora 相比，Sora 2 不再只是 ChatGPT Plus 裡的“附加功能”，而是直接進入消費級產品賽道，成為一款帶有短影片流和互動機制的 App：

Sora by OpenAI

（因為Sora當初發佈後，這個名字就被很多人給佔去了，所以它後面帶上了By OpenAI）

這款名為 Sora 的應用目前在美國和加拿大率先上線，採用邀請制，使用者可生成並分享 10 秒視訊，瀏覽個性化推薦流，並通過點贊、評論和二次創作（Remix）與他人互動。OpenAI 把它定位為“超寫實動作與聲音”的創作工具，既是模型升級，也是產品形態上的徹底轉身。

上手實測：

雖然是邀請碼機制，但它分發的方式其實很容易讓人們拿到邀請，更重要的其實還是一個製造FOMO帶來行銷效果的策略。也就是說，OpenAI對這個產品的投入，並沒有擔心token——那怕ChatGPT都在悄悄通過“降智”來減少token使用的今天，OpenAI對這個產品以及向toC的市場衝刺的野心也體現出來。

打開app，輸入邀請碼後，會看到提示。

然後，是一個和今天所有短影片應用介面一樣的首頁。

抄襲致敬TikTok們的介面。

當你想製作視訊，點選“+”號，開始製作。

你可以選擇已經有的“人物”，描述視訊內容，生成他們彼此互動的視訊。

也可以製作自己的虛擬形象。

然後你就可以盡情虛構你的人生了！

Cameo：把自己放進視訊

Sora 2 的最大變化之一，是在生成畫面時實現了同步音訊。過去 AI 視訊往往只負責影像，聲音需要後期疊加，而現在使用者可以在同一次生成裡得到語音對白、環境音效和音軌，帶來更完整的沉浸式體驗。

OpenAI 在研究博文中強調，Sora 2 在物理一致性、動作連貫性和指令跟隨上都有明顯提升，並配合安全過濾機制，限制錯誤資訊或不當內容的生成。業內分析認為，這一功能正是與 Google Veo 3 等競品正面競爭的關鍵點。

如果說 Sora 2 的視訊+音訊一體化是“底層能力”的升級，那麼 Cameo 功能則是“玩法邏輯”的變革。

在 Sora App 裡，使用者可以通過一次性的錄入來確認身份，並上傳肖像和聲音的樣本。只要完成了這個步驟，App 就會為你生成一個“可授權的虛擬分身”。從此，你不僅能生成一個抽象的角色，還能讓視訊裡的主角就是“自己”：你會出現在 10 秒的短片裡，唱歌、演戲、跳舞，甚至在虛擬場景裡和 AI 生成的角色互動。

這種體驗被 OpenAI 形容為“超寫實 Cameo”，強調的是本人同意、本人形象。它的設計邏輯就是 “只生成願意出現的人”。因此，公眾人物、未經授權的第三方形象都被禁止使用，使用者也可以隨時撤銷授權。

在 OpenAI 的官方頁面中，有文字描述：使用者可通過一次錄製，將自己以 Cameo 形式插入模型生成的視訊場景中。OpenAI 表示，這一功能在內部測試階段就已經被團隊頻繁使用，能夠在任意場景中重現面部、聲音與動作一致性。

提示：大腳怪對他真的很好，有點太好了，像奇怪的好。大腳怪想一起玩，但他他太想一起玩了。

Prompt：薩姆·奧特曼走進火車站，讓每個人都和他一起跳舞

官方展示案例：AI 拍出的“日常生活”

OpenAI 展示了幾組由 Sora 2 生成的視訊：

提示：花樣滑冰運動員在頭上放著一隻會貓，完成三周跳

提示：兩位穿著亮麗技術外殼的山地探險家，臉上結著冰霜，眼睛因緊迫而眯起，在雪地裡輪流大聲呼喊

這些案例展示了 Sora 2 不只是“生成影像”，而是第一次讓 AI 視訊在動作、環境和聲音上趨近真實世界。

版權與合規：爭議與防護並存

與此同時，Sora App 還同步上線了家長控制功能，允許為青少年帳號設定非個性化內容流、關閉私信和限制連播。這也是 OpenAI 在內容安全上的防護措施之一。

從 Sora 到 Sora 2：應用場景的轉變

去年底的 Sora 1 主要服務於 ChatGPT 使用者，強調“文字到視訊”的突破，最長支援 20 秒片段，並在微軟 Bing 裡落地成工具。但它始終是工具屬性更強的“創作模組”。

而 Sora 2 則直接轉向消費級應用：一方面通過 App 降低門檻，讓更多使用者體驗 AI 視訊；另一方面通過短影片流、點贊、評論與二次創作，激發社交屬性。這種“模型 + 平台”的組合，使得 AI 視訊不再只是技術炫技，而是進入日常內容生態。

不是“AI抖音”，而是musical.ly時刻

OpenAI帶來的明星效應，繼續讓這個產品被廣泛關注。那怕在此之前已經有大量同樣設計的產品，甚至玩法更花樣的產品。但人們依然選擇第一時間稱呼這個產品為“AI版抖音”。

然而當人們稱 Sora 2 是“AI 抖音”時，其實隱含了一個預設：它已經具備了大規模的使用者沉浸和內容爆發的條件。但事實上，現在的 Sora 2 更接近於當年的 musical.ly——這個產品可能已經被很多人忘了，但它被收購是抖音等產品真正風靡的關鍵轉折點。

它展示了一種新媒介的可能性，卻還未真正融入到大規模的日常社交場景中。musical.ly 在 2014 年首次讓人們看到短影片不只是“視訊版的微博”，而是一種全新的表達語言：

配合音樂、用鏡頭和動作創造氛圍。這種創作範式的創新才是後來抖音得以崛起的土壤。

同樣，Sora 2 的意義也不在於今天就能帶來爆炸性的流量或商業化，而在於它讓大眾第一次直觀地感受到：AI 生成的視訊可以像 musical.ly 的 lip sync 一樣，創造出一種全新的敘事風格，意識到“視訊不一定是拍攝的結果，也可以是生成的起點”。

這是一種從“拍攝”到“想像”的思路遷移，就像短影片從“記錄”到“表演”的轉折。

如果說抖音的關鍵在於建立了規模化分發和使用者沉浸的基礎設施，那麼 musical.ly 的關鍵則是教育了使用者：原來短影片是可以用來玩、用來表達自我、用來社交的。Sora 2 今天所扮演的，或者說今天只有OpenAI下場才會帶來的，正是這種“教育角色”。它會讓更廣泛的人直觀地玩起“AI 視訊”，產生了最初的“哦，原來還能這樣講故事”的感受。

同時這也意味著另一件事：Sora2開啟的商業和更多的可能性，並不一定就是OpenAI最終全部吞下，這只是起點，大家都還有機會！

至於現在，那肯定是趁著假期先玩起來吧。 (鈦媒體AGI)

科技