#AI抖音
刷屏的Sora 2,不是“AI抖音”時刻
從模型到 App:Sora 2 的全新亮相今日AI圈無人放假。OpenAI 在預告了一段之後,正式推出新一代視訊生成模型 Sora 2,而這一次的主角不再是模型本身。它首次將其以獨立 iOS 應用的形式發佈。與一年前發佈的第一代 Sora 相比,Sora 2 不再只是 ChatGPT Plus 裡的“附加功能”,而是直接進入消費級產品賽道,成為一款帶有短影片流和互動機制的 App:Sora by OpenAI(因為Sora當初發佈後,這個名字就被很多人給佔去了,所以它後面帶上了By OpenAI)這款名為 Sora 的應用目前在美國和加拿大率先上線,採用邀請制,使用者可生成並分享 10 秒視訊,瀏覽個性化推薦流,並通過點贊、評論和二次創作(Remix)與他人互動。OpenAI 把它定位為“超寫實動作與聲音”的創作工具,既是模型升級,也是產品形態上的徹底轉身。上手實測:雖然是邀請碼機制,但它分發的方式其實很容易讓人們拿到邀請,更重要的其實還是一個製造FOMO帶來行銷效果的策略。也就是說,OpenAI對這個產品的投入,並沒有擔心token——那怕ChatGPT都在悄悄通過“降智”來減少token使用的今天,OpenAI對這個產品以及向toC的市場衝刺的野心也體現出來。打開app,輸入邀請碼後,會看到提示。然後,是一個和今天所有短影片應用介面一樣的首頁。抄襲致敬TikTok們的介面。當你想製作視訊,點選“+”號,開始製作。你可以選擇已經有的“人物”,描述視訊內容,生成他們彼此互動的視訊。也可以製作自己的虛擬形象。然後你就可以盡情虛構你的人生了!Cameo:把自己放進視訊Sora 2 的最大變化之一,是在生成畫面時實現了同步音訊。過去 AI 視訊往往只負責影像,聲音需要後期疊加,而現在使用者可以在同一次生成裡得到語音對白、環境音效和音軌,帶來更完整的沉浸式體驗。OpenAI 在研究博文中強調,Sora 2 在物理一致性、動作連貫性和指令跟隨上都有明顯提升,並配合安全過濾機制,限制錯誤資訊或不當內容的生成。業內分析認為,這一功能正是與 Google Veo 3 等競品正面競爭的關鍵點。如果說 Sora 2 的視訊+音訊一體化是“底層能力”的升級,那麼 Cameo 功能則是“玩法邏輯”的變革。在 Sora App 裡,使用者可以通過一次性的錄入來確認身份,並上傳肖像和聲音的樣本。只要完成了這個步驟,App 就會為你生成一個“可授權的虛擬分身”。從此,你不僅能生成一個抽象的角色,還能讓視訊裡的主角就是“自己”:你會出現在 10 秒的短片裡,唱歌、演戲、跳舞,甚至在虛擬場景裡和 AI 生成的角色互動。這種體驗被 OpenAI 形容為“超寫實 Cameo”,強調的是本人同意、本人形象。它的設計邏輯就是 “只生成願意出現的人”。因此,公眾人物、未經授權的第三方形象都被禁止使用,使用者也可以隨時撤銷授權。在 OpenAI 的官方頁面中,有文字描述:使用者可通過一次錄製,將自己以 Cameo 形式插入模型生成的視訊場景中。OpenAI 表示,這一功能在內部測試階段就已經被團隊頻繁使用,能夠在任意場景中重現面部、聲音與動作一致性。提示:大腳怪對他真的很好,有點太好了,像奇怪的好。大腳怪想一起玩,但他他太想一起玩了。Prompt:薩姆·奧特曼走進火車站,讓每個人都和他一起跳舞官方展示案例:AI 拍出的“日常生活”OpenAI 展示了幾組由 Sora 2 生成的視訊:提示:花樣滑冰運動員在頭上放著一隻會貓,完成三周跳提示:兩位穿著亮麗技術外殼的山地探險家,臉上結著冰霜,眼睛因緊迫而眯起,在雪地裡輪流大聲呼喊這些案例展示了 Sora 2 不只是“生成影像”,而是第一次讓 AI 視訊在動作、環境和聲音上趨近真實世界。版權與合規:爭議與防護並存路透社報導稱,OpenAI 對 Sora 2 的版權管理可能採用“版權所有者選擇退出(opt-out)”機制。換句話說,如果權利人沒有明確聲明退出,其作品可能被模型用作生成資料。這一做法立刻引發好萊塢關注,迪士尼等大型內容公司已經宣佈選擇退出。與此同時,Sora App 還同步上線了 家長控制功能,允許為青少年帳號設定非個性化內容流、關閉私信和限制連播。這也是 OpenAI 在內容安全上的防護措施之一。從 Sora 到 Sora 2:應用場景的轉變去年底的 Sora 1 主要服務於 ChatGPT 使用者,強調“文字到視訊”的突破,最長支援 20 秒片段,並在微軟 Bing 裡落地成工具。但它始終是工具屬性更強的“創作模組”。而 Sora 2 則直接轉向消費級應用:一方面通過 App 降低門檻,讓更多使用者體驗 AI 視訊;另一方面通過短影片流、點贊、評論與二次創作,激發社交屬性。這種“模型 + 平台”的組合,使得 AI 視訊不再只是技術炫技,而是進入日常內容生態。不是“AI抖音”,而是musical.ly時刻OpenAI帶來的明星效應,繼續讓這個產品被廣泛關注。那怕在此之前已經有大量同樣設計的產品,甚至玩法更花樣的產品。但人們依然選擇第一時間稱呼這個產品為“AI版抖音”。然而當人們稱 Sora 2 是“AI 抖音”時,其實隱含了一個預設:它已經具備了大規模的使用者沉浸和內容爆發的條件。但事實上,現在的 Sora 2 更接近於當年的 musical.ly——這個產品可能已經被很多人忘了,但它被收購是抖音等產品真正風靡的關鍵轉折點。它展示了一種新媒介的可能性,卻還未真正融入到大規模的日常社交場景中。musical.ly 在 2014 年首次讓人們看到短影片不只是“視訊版的微博”,而是一種全新的表達語言:配合音樂、用鏡頭和動作創造氛圍。這種創作範式的創新才是後來抖音得以崛起的土壤。同樣,Sora 2 的意義也不在於今天就能帶來爆炸性的流量或商業化,而在於它讓大眾第一次直觀地感受到:AI 生成的視訊可以像 musical.ly 的 lip sync 一樣,創造出一種全新的敘事風格,意識到“視訊不一定是拍攝的結果,也可以是生成的起點”。這是一種從“拍攝”到“想像”的思路遷移,就像短影片從“記錄”到“表演”的轉折。如果說抖音的關鍵在於建立了規模化分發和使用者沉浸的基礎設施,那麼 musical.ly 的關鍵則是教育了使用者:原來短影片是可以用來玩、用來表達自我、用來社交的。Sora 2 今天所扮演的,或者說今天只有OpenAI下場才會帶來的,正是這種“教育角色”。它會讓更廣泛的人直觀地玩起“AI 視訊”,產生了最初的“哦,原來還能這樣講故事”的感受。同時這也意味著另一件事:Sora2開啟的商業和更多的可能性,並不一定就是OpenAI最終全部吞下,這只是起點,大家都還有機會!至於現在,那肯定是趁著假期先玩起來吧。 (鈦媒體AGI)
剛剛,Sora 2來了!OpenAI還發了“AI抖音”,阿爾特曼被“玩壞”
視訊生成迎來“GPT-3.5時刻”。智東西10月1日報導,今日凌晨,OpenAI發佈了旗艦視訊和音訊生成模型Sora 2,並推出“AI版抖音”——Sora應用程式。OpenAI將Sora 2稱作“正直奔視訊領域的GPT-3.5時刻”。相比之前的Sora,Sora 2能更加精準逼真地模擬物理世界,並且更易於控制,還支援同步對話和音效。從官方公佈的視訊Demo來看,它可以完成一些對於之前的視訊生成模型難以完成的事情:奧運會體操動作、精準模擬浮力和槳板上後空翻,以及花滑運動員頭頂貓咪的三周半跳。Sora應用程式定位一款社交App,支援使用者將自己生成的視訊上傳,並通過“客串(Cameos)”功能讓使用者參與到好友視訊創作中。OpenAI的目標是試圖打造一種全新獨特的人際溝通方式。▲OpenAI推出社交App Sora目前,Sora iOS應用程式現已開放下載,以邀請制的形式在美國和加拿大推出。獲得邀請碼的使用者也可在Sora官網免費體驗Sora 2,ChatGPT Pro使用者可以體驗更高品質的Sora 2 Pro模型。Sora 2一經發佈就在外網炸開了鍋,有大部分人是求邀請碼的,有小部分人已拿到邀請碼。社交平台X上立馬出現了不少Sora 2生成視訊,甚至連OpenAI CEO薩姆·阿爾特曼都被“玩壞了”。▲OpenAI研究員Gabriel生成的阿爾特曼“客串”視訊引圍觀同時也有不少人感到擔憂,X上的一位使用者稱:“幾個月後,我們將無法區分什麼是真實的,什麼不是真實的,那將是一個可怕的時代。”▲社交平台X的網友評論01. Sora 2來了:“視訊領域的GPT-3.5時刻”OpenAI稱,2024年2月發佈的Sora在很多方面都堪稱視訊領域的“GPT-1時刻”——視訊生成首次開始顯現成效,通過擴展預訓練計算能力,物體持久性等需求得以實現。OpenAI將Sora 2稱作“正直奔視訊領域的GPT-3.5時刻”。先前的視訊模常常使得物體變形並扭曲現實,以便成功執行文字提示。例如,如果籃球運動員投籃不中,球可能會自動傳送到籃筐。但在Sora 2中,如果籃球運動員投籃不中,球會從籃板上反彈。還比如,下面這個Sora 2生成的後空翻視訊,表演者甚至在落地後有一些踉蹌,且臉上出現了因小失誤有些尷尬的表情,很像真實生活中的場景。有趣的是,該模型犯下的“錯誤”往往看起來像是Sora 2 隱式建模的內部智能體所犯的錯誤;儘管它仍然不完美,但與先前的系統相比,它在遵循物理定律方面做得更好。OpenAI認為,對於任何有用的世界模擬器來說,這都是一項極其重要的能力——你必須能夠模擬失敗,而不僅僅是成功。該模型在可控性方面也實現了巨大的飛躍,能夠執行跨越多個鏡頭的複雜指令,同時精準地保留世界狀態。它擅長處理寫實、電影和動漫風格。作為通用的視訊音訊生成系統,它能夠建立具有高度真實感的複雜背景音景、語音和音效。使用者還可以將現實世界的元素直接注入Sora 2。例如,通過觀察我們一位隊友的視訊,該模型可以將其插入到任何由Sora生成的環境中,並精準刻畫其外貌和聲音。這項功能非常通用,適用於任何人類、動物或物體。OpenAI稱,該模型遠非完美,並且存在很多錯誤,但它證實了進一步擴大視訊資料上的神經網路將使我們更接近模擬現實。02. AI版抖音推出,真人“客串”視訊 新社交神器?今天,OpenAI還推出了一款名為“Sora”的全新iOS社交應用,該應用由Sora 2提供支援。在應用中,使用者可以創作、混錄彼此的創作風格,在可自訂的Sora動態中發現新視訊,並通過“客串(Cameos)”功能將自己或好友引入到視訊中。使用客串功能,使用者只需在應用中進行一次簡短的音視訊錄製,即可以驚人的保真度將自己直接帶入任何Sora場景。這看起來像一款AI版的抖音或TikTok,而OpenAI認為,圍繞這項“客串”功能建構的社交應用是Sora 2體驗的魅力所在。幾個月前,OpenAI在Sora團隊開始嘗試“上傳自己生成的視訊”的功能,他們都玩得很開心。OpenAI稱,這感覺就像是溝通方式的自然演變——從簡訊到表情符號,再到語音備忘錄,再到現在的視訊。上周,OpenAI向全體員工內部發佈了這款應用。已經有同事反饋,他們通過這項功能在公司結識了新朋友。03. 邀請制推出,Sora 2免費可用 Pro使用者體驗更高級OpenAI將Sora應用以邀請制的形式推出,確保使用者能與好友一同使用。收到邀請後,使用者還可以通過sora.com訪問Sora 2 。Sora 2最初將免費提供,但這些功能仍受計算能力限制。ChatGPT Pro使用者還可以在sora.com上使用實驗性的、更高品質的Sora 2 Pro模型。OpenAI還計畫在API中發佈Sora 2。Sora 1 Turbo將繼續可用,使用者建立的所有內容也將繼續存在於sora.com中。為了防止上癮等問題,OpenAI將採取一系列措施。一是其將為使用者提供工具和自主選擇權,讓他們能夠掌控資訊流中的內容。利用OpenAI現有的大型語言模型,其開發了一類新的推薦演算法,可以通過自然語言進行指導;還內建了定期調查使用者健康狀況的機制,並主動為他們提供調整資訊流的選項。默認情況下,OpenAI會向使用者顯示主要針對關注或互動的人的內容,並優先顯示模型認為使用者最有可能用作創作靈感的視訊;不會針對使用者在動態資訊流中花費的時間進行最佳化,明確設計這款應用的初衷是最大限度地提升創作量,而非消費量。在青少年保護方面,OpenAI將通過ChatGPT推出Sora家長控制功能,以便家長可以覆蓋無限滾動限制、關閉演算法個性化以及管理私信設定。在客串功能方面,使用者可以與Sora端到端地掌控肖像。只有使用者本人才能決定誰可以使用自己的客串,並且可以隨時撤銷存取權或移除包含該客串的任何視訊。使用者可以隨時查看包含您客串的視訊,包括其他人建立的草稿。OpenAI在這款應用中處理了許多安全問題,例如肖像使用方面的知情同意、出處確認、防止有害內容的生成等等。其他應用的很多問題都源於其盈利模式。OpenAI目前唯一的計畫是,如果需求量相對於可用計算能力過大,最終允許使用者選擇支付一定金額來生成額外的視訊。04. 結語:Sora 2憋大招或帶來視訊生成產業洗牌自OpenAI在2024年2月發佈Sora已經過去超一年半時間,Sora 2終於到來。從效果來看,這款模型在模擬真實性、可控性及音效方面都有比較大的進展,有望推動視訊生成產業格局加速洗牌。視訊模型正在飛速發展,通用世界模擬器不僅提供了新的內容生成方式,還有望重塑人際溝通方式。OpenAI正通過全新的Sora社交App靠近這一目標,也標誌視訊生成模型在落地應用上更加成熟。 (智東西)
曝 OpenAI 將推出「AI 抖音」:禁止上傳實拍內容,Sora 2 加持
這兩天的 AI 圈,更新速度快得讓人喘不過氣,那是要讓人放假的樣子。昨天 DeepSeek 更新了 V3.2-Exp 模型,Anthropic 凌晨就緊跟著發佈了性能更強的 Claude 4.5。正當大家都在預測牌桌上的其他巨頭何時出手時,行業領頭羊 OpenAI 的「王炸」似乎已經提前被劇透了,那就是 Sora 2。最近,OpenAI 不僅在 X 平台連發多條神秘視訊,引爆社區對 Sora 2 的猜想。來自《連線》雜誌的重磅爆料更是指出,OpenAI 的下一步棋,並非簡單升級一個模型,而是要親自下場,推出一個獨立的 AI 視訊社交 App。一個酷似抖音,但內容 100% 由 AI 生成的全新平台。奧特曼曾經發 X 說,未來幾周,OpenAI 將推出一些新的計算密集型產品,且最初只會向 Pro 使用者開放。而需要大量算力的,不正是視訊生成嗎?剛好 Sora 目前也僅面向 Plus 和 Pro 使用者,傳聞已久的 Sora 2 真的要發佈了。https://x.com/sama/status/1969835407421374910AI 視訊也要迎來它的「吉卜力」時刻了。揭秘「Sora 2 App」:一個怎樣的 AI 抖音?從目前曝光的資訊來看,OpenAI 正在測試這款名為 Sora 2 的短影片應用,乍看之下,它就是一個 AI 版抖音。但最顛覆的一點是,在這個平台上,我們看不到任何真實拍攝的內容。TikTok 應用截圖,主要特點是豎屏滑動、演算法推薦、點贊評論它的介面和互動,與我們熟悉的短影片 App 幾乎一模一樣。採用豎屏資訊流,和滑動切換的導航方式的視訊源,並由推薦演算法為我們提供「為你推薦」的內容。在視訊的右側下方,同樣提供了點贊、評論等互動選項,甚至還有一個獨特的「Remix」(再創作)功能。OpenAI 去年 12 月正式推出了 Sora,很快被整合到 ChatGPT 應用中,圖為 Sora 網頁版截圖。OpenAI 指出它存在一些侷限性,例如似乎並不完全理解物理學,在製作逼真的動作場景時尤其困難,尤其是在較長的片段中。目前,1080p 超高畫質解析度僅支援生成 10s。 Sora 體驗地址:sora.chatgpt.com根據檔案顯示,使用者只能使用 OpenAI 的下一代視訊模型 Sora 2,生成最長 10 秒的視訊片段。並且,App 不提供任何從手機相簿,或其他應用上傳照片或視訊的選項。這意味著,這個平台將成為全球首個內容 100% 由 AI 生成的短影片社區。用數字分身來做社交如果說純 AI 生成內容還只是概念上的不同,OpenAI 還要為這個短影片 APP 引入社交的功能。Sora 2 應用具有身份驗證的功能,即允許使用者確認自己的「肖像」(likeness)。一旦驗證通過,就可以在生成的視訊中,使用自己的形象。更有趣的是,社交的邊界被進一步打破。你的朋友也可以在他們的視訊裡標記你,使用你的「數字分身」。AI 圖片視訊生成平台即夢,也提供了數字人生成。舉個例子,我們可以直接使用別人的數字分身,生成一個視訊,內容是「你和朋友在從沒去過的主題公園,一起坐過山車」。為了保護使用者隱私,數字分生這項功能,也設定了提醒機制。每當你的形象被他人使用時,無論對方是公開發佈,還是僅僅保存在草稿中且從未發佈,你都會收到通知。這款應用上周已經在 OpenAI 內部發佈,並收到了員工壓倒性的積極反饋。據連線雜誌的消息,員工們使用得非常頻繁,以至於一些管理層開玩笑說,這可能會影響生產力。真的跟刷抖音一樣會上癮?為什麼 OpenAI 要親自下場做社交?答案或許和 ChatGPT 的成功路徑如出一轍。OpenAI 似乎在押注,Sora 2 這個 AI 版抖音,能讓我們與 AI 視訊的互動方式發生根本性改變,就像 ChatGPT 讓大眾第一次真正體驗到 AI 文字的潛力一樣。社交榜和娛樂榜第一名分別是 Meta 的 Thread 和 TikTok當然,也不是只有 OpenAI 想到了 AI 視訊社交這條路,就在上周,Meta 在它們的 AI 應用中,推出了名為「Vibes」的新功能。這是一個 AI 生成短影片的新平台,集創作、分享與社交功能於一體。使用者可通過瀏覽、創作、或二次創作(Remix)來生成自己的 AI 視訊,並將視訊快速分享到 Vibes、Instagram、Facebook 等 Meta 社交平台。Vibes 視訊生成介面截圖Google 也早已宣佈,計畫將自己最新的視訊生成模型 Veo 3 整合到 YouTube 中。一個是坐擁最大的社交網路平台,一個是最大的視訊分享平台,OpenAI 的 AI 視訊社交之路看起來,也並非一片坦途。從一個聊天機器人,到一個可能的內容社交平台,OpenAI 的野心,在於建造下一代的網際網路入口,而這個入口,完全由 AI 驅動。這種野心並非空談,就在今天,OpenAI 推出了其商業化佈局中最重要的一步棋,在 ChatGPT 內直接購物。使用者現在可以在與 ChatGPT 的對話中,直接購買來自 Etsy 甚至 Shopify 商家的商品。當我們跟 ChatGPT 聊天,問到「適合送給陶瓷愛好者的禮物」時,ChatGPT 不再只是給一個連結,而是直接展示商品並提供一個「購買」按鈕,不需要離開聊天窗口,幾下點選就能完成支付。OpenAI 的「即時結帳」(Instant Checkout)功能,背後是 OpenAI 與 Stripe(知名支付工具) 聯合開發並開放原始碼的「代理商業協議」(Agentic Commerce Protocol)。通過這個協議,OpenAI 正在為 AI 時代的電商制定新的規則。電商、視訊、社交、生產力,當這些過去分散在不同 App 中的功能,且都是最賺錢的生意,開始被一個統一的 AI 入口所整合時,OpenAI 的 Open 原來是「我全都要」。 (APPSO)