#視訊生成
迪士尼10億美金聯姻OpenAI,一個IP+AI的資本遊戲
迪士尼剛宣佈給OpenAI砸下10億美金搞‘世紀聯姻’,反手就逼著Google把AI生成的米老鼠、死侍全部下架!一邊當最大的金主,一邊舉最狠的屠刀。本期視訊給大家從資本、版權、行業生態幾個角度詳細拆解這位全球娛樂巨頭到底在下什麼大棋?近日,迪士尼宣佈把自家200多個角色IP開放給Sora做視訊生成,同時宣佈對OpenAI投資10億美元,雙方正式達成深度戰略合作夥伴關係及內容授權協議。幾乎在同一時間,迪士尼法務部向Google發出了版權警告,要求其旗下YouTube及相關平台立即下架利用AI生成的,包含米老鼠、死侍、鋼鐵人等經典IP形象的視訊內容。Google迅速響應,數小時內下架了相關違規內容並封禁了部分帳號。迪士尼對OpenAI和Google的一系列動作,這兩天在AI圈可是太過戲劇性了。回顧過去兩年,迪士尼對AI的態度經歷了過山車般的轉變。曾經我們的視訊也提過迪士尼、環球、華納三巨頭起訴MiniMax,對Midjourney、Mata、Character.AI同樣是重拳出擊,毫不留情。如今迪士尼對OpenAI的投資,看起來就像是迪士尼終於成熟長大了,打不過就加入,買下它並制定規則。傳統內容巨頭不再將AI視為“掠奪者”,而是將其定義為一種需要被資本馴化的生產力工具。為什麼迪士尼和OpenAI的合作是10億美元股權投資,而不是簡單的付費授權呢?其實背後隱藏著雙方對未來的深度算計。這場交易其實是各取所需的雙贏。通過持有OpenAI的股權,迪士尼獲得了一張進入AI核心圈的門票。作為OpenAI的股東之一,迪士尼自然獲得了技術優先權,將廣泛使用ChatGPT和其他AI工具在內容和產品開發等場景中。這項合作讓迪士尼能夠進入社交平台快速增長的使用者生成短影片領域。迪士尼CEO艾格在交易公佈後對媒體稱,與OpenAI達成的授權合作旨在“為迪士尼打開新的數字娛樂空間並吸引更多年輕使用者”。市場對這一交易的回應是積極的,迪士尼股價迎來了一波持續上漲。對於OpenAI而言,10億美元讓它獲得了迪士尼的估值背書,並且成為了版權“正規軍”。不僅獲得了迪士尼高品質、無版權爭議的資料,而且迪士尼龐大的產業鏈為OpenAI的技術提供了最頂級的落地場景。這次合作給AI版權之爭這個老生常談的話題,帶來了新的解法。此前,AI公司用網際網路資料訓練模型屬於資料合規的模糊地帶。迪士尼通過這筆交易打開了一個新的樣式:高品質的訓練資料是資產,必須付費。迪士尼要求Google下架AI生成內容,也釋放了一個明確的訊號:只有經過授權的AI生成內容才是合規的。一位是全球IP巨頭,一位是AI頭號玩家,10億美元合作,為全球確立了“IP+AI”的新型模式,對國內AI公司和內容公司來說,是壓力還是機會呢?未來,AI公司獲取高品質IP資料的成本被抬升,優質IP內容公司也必須主動尋求商業化的授權合作,同時將使用者二創納入商業版圖。AI時代的內容擴展,將在版權規則下進行。好萊塢AI時代的正式到來,同時新問題也來了,未來IP+AI的收入分成如何劃分?AI生成不當內容的責任如何判定?粉絲作品的版權歸誰? (競爭秩序場)
OpenAI收緊Sora監管!
當地時間周一(10月20日),人工智慧(AI)研究公司OpenAI發佈聯合聲明稱,將與演員布萊恩·克蘭斯頓、美國演員工會(SAG-AFTRA)及其他表演者工會合作,防範其AI視訊生成應用Sora的深度偽造(Deepfake)內容。據美國演員工會在社交媒體平台X上發佈的資訊,在9月底Sora 2上線後,有使用者在平台上生成了未經授權、模仿克蘭斯頓聲音與形象的AI視訊,引發了這位《絕命毒師》主演的擔憂。克蘭斯頓在聲明中表示:“感謝OpenAI制定政策並完善防護機制,並希望他們以及所有從事這一領域的公司,能夠尊重我們管理個人聲音與形象複製權的職業權利。”除了美國演員工會之外,OpenAI還宣佈將與代表克蘭斯頓的聯合人才經紀公司(UTA)、經紀人協會(ATA)及創意藝術家經紀公司(CAA)展開合作,以進一步強化對未經授權AI生成內容的防護。此前,CAA和UTA曾公開批評OpenAI在Sora中使用受版權保護素材的做法,稱其對客戶及其智慧財產權構成威脅。上周,因Sora使用者生成對民權領袖馬丁·路德·金的不敬形象,OpenAI應馬丁·路德·金遺產委員會的要求,在Sora平台封禁了相關視訊。自9月30日Sora 2推出以來,OpenAI在版權與肖像使用政策方面持續調整。10月3日,OpenAI首席執行官薩姆·奧爾特曼更新了Sora的“退出(opt-out)政策”。該政策此前允許使用智慧財產權內容,除非版權方明確要求停用;新政策則賦予權利人“更精細的角色生成控制權”。在Sora推出時,平台就要求對個人聲音與肖像的使用需經授權同意(opt-in)。OpenAI隨後又進一步承諾稱,將迅速回應任何相關投訴。OpenAI還重申支援美國的《禁止偽造法案》,該法案旨在防止未經授權AI生成他人聲音或肖像。 (科創日報)
不止於Sora 2!商湯Seko再次定義“成片智能體”,AI視頻生成迎來殺手級應用
讓AI視頻生成拿來即用。AI影片的競爭焦點開始轉移——不再侷限於單一畫面效果的比拚,而是聚焦可用性與開箱即用的突破。9月底Sora 2的橫空出世便清晰傳遞出這一趨勢:其不僅以精彩紛呈的動態生成效果刷新行業認知,更通過能引入現實角色、提升物理模擬逼真度、整合創編傳播工具等的綜合性“成片智能體”,展現了向易用性、實用性發展的趨勢。這一行業趨勢逐漸明晰的當下,國產平台商湯Seko早已率先佈局,以實際行動重新定義AI視頻的應用邊界。下面的影片就直觀展示了Seko的成片能力,這一視頻從劇本、故事板、配音到後期均由Seko完成,並且精細到每一個細節都符合導演和編劇要求,畫面以及動畫效果也都拉到專業級。Seko用戶@聽白AIGC 生成了下面的視頻,將動漫形象與現實環境相結合且毫無違和感,使得整體畫面質感提升。還有下面的恐怖氛圍短片,Seko使用者@liuker、@不會畫畫的美術生生成的視頻中呈現了醫院場景,從陰森的空間佈局到冷冽的燈光風格,所有視覺元素全程線上、精準配合,成功營造出壓抑、驚悚的恐怖氛圍。作為國內首個創編一體的短片創作Agent平台,Seko使用者規模與作品數量的快速爆發增長證明了產品的價值。從工具到智能體、從畫面到成片,AI正從根本上降低內容生產的門檻、提升創作效率、拓展表達邊界。在這場由Sora2引領的變革中,國產平台商湯Seko是亦步亦趨的追隨者,還是另闢蹊徑的破局者?我們試圖拆解Sora 2與Seko,找到其在這場變革中搶佔先機的關鍵要素。01. 「成片智能體」風起:從技術炫技到應用為王回溯AI視頻產業的發展脈絡,早期產品多停留在技術驗證層面,往往會通過生成各類逼真、新奇的視頻內容來滿足用戶好奇心,如今隨著營銷、短劇、自媒體等領域的剛性需求爆發,其定位正逐漸向生產力工具轉移,而能否覆蓋從創意到成片的全流程,也成為衡量產品價值的核心標準。9月底爆火的Sora 2以及OpenAI伴隨其發布的Sora應用就清晰表明了這一趨勢。具體來看,在核心生成能力上,Sora 2實現了全維度的效能提升。物理模擬層面,其優化動力學與材質還原的可信度,能精準呈現對象體積、遮擋關係與光照互動,例如模擬液體潑灑時的流動軌跡、織物飄動的重力反饋均更貼近真實物理邏輯;音頻能力實現了音畫一體化生成,環境音、動作音效可隨性的畫面自動匹配;提示詞:吉卜力工作室動畫風格,畫面中一個男孩和他的狗跑上長滿青草的風景優美的山坡,頭頂是絕美的雲朵,遠處背景中還能眺望到一個村莊(in the style of a studio ghibli anime, a boy and his dog run up arassy scenic mount y接著是產品形態方面,OpenAI伴隨Sora 2推出的獨立Sora App社交平台,透過內置的Cameo(角色引入)功能,用戶可建立高度逼真的個人數字分身,無縫植入任意Sora 2的生成場景,還能授權好友使用自己的形象實現多人同框創作。相較於上一代產品,Sora 2正向著更符合使用者實際創作需求的工具轉型。但值得注意的是,Sora 2的生成本質上仍是「黑盒式」輸出,因為用戶輸入指令後需等待系統完整輸出,無法對中間環節進行干預調整,即便使用千字級的詳細提示詞,也可能出現與預期偏差的生成結果。因此在實際應用場景,這對追求精準表達的商業創作而言,無疑意味著不可預測的時間損耗與修改成本。反觀國內,商湯科技今年8月推出的Seko就在成片智能體的基礎上,實現了「可控式閉環」。Seko可以做到自動劇本拆解、故事板產生、角色一致性控制等,來產生高品質AI視頻,與Sora 2在成片智能體核心能力上實現對標。下面Seko使用者@豆芽AI筆記本產生的視頻中主體角色整體一致,畫面跟隨人物移動時也沒有出現偏差。與Sora 2不同的是,Seko支援即時可編輯,非一次輸入、一次輸出,甚至可對分鏡畫佈局部修改,消除、重繪、元素加入等,讓使用者透過精細化編輯實現「所見即所得」。▲Seko故事板畫佈局部修改功能儘管當下AI視頻發展距離規模化應用還有一定距離,但當下我們可以確定的是,其行業競爭正在從單一效果比拚轉向全鏈路價值競爭,也就是“成片智能體”在AI視頻工具中逐漸成為共識。02. 解碼「成片智能體」概念讓AI視頻開箱即用的關鍵以「成片智能體」應具備的能力為標準,我們看到Sora 2和Seko的部分能力設定高度趨同,都朝著讓AI視頻生成開箱即用視頻、零門檻出成片的目標進階。需要注意的是,即便二者在降低創作難度、覆蓋全流程需求等方向上高度趨同,但實現路徑呈現鮮明差異,Sora 2強調的是端到端直接輸出,Seko則看重生成過程中各環節進行可控性編輯。先來具體看下兩大平台的相似與不同之處。首先,降低使用門檻的前提是,讓AI能聽懂使用者的日常表達,減少對專業工具的依賴。Sora 2和Seko都可以理解使用者的日常用語,不需要更專業的術語即可產生相應的視頻內容,打破AI視頻創作對專業知識的依賴。在實測體驗時,當智東西輸入「小羊介紹新疆伊犁的美麗景色,一隻擬人化的小羊羔,超寫實風格」的提示詞,其就會生成策劃摘要、美術風格、角色主體、場景概念、音樂風格、故事板劇本。另外眾所周知影片的創作需要不同的工具進行音畫比配、實體模擬等,Seko將復雜技術環節全部封裝為後台自動流程,使用者無需手動調試參數,更無需借助剪輯、配音等第三方工具,就可以實現輸入想法就能得到​​視頻的體驗。Seko近日上線的新功能還支援一鍵製作多人對口型視頻,基於SekoTalk這個商湯自研的圖生視頻對口型演算法,在音樂MV、劇情視頻、廣告等領域都可以應用。在下面的影片中,它支援中英文等多種語言、多人對口型,包括輪流說話或同時說話的情況,即使是語速超快的說唱也不會出現偏差。其次是端到端直接輸出與極致的可編輯性,這也是Sora 2和Seko兩大成片智能體最核心的區別。Sora 2和Seko都可以覆蓋創作的全鏈路,其支援多模態輸入,使用者能透過文字描述建構場景、上傳參考圖定義角色外觀,可一次完成從創意拆解、理解複雜指令到成片輸出的端到端貫通。值得一提的是,這次Sora應用程式新增的Cameo與Seko的主體功能類似,都是透過產生統一的角色,保證後續生成內容的主體穩定、一致。▲Sora 2的Cameo功能(左)、Seko的主體功能(右)在此之上,Seko還進一步將生成內容進行了細化拆解,打造了「先靜後動」流程,將創作分為分鏡確認、細節修改、視頻生成幾個階段,具體來說就是,平台先根據用戶創意生成靜態分鏡序列,經用戶逐幀檢查畫面內容後,可以直接通過自然語言指令重繪角色、調整台詞或鏡頭角度,最後都可以確認鏡頭,最後都可以確認視頻。為了進一步確保成片的可控性,Seko還具備故事板靜態預覽、分鏡畫佈局部修改等功能,允許使用者在每個環節,對生成內容進行修改,如直接要求“把圖中的小羊換成牧羊犬”,系統能精準完成修改。Seko也支援一鍵修改背景,如要求「更換背景為咖啡廳」等。▲Seko局部修改功能當使用者確認了故事板的主體、影片內容、文字內容,就可以在右上方點選一鍵轉視頻。相較於Sora 2的一鍵成片,Seko的成片方式給了使用者更大的自由創作空間。最後是成片品質方面,相較於早期的工具,Sora 2、Seko在視頻生成內容的鏡頭穿幫、音畫不同步等問題上,已經基本實現了超長分鏡的穩定輸出。在此基礎上,Seko平台還更進一步,整合了商湯日日新、即夢、可靈、海螺、Veo等多款業界主流生圖模型,使用者基於該平台能精準控制多角色、多場景的複雜劇本輸出,確保角色形象、光線風格、動作邏輯全程穩定。在下面Seko使用者@不會畫畫的美術生生成的影片中,Seko將背景音樂、鏡頭轉換等諸多設定都與劇本內容相呼應。這些技術突破共同指向,AI視頻生成正朝著「成片智能體」進化,其核心是透過極簡互動、全流程貫通與高品質輸出降低創作門檻。商湯科技的Seko在此基礎上基於故事板預覽、可控式流程等關鍵能力,在視頻生成的可控性與商業可行性兩大關鍵維度上率先落地,讓「成片智能體」真正從技術概念變為觸手可及的生產力工具。03. 從不可控到可落地:Seko重構AI視頻商業化價值邏輯Sora 2和Seko的發展讓我們看到了AI視頻商業化落地的潛力,但當我們將視野放大到整個生成式AI行業會發現,想要讓AI視頻生成真正實現拿來即用,遠比圖文生成複雜得多。影片創作需同步處理畫面渲染的時序邏輯、音訊合成的情緒適配、物理模擬的真實回饋等多重難題,任何環節的斷層都會讓產生的影片出現偏差。正因為這種複雜性,Sora 2與商湯Seko在「成片智能體」的定位上,也呈現出了差異化的思路,前者聚焦從輸入到輸出的高品質端到端交付,後者則在保證成片質量的基礎上,強化了全流程創作的自主、可編輯與可控性。在下面Seko使用者@林龍生成的影片中,伴隨著鏡頭的變化將拯救公主的故事進行了完整呈現,還融入了逼真的特效。如同前面所提到的,創作可控性在AI視頻生成中至關重要,這也是Seko相比Sora 2等其他工具的顯著優勢,其核心可概括為創意可控、風格可控、成本可控。創意可控基本貫穿了前期使用者創作的全流程。使用者輸入核心創意後可進入編輯模式,對畫面細節不滿意可直接修改提示詞重繪單幀分鏡,覺得台詞生硬能逐句調整文案並同步更新配音,想優化敘事節奏可直接增減分鏡或調整鏡頭結構。這種先確認靜態效果、再產生動態視訊的設計,可以幫助使用者在早期修正創意偏差。其次是風格可控,Sora 2的模型體系相對單一,Seko採用了多模型整合和智慧匹配策略,整合了全行業主流生成模型,支援使用者自主選擇相應模型。最後是成本,Sora 2雖能產生高品質畫面,但其千卡級算力消耗帶來的隱性成本,讓中小型商家和個人創作者難以負擔。根據實際使用者回饋,Seko已將單分鐘動畫成本從傳統方式的數萬元降至千元等級,降幅超99.5%以上,讓中小企業和個人創作者也能負擔專業級製作。另外還要注意的是,Sora 2目前仍採用邀請制,並沒有免費向大眾開放,導致大量潛在使用者無法直觀體驗。再加上用戶紛紛在社群平台上傳Sora 2產生的短影片,涉及諸多熱門影視節目角色,使得其在版權方面的監管被廣泛質疑。目前,Seko已經全面向用戶開放,其上線1個月就擁有超10萬名創作者,生成視頻內容超50萬條。這些真實的使用者案例和資料,是Seko開箱即用潛力最有力的證明,其讓AI視頻創作變為可預期、可調整、可落地的過程,這也成為其區別於同類產品的核心競爭力。04. 結語:AI視頻競爭回歸實用價值Seko憑可控+普惠領跑當下AI視頻產業的發展意味著,其競爭正在回歸到價值本身,即能否以更低門檻、更可控過程和更低成本為使用者交付可用成果。Sora 2與商湯Seko共同指向的“成片智能體”,正是破解視頻生成普及難題的關鍵。商湯Seko透過創作可控性和商業普惠性,正在將這一藍圖變為觸手可及的商業現實。這條本土超越之路,或許正是AI影片普及的關鍵路徑。此外,Seko還有一大獨特優勢是集合多種大模型,未來或許也會接入Sora 2模型的能力,為使用者提供1+1>2的更優成片效果。 (智東西)
Sora首周下載量超越ChatGPT!
OpenAI的視訊生成應用程式Sora首周iOS下載量達62.7萬次,超越ChatGPT首周表現。上周,OpenAI的視訊生成應用程式Sora正式推出後,迅速登頂蘋果美國“熱門免費應用”(Top Free Apps)榜單。而本周,根據應用情報提供商Appfigures提供的新資料,它在蘋果iOS系統上的首周表現比ChatGPT當初的首周表現更為出色。Appfigures估算的資料顯示,Sora應用程式在首次發佈後的七天內獲得了627,000次iOS下載量,而ChatGPT應用程式在其發佈首周的iOS下載量為606,000次。只不過,由於ChatGPT在其推出的首周僅在美國可下載,而Sora則在美國和加拿大同時推出。若是除去加拿大市場貢獻的約45,000次安裝量,僅以美國的資料為準的話,Sora的首周下載量也佔了ChatGPT當初的約96%。這種程度的使用者接受度仍是非常值得關注的,因為Sora目前尚是作為一款邀請制應用,而ChatGPT在推出時則面向更廣泛的公眾開放,這一對比也意味著Sora的表現更加出色。穩定使用率在9月30日Sora應用程式發佈首日,Sora迅速獲得了56,000次應用下載,使其一舉躍升成為美國應用程式商店中下載量排名第三的綜合類應用。到了10月3日(上周五),其排名已升至榜首。這一迅猛增長已經使Sora的首次亮相領先於其他主要的人工智慧應用的發佈,包括初創公司Anthropic的Claude和微軟的Copilot,並使其與xAI的Grok發佈處於同一水平。此外,據Appfigures資料顯示,該應用程式自9月30日上市以來,一直保持著穩定的使用率。資料表明,10月1日的iOS日下載量達到了107,800次的峰值,此後其日下載量呈現出波動狀態。雖然這些數字不如本周早些時候那麼高,但對於一款並非所有人都能使用的應用程式來說,這仍然是相當不錯的成績。如果你日常瀏覽社交媒體就能發現,使用最新Sora 2生成的視訊近乎可以以假亂真。根據一些使用者在社媒上分享的視訊,用Sora 2新生成的視訊告別了早期人工智慧視訊的“跳戲感”, 不再侷限於畫面拼接,而是真正學會了模擬現實世界的運轉邏輯;甚至,一些使用者還通過該模型“復活”了已故的籃球巨星科比·布萊恩特等名人。 (財聯社AI daily)
OpenAI Sora 2剛發佈沒多久,已經被網友們“玩壞了”
9月30日,OpenAI推出新一代視訊生成模型Sora 2,該模型首次支援與畫面匹配的AI音訊生成。Sora 2的發佈標誌著視訊生成技術在物理模擬、真實感和可控性方面的顯著提升,能夠處理複雜的動作場景並遵循物理規則。Sora 2發佈後,這幾天網上掀起了“AI生成視訊”風,很多網友在社交平台上發佈了各種各樣用Sora生成的趣味甚至惡搞視訊,令人忍俊不禁。有網友用Sora生成一架粉紅色的“豬臉客機”,視訊中“遊客”們紛紛和這架飛機自拍;還有網友利用Sora 2生成一段“古裝修仙”劇情;能“拍”古裝劇,戀愛劇也不在話下,只是這劇情:女:渣男,你為什麼和我分手?男:我怕。。。我媽知道。。女:我都不怕我老公知道啊!還有網友直接搞了一個“集合”,有“古裝戀愛劇”、“韓劇”還有“警匪動作劇”;還可以拍一段“民國風的諜戰劇”;想不到還有更離譜的“霸道總裁愛上絕經的我”……除了用Sora 2生成各種類型劇集,也有網友做了個“村口大爺大媽閒話”記錄;當然,更可以用Sora 2“實現”一些可能永遠無法在現實中見到的場面:國足2:1贏得世界盃冠軍,捧起大力神獎盃;或者在一場足球比賽中男足輕易踢贏日本隊。不過,這幾天網友利用Sora 2惡搞最多的對像是OpenAI CEO 山姆·奧特曼。這些惡搞視訊同樣非常有趣,三言簡單選了一些彙總如下:先來一個“緊跟時事”的,有網友用Sora 2生成了一段“奧特曼給大家講解如何將凍起來的饅頭加熱幾分鐘後端給消費者”的視訊。正值國慶期間,很多網友用Sora 2生成了“奧特曼手持國旗在天安門廣場”、甚至“身穿軍裝在國旗下”為祖國慶祝生日的視訊;還有很多網友製作了“奧特曼在深圳、空降上海、遊覽西湖”等地點的視訊,幾條視訊中,有奧特曼為某個博主“打call”;有奧特曼“真從高樓傘降”到外灘或者直接在上海外灘與遊客握手合影的;還有奧特曼在西湖邊欣賞美景、開演唱會的視訊;網友還製作了奧特曼在全國各地遊覽、品嚐奶茶、火鍋等各種美食的視訊;當然,還少不了“奧特曼站在堵車的高速路上吐槽擁堵”的視訊;有“奧特曼擺攤賣雞排”視訊;有“奧特曼表演川劇變臉”視訊;有“奧特曼與小白鼠一同用餐、喝啤酒”視訊;有“奧特曼與友人以及大貓熊、皮卡丘歡聚、唱歌”的視訊;還有“奧特曼穿著東北大棉襖講話”的視訊;“奧特曼能打拳擊”……能化身“武俠”……甚至能夠“剃度出家成為武僧”;能“說相聲,主題是購買顯示卡”;能化身“某大廠高管,訓斥員工”……能變成數位博主,“介紹一款‘逆光之王’手機”;更能化身車評人,“介紹一輛‘SU7’”;奧特曼還“因算力不夠,去超市偷顯示卡被抓”……不得不說,網友的想像力真的豐富多彩。這些視訊大多數都是惡搞性質,並且仔細觀察能發現Sora 2生成的視訊雖然非常逼真,但也在一些細節上存在錯誤。例如網友製作的“諜戰劇”中,主角竟然可以像蜘蛛俠一樣爬上牆;奧特曼在上海外灘與遊客合影的視訊中,背景出現奇怪的建築等。但這些問題屬於瑕不掩瑜,可以看到Sora 2生成的視訊整體質量非常高,尤其是對知名公眾人物還原度很高。隨著技術不斷進步,AI生成完全可以以假亂真的視訊幾乎是指日可待。也許到了那一天,真的會“眼見不一定為實”。對此,你怎麼看? (三言Pro)
Sora 2 震撼發佈!獨立 App 上線,顛覆性「客串」功能打造首個 AI 社交宇宙,要革抖音的命?
國慶節不過了,連夜幹!!!剛剛,就像爆料的一樣OpenAI正式發佈Sora 2相比初代Sora模型,Sora 2在物理世界的精準性、真實感和可控性方面都實現了巨大飛躍,並首次加入了同步對話和音效生成功能OpenAI表示,初代Sora是視訊生成的“GPT-1時刻”,而Sora 2則直接躍升至視訊領域的“GPT-3.5時刻”最重磅的是Sora獨立為APP,介面非常像抖音,主打創作、分享,以及一項顛覆性的社交玩法-“Cameo(客串)”的真人穿越功能,使用者可以將自己一鍵置入AI生成的視訊場景中關於 Sora App 的推廣計畫,OpenAI 採取了分階段的策略:邀請制推出:為了營造一個以熟人社交為基礎的社區氛圍,應用將採用邀請制進行推廣。成功註冊的使用者將獲得四個邀請碼,可以分享給自己的朋友目前sora app,只在IOS系統提供,現在就可以下載(首批上線地區為美國和加拿大,計畫將迅速擴展到更多國家),收到邀請後,使用者也可通過 sora.com 訪問Sora 2,Sora 2初期將免費提供,並設有慷慨的使用限制,Sora 2未來也計畫發佈API,Android版本還在開發當中Sam Altman把 sora 2稱作創造力的ChatGPT時刻以下是sora 2 發佈會現場詳細資訊:Sora 2 本體表現Sora 2 在物理世界的模擬上達到了前所未有的高度。團隊在發佈中強調,新模型在運動(motion)、物理(physics)、智商(IQ)和對真實身體運動規律的精準模擬(body mechanics)方面都達到了業界頂尖水平。這意味著 Sora 2 能夠更準確地理解和模擬複雜的物理互動。過去,像奧運會體操運動員的整套動作,或是在尾波滑水板上完成後空翻這類包含複雜動態和碰撞的場景,對於視訊生成模型來說是極大的挑戰。Sora 2 在處理這類複雜碰撞和動態建模方面表現得更為穩健,生成的畫面感覺極其自然。例如,視訊中展示的滑板愛好者完成踢翻的動作,其物理表現的精準度是以往模型難以企及的。這種對物理世界的深刻理解,是實現更高層次真實感的關鍵其次,Sora 2 顯著增強了模型的可控性。以往的視訊生成系統通常需要使用者以“逐個鏡頭”(shot-by-shot)的方式進行創作,很難在一次生成中建構一個包含多個鏡頭、敘事連貫的長故事。Sora 2 在這方面取得了突破,它能更好地理解和執行複雜的指令,在一次生成任務中講述更長、更連貫的故事。這使得創作者能夠擺脫碎片化鏡頭的束縛,更自由地建構完整的敘事,為短片、故事創作等應用場景提供了極大的便利最後Sora 2 首次實現了視訊與音訊的同步生成。這是第一個能夠同時生成視訊和配套音訊的 Sora 模型,並且它是一個非常通用的系統。這意味著使用者生成的每一段視訊都將自帶聲音,不再是無聲的畫面。這個音訊生成系統能力非常全面,具體體現在:多語言對話:能夠生成涵蓋多位說話者的多種語言的對話,並且口型同步非常自然,能夠準確捕捉對話內容環境音效:可以生成各種逼真的音效,例如環境中的風聲、水聲等完整音景:能夠創造出完整的音景(soundscapes),為視訊增添沉浸感此外,Sora 2 在風格多樣性上也表現出色。許多早期的生成模型往往會陷入一種單一的美學風格,而 Sora 2 擁有極其廣泛和多樣的動態範圍。無論是追求極致的現實主義風格,還是充滿想像力的動漫風格,Sora 2 都能駕馭自如,並能覆蓋兩者之間的所有風格。這為全球創作者提供了無盡的創意空間,讓人們能夠以前所未有的方式將想像力變為現實客串(Cameo)功能:化身萬千,步入想像中的任何世界在 Sora 2 帶來的眾多新功能中,最具顛覆性的無疑是客串玩法。這項功能是 Sora 2 獨有的,它賦予了使用者一種前所未有的能力:將真實世界的人物、寵物甚至物體,無縫地植入到任何由 AI 生成的虛擬世界或場景中。這不僅僅是簡單的“換臉”,而是一種深度的人物和場景融合,讓使用者能夠真正步入”自己的想像Cameo 的核心工作原理源於 OpenAI 正在建構的世界模擬模型(world simulation models)。該功能通過觀察一段關於某個主體(例如一個人、一隻寵物)的簡短影片片段,模型就能深度理解這個主體的外觀、動態和特徵。一旦理解完成,這個主體就可以像一個文字token一樣,被注入到任何提示詞中。這意味著,使用者只需提供一個簡單的視訊素材,就能將自己或朋友“傳送”到古羅馬鬥獸場、未來賽博朋克都市,或是任何能夠想像到的場景中,並讓他們在其中自然地活動和互動為了確保這項強大功能的安全和使用者自主性,OpenAI 設計了一套嚴謹的設定和權限流程:建立與驗證流程:使用者若想建立自己的 Cameo,必須經過一個專門的流程。系統會要求使用者錄製一個動態的音訊提示,並進行一次“活性檢查”,例如根據指示移動頭部。這個過程旨在通過多重驗證,確保建立 Cameo 的是使用者本人,從而有效防止身份冒用精細化的權限控制:使用者對自己 Cameos 的使用權擁有完全的控制。在設定中,使用者可以決定誰有權使用自己的形象進行創作,選項包括“僅限我本人”(Only I)、“我批准的人”(People I approve)、“互相關注的好友”(Mutuals)或“所有人”(Everyone)。這一原則確保了任何人都無法在未經使用者明確授權的情況下,使用其形象生成內容。使用者的數字肖像權得到了充分的尊重和保護個性化偏好設定:模型雖然強大,但並非完美,有時可能會“幻覺出”一些不符合使用者特徵的細節,比如給使用者穿上緊身牛仔褲或賦予奇怪的口音。為瞭解決這個問題,使用者可以在 Cameo 偏好設定(Cameo preferences)中進行調整,引導模型更準確地描繪自己。這種設定也可以用於娛樂目的,比如使用者可以主動為自己的 Cameo 形象加入一個標誌性的金項鏈或一頂有趣的帽子,為創作增添趣味內容所有權與刪除權:使用者對自己授權建立的所有 Cameo 內容擁有完全的權利。這意味著,即使使用者的朋友使用了其 Cameo 創作了一段視訊,該使用者也被視為該視訊的所有者之一,並擁有隨時將其刪除的權力。這進一步強化了使用者對自己數字身份的掌控Cameo 功能的推出,被 OpenAI 團隊視為一種全新的溝通方式。它超越了傳統的文字、表情符號(emojis)或語音筆記,演變成一種基於視訊的全新媒介。朋友之間可以通過 Cameo 共同出演一部微型電影,或是在一個奇幻世界裡互動,這種充滿樂趣和創意的交流方式,為社交帶來了前所未有的可能性Sora App:一個專為 AI 創意而生的社交新大陸為了將 Sora 2 模型的魔力傳遞給最廣泛的使用者,並充分發揮 Cameo 功能的社交潛力,OpenAI 專門開發了一款全新的移動應用——Sora App。團隊認為,Sora 2 所帶來的體驗已經超越了傳統工具的範疇,它更像是一種全新的溝通媒介,因此需要一個全新的產品形態來承載。Sora App 的定位是一個以 AI 生成內容為核心的社交平台,旨在激發使用者的創造力,並加深人與人之間的連接Sora App 的介面設計看起來非常像抖音。有一個內容流、個人首頁(p以及關注系統。但其核心區別在於,這個平台上的所有內容都是由人類使用者通過 AI 生成的,而非機器人發佈的垃圾資訊。這創造了一種非常獨特且新奇的體驗,使用者看到的不再是現實世界的快照,而是朋友們想像力應用內的核心體驗圍繞著創造與互動展開:動態流:使用者打開應用後,會看到一個由其關注的人所創作的 AI 視訊流Remix 功能:這是 Sora App 的一個核心互動機制。當使用者看到一個喜歡的視訊時,可以點選 Remix 按鈕,在其基礎上進行二次創作。例如,看到一個香水廣告,使用者可以輸入新的提示詞,如“把它變成一個帶有巨大羽毛的禮帽廣告”,Sora 就會生成一個全新的、與原作相關聯的視訊。這個功能極大地降低了參與熱門趨勢和故事線的門檻,讓每個人都能輕鬆地為社區的集體創作貢獻一份力量社交哲學:OpenAI 團隊坦言,他們最初對一個完全由 AI 生成內容的平台持懷疑態度,擔心它會削弱真實的人際關係。然而,內部測試表明,Cameo 功能反而以一種意想不到的方式拉近了人們的距離。因此,Sora App 的設計理念將重點放在加強朋友和家人之間的聯絡上。平台會優先推薦來自使用者社交圈的內容,並提供一個專門的“關注”流,只顯示使用者已關注的人發佈的內容推薦:為了提升使用者體驗並給予使用者更多主導權,Sora App 正在測試一項新功能,允許使用者根據自己的心情來引導內容推薦。例如,使用者可以選擇“放鬆”或“動物”等模式,應用就會相應地展示更符合其當下心境的內容。OpenAI的說法是Sora App 的目標不僅僅是成為一個內容消費平台,更是要成為一個激發每個人創造潛能的社區。它鼓勵使用者從被動的刷視訊轉變為主動的創造者,通過簡單有趣的工具,將腦海中的奇思妙想變為現實,並與朋友們分享這份快樂當然你可以完全把以上內容看做是OpenAI的宣傳,說的很好聽,到時候只怕玩的停不下來防沉迷針對社交媒體普遍存在的沉迷、孤立和演算法投喂等問題,OpenAI提出了一系列應對措施:使用者控制資訊流: 使用者可通過自然語言指示推薦演算法,調整資訊流內容。App會定期詢問使用者的使用感受,並主動提供調整選項優先創作而非消費: App默認優先展示使用者關注的人或能激發創作靈感的內容,不以“使用時長”為最佳化目標強化社區聯絡: App採用邀請制,旨在鼓勵朋友間共同使用,通過Cameos功能加強社區聯絡青少年保護: 為青少年設定了每日觀看視訊數量的默認限制,並對Cameos功能採用更嚴格的權限設定。家長可通過ChatGPT使用家長控制工具,管理滾動限制、演算法個性化和私信設定肖像權控制: 使用者對自己的Cameo擁有端到端的控制權,可以決定誰能使用,並隨時撤銷存取權或刪除包含其Cameo的任何視訊商業模式: 目前唯一的商業化計畫是,當計算資源緊張時,可能允許使用者付費生成額外視訊Sam Altman的思考:創造力的“寒武紀大爆發”**Sam Altman也發文表示,這感覺像是“創造力的ChatGPT時刻”,從想法到結果變得簡單快速,帶來了新的社交動態他認為,創造力可能即將經歷一場“寒武紀大爆發”,藝術和娛樂的質量將大幅提升。同時,他也表達了憂慮,承認社交媒體的負面影響,如成癮和霸凌。他強調,團隊已深入思考如何避免Sora App落入由強化學習(RL)最佳化的垃圾資訊流的陷阱。為此,Sam Altman提出了產品的幾項原則:最佳化長期使用者滿意度。 大多數使用者在回顧過去6個月時,應該覺得使用Sora讓他們的生活變得更好鼓勵使用者控制自己的資訊流。 使用者應該能通過自然語言詳細告訴Sora他們想看什麼優先考慮創作。 讓每個人都能輕鬆參與創作過程。幫助使用者實現長期目標。 無論是想與朋友更多聯絡,還是想健身、創業,Sora都將努力提供幫助寫在最後OpenAI認為通用世界模擬器和機器人智能體將從根本上重塑社會。Sora 2代表了朝此目標邁出的重要一步sora 2會成為抖音一樣的超級APP嗎?會成為一款顛覆性的社交應用嗎? (AI寒武紀)
剛剛,Sora 2來了!OpenAI還發了“AI抖音”,阿爾特曼被“玩壞”
視訊生成迎來“GPT-3.5時刻”。智東西10月1日報導,今日凌晨,OpenAI發佈了旗艦視訊和音訊生成模型Sora 2,並推出“AI版抖音”——Sora應用程式。OpenAI將Sora 2稱作“正直奔視訊領域的GPT-3.5時刻”。相比之前的Sora,Sora 2能更加精準逼真地模擬物理世界,並且更易於控制,還支援同步對話和音效。從官方公佈的視訊Demo來看,它可以完成一些對於之前的視訊生成模型難以完成的事情:奧運會體操動作、精準模擬浮力和槳板上後空翻,以及花滑運動員頭頂貓咪的三周半跳。Sora應用程式定位一款社交App,支援使用者將自己生成的視訊上傳,並通過“客串(Cameos)”功能讓使用者參與到好友視訊創作中。OpenAI的目標是試圖打造一種全新獨特的人際溝通方式。▲OpenAI推出社交App Sora目前,Sora iOS應用程式現已開放下載,以邀請制的形式在美國和加拿大推出。獲得邀請碼的使用者也可在Sora官網免費體驗Sora 2,ChatGPT Pro使用者可以體驗更高品質的Sora 2 Pro模型。Sora 2一經發佈就在外網炸開了鍋,有大部分人是求邀請碼的,有小部分人已拿到邀請碼。社交平台X上立馬出現了不少Sora 2生成視訊,甚至連OpenAI CEO薩姆·阿爾特曼都被“玩壞了”。▲OpenAI研究員Gabriel生成的阿爾特曼“客串”視訊引圍觀同時也有不少人感到擔憂,X上的一位使用者稱:“幾個月後,我們將無法區分什麼是真實的,什麼不是真實的,那將是一個可怕的時代。”▲社交平台X的網友評論01. Sora 2來了:“視訊領域的GPT-3.5時刻”OpenAI稱,2024年2月發佈的Sora在很多方面都堪稱視訊領域的“GPT-1時刻”——視訊生成首次開始顯現成效,通過擴展預訓練計算能力,物體持久性等需求得以實現。OpenAI將Sora 2稱作“正直奔視訊領域的GPT-3.5時刻”。先前的視訊模常常使得物體變形並扭曲現實,以便成功執行文字提示。例如,如果籃球運動員投籃不中,球可能會自動傳送到籃筐。但在Sora 2中,如果籃球運動員投籃不中,球會從籃板上反彈。還比如,下面這個Sora 2生成的後空翻視訊,表演者甚至在落地後有一些踉蹌,且臉上出現了因小失誤有些尷尬的表情,很像真實生活中的場景。有趣的是,該模型犯下的“錯誤”往往看起來像是Sora 2 隱式建模的內部智能體所犯的錯誤;儘管它仍然不完美,但與先前的系統相比,它在遵循物理定律方面做得更好。OpenAI認為,對於任何有用的世界模擬器來說,這都是一項極其重要的能力——你必須能夠模擬失敗,而不僅僅是成功。該模型在可控性方面也實現了巨大的飛躍,能夠執行跨越多個鏡頭的複雜指令,同時精準地保留世界狀態。它擅長處理寫實、電影和動漫風格。作為通用的視訊音訊生成系統,它能夠建立具有高度真實感的複雜背景音景、語音和音效。使用者還可以將現實世界的元素直接注入Sora 2。例如,通過觀察我們一位隊友的視訊,該模型可以將其插入到任何由Sora生成的環境中,並精準刻畫其外貌和聲音。這項功能非常通用,適用於任何人類、動物或物體。OpenAI稱,該模型遠非完美,並且存在很多錯誤,但它證實了進一步擴大視訊資料上的神經網路將使我們更接近模擬現實。02. AI版抖音推出,真人“客串”視訊 新社交神器?今天,OpenAI還推出了一款名為“Sora”的全新iOS社交應用,該應用由Sora 2提供支援。在應用中,使用者可以創作、混錄彼此的創作風格,在可自訂的Sora動態中發現新視訊,並通過“客串(Cameos)”功能將自己或好友引入到視訊中。使用客串功能,使用者只需在應用中進行一次簡短的音視訊錄製,即可以驚人的保真度將自己直接帶入任何Sora場景。這看起來像一款AI版的抖音或TikTok,而OpenAI認為,圍繞這項“客串”功能建構的社交應用是Sora 2體驗的魅力所在。幾個月前,OpenAI在Sora團隊開始嘗試“上傳自己生成的視訊”的功能,他們都玩得很開心。OpenAI稱,這感覺就像是溝通方式的自然演變——從簡訊到表情符號,再到語音備忘錄,再到現在的視訊。上周,OpenAI向全體員工內部發佈了這款應用。已經有同事反饋,他們通過這項功能在公司結識了新朋友。03. 邀請制推出,Sora 2免費可用 Pro使用者體驗更高級OpenAI將Sora應用以邀請制的形式推出,確保使用者能與好友一同使用。收到邀請後,使用者還可以通過sora.com訪問Sora 2 。Sora 2最初將免費提供,但這些功能仍受計算能力限制。ChatGPT Pro使用者還可以在sora.com上使用實驗性的、更高品質的Sora 2 Pro模型。OpenAI還計畫在API中發佈Sora 2。Sora 1 Turbo將繼續可用,使用者建立的所有內容也將繼續存在於sora.com中。為了防止上癮等問題,OpenAI將採取一系列措施。一是其將為使用者提供工具和自主選擇權,讓他們能夠掌控資訊流中的內容。利用OpenAI現有的大型語言模型,其開發了一類新的推薦演算法,可以通過自然語言進行指導;還內建了定期調查使用者健康狀況的機制,並主動為他們提供調整資訊流的選項。默認情況下,OpenAI會向使用者顯示主要針對關注或互動的人的內容,並優先顯示模型認為使用者最有可能用作創作靈感的視訊;不會針對使用者在動態資訊流中花費的時間進行最佳化,明確設計這款應用的初衷是最大限度地提升創作量,而非消費量。在青少年保護方面,OpenAI將通過ChatGPT推出Sora家長控制功能,以便家長可以覆蓋無限滾動限制、關閉演算法個性化以及管理私信設定。在客串功能方面,使用者可以與Sora端到端地掌控肖像。只有使用者本人才能決定誰可以使用自己的客串,並且可以隨時撤銷存取權或移除包含該客串的任何視訊。使用者可以隨時查看包含您客串的視訊,包括其他人建立的草稿。OpenAI在這款應用中處理了許多安全問題,例如肖像使用方面的知情同意、出處確認、防止有害內容的生成等等。其他應用的很多問題都源於其盈利模式。OpenAI目前唯一的計畫是,如果需求量相對於可用計算能力過大,最終允許使用者選擇支付一定金額來生成額外的視訊。04. 結語:Sora 2憋大招或帶來視訊生成產業洗牌自OpenAI在2024年2月發佈Sora已經過去超一年半時間,Sora 2終於到來。從效果來看,這款模型在模擬真實性、可控性及音效方面都有比較大的進展,有望推動視訊生成產業格局加速洗牌。視訊模型正在飛速發展,通用世界模擬器不僅提供了新的內容生成方式,還有望重塑人際溝通方式。OpenAI正通過全新的Sora社交App靠近這一目標,也標誌視訊生成模型在落地應用上更加成熟。 (智東西)
曝 OpenAI 將推出「AI 抖音」:禁止上傳實拍內容,Sora 2 加持
這兩天的 AI 圈,更新速度快得讓人喘不過氣,那是要讓人放假的樣子。昨天 DeepSeek 更新了 V3.2-Exp 模型,Anthropic 凌晨就緊跟著發佈了性能更強的 Claude 4.5。正當大家都在預測牌桌上的其他巨頭何時出手時,行業領頭羊 OpenAI 的「王炸」似乎已經提前被劇透了,那就是 Sora 2。最近,OpenAI 不僅在 X 平台連發多條神秘視訊,引爆社區對 Sora 2 的猜想。來自《連線》雜誌的重磅爆料更是指出,OpenAI 的下一步棋,並非簡單升級一個模型,而是要親自下場,推出一個獨立的 AI 視訊社交 App。一個酷似抖音,但內容 100% 由 AI 生成的全新平台。奧特曼曾經發 X 說,未來幾周,OpenAI 將推出一些新的計算密集型產品,且最初只會向 Pro 使用者開放。而需要大量算力的,不正是視訊生成嗎?剛好 Sora 目前也僅面向 Plus 和 Pro 使用者,傳聞已久的 Sora 2 真的要發佈了。https://x.com/sama/status/1969835407421374910AI 視訊也要迎來它的「吉卜力」時刻了。揭秘「Sora 2 App」:一個怎樣的 AI 抖音?從目前曝光的資訊來看,OpenAI 正在測試這款名為 Sora 2 的短影片應用,乍看之下,它就是一個 AI 版抖音。但最顛覆的一點是,在這個平台上,我們看不到任何真實拍攝的內容。TikTok 應用截圖,主要特點是豎屏滑動、演算法推薦、點贊評論它的介面和互動,與我們熟悉的短影片 App 幾乎一模一樣。採用豎屏資訊流,和滑動切換的導航方式的視訊源,並由推薦演算法為我們提供「為你推薦」的內容。在視訊的右側下方,同樣提供了點贊、評論等互動選項,甚至還有一個獨特的「Remix」(再創作)功能。OpenAI 去年 12 月正式推出了 Sora,很快被整合到 ChatGPT 應用中,圖為 Sora 網頁版截圖。OpenAI 指出它存在一些侷限性,例如似乎並不完全理解物理學,在製作逼真的動作場景時尤其困難,尤其是在較長的片段中。目前,1080p 超高畫質解析度僅支援生成 10s。 Sora 體驗地址:sora.chatgpt.com根據檔案顯示,使用者只能使用 OpenAI 的下一代視訊模型 Sora 2,生成最長 10 秒的視訊片段。並且,App 不提供任何從手機相簿,或其他應用上傳照片或視訊的選項。這意味著,這個平台將成為全球首個內容 100% 由 AI 生成的短影片社區。用數字分身來做社交如果說純 AI 生成內容還只是概念上的不同,OpenAI 還要為這個短影片 APP 引入社交的功能。Sora 2 應用具有身份驗證的功能,即允許使用者確認自己的「肖像」(likeness)。一旦驗證通過,就可以在生成的視訊中,使用自己的形象。更有趣的是,社交的邊界被進一步打破。你的朋友也可以在他們的視訊裡標記你,使用你的「數字分身」。AI 圖片視訊生成平台即夢,也提供了數字人生成。舉個例子,我們可以直接使用別人的數字分身,生成一個視訊,內容是「你和朋友在從沒去過的主題公園,一起坐過山車」。為了保護使用者隱私,數字分生這項功能,也設定了提醒機制。每當你的形象被他人使用時,無論對方是公開發佈,還是僅僅保存在草稿中且從未發佈,你都會收到通知。這款應用上周已經在 OpenAI 內部發佈,並收到了員工壓倒性的積極反饋。據連線雜誌的消息,員工們使用得非常頻繁,以至於一些管理層開玩笑說,這可能會影響生產力。真的跟刷抖音一樣會上癮?為什麼 OpenAI 要親自下場做社交?答案或許和 ChatGPT 的成功路徑如出一轍。OpenAI 似乎在押注,Sora 2 這個 AI 版抖音,能讓我們與 AI 視訊的互動方式發生根本性改變,就像 ChatGPT 讓大眾第一次真正體驗到 AI 文字的潛力一樣。社交榜和娛樂榜第一名分別是 Meta 的 Thread 和 TikTok當然,也不是只有 OpenAI 想到了 AI 視訊社交這條路,就在上周,Meta 在它們的 AI 應用中,推出了名為「Vibes」的新功能。這是一個 AI 生成短影片的新平台,集創作、分享與社交功能於一體。使用者可通過瀏覽、創作、或二次創作(Remix)來生成自己的 AI 視訊,並將視訊快速分享到 Vibes、Instagram、Facebook 等 Meta 社交平台。Vibes 視訊生成介面截圖Google 也早已宣佈,計畫將自己最新的視訊生成模型 Veo 3 整合到 YouTube 中。一個是坐擁最大的社交網路平台,一個是最大的視訊分享平台,OpenAI 的 AI 視訊社交之路看起來,也並非一片坦途。從一個聊天機器人,到一個可能的內容社交平台,OpenAI 的野心,在於建造下一代的網際網路入口,而這個入口,完全由 AI 驅動。這種野心並非空談,就在今天,OpenAI 推出了其商業化佈局中最重要的一步棋,在 ChatGPT 內直接購物。使用者現在可以在與 ChatGPT 的對話中,直接購買來自 Etsy 甚至 Shopify 商家的商品。當我們跟 ChatGPT 聊天,問到「適合送給陶瓷愛好者的禮物」時,ChatGPT 不再只是給一個連結,而是直接展示商品並提供一個「購買」按鈕,不需要離開聊天窗口,幾下點選就能完成支付。OpenAI 的「即時結帳」(Instant Checkout)功能,背後是 OpenAI 與 Stripe(知名支付工具) 聯合開發並開放原始碼的「代理商業協議」(Agentic Commerce Protocol)。通過這個協議,OpenAI 正在為 AI 時代的電商制定新的規則。電商、視訊、社交、生產力,當這些過去分散在不同 App 中的功能,且都是最賺錢的生意,開始被一個統一的 AI 入口所整合時,OpenAI 的 Open 原來是「我全都要」。 (APPSO)