中國國產視訊大模型,那家強?

當前,DeepSeek等大模型引發的人工智慧浪潮日漸升溫,大模型落地應用的門檻和成本持續降低。視訊大模型作為一種能夠處理和生成視訊內容的大規模深度學習模型,具有在處理複雜視覺資訊方面的獨特優勢,展現出巨大的發展潛力,逐漸在影視製作、線上教育、智能客服等領域得到應用。

《政府工作報告》首次提出支援大模型廣泛應用,《政府工作報告》起草組成員、國務院研究室副主任陳昌盛在國務院新聞辦公室舉行吹風會答記者問時也提到,可靈AI從某種程度上在國際上的評價已經超過了Sora,更是為國產視訊大模型行業加速發展釋放積極訊號,中國國產視訊大模型發展前景廣闊、未來可期。


AI大模型製作的圖像


一、全球視訊大模型進入發展快車道

視訊大模型可以接受多種模態的資訊作為輸入,例如文字、語音、圖像和視訊等,並執行包括視訊生成、編輯、理解和分析等多種任務,被認為是大模型領域極具挑戰性的前沿方向。

與語言大模型相比,視訊大模型所需要的技術更加複雜,例如:需要更強大的計算能力和更複雜的模型架構,能夠處理海量且高維度的視訊資料,解決資料的時序一致性、空間理解、運動物理規律模擬、真實世界因果關係等問題;需要突破跨模態理解和生成等關鍵技術難點,有效融合不同模態的資訊,確保生成高品質、連貫的視訊內容。

當前,全球科技巨頭憑藉強大的技術實力和豐富的資源儲備,在視訊大模型領域展開了激烈角逐。

國外方面,OpenAI率先發佈文生視訊模型Sora,開啟了AI視訊生成的“ChatGPT時刻”;Google發佈Veo2,在理解電影攝影語言和解析度等方面表現突出。其他公司如Stability AI、Luma、Runway、Haiper等也相繼發佈了各自的視訊大模型產品。

國內方面,視訊領域佼佼者以及人工智慧企業紛紛立足自身優勢推出系列產品,如快手率先上線可公開體驗的視訊大模型可靈AI,開啟視訊大模型的視訊產業化探索,隨後生數科技的Vidu、字節跳動的即夢AI、MiniMax的海螺AI、智譜的清影、通義的萬相等紛紛上線。


二、國產視訊大模型價值逐步釋放、潛力巨大

近一年來,國產視訊大模型在技術突破和商業拓展方面取得了顯著進展。

從技術能力看,視訊大模型在生成視訊時長、解析度、畫面比例以及鏡頭運動方面性能不斷提升。

視訊時長方面,單次生成已經從最初的2-4秒,普遍延長至6-10秒,甚至數十秒,另有產品支援視訊續寫功能,如可靈AI支援最長3分鐘的視訊續寫。

解析度方面,生成視訊已達到1080P甚至4K水平。此外,鏡頭控制、比例切換等技術能力也不斷提升。如可靈AI在時間維度的一致性上表現優秀,且視訊中生成的運動平滑度高、對物理定律的遵循較好。

資料顯示,截至2024年12月,可靈AI已有超600萬使用者,累計生成超6500萬個視訊。

從價值變現看,會員制等商業化模式探索不斷加快。當前視訊大模型的收費模式包括會員制、按需收費、定製收費、API呼叫次數收費等多種收費模式,其中會員制模式較為普遍,即將視訊大模型按照性能不同分為不同等級,提供單月、年度會員等多種收費模式,如Vidu、可靈AI、PixVerse等均採用這種模式,1秒收費在0.05-0.9元之間。

目前,可靈AI商業化探索較為成功,資料顯示,可靈AI單月流水超千萬,已與伊利、vivo、聯想、周大福、瑪氏箭牌、青島啤酒等多個企業進行多樣化商業探索。

未來,隨著技術加速迭代以及算力成本不斷下降,視訊大模型技術應用的門檻和成本將實現“雙降”,進而催化國產視訊大模型加快規模化使用。

據東方證券報告指出,未來內容生態將在現有量級基礎上進一步實現指數級提升,形成下一代內容生態,國產視訊大模型的價值有望進一步釋放。


三、視訊大模型應用正引發一場視覺革命

推動視訊領域生產方式智能化,大幅提升內容生產效率和質量。通過應用大模型技術深入挖掘視聽領域豐富資料,打造的視訊大模型將化身有著豐富知識和資深經驗的“行家裡手”,推動從劇本創作到特效製作等工作由高度依賴從業人員經驗轉向由AI承擔,大幅縮短了內容生產時間,提高了內容質量。

如多家電視台推出AI生成短片和短劇,通過分析觀眾偏好,實現了較高的觀眾粘性和滿意度。資料顯示,河南大象融媒通過應用AIGC技術,推動短影片製作周期由一天縮短至數小時。

據東吳證券資料顯示,在人機協作模式下,AI可以降低43%的影視製作成本,在全部應用視訊大模型等人工智慧技術情況下成本可降低95%。

培育視訊新模式新業態,大幅提升內容體驗感和競爭力。

通過應用視訊大模型,創意視訊、AI導演、虛擬主播等創新產品,並為使用者帶來新奇的觀看體驗。如湖南廣電推出AI導演愛芒,參與湖南衛視《我們仨》綜藝節目錄製,以助理導演的身份與嘉賓共同探索潮流生活新方式。

可靈AI推出國內首部AIGC短劇《山海奇鏡之劈波斬浪》;與青年導演團隊“異類Outliers”上線全球首部AI單元劇集《新世界載入中》先導片,推動AI短劇製作進入2.0時代;聯合李少紅等9位知名導演打造的9部AIGC電影短片被中國電影博物館永久收藏、放映展示,電影工業開啟人工智慧序幕。


四、視訊大模型未來的發展機遇與挑戰

未來視訊大模型跨領域應用拓展前景可期。

一是視訊大模型技術以其強大的內容生成能力開啟內容創新“萬花筒”,為視聽行業提供了全新的內容創作和呈現方式,孕育了豐富的應用場景和廣闊的創新空間。

二是實現“千人千面”的智能內容和產品推薦、製作或成為可能。通過視訊大模型技術進步以及智能體等前沿技術的應用,精準挖掘使用者對內容題材、時長等的偏好,實現內容產品的量身推薦,通過智能生成等方式為使用者定製個性化內容,提高消費者滿意度和粘性。

三是推動視聽領域與其他行業跨界融合拓展增長新空間。利用視訊大模型技術,促進視聽領域與文旅、教育、公益、健康等領域深度融合,形成跨界融合、良性互促的生態系統,激發各領域廣泛形成新商業模式、新產業形態和新增長空間。

視訊大模型發展仍面臨諸多挑戰。技術的發展是一柄雙刃劍,視訊大模型進步在帶來產業發展、經濟增長和社會進步的同時,但也會產生一些如虛假資訊傳播、深度偽造、內容侵權等潛在風險。需平衡好發展與安全的關係,既不能因技術進步伴生的潛在風險而“因噎廢食”,也不能對出現的問題置之不理,應通過技術創新、機制完善等手段讓技術更好地服務於人。 (中國經濟週刊)