最近, 花了不少時間在視訊生成領域, 把國內外的最新頂級視訊大模型深入翻了個遍. 為的是確認一個小問題: 真人AI影視的時代是否已經到來.當然, 這話題也可以說了無新意, 因為關心視訊生成這個領域的同學都知道, 無論如何,我們都可以手工搓出每一個鏡頭圖片, 然後再手搓出各個視訊分鏡頭 - 這裡顯然還有很多的細節, 比如那個大模型更適合合成真人靜態圖片, 那個大模型更容易從參考圖得到高品質的生成視訊.但這個事情總是可以做的. 無非是說要花的時間而已.只是 這時間問題, 就是目前真人AI影視生成的核心問題了. 如果只是做一個幾十秒的廣告片, 花上幾星期去手搓打磨是完全沒問題的, 也是應該的- 每一個鏡頭都需要甲方乙方反覆的溝通確認.但動則幾十分鐘, 甚至一兩個小時的影視製作呢?手搓真人AI視訊就像是一個工坊小製作, 可以做出一個精緻的藝術品, 但這個技能無法延伸出一個影視級製作, 更無法成為一個影視生產的流水線 -- 即使這樣的手搓流水線真的存在, 其人員培訓成本和維護成本一定是相當高的.這和所謂動漫AI短劇生產還不太一樣. 目前已經有一些團隊使用ai製作一些靜態漫劇甚至更高品質的動漫AI短劇了, 但相對於真人AI視訊, 動漫AI視訊的門檻低了不止一點, 比如人物一致性和影視表現的要求(畫面光影, 人物互動,對話,等等), 不在一個等級上.前一兩周有流傳過一個帖子, 使用一張圖來生成多個分鏡圖, 這個方法用來生成病毒傳播的短影片還可以(就像使用sora生成十幾秒的視訊), 但對於動則上百上千個鏡頭的影視內容, 如何確保其連續性和表現的專業性呢?不過, 這些問題並不是無法解決的,甚至可以反過來說, 這些問題克服之後, 基於AI的長篇視訊內容的生產打造將展示出無與倫比的威力.無論如何, 城主可以斷言, 真人AI影視的時代已經悄悄來了, 不用很久, 我們可以看到基於AI視訊的完整真人短劇甚至電影. (Web3天空之城)