這兩天我 X 的時間線基本都被 seedance 2.0 佔領了,從看官方案例到自己經過長時間的實測,我可以說這絕對是視訊領域的 Nano Banana 時刻。
或者說:是影視領域的 ChatGPT 時刻。
這篇測評其實做了很久,因為這次的更新真的太猛了,每個方面其實都可以單獨寫一篇文章。
在這麼多更新當中,最讓我印象時刻的,或者讓我覺得對這個行業影響最大的是 4 個方面。
我們一個個來聊聊。
我經常聽到一句話叫“人人都是導演”,說實話,以前我覺得這就是句忽悠人的雞湯。
但用完 seedance 2.0,我第一次覺得:這事兒可能真成了。
先看一個簡單的例子。
這個例子我沒有用什麼複雜的技巧,只用了一張參考圖,和下面的提示詞:
@圖片1 在香港街頭和多名黑衣男子激烈打鬥,最後那些黑衣男子全部倒地不起。最後@圖片1 怒吼:“還有誰?”
看出來了嗎?生成的視訊一氣呵成。
最可怕的是,它自動運用了分鏡邏輯。以前的 AI 視訊,通常只能生成一個單鏡頭。
而這裡,鏡頭運動、角度切換、音效,全是它自己“腦補”並剪輯好的。
對於動畫導演來說,特效也直接好了。
提示詞:
日式熱血動漫風格。一個渾身纏繞金色雷電的少年劍士,與一個操縱暗紅血霧的惡鬼對峙。少年拔刀瞬間化作一道金色閃電穿過血霧,畫面瞬間定格為黑白線條的衝擊幀,隨後惡鬼的身體在雷光中消散。
一個視訊裡面有多個鏡頭其實不是新鮮事,但之前的 AI 視訊裡面的多鏡頭切換是非常生硬的,而且大規模的場景調度、鏡頭切換也容易翻車,而現在可以做到非常絲滑。
以往我們做視訊,是拍攝單鏡頭 -> 剪輯師/導演組裝 -> 加特效 -> 加音效。
剪輯的功力直接決定片子的生死。
現在界限模糊了。很多人說剪輯行業要完了,我不敢說死,但seedance 2.0 確實已經不是在“生成素材”,而是在“直接出片”。
它不僅僅是個畫師,它現在是個導演。
雖然AI 視訊模型已經非常強大,寫一些簡單的提示詞就能生成不錯的片段,但之前我最苦惱的其實是這種生成太隨機了,或者說“太不可控”了。(這裡說的是內容,不是質量)。
而現在 seedance 徹底改了這一切。它可以通過多種方式,非常精準的控制視訊的生成。
比如我希望精準控制到每個鏡頭。
我寫了這麼具體的提示詞:
生成一段專業賽車電影預告。
0-3秒: 特寫鏡頭。參考 @圖片2,賽車手眼神犀利,儀表盤指針瞬間打到紅區,手部快速換擋。音效:引擎轟鳴聲。
4-8秒: 高速跟拍。參考 @圖片1,黃色跑車在賽道彎道處極速漂移,輪胎捲起大量白煙,車尾甩動。一輛黑色賽車緊貼著試圖超車。
9-13秒: 慢動作(升格)。跑車沖上坡道騰空飛起。鏡頭在空中圍繞靜止的車身旋轉 360 度,展示懸掛細節。背景是夕陽。
14-15秒: 正常速度。賽車重重落地,衝過終點線。畫面黑屏,出現片名《FAST & FURY》。
大家注意看一下提示詞,我精準控制了每個時間段的具體內容、鏡頭快慢、音效以及標題。
可以說每一個的結果都非常精準,特別是慢鏡頭以及最後黑屏後出現片名,非常有大片預告片的感覺。
另一個讓我非常驚訝的是,我們專業拍攝中用到的分鏡表或者分鏡圖,都可以直接用來生成視訊了。
比如我有這樣一張分鏡表:
現在我只要直接把這圖發給 seedance,然後在提示詞裡面說:
參考圖片1 的專題片的分鏡頭指令碼,參考圖片1 的分鏡、景別、運鏡、畫面和文案,創作一段15s的關於“節氣·流轉”的新中式國風片頭
就可以得到這樣一個專業的視訊:
至於分鏡圖,完全不在話下,甚至更高難度的,直接給它漫畫分鏡,它都能直接出片。
比如這幅漫畫:
使用簡單的提示詞:
將@圖片1 以從左到右從上到下的順序進行漫畫演繹,保持人物說的台詞與圖片上的一致,分鏡切換以及重點的情節演繹加入特殊音效,整體風格溫馨甜蜜;演繹方式參考@視訊1
這裡同時使用了圖片和視訊來做參考,圖片就是設定每個鏡頭的內容,視訊主要用來參考風格和配音。
不得不說,這非常強大。
更絕的是,它還可以直接通過音樂卡點來控制視訊節奏。
比如我想做一個模特換裝的卡點視訊,我把模特和需要換的衣服放進來,最後在放一個卡點音樂。
然後就可以得到一個非常不錯的卡點視訊。
從完全隨機生成到“精準控制”,這不僅是一個技術上的巨大飛躍,也是 AI 視訊能直接進入生成的一個標誌。
上面的能力雖然很強,但像我這樣的大部分人畢竟不是影視專業出身的,寫很豐富、專業的提示詞,這實在是困難。
玩過抖音的人應該都知道一個功能叫“做同款”,不愧是同一個爸爸(位元組)出品,這個功能也移植到了 seedance 2.0,而且變得更加強大。
不過它改了名字,叫“全能參考”。
什麼樣叫“全能參考”,我們以前都知道文生視訊、圖生視訊,而現在還可以組合參考多個視訊、音訊來生成新的視訊。
抖音上有很多酷炫的運鏡或者舞蹈,一般人想學太難了,現在“參考”就行了。
比如我有一個這樣的模特(AI 生成的):
然後想讓她模仿一個抖音博主的視訊,只要用提示詞:
@圖片1的女生作為主體,參考@視訊1 的運鏡方式進行有節奏的推拉搖移,女生的動作也參考@視訊1中女子的舞蹈動作,在舞台上活力十足地表演
可以看到這裡的輔導動作、運鏡基本都是 1:1 復刻了。
再來看看這麼🐂🍺的動作片是怎麼做出來的。
我需要寫一大堆提示詞,說明男的怎麼運動、女的怎麼打嗎?這太難了,有這能力,我都可以去當武術指導了。
在 seedance 2.0 里面操作特別簡單,一張素材圖(NBP 生成的):
一個武術指導。。哦不,一個參考動作視訊(來自即夢官方):
然後一個簡單的提示詞:
@圖片1 中的角色在激烈打頭,動作模仿@視訊1
一樣的,這種復刻幾乎是完美的。
以前我經常看到動作片(功夫片)裡面會有個武術指導,未來的武術指導看來都不需要了,一個視訊來指導就行。
這麼說,武術指導又下崗了?
這次 Seedance 2.0 還有一個重大的更新是同期聲,能同時生成貼合視訊內容的音效、對白。
同期聲的能力說實話也見怪不怪了,Veo 3.1、Sora 2 都有,但這一次 Seedance 2.0 提升了一個高度。
除了極其逼真以外,還支援多種語言(據說是 8 種),甚至還包括方言(比如四川話、粵語),更絕的是,可以做到口型同步。
受限於一篇公眾號只能放 10 個視訊的原因,這裡開始沒法舉例了,可以看前面有對白的案例。
說說價格。
實際上來說,如果你用圖生視訊,應該感覺不到價格問題。10s 的視訊也只需要 60 個積分(10 個積分相當於 1 元 RMB)。
但如果是用到了視訊參考,會發現立馬飆升到了 100 多(一個視訊參考會多 70 個積分)
我前面那個12s 的舞蹈+運鏡模仿,消耗了 156 積分,也就是 15.6 塊錢。
而且坦率的說,這篇文章寫完,我即夢剩餘的 1 年的會員積分全部消耗完了(一共 1500 多)。
這貴嗎?
直覺上好像是挺貴的,但真的想想現實當中如果要去拍一段同樣時長視訊、或者做一段類似特效,要花多少時間、多少錢,我會覺得這 AI 還是巨便宜。
以前我覺得 AI 貴,有個很大的問題是因為要抽卡,可能 70% 都是廢片,但實際測試下來,seedance 2.0 的成功率非常高,我覺得 80% 以上都是可用的(純個人測試感覺)
seedance 2.0 當然不是完美的,最明顯的是視訊當中會出現中文亂碼,不過我覺既然 seedream 中文處理那麼完美,視訊裡面解決中文的問題只是遲早的事情。
另外一點是,生成的速度真的是有點慢,這也導致一篇測評搞了很久。
最讓我心態崩了的是:稽核太變態了!
可能是因為版權問題,明星、公眾人物的圖片幾乎一律不讓用。
關鍵詞稽核更是“玄學”,我根本不知道哪個詞觸犯了天條。比如前面那個飛車視訊,我反覆改了起碼 30 次以上,全是“稽核失敗”。
(它也不告訴我具體哪個詞有問題,這樣合適嗎??
這種挫敗感真的很搞人心態。最後只能被迫放棄原來的方案,改成了大家看到的那個簡化版。
seedance 2.0 這次更新貌似非常低調,沒看到太多宣傳。目前在即夢上可以使用,但好像也是部分人可以看到。豆包裡面還沒上線,想用的的朋友再等等。其實我早就關注到了,但真的發現它的更新點太多,而不知道該從何下手。
除了前面介紹到的這些,它的視訊延長功能也非常強大,就相當於續拍鏡頭。
還有就是可以進行視訊編輯,比如修改參考視訊裡面的劇情、替換裡面人物。
雖然這次的更新很低調,但這幾天我聽到很多影視創作者群都是“炸鍋”狀態,連影視颶風的 Tim 這樣的頭部大佬,都連夜發視訊感嘆這次更新帶來的震撼。
當行業頂尖的創作者都開始感受到壓力時,你就知道,這次不是狼來了,是狼真的進屋了。
尤其是對短劇和漫劇行業來說,這無疑是一次降維打擊:
對於短劇: 那些原本需要昂貴場地、服化道才能堆出來的“豪門”、“玄幻”特效,現在可能只需要幾十塊錢的積分就能生成。成本的邏輯,徹底變了。
對於漫劇: 以前不僅要畫,還要做複雜的動態效果,現在直接把分鏡圖扔進去,靜態漫畫瞬間變成有運鏡、有演技的電影感視訊。
如果說之前的 AI 視訊還是“玩具”,那我真的覺得,現在的能力已經到了可以直接上生產的程度了。
對於個人創作者來說,這絕對是個巨大的紅利。你可能不需要太專業的背景,就能創作出廣告級的內容。
但對於傳統影視從業者來說,那把懸在頭頂的劍,可能真的掉下來一半了。 (AI范兒)