“除了娛樂業沒有其他行業”——《娛樂至死》尼爾波茲曼一直在想怎麼聊 Seedance 2.0。最近它實在太火,再加上春節之後,火山引擎就將開放Seedance 2.0的API了,屆時應用量會進一步上升。顯然對於這種量級的模型,評測已經意義不大了。事實上,當我和團隊第一次使用它時,只測了4-5個片段,我們就停止了。因為當一個模型能力具備某些降維能力的時候,不用測太多,幾個案例就足夠感受到,就像 MJ v7 和 Veo2 發佈時一樣。比如下面這段:所以本文不是評測,而是聊聊:在體驗幾天之後,我們覺得 Seedance2.0的上限大概在什麼位置,以及對 AIGC 行業的影響有那些。所以這篇文章沒有教學,沒有哭天喊地的炫酷案例。幾乎是我一本道的想法和絮叨。核心觀點AI視訊的工作流大機率會邁入新階段。——注意,不是一刀切說以前的沒用了,理性看待。AI內容過載到達巔峰,注意力嚴重稀缺。——是不是創作者的狂歡?是,但我們生產更多內容,不等於有更多人來看我們的內容,甚至相反。廣義內容的工業水準差異化幾乎消失,但專業內容仍存在工業水準的差異。——Seedance 2.0 目前的上限,已經可以滿足絕大部分內容場景的需要。“足夠”的Seedance2.0首先,我有必要解釋一下在開頭引用《娛樂至死》的用意。這並非帶有個人道德立場的判斷,只是想澄清一個我自己看到的事實:從2000年左右網路影片的流行開始,大眾媒體消費內容的粗顆粒化、娛樂化、碎片化趨勢開始加速,在2010年左右開啟的移動網際網路時代達到前所未有的高峰。這一路上,從Youtube的業餘攝影,到B站的二創文化,到豎屏短影片資訊流的發明,再到短劇,無一不在體現這種變化。誠然,偉大的尼爾波茲曼在幾十年前就已經預見了今天的一切,但其未必想到今天的技術會讓這種趨勢如此登峰造極。如今,對於主流的大眾注意力消費市場而言,情緒和娛樂性的重要程度是高於對工業性的要求的。之所以要提這點,是有很多朋友會好奇Seedance2.0目前的上限能否滿足商業和大眾市場消費級的需求。我個人的觀點是:大部分情況下,已經足夠用了。別再糾結什麼1080P了,大部分使用者對內容的需求,並不在工業規格上。這種情況下,Seedance2.0不僅是夠用,甚至某些時候“超出預期”。當然,話不能說絕對。工業質量並非變得沒有意義。以短劇市場為例,讓進入到過飽和的競爭之後,還是會有很多製作精良的作品出來,但已經這是另一個話題。相比Veo2、Sora之前的“還差一點”,Seedance2.0把AI原生視訊直出的標準又往前邁了一步,捅破了這層窗戶紙:在Seedance2.0之後,進入大眾媒體消費市場的門檻,幾乎歸零。下面就詳細聊聊。我自己對視訊模型的關注點,其實一直只有兩個:精確性和審美。本文也會圍繞它們展開。精確性:慢慢告別首尾幀三天前,我發了一個朋友圈:很多朋友當時不知道我說的是 Seedance 2.0。當然,幾個小時後,整個AIGC圈都炸鍋了。我不知道有多少人拿到了內測,但我知道拿到的人,那晚沒睡覺的人居多。澄清一下:說“首尾幀”的時代要結束了,並不是指首尾幀這種技術以後就沒用了(還會大量存在,但用法會完全不一樣)。而是想表達:AI視訊的工作流可能要告別上一個時代的範式了,而“首尾幀”正是其最典型的代表模式。因為它幾乎是在過去幾年解決“精確性”的唯一方法。這裡展開一下:所謂“精確性”其實包含很多我們常見的話題:一致性(人物、場景),泛化能力的補足(通過強控修正物理邏輯),影像序列的延伸(說人話就是把動畫“接”下去)等等。但其實這種方法是無奈之舉。因為圖片是一個非常不穩定,缺乏連續性的資產。一錘子買賣,復用度很低。什麼是有連續性,高復用度的資產呢?一定是基於對象的,或者時髦點叫ID化,比如角色資產,再比如場景資產。有研發經驗的朋友應該不難理解這個邏輯。這也是為什麼Lora這個技術一直有相當的使用者量。大家會發現:之前很多模型已經開始有了參考功能,這其實是角色資產的一個雛形。可這些功能在之前並沒有大量普及到工業製作中。原因我覺得挺簡單:還不夠好用。比如MJ早早就有了萬物參考功能,但效果:祝你有個好心情。而精確性,恰恰是 Seedance 2.0 這次出圈的核心。它叫做:全能參考。目前最完美的一致性Seedance 2.0 之前,一致性究竟有沒有好的解決方法?這個事看怎麼聊,如果大家就是做點小作品發發,或者簡單弄個評測視訊,乍一看之下,好像這個碗一早就解決了。但如果做商業角度的工業生產,我很負責任地說:沒有。包括Banana Pro,角色一致性都差的很遠。AI.TALK過去3年大概做了500個以上的數字人,還是有點資格聊聊這個事兒的。其實判斷模型的一致性不難:角色扔進去,反覆開,不同角度不同光線,每次的“長相”是不是一致,和原圖是不是一致。推薦一個特別簡單的360度測試方法,連續開幾次,放在一起:這是3次開卡連在一起的效果,細節一致性出奇的高,這兩天已經有無數朋友讓自己過足癮當演員了,我就不花時間證明這件事了。但“像”只是最基礎的一步,舉例來說,我用PS也可以把任何人的頭P到任何人身上,但沒法用,因為光線、色調、景深、濾鏡、白平衡這些畫質參數都有可能不對。所以 Seedance 2.0 最大亮點其實是泛化性的能力表現。泛化能力:震撼剛才我們測試的時候特意放在不同的光線下,就是要測試角色在跨環境的情況下和環境的融合程度。我們再嘗試用萬能參考讓老人“進入”各種電影裡,用最簡單的提示詞。請注意細節,尤其是人物的面部布光,邊緣光效,畫面對比度和參考對象的融合。可以看到,無論是韓國電影的灰暗壓抑,還是港片武俠偏紅的濃郁飽和,人物“進去”的時候都完美適配。這種無縫的角色資產融合能力,真的太重要了。我不知道大家有沒有用過這幾年很多AI打光的工具,從個人體感來講:之前沒有任何一個圖像或視訊模型達到如此完美的光線融合,包括Seedream之前的版本。傳統流程:首先要想辦法用圖片模型得到一張水墨風格的老人設定,這一步可能就快吐血了,然後再處理首尾幀需要的各種圖片。運氣好的話花點時間,運氣不好的話可能根本就無解。Seedance 2.0 的流程是這樣的:爽翻。更離譜的是,我們甚至不太用得到再去出關鍵幀。這裡就涉及到首尾幀這種技術的一個需求:動作的精控。為何要就精控動作和分鏡?因為兩個原因:AI生成的不合理不是你想要的內容質量不評價了,主要是它幾乎不出錯,抽卡成本很低。這得益於 Seedance 2.0 出色的時序泛化能力。至於第二個問題(不是你想要的內容),一般涉及到非常精細化的指定動作。我在這裡想說的是,除非是那種必須要手工處理PS的顆粒度要求,那麼大部分指定場景 Seedance 2.0 完全可以代勞,因為它的提示詞語義遵循甚至比控製圖片還方便。比如我們在武術場景裡指定:連續只用腳來擊倒敵人。實測下來我們是可以在 Seedance 2.0 極其精準的進行提示詞指定動作的,比如我們更極限一點,精確到每一秒要出現的內容:我只開了一次卡,然後仔細對了一下,不能說是完美響應,但大部分的要求都滿足到位了,並且實現了非常合理的動作連接。因此,除了極個別場景依然需要手工定製圖片,大部分的需求 Seedance 2.0 完全可以直出搞定。這也是為什麼我認為首尾幀為主要的工作流時代可能要“過去了”,因為在實戰場景裡目前 Seedance 2.0 表現的已經足夠超出預期。這是Seedance 2.0第一個意義:你只需要文字和核心圖像資產,就可以迅速進入消費級內容市場。審美:一切都回到選擇審美的部分,我想放在一起說了。首先,對於畫質的擔心大可不必,雖然目前僅開放720P的解析度,但是完全夠用。道理很簡單:審美從來都不是規格的問題。我甚至覺得720P是一個在性能和速度間很好的平衡。由於萬能參考的存在,任何你想參考的風格都可以有很好的延續,所以我們理論上是可以將審美“外包”的,一切都源於你找到的參考。所以和以往的測試不同,去單獨測試這個模型的視覺審美幾乎沒什麼意義。因為它的審美幾乎就是“萬物”,你的選擇是唯一標準。比如我找來一張北歐風格的分鏡,具備典型的冷峻、淺景深、畫面顆粒感等特徵,讓 Seedance 2.0 續寫:把圖1衍生為一部北歐電影的故事情節。把分鏡截出來,你幾乎看不出那一張是種子:這是 Seedance 2.0 最出色的特點之一,完美還原參照物本身的特質。放大細節,看一下 Seedance 2.0 表現出來的電影柔化和顆粒感令人驚嘆。真實和質感的關鍵點從來都不是“最清楚”,這是為什麼有時候視訊越清楚你會覺得越假。影像和圖像是不一樣的,處在影像中的圖像因為有連續性,大部分情況下其實是“不清楚的”,有興趣的朋友可以找一些電影的截圖自己觀察一下。除了視覺上的審美,Seedance 2.0 甚至可以“外包”剪輯和敘事的審美。關於剪輯,這兩天網上已經有很多朋友發過無數測試了。一句話總結就是:大部分情況下它完成的剪輯要比一般人出色的多。尤其是在快剪的領域。看一下下面這段打鬥鏡頭:在敘事上,它對提示詞的理解讓我覺得很誇張,可以根據不同提示詞的要求,衍生完全不同氛圍的風格呈現。悲劇案例中充滿壓迫感的高角度近距離特寫,還有情緒表演都讓人印象深刻。席捲裡中,使用了明顯更快節奏的剪輯,配合的人物表情也是典型的喜劇中略顯誇張的對話氛圍。綜上,Seedance 2.0 在審美方面的表現有兩個特點:由於萬能參考的存在,他的審美是一個整體解決方案,包含了構圖、畫質、剪輯、表演。由於第1點的存在,它把審美問題拉回了原點:你的選擇。再說得直白一點:你可以把任何一部電影或者廣義的作品看成一組“內容範本”,直接套用它的審美。只有“選擇”,是目前無法外包的。行業影響:在爆炸中回到原點目前為止,我們已經大致梳理了 Seedance 2.0 在技術角度帶來的變化,如果簡單點概括:1. 史無前例高效的生成精確、符合創作需求的影像2. 審美完全取決於創作者的選擇基於此,這個模型對產業的影響可能有幾點:首先,所有使用 Seedance 2.0 進行創作的個人和團隊,效率將大幅提升。而且這個提升速度不是簡單的提升百分之多少,很可能是一種轉移。因此,和舊的工作流做對比有可能是毫無意義的。我們以一個15秒的鏡頭為例,如果正常剪輯按3-5個鏡頭。原來的流程:生成3-5張分鏡,包含設計、修圖、開卡,然後生成3-5短影片,再剪輯。現在的流程:一段提示詞,反覆開幾次就可以了,而且 Seedance 2.0 的開卡率極高。這會導致創作效率指數級上升,具體快到什麼程度,只能看行業的實踐了。可以預見新的行業內卷一定會出現:價格、成本都會迎來新的挑戰,對從業者來說是機會,也是問題。這裡涉及到的方面太多,包括流量的分配機制,管道的重新定義問題,先不展開。這種效率的提升會導致AI內容史無前例的擁擠。類似的論調在 Veo2、Sora 出現時都有過預測和討論。但我認為這次不一樣。因為 Seedance 2.0 是可以滿足大部分商用和工業場景應用的。這次被提效的不僅僅是普通愛好者,而是整個行業,這就很恐怖了。AI內容的大量爆發在2026年幾乎是註定的,其實圈子裡大家心裡都有準備這一天一定會到,只不過這次 Seedance 2.0 點燃了這個節點。那麼就必須回到另一個問題,這麼多的內容,如何爭奪注意力?你能生產更多,不等於就有更多的人來看。所以它延伸到了我們在審美方面的討論。Seedance 2.0 用“萬能參考”這個方法,讓創作回到了最初最初的原點:你的想法。作為普通愛好者,如果只是為了“圖個樂”,你可以放開腦洞隨便玩耍。但如果作為希望有伸進內容產業的專業團體和個體創作者,我的觀點一直沒變:低成本的Meme格式視訊,無論多麼火爆,都沒有價值去跟隨和模仿。因為它不構成稀缺。這裡要補充一個觀點,這個模型這麼強,是不是說所謂專業能力已經完全失去意義了?X上面有以為朋友發了一個動態,裡面是一個 Seedance 2.0 生成的動畫視訊,然後問:現在堅持傳統動畫製作是不是已經沒有意義?我的看法沒這麼極端,在嚴格的商業場景下,專業人才和技術依然有很大的價值,不是說現在有了AI,專業團隊的能力就完全被抹平了,至少現在不是。因為在畫面規格,極高精確度的要求下,目前的AI依然無法滿足要求。但實話實說,對於大部分廣義內容的市場要求,Seedance 2.0 的完成度已經足夠,畢竟像短影片、短劇、網路廣告等內容,對於精確性的要求本來就不高,主流內容的娛樂化帶來的“相對粗糙”從2000年的網路影片開始就已經決定了趨勢,而且幾乎不可逆。大部分情況下使用者對於情緒的訴求遠遠大於工業精度,所以一切的一切就會到了那個最開始的問題:我們到底要拍點什麼給別人看。最簡單的就是最難的陳丹青老師在一段採訪中說過:當他到了紐約,沒有任何創作限制後,反而陷入焦慮:他不知道該畫什麼了。這讓我想起《肖申克的救贖裡》那段經典的關於“限制”的台詞。有的時候,“無限”反而是最難掌控的。Seedance 2.0 的出現似乎在把問題簡單化:你只要有選擇能力,有想法,就能拍片。但我不確定這是不是一個真的簡單的處境,因為在我看來,“選擇拍什麼,選擇審美”可能才是最難的。工業水準從來都不是創作最關鍵的核心。想法才是。所以我總覺得 Seedance 2.0 的出現帶有某種很“本質”的意味。它把這個市場的供給量拉到了史無前例的高度,然後在需求側把最核心的拷問呈現了出來:我們正在一起邁過一個臨界點。隨著節後火山引擎開放Seedance 2.0的API,我們將一起迎接這個AI內容徹底爆發的時代。而現在的問題是:當什麼都能拍的時候,我們拍什麼? (汗青AI Talk)