凌晨三點,徹底失眠:Seedance2.0告訴我們,AI正在瘋狂“壓縮”現實世界工作流

凌晨三點,看到影視颶風Tim更新的字節即夢Seedance 2.0視訊,我徹底睡不著了。

這是過去一年多來,AI的進步第一次讓我感到如此興奮。或者說,顫慄。

很多人都在等視訊領域的GPT-3.5時刻,大家覺得那還要兩三年。Seedance 2.0告訴我們,它已經近在眼前了。

它的強悍之處,在於它把運鏡、分鏡、音畫匹配,全部AI化了,並且做到很棒。它理解了光影、透視、鏡頭語言。

Tim在視訊裡展示的,是控制,是AI對物理世界的完美復刻。

AI的邏輯正在變得清晰而簡單,AI正在瘋狂壓縮我們的工作流:從導演、拍攝到剪輯、配樂;從產品經理、開發到測試、交付。

所有的中間環節都在逐步壓縮。

這篇文章,我想聊聊AI正在如何改變工作流、如何重構我們的工作。

01 視訊工業的GPT3.5時刻

Tim在視訊裡那種抑制不住的興奮,我感同身受。

以前我們認為運鏡是物理世界的特權,滑軌、搖臂、無人機、斯坦尼康。這些裝置很貴,操作這些裝置的人更貴。

Seedance2.0把這些都變成了參數,視訊裡演示的圖生視訊,一張主角的照片+一張場景的照片。

它能讓這個主角,在這個場景裡,按照你指定的運鏡方式動起來,多主體一致性得到了驚人的保持。

推拉搖移,以前需要鋪設軌道,需要燈光師配合調整每一秒的光位。

現在這只是Prompt裡的一行字,物理世界的物理限制,被數學世界的參數限制取代了。

Seedance 2.0似乎理解了三維空間的一致性。

它知道當鏡頭左移時,背景物體應該如何產生視差。它知道當光線從右邊打來時,影子的長度應該如何變化。

Seedance 2.0開始涉足剪輯,AI能夠理解視訊的節奏,能識別畫面中的情緒高點,能自動匹配音樂的鼓點。

對於剪輯師來說,以前需要耗費幾個小時的“粗剪”工作,現在可能只需要幾秒鐘。

聲音也是一樣,畫面裡籃球場,賽場複雜的聲音同步出現。

這種感知上的一致性,是人類大腦判斷“真實”的重要依據,AI做到了。

影視後期原本是一個極度複雜的系統工程。導演負責構思,攝影師負責將構思轉化為光影,剪輯師負責將光影重新組合成敘事,配樂師負責用聲音調動情緒。

這是一個極其昂貴、低效、且充滿摩擦的線性工作流。Seedance 2.0把這個鏈條打碎了,它把這些工種全部壓縮排了一個模型裡。

本質上,AI現在在做的內容就是不斷壓縮我們的各種工作流。

從Seedance 2.0看到了AI在壓縮導演、拍攝、剪輯、配樂這些人員的工作流雛形。

視訊領域的GPT-3.5時刻已經到來。

接下來的兩三年,將是行業洗牌的時刻,舊的秩序正在崩塌。

02 AI正在極致壓縮我們的工作流

視訊領域的變革只是AI重塑工作流的一個切面,更深刻的變革,發生在軟體領域,發生在我們的手機螢幕上。

最近用阿里千問點了一次奶茶,這個體驗讓我思考了很多。

它可能預示了App時代的終結,或者說,它預示了“即時軟體”時代的到來。

我們現在的網際網路體驗,是被“App”這個形態鎖死的。

你想點一杯奶茶,你需要解鎖手機,找到外賣App,點選進入,等待開屏廣告,點選搜尋框,輸入“奶茶”,在幾十個商家列表中篩選,點選進入商家頁面,在幾十種商品中選擇,選擇甜度,冰度,點選下單,支付。

這是一個極其冗長的鏈路。

為什麼我們要經歷這個過程?因為App在試圖滿足所有人的需求,它在找最大公約數,它不得不把低頻需求塞進二級頁面,它不得不為了商業化加入各種推薦。

對於我來說,我不需要這些,我常點的就是那3家店,我知道那家的檸檬茶最好喝,知道那家的後廚最乾淨。

我只需要:“幫我點一杯我常喝的那家,無糖。”

千問現在的能力,正在接近這個理想狀態。

你給它一個指令,它在後台通過程式碼,通過Agent,直接呼叫介面,完成交付。

這就是“意圖介面”,你輸出意圖,AI交付結果。中間的UI、互動、跳轉,全部被壓縮了。

當AI的能力從Andrej Karpathy提出的“Vibe Coding”進化到足夠強大的Agent,我們的每一個需求都將通過即時生成的“一次性App”來交付。

傳統的“產品經理需求文件-開發編寫程式碼-測試找Bug-最終交付”這一長達數周甚至數月的鏈路,將被AI瞬間壓縮至1分鐘以內。

這引發了一個根本性的商業追問:既然我可以用1分鐘生成一個“App”來滿足我當下的需求,那我為什麼還要下載一個幾百兆的App?

現有的App生態存在著無法克服的結構性矛盾,每個人的需求都是獨特的,AI可以通過即時程式碼將使用者的自然語言需求直接轉化為交付結果。

這實際上是AI為使用者量身定製了一個“專屬App”,用完即走,無需留存。

這對於現在的網際網路巨頭是巨大的挑戰,他們的護城河建立在App的裝機量上,建立在使用者的使用時長上。

如果App消失了,如果入口變成了AI Agent,那他們的流量從那裡來?廣告往那裡投?

下一個時代的入口可能逐漸清晰。

為什麼所有大廠都在瘋狂做大模型,爭奪那個唯一的“超級Agent”的答案呼之慾出。

對於很多App這種集合需求形態的產品,是不是在AI時代會轉向個性化需求的AI內產品呢?

現在的App開發商,可能會變成“資料API服務商”,隨著交付鏈路的大幅壓縮和成本降低,App需求實際變成了API需求。

每一次產品對話,都是自己作為產品經理的一次結果交付。

最終,傳統工作流的消失,意味著公司組織的解體。

公司這種組織形式,本質上是為了降低交易成本而存在的。因為溝通很貴,信任很貴。所以我們要把人聚在一起,簽合同,發工資。

當一個人+AI就能完成以前需要一個團隊做的事情,龐大的組織就變得沒有必要了,我們會看到越來越多的“一人公司”……

這樣看,我相信,AI對世界的改變,正在加速。 (華爾街見聞)