#SeeDance
從Gemini到豆包:全球兩大AI巨頭為何走上同一條路?
視訊模型Seedance 2.0、圖像模型Seedream 5.0 Lite連續刷屏後,2月14日,字節跳動正式宣佈推出豆包大模型2.0(Doubao-Seed-2.0,簡稱豆包2.0)系列。自2023年,豆包大模型初始測試版上線,2024年正式對外發佈,豆包代際模型版本更新已經過去近一年半時間。其間持續在文字基礎、多模態強化、深度思考、Agent(智能體)執行等方面更新,直至此次版本,在2.0全能力升級。此次備受關注的2.0版本,具備全端模型矩陣 + 多模態理解 + 企業級 Agent + 極致成本四大差異化優勢,已躋身全球第一梯隊,成為 Agent 時代的關鍵玩家。在多項公開測試集上表現突出,接近Google Gemini3,和具備更高性價比。字節跳動官方明確表示,旗艦版豆包2.0 Pro“面向深度推理與長鏈路任務執行場景,全面對標GPT 5.2與Gemini 3 Pro”。從技術參數到產品定位,豆包2.0與Google Gemini的相似性正在從“對標”走向“一致”。而這種“一致”並非偶然的“撞車”,本質是全球頂尖AI實驗室在通往通用人工智慧(AGI)路徑上達成的戰略共識——AI最終需要為人類完成任務執行,而這需要對真實世界物理運行規律的理解。版本代際更新此次更新,豆包2.0 系列模型提供 Pro、Lite、Mini 三款不同尺寸的通用 Agent 模型。該系列通用模型的多模態理解能力實現全面升級,並強化了LLM 與Agent 能力,使模型在真實長鏈路任務中能夠穩定推進。同時進一步把能力邊界從競賽級推理擴展到研究級任務,在高經濟價值與科研價值任務評測中達到業界第一梯隊水平。據官方介紹,此次豆包2.0針對大規模生產環境的使用需求進行系統性最佳化,旨在更好地完成真實世界的複雜任務。其中,在語言模型基礎能力上,豆包2.0 Pro旗艦版取得IMO、CMO數學競賽和ICPC程式設計競賽金牌成績,數學和推理能力達到世界頂尖水平。另外,大模型執行長鏈路複雜任務,需要豐富的世界知識。豆包2.0加強了長尾領域知識覆蓋,在SuperGPQA等多項公開測試集上表現突出,科學領域知識測試成績與Gemini 3 Pro和GPT 5.2相當,在跨學科知識應用上也排名前列。在教育、娛樂、辦公等眾多場景中,大模型需要理解圖表、複雜文件、視訊等內容。對此,豆包2.0全面升級多模態理解能力,視覺推理、空間感知、長上下文理解等權威測試均取得業界最佳表現。面對動態場景,豆包2.0強化了對時間序列與運動感知的理解能力。以健身場景為例,接入豆包2.0的智能健身App可即時分析使用者動作視訊,一旦檢測到深蹲姿勢偏移,立即語音糾正——這正是環境感知與主動互動能力的落地。目前,這一能力已延伸至穿搭建議、老人看護等領域。Agent能力是大模型具備行動力的關鍵。測試成績顯示,豆包2.0 Pro在指令遵循、工具呼叫和Search Agent等評測中達到頂尖水平,在HLE-Text(人類的最後考試)上更是獲得54.2的最高分,大幅領先於其他模型。目前,豆包2.0 Pro已在豆包App、電腦客戶端和網頁版上線,使用者選擇專家模式即可對話體驗。火山引擎也已上線豆包2.0系列模型API服務。價格方面,豆包2.0 Pro按“輸入長度”區間定價,32k以內的輸入定價為3.2元/百萬tokens,輸出定價為16元/百萬tokens,相比Gemini 3 Pro和GPT 5.2有較大的成本優勢。豆包2.0 Lite更是極具性價比,綜合性能超越兩個月前發佈的上一代主力模型豆包1.8,百萬tokens輸入價格僅為0.6元。強化執行任務能力此次豆包2.0的全面升級,核心落點在“真實世界複雜任務的執行力”。而這一能力的根基,正是多模態理解層的突破——只有讓模型真正看懂物理世界的動態與邏輯,它才能從“答題者”進化為“執行者”。字節模型團隊觀察到一個典型失衡:語言模型已經可以順利解決競賽難題,但放在真實世界中,它們依然很難端到端地完成實際任務——比如一次性建構一個設計精良、功能完整的小程序。LLM 和 Agent 為什麼在處理現實問題時屢屢碰壁?團隊認為,原因主要來自兩點:真實世界任務往往跨越更長時間尺度、包含多個階段,而現有LLM Agent 難以自主建構高效工作流,並在長時間跨度中積累經驗;真實世界知識具有很強的領域壁壘且呈長尾分佈,各行業的經驗不在訓練語料的高頻區,導致即便模型擅長數學與程式碼,其在專業場景中往往價值有限。在提升了長程任務執行能力的同時,Seed2.0 還進一步降低了推理成本。其模型效果與業界頂尖大模型相當,同時 token 定價降低了約一個數量級。在現實世界的複雜任務中,由於大規模推理與長鏈路生成將消耗大量token,這一成本優勢將變得更為關鍵。另外在多模態理解能力方面,豆包2.0Pro在視覺推理、空間感知、運動理解、長視訊理解等維度,在大多數相關基準測試中取得最高分。此前刷屏AI視訊模型Seedance2.0正是多模態能力支撐的體現之一。Seedance 2.0核心升級主要體現在原聲音畫同步、多鏡頭長敘事、多模態可控生成。使用者輸入提示詞與參考圖,可一鍵生成帶完整原生音軌的多鏡頭視訊,模型自動解析敘事邏輯,確保角色、光影、風格與氛圍高度統一。此前馬斯克點評稱:模型發展非常迅速。據官方介紹,豆包2.0可以處理複雜視覺輸入,並完成即時互動和應用生成。無論是從圖像中提取結構化資訊,還是通過視覺輸入生成互動式內容,Seed2.0都能高效、穩定地完成任務。這正是Gemini一直強調的“原生多模態”能力——不是簡單拼接視覺與語言,而是在底層實現跨模態的深度對齊。豆包2.0的升級方向與Google的Gemini 3 Pro在視訊理解、空間推理上的優勢高度一致。而豆包2.0與Gemini在基礎模型層面均選擇死磕多模態,本質上是在進行一場 “世界模型”的軍備競賽。它們不再滿足於讓AI做一個“語言遊戲高手”,而是希望AI成為一個能看懂、聽懂、理解物理世界複雜性的“數字人類”。只有當模型真正理解了杯子為什麼會碎、人為什麼會笑、視訊裡的人在做什麼動作,它才能在現實世界中可靠地執行任務。 (第一財經)
seedance 2.0 提示詞深度使用指南:從零開始成為AI視訊導演(附59套提示詞)
基於seedance2.0官方使用手冊59套提示詞的系統性拆解,需要的可文末找我領手冊。序章:即夢seedance2.0有多強?這兩天即夢seedance2.0真的殺瘋了,我的B站已完全是seedance2.0的形狀。到處都是高品質AI視訊,如果不標註,很多已經看不出是AI視訊了。Seedance 2.0相比之前國內外的視訊生成模型,強在那?一句話:風格還原能力強,自然效果強,運鏡效果強,實用意義強現在什麼邵氏電影風格,皮套電影風格,還原度非常好,看上去就像是原電影公司做的一樣。且效果非常自然,除去偶爾一些物理效果有些許問題,整體已經沒有以前的AI違和感了,也不會有那種顆粒的模糊感。運鏡效果更是強得沒邊,是被很多人津津樂道的存在,對真實影視拍攝的真實運鏡效果還原得非常好。現在很多人已經用來拍各種自己想拍的片了,主要是看起來太真了,甚至用來拍廣告都很驚豔。目前可以說,是AI視訊生成模型最接近商用邊界的時候。接下來,我會把官方手冊裡的59套提示詞全部拆開,按照"你想拍什麼"來分類,幫你建立一套隨時能用、隨拍隨出的提示詞思維體系。第一章:提示詞的底層結構——"五要素導演法"在分析59套提示詞之前,你需要先理解一個核心框架。所有好的AI視訊提示詞,本質上都在回答五個問題:五要素一覽實戰公式[角色指定] + [場景設定] + [動作/劇情描述] + [鏡頭語言] + [氛圍/聲音]舉例(手冊案例#3):鏡頭小幅度拉遠(露出街頭全景)並跟隨女主移動,風吹拂著女主的裙襬,女主走在19世紀的倫敦大街上;女主走著走著右邊街道駛來一輛蒸汽機車,快速駛過女主身旁,風將女主的裙襬吹起,女主一臉震驚的趕忙用雙手向下摀住裙襬拆解:角色:女主(由首幀圖指定)場景:19世紀的倫敦大街動作:走路→蒸汽機車駛過→裙襬被吹起→摀住裙襬鏡頭:小幅度拉遠+跟隨移動氛圍:背景音效為走路聲、人群聲、汽車聲注意:你不需要每次都寫滿五個要素。但要素越完整,生成結果越接近你腦海中的畫面。像"導演手記"一樣寫,不像"許願"一樣寫。第二章:按創作動機分類的提示詞全景解析分類一:我想生成一條完整的故事短片適合誰:短影片創作者、自媒體人、想用AI講故事的人核心動機:腦海裡有一個故事或場景,想讓AI幫你"拍"出來類型A:生活情景劇這類提示詞的特點是:日常場景 + 細膩的人物動作 + 情緒轉折。案例#1——曬衣服的女孩:女孩在優雅的曬衣服,曬完接著在桶裡拿出另一件,用力抖一抖衣服。案例#5——下班回家的父親:男人@圖片1下班後疲憊的走在走廊,腳步變緩,最後停在家門口,臉部特寫鏡頭,男人深呼吸,調整情緒,收起了負面情緒,變得輕鬆,然後特寫翻找出鑰匙,插入門鎖,進入家裡後,他的小女兒和一隻寵物狗,歡快的跑過來迎接擁抱,室內非常的溫馨,全程自然對話案例#40——起床日常:0-3秒:開頭鬧鐘響起來,畫面朦朧中出現畫面1;3-10秒:快速搖鏡頭,轉向對面特寫男人面部,男人無奈的叫女生起床,語氣和音色參考@視訊1;10-12秒:女生撅著嘴躲進被子裡面;12-15秒:切換到男主全身,他嘆著氣說:"真拿你沒辦法!"設計思路提煉:動作要拆成"微動作鏈" :不要寫"女孩曬衣服"就完了,要寫"曬完→從桶裡拿出→用力抖一抖"。每一個微動作都是給模型的精確指令情緒要有"轉折弧線" :案例#5的精髓在於"疲憊→深呼吸→收起負面情緒→輕鬆→被女兒擁抱的溫馨",這是一條完整的情緒曲線時間軸寫法是最可控的模式 :案例#40按秒數分段描述,模型對每一秒該發生什麼都有明確指令對話直接寫在提示詞裡 :如"真拿你沒辦法!",模型可以直接生成對應的配音類型B:戲劇性/電影感敘事這類的特點是:高衝突 + 強鏡頭語言 + 電影級氛圍。案例#4——街頭追逐:鏡頭跟隨黑衣男子快速逃亡,後面一群人在追,鏡頭轉為側面跟拍,人物驚慌撞倒路邊的水果攤爬起來繼續逃,人群慌亂的聲音。案例#45——諜戰片:諜戰片風格,@圖片1作為首幀畫面,鏡頭正面跟拍穿著紅風衣的女特工向前走,鏡頭全景跟隨,不斷有路人遮擋紅衣女子,走到一個拐角處,參考@圖片2的拐角建築,固定鏡頭紅衣女子離開畫面,走在拐角處消失,一個戴面具的女孩在拐角處躲著惡狠狠的盯著她...全程不要切鏡頭,一鏡到底。案例#11——恐怖/懸疑電梯:參考@圖1的男人形象,他在@圖2的電梯中,完全參考@視訊1的所有運鏡效果還有主角的面部表情,主角在驚恐時希區柯克變焦,然後幾個環繞鏡頭展示電梯內視角,電梯門打開,跟隨鏡頭走出電梯設計思路提煉:先定"類型片調性" :開頭寫"諜戰片風格"或暗示"恐怖/懸疑",給模型一個整體方向鏡頭語言是核心差異化 :正面跟拍→全景跟隨→固定鏡頭→一鏡到底,這些詞決定了"電影感"和"手機隨拍"的區別環境互動增加真實感 :撞倒水果攤、路人遮擋、人群慌亂聲——這些細節讓畫面"活"起來專業術語和大白話都能用 :希區柯克變焦 = 畫面突然拉近產生眩暈感,模型都能理解類型C:搞笑/創意反轉案例#2——畫中人偷喝可樂:畫裡面的人物心虛的表情,眼睛左右看了看探出畫框,快速的將手伸出畫框拿起可樂喝了一口,然後露出一臉滿足的表情,這時傳來腳步聲,畫中的人物趕緊將可樂放回原位,此時一位西部牛仔拿起杯子裡的可樂走了,最後鏡頭前推畫面慢慢變得純黑背景只有頂光照耀的罐裝可樂,畫面最下方出現藝術感字幕和旁白:"宜口可樂,不可不嘗!"案例#41——四川話猴子買奶茶:@圖片1的猴子走向奶茶店櫃檯,鏡頭跟隨在他身後,一位@圖片2的比熊服務員正在吧檯處擦拭製作工具,猴子向服務員用四川口音點單:"幺妹兒,霸王別姬有得沒得?"案例#48——泰坦尼克號反轉:顛覆@視訊1里的劇情,男人眼神從溫柔瞬間轉為冰冷狠厲,在露絲毫無防備的瞬間,猛地將女主從橋上往外推...設計思路提煉:"顛覆"是最強的創意入口指令:直接寫顛覆@視訊1的整個劇情,模型會自動生成反轉方言/語種可以直接在提示詞中指定:用四川口音、用西班牙語、用韓語,模型支援多語種配音對話台詞直接用引號寫出:模型會按照你寫的台詞生成對應的語音跨次元/荒誕設定大膽寫:畫中人探出畫框、猴子買奶茶——AI不受"常理"約束,腦洞越大越出彩分類二:我想做產品展示/商業廣告適合誰:電商賣家、品牌方、廣告從業者、個人帶貨核心動機:有一個產品,想用AI快速生成高品質的推廣視訊類型A:產品特寫展示案例#9——包包商業展示:對@圖片2的包包進行商業化的攝像展示,包包的側面參考@圖片1,包包的表面材質參考@圖片3,要求將包包的細節均有所展示,背景音恢宏大氣案例#13——科技產品展示:@圖片1的平板電腦作為主體,運鏡參考@視訊1,推近到螢幕的特寫,鏡頭旋轉後平板反轉展示全貌,螢幕中的資料流一直在變化,周圍的環境逐漸變成科幻風格的資料空間設計思路提煉:多圖拼合產品細節:一張圖給正面,一張圖給側面,一張圖給材質紋理——模型會把它們"拼"成一個完整的產品運鏡參考專業廣告片:找一段你喜歡的產品廣告,當作運鏡參考視訊上傳背景可以"超現實" :讓平板電腦周圍變成科幻資料空間——產品廣告不需要寫實記得指定BGM風格:背景音恢宏大氣 = 高端感,輕快節奏 = 年輕時尚類型B:創意廣告/品牌短片案例#8——韓語蝴蝶結飾品廣告(時間軸型):0-2秒畫面:快速四格閃切,紅、粉、紫、豹紋四款蝴蝶結依次定格,特寫緞面光澤與"chéri"品牌字樣。 3-6秒畫面:特寫銀色磁吸扣"咔嗒"吸合,再輕輕一拉分開,展示絲滑質感與便捷性。 7-12秒畫面:快速切換佩戴場景:酒紅款別在大衣領口,通勤氛圍感拉滿;粉色款綁在馬尾,甜妹出街... 13-15秒畫面:四款蝴蝶結並排陳列,品牌名彈出。案例#20——羽絨服廣告:參考視訊的廣告創意,用提供的羽絨服圖片,並參考鵝絨圖片、天鵝圖片,搭配以下廣告詞"這是根鵝絨,這是暖天鵝,這是能穿的極地天鵝絨羽絨服,新年穿得暖,生活過得暖",生成新的羽絨服廣告視訊。案例#49——零食反轉廣告:顛覆@視訊1的整個劇情。0–3秒:西裝男坐在酒吧...6–9秒:突然西裝男從桌下掏出一大包體積誇張的零食禮包...13–15秒:字幕彈出"再忙,也要記得吃點零食~"案例#58——油煙機廣告:這是一個油煙機廣告,@圖片1作為首幀畫面,女人在優雅的做飯,沒有煙霧,鏡頭快速向右邊搖動,拍攝@圖片2男人滿頭大汗面紅耳赤在做飯,濃煙滾滾,鏡頭向左邊搖動推進拍攝桌面上的一個油煙機,油煙機在瘋狂抽菸。設計思路提煉:時間軸指令碼是廣告的最佳寫法:精確到每一秒發生什麼,模型會嚴格按照你的節奏來"參考視訊的廣告創意"是王牌指令:看到競品/同行的好廣告,直接當參考,換上你的產品對比手法天然適合廣告:案例#58的"優雅做飯 vs 滿頭大汗"對比,比文字描述更有衝擊力廣告詞/slogan直接寫在提示詞裡:模型會在畫面合適的時候展示文字或配音反轉/懸念型廣告更抓人:先營造緊張氛圍,再用產品做"解圍"——這是爆款廣告的經典結構類型C:品牌視覺/視訊延長案例#30——JUST DO IT運動品牌:將視訊延長6s,出現電吉他的激昂音樂,視訊中間出現"JUST DO IT"的廣告字型後逐漸淡化,鏡頭上移到天花板...男人用健碩的上肢拉上吊環,後視訊中間出現"DO SOME SPORT"的廣告結束字型。案例#31——Lucky Coffee品牌片尾:將@視訊1延長15秒。1-5秒:光影透過百葉窗在木桌、杯身上緩緩滑過,樹枝伴隨著輕微呼吸般的晃動。6-10秒:一粒咖啡豆從畫面上方輕輕飄落。11-15秒:英文漸顯"Lucky Coffee","Breakfast","AM 7:00-10:00"。設計思路提煉:延長功能適合做品牌片尾:已有一段好視訊,延長幾秒加上品牌logo和slogan文字出現方式要描述清楚:漸顯 / 彈出 / 逐漸淡化 / 從中間向兩邊展開注意:延長5秒,生成時長也要選5秒(這是官方文件的重要提示)分類三:我想復刻/模仿一段我喜歡的視訊適合誰:看到爆款內容想做自己版本的創作者、學習影視技法的新手核心動機:有參考視訊,想用自己的角色/產品重新"翻拍"運鏡與動作復刻案例#17——超跑廣告運鏡復刻:參考視訊1的運鏡、畫面切換節奏,拿圖片1的紅色超跑進行復刻。案例#14——舞台表演復刻:@圖片1的女星作為主體,參考@視訊1的運鏡方式進行有節奏的推拉搖移,女星的動作也參考@視訊1中女子的舞蹈動作,在舞台上活力十足地表演案例#50——換主唱:視訊1中的女主唱換成圖片1的男主唱,動作完全模仿原視訊,不要出現切鏡,樂隊演唱音樂。案例#6——換角色保留運鏡:將@視訊1中的女生換成戲曲花旦,場景在一個精美的舞台上,參考@視訊1的運鏡和轉場效果,利用鏡頭匹配人物的動作,極致的舞台美感,增強視覺衝擊力設計思路提煉:最簡指令 :參考@視訊1的運鏡+畫面切換節奏,用@圖片1的XX進行復刻 ——一句話搞定可以分別指定"參考什麼" :運鏡參考視訊A,動作參考視訊B,角色用圖片C——三種素材各取所長"換人不換動作"是最高頻用法 :把別人視訊裡的角色換成你的,動作和鏡頭保持不變加上你自己的改造 :復刻不是100%照搬,你可以在復刻基礎上改場景、改風格、改氛圍分類四:我想做特效/轉場/視覺奇觀適合誰:追求視覺衝擊力的創作者、想做炫酷片頭的人特效復刻與創造案例#22——面部裂紋特效:將@視訊1的首幀人物替換成@圖片1,完全參考@視訊1的特效和動作,手裡的花蕊長出玫瑰花瓣,裂紋在臉部向上延伸,逐漸被雜草覆蓋,人物雙手拂過臉部,雜草變成粒子消散,最後變成@圖片2的長相案例#23——拼圖破碎轉場:由@圖片1的天花板開始,參考@視訊1的拼圖破碎效果進行轉場,"BELIEVE"字型替換成"Seedance",參考@圖2的字型案例#24——粒子鎏金特效:以黑幕開場,參考視訊1的粒子特效和材質,金色鎏金材質的沙礫從畫面左邊飄出並向右覆蓋,參考@視訊1的粒子吹散效果,@圖片1的字型逐漸出現在畫面中心案例#21——水墨太極:黑白水墨風格,@圖片1的人物參考@視訊1的特效和動作,上演一段水墨太極功夫設計思路提煉:特效不需要你從頭描述:找一段有你想要特效的參考視訊,寫參考@視訊1的XX特效即可可以"嫁接"特效到新角色/新場景:水墨特效配太極、粒子特效配品牌logo、裂紋特效配變身風格關鍵詞一句話就能生效:黑白水墨風格、賽博朋克、科幻資料空間轉場類提示詞的核心:說清楚"從什麼畫面 → 經過什麼效果 → 變成什麼畫面"分類五:我想做音樂卡點/MV/有節奏感的視訊適合誰:音樂類自媒體、想做炫酷Vlog的人、舞蹈類創作者案例#53——換裝卡點:海報中的女生在不停的換裝,服裝參考@圖片1@圖片2的樣式,手中提著@圖片3的包,視訊節奏參考@視訊案例#54——人物卡點MV:@圖片1@圖片2@圖片3@圖片4@圖片5@圖片6@圖片7中的圖片根據@視訊中的畫面關鍵幀的位置和整體節奏進行卡點,畫面中的人物更有動感,整體畫面風格更夢幻,畫面張力強,可根據音樂及畫面需求自行改變參考圖的景別,及補充畫面的光影變化案例#55——風光卡點:@圖片1-6的風光場景圖,參考@視訊中的畫面節奏,轉場間畫面風格及音樂節奏進行卡點案例#37——電影級MV:生成一個15秒的MV視訊。關鍵詞:穩重構圖/輕推拉/低角度英雄感/紀實但高級A超廣角建立鏡頭,低機位輕微仰拍,懸崖土路與復古旅行車佔畫面下三分之一,遠處海面與地平線拉開空間,夕陽側逆光體積光穿過塵粒,電影級構圖,真實膠片顆粒,微風吹動衣角。設計思路提煉:卡點的關鍵指令 :根據@視訊中的畫面關鍵幀的位置和整體節奏進行卡點多圖+一段音樂視訊 = 自動卡點MV :上傳你想要出現的畫面圖片 + 一段有節拍的音樂視訊,模型自動匹配想要更高級的視覺 :加上畫面張力強、更夢幻、光影變化等修飾詞電影級MV可以用"關鍵詞堆疊法" :把你想要的攝影風格關鍵詞全部列出來,如側逆光、膠片顆粒、低機位仰拍分類六:我想讓AI幫我"接著拍"或"改一改"適合誰:已經有半成品視訊、想做後期微調的創作者視訊延長案例#29——驢騎摩托腦洞廣告:延長15s視訊,參考@圖片1、@圖片2的驢騎摩托車的形象,補充一段腦洞廣告。畫面1:側面固定鏡頭,驢騎著摩托車衝出棚欄...畫面2:驢騎著摩托在沙地盤旋...畫面3:背景是雪山鏡頭,驢騎著車從山坡飛越過...案例#32——向前延長花店場景:向前延長10s,溫暖的午後光線裡,鏡頭先從街角那排被微風掀動的遮陽篷開始,慢慢下移到牆根處幾株探出頭的小雛菊...視訊編輯案例#51——改髮型加元素:將視訊1女人髮型變成紅色長髮,圖片1中的大白鯊緩緩浮出半個腦袋,在她身後。案例#52——炸雞店加品牌元素:視訊1鏡頭右搖,炸雞老闆忙碌地將炸雞遞給排隊的客戶...特寫展示老闆拿印有圖1的紙袋子,特寫展示遞給客戶的手部特寫。設計思路提煉:"向前延長"和"向後延長"都支援 :可以給視訊加片頭,也可以加片尾延長時寫清新增部分的具體內容 :不要只說"延長5秒",要描述這5秒裡發生什麼編輯指令要精確 :髮型變成紅色長髮 而不是 改一下髮型;加一隻大白鯊在身後 而不是 加一個嚇人的東西延長適合做"系列連續劇" :第一集生成完,延長就是第二集,角色和場景保持一致分類七:我想讓角色開口說話/唱歌/表演適合誰:想做有對話/配音/演唱的視訊的創作者案例#35——貓狗脫口秀(長對話):在"貓狗吐槽間"裡的一段吐槽對話,要求情感豐沛,符合脫口秀表演: 喵醬(貓主持,舔毛翻眼):"家人們誰懂啊..." 旺仔(狗主持,歪頭晃尾巴):"你還好意思說我?..."案例#36——豫劇戲曲:豫劇經前橋段《鍘美案》的伴奏響起,左側的黑衣包拯指著右側的紅衣陳世美,咬牙切齒地唱著豫劇...案例#38——多人家庭對話:畫面中間戴帽子的女孩溫柔地唱著說"I'm so proud of my family!",之後轉身擁抱...黑人女孩感動地回應"My sweetie, you're the heart of our family"...案例#39——多人戰術對話:固定鏡頭。站著的壯漢(隊長)握拳揮臂用西班牙語說著:"三分鐘後突襲!"...設計思路提煉:對話格式 :角色名 + 動作描述 + 冒號 + 引號內台詞,如 喵醬(舔毛翻眼):"家人們誰懂啊..."可以指定語言和口音 :四川話、西班牙語、韓語、豫劇腔——直接寫就行音色可以參考 :語氣和音色參考@視訊1 可以讓配音更像參考視訊中的聲音多人對話要寫清"誰說什麼"和"說的時候在做什麼" :模型需要知道畫面和聲音的對應關係分類八:我想從分鏡/指令碼/漫畫直接生成視訊適合誰:有創作基礎的人、習慣先畫分鏡再執行的創作者案例#26——漫畫動畫化:將@圖1以從左到右從上到下的順序進行漫畫演繹,保持人物說的台詞與圖片上的一致,分鏡切換以及重點的情節演繹加入特殊音效,整體風格詼諧幽默;演繹方式參考@視訊1案例#27——分鏡頭指令碼生成專題片:參考@圖片1的專題片的分鏡頭指令碼,參考@圖片1的分鏡、景別、運鏡、畫面和文案,創作一段15s的關於"童年的四季"的治癒系片頭案例#56——分鏡圖生成動漫:8秒智性博弈式戰鬥動漫片段...0-3秒:分鏡圖1中女主轉身坐下...3-4秒:快速搖鏡頭...4-6秒:切鏡頭,俯拍...6-8秒:鏡頭迅速向下搖,畫面黑屏轉場...設計思路提煉:漫畫→視訊:上傳漫畫圖,指定閱讀順序(從左到右從上到下),模型自動演繹分鏡稿→視訊:上傳你的分鏡圖,寫"參考分鏡的景別、運鏡、畫面",模型按你的分鏡拍這是最"導演級"的用法:如果你有編導基礎,直接畫分鏡+寫指令碼,AI精準執行分類九:我想創造沉浸式/一鏡到底的體驗適合誰:追求高級視覺敘事的創作者案例#43——追蹤跑步者:@圖片1-5,一鏡到底的追蹤鏡頭,從街頭跟隨跑步者上樓梯、穿過走廊、進入屋頂,最終俯瞰城市。案例#47——過山車主觀視角:@圖片1-5,主觀視角一鏡到底的驚險過山車的鏡頭,過山車的速度越來越快。案例#44——飛機舷窗奇幻旅程:以@圖片1為首幀,畫面放大至飛機舷窗外,一團團雲朵緩緩飄至畫面中,其中一朵變形為@圖片2的冰淇淋,鏡頭推遠回到機艙內,坐在窗邊的@圖片3伸手從窗外拿進冰淇淋...案例#10——第一人稱遊戲視角:把@圖片1作為畫面的首幀圖,第一人稱視角,參考@視訊1的運鏡效果,上方場景參考@圖片2,左邊場景參考@圖片3,右邊場景參考@圖片4。設計思路提煉:"一鏡到底"是關鍵指令:寫上這四個字,模型就知道整段視訊不能有切鏡多張圖按順序=場景路徑:5張圖就是5個經過的場景節點,模型自動做場景間的過渡主觀視角 = 沉浸感:寫第一人稱視角或主觀視角,觀眾彷彿身臨其境速度變化寫清楚:越來越快、緩緩飄至——節奏感來自速度描述第三章:提示詞設計的六大黃金法則從59套提示詞中,提煉出以下六條可以反覆使用的寫作原則:法則一:素材分工要"點名到人"❌ 錯誤寫法:上傳了幾張圖和一段視訊,生成一段打鬥視訊✅ 正確寫法:@圖1@圖2為長槍角色,@圖3@圖4為雙刀角色,模仿@視訊1的動作,在@圖5的楓葉林中打鬥原理:每一個@素材都需要明確它在視訊中的"角色"——誰是演員、誰是佈景、誰是參考動作、誰是參考音樂。不點名,模型就在猜。法則二:動作要拆成"微動作鏈"❌ 錯誤寫法:女生在做飯✅ 正確寫法:女人在優雅的做飯,沒有煙霧,鏡頭快速向右邊搖動,拍攝男人滿頭大汗面紅耳赤在做飯,濃煙滾滾原理:AI模型不理解"做飯"這個抽象概念背後的畫面,但它理解每一個具體動作和視覺特徵。法則三:鏡頭語言決定"質感段位"同樣的內容,換一種鏡頭描述,質感天差地別:常用鏡頭術語速查:推:鏡頭從遠到近 → 聚焦某物拉:鏡頭從近到遠 → 展示全景搖:鏡頭左右旋轉 → 掃視環境移:鏡頭整體平移 → 跟隨角色環繞:圍繞角色旋轉拍攝 → 強調主體俯拍:從上往下拍 → 上帝視角仰拍:從下往上拍 → 英雄感/壓迫感一鏡到底:不切鏡頭連續拍 → 沉浸感希區柯克變焦:主體大小不變但背景突然拉近/拉遠 → 眩暈/驚恐感法則四:時間軸指令碼是精確控制的終極武器當你需要精確控制15秒內每一秒發生什麼時,用這個格式:0-3秒:[畫面1的描述]3-6秒:[畫面2的描述]  6-10秒:[畫面3的描述]10-15秒:[畫面4的描述+結尾處理]手冊中至少有8個案例使用了這種格式(#8、#40、#49、#30、#31、#56等),且全部是高品質輸出。這不是巧合——越精確的指令,模型越不會"自由發揮"走偏。法則五:用"參考+改造"實現80%效率提升絕大多數創作不需要從零開始。最高效的提示詞模式是:參考@視訊1的[你想保留的部分] + 把[你想修改的部分]換成[你要的新內容]例如:參考@視訊1的運鏡和轉場 + 把人物換成@圖片1參考@視訊1的廣告創意 + 用@圖片1的產品替換參考@視訊1的動作和節奏 + 風格改成水墨畫這是59套提示詞中最高頻的模式,超過一半的案例都在用。法則六:情緒和氛圍要"演"出來,不要"說"出來❌ 錯誤寫法:角色很傷心✅ 正確寫法:走到鏡子前,看著鏡子裡面的自己,沉思了一會突然開始崩潰大叫,抓鏡子的動作崩潰大叫❌ 錯誤寫法:氛圍很緊張✅ 正確寫法:咬牙切齒地唱著,眼珠左右滴溜溜亂轉,面色窘迫至極原理:AI不理解"傷心"這個抽象情緒詞,但它理解"崩潰大叫"、"咬牙切齒"、"眼珠亂轉"這些可以被畫面化的動作描寫。第四章:新手快速起步路徑如果你是完全的新手,建議按以下順序嘗試:第一步:純文字描述不上傳任何素材,唯寫文字。適合練手和理解模型的理解力:女孩在優雅的曬衣服,曬完接著在桶裡拿出另一件,用力抖一抖衣服。第二步:一圖+文字上傳一張角色或場景圖作為首幀,文字描述後續動作:@圖片1作為首幀,鏡頭旋轉推近,人物突然抬頭,開始大聲咆哮第三步:多圖+文字上傳多張圖片,指定各自用途:@圖片1-5,一鏡到底的追蹤鏡頭,從街頭跟隨跑步者上樓梯、穿過走廊、進入屋頂第四步:圖+視訊參考+文字加入參考視訊來控制鏡頭和動作:@圖片1的女星作為主體,參考@視訊1的運鏡方式進行推拉搖移,女星的動作也參考@視訊1第五步:全模態組合圖+視訊+音訊+文字全部上陣,做真正的"導演":圖片指定角色和場景,視訊參考運鏡和動作,音訊參考配樂和音色,文字描述劇情和對話附錄:59套提示詞速查索引最後的話:提示詞不是越長越好,也不是越專業越好。它的本質是——你把你腦海中的畫面,翻譯成文字。你腦海中的畫面越清晰,你的提示詞就越好。你可以這麼想,在打字之前,先在腦子裡"放一遍電影"。 (心辰AI寫作筆記)
Seedance 2.0 出片萬能範本
你有沒有在 Seedance 2.0 里輸過「一個女孩在街上走」,然後生成了一段毫無運鏡、像素級 PPT 的東西?問題不在工具,在提示詞。精準說,在兩件事上:結構和運鏡。結構決定視訊「能不能看」,運鏡決定視訊「好不好看」。大多數人兩樣都缺。這篇把兩個問題一次解決。為什麼自己寫幾乎必然翻車大多數人用 AI 視訊工具的方式是:腦子裡有個模糊畫面 → 用自然語言描述 → 祈禱 AI 理解你。結果通常是:畫面靜止、角色僵硬、鏡頭不動、轉場生硬。不是 Seedance 2.0 不行,是你的提示詞裡缺了太多東西——運鏡類型、鏡頭切換邏輯、光線氛圍、特效節奏。這些術語你可能聽都沒聽過,更別說精準使用。@yanhua1010 說得很直接:AI 視訊的質量,70% 取決於運鏡描述,而不是場景描述。你寫「A girl walking in the forest」,出來的是監控錄影;你寫「A girl walking in the forest, Smooth Dolly Follow, golden hour lighting」,出來的才叫視訊。場景是骨架,運鏡才是靈魂。第一層:用萬能範本搞定結構@leslieyu0 公開了一個提示詞範本,結構大致是這樣的:**(多鏡頭,快速呈現人物/高光動作,分鏡銜接流暢)**【@素材1】作為首幀參考,【角色名】為主角。鏡頭1(【鏡頭類型】):角色出現在【場景】中,做出【核心動作】,搭配【局部特效】;鏡頭2(【鏡頭類型】):鏡頭切換方式銜接,特寫面部表情,強化情緒;鏡頭3(可選):快速帶過輔助元素,呼應核心動作;整體【畫風】,色彩【光線】,自帶【音效/配樂】,時長5s。看起來像一份分鏡指令碼的骨架。它把一個視訊該有的要素全鎖定了:多鏡頭結構、運鏡變化、情緒節奏、風格統一。你不需要懂這些術語。把範本丟給 ChatGPT、Gemini 或 Kimi,告訴它你想要什麼風格、什麼主角、什麼氛圍,AI 會幫你把每個槽位填滿專業詞彙。比如你說「賽博朋克風格,銀髮機械姬,5秒,視覺炸裂」,AI 會自動補上「極速推拉」「光子粒子流」「故障轉場」這些你手寫想不到的東西。這套範本解決了「從 0 到能用」的問題。但範本裡有個關鍵槽位——【鏡頭類型】——大多數人填不好,因為根本不知道有那些選項。這就需要第二層。第二層:運鏡詞典——範本裡那個填不好的槽位@yanhua1010 結合 @yyyole 的運鏡術語體系和 @YZCStella 的實戰範本庫,整理了一套三級進階體系。我把它壓縮成最實用的部分。三個基礎詞所有運鏡都建立在這三個詞上:Pan(搖移):鏡頭水平或垂直轉動,機位不動。展示全景、交代環境用這個。Zoom(變焦):改變焦距,主體變大或變小。聚焦細節、製造衝擊。Dolly(推軌):鏡頭物理前進或後退。跟隨人物、營造沉浸。Pan 和 Dolly 最容易搞混。Pan 是「頭轉了,人沒動」,Dolly 是「整個人跟著走了」。我一開始就搞反了,生成出來的畫面總覺得那裡不對,後來才意識到是運鏡指令給錯了。加修飾詞,超過 80% 的人光寫 Pan、Zoom、Dolly 太生硬,就像跟攝影師說「你動一下」。加一個修飾詞,告訴 AI 這個鏡頭的「情緒」,效果天差地別。速度:Smooth(流暢)、Slow(緩慢)、Fast(快速)、Subtle(微妙,極細微的移動,高級感全靠它)。情緒:Cinematic(電影感,萬能詞,不知道加什麼就加這個)、Dreamy(夢幻)、Aggressive(侵略性,恐怖片動作片用)、Intimate(親密,人物特寫用)。風格:Handheld(手持,紀實感)、Aerial(航拍,史詩感)、Dutch Angle(荷蘭角,畫面傾斜,製造不安)。組合起來就是:Smooth Dolly Forward、Slow Aerial Pan、Cinematic Handheld Tracking。試過一次你就知道區別有多大。同樣一個森林場景,「Dolly Forward」出來的是平淡的前進鏡頭,「Slow Cinematic Dolly Forward」出來的有呼吸感,光影在樹葉間流動,完全不是一回事。組合運鏡單一運鏡夠用了,但 Seedance 2.0 對組合運鏡的理解特別好,不用白不用。幾個經典組合:Orbit + Zoom In(環繞 + 推進):鏡頭繞著主體轉,同時緩緩靠近。人物登場、產品展示首選。Crane Up + Pan(升降 + 搖移):鏡頭向上升起同時水平轉動。大氣磅礴,開場結尾用。Dolly Zoom(推軌變焦):鏡頭前推同時焦距拉遠,希區柯克的經典「眩暈」效果。用好了驚豔,用不好暈車。Tracking + Handheld Shake(跟蹤 + 手持抖動):跟拍加適度晃動。戰爭片動作片標配。一條視訊不要超過 2 個組合。「快速推進 + 環繞 + 升降 + 變焦」四合一,AI 會精神分裂,出來的畫面你自己都不知道它在幹嘛。中文也能用,而且效果不差英文術語是底層邏輯,但 Seedance 2.0 對中文理解同樣強。@YZCStella 總結了一套中文萬能公式:主體 + 動作 + 場景 + 光影 + 鏡頭語言 + 風格 + 畫質 + 約束幾個可以直接複製的範本:唯美人像:一位年輕女生在林間緩慢行走,微風輕拂頭髮,自然微笑,暖光光影,中景,緩慢推鏡,畫面流暢穩定,4K高畫質,電影感,面部清晰不變形,人體結構正常,細節豐富。氛圍風景:海邊日落,海浪輕拍沙灘,鏡頭緩慢橫移,暖橙色調,治癒清新,畫面絲滑,4K超高畫質,無閃爍無重影。圖生視訊(首幀固定):基於參考圖保持人物樣貌與服裝一致,動作緩慢抬手轉身,自然流暢,不僵硬不變形,穩定運鏡,高畫質細節,電影質感。如果想自己寫,套這個框架:[景別] + [主體描述] + [動作(慢、連續、具體)] + [運鏡指令(1-2 個組合)] + [光影氛圍] + [風格標籤] + [畫質標籤] + [穩定性約束]五條鐵律這幾條是踩坑踩出來的,每一條背後都有翻車的教訓。動作寫慢,寫連續。不要寫「跳舞」「走路」這種大詞,要寫「緩慢轉身、輕輕抬手、腳步輕移」。AI 生成慢動作的成功率遠高於快動作。你寫「高速奔跑」,出來大機率是鬼畜。運鏡寫穩,寫簡單。一條視訊最多 2 個運鏡組合。前面說過了,貪多必亂。必加穩定約束詞。無論什麼場景,結尾加上「畫面流暢穩定 / stabilized / 無抖動無閃爍」。不加的話畫面穩定性全靠運氣,十次裡有七次抖。必加角色約束詞。人物視訊最大的坑是變臉變形。加上「面部穩定不變形,五官清晰,人體結構正常,服裝一致」。這不是錦上添花,是保底。模糊詞換精確詞。「move」→「Smooth 3-second dolly forward」;「好看」→「治癒清新,暖光光影」;「很酷」→「賽博朋克,暗調高級,霓虹反光」。模糊詞等於沒描述,AI 全靠猜。速查表鐵律是通用底線,具體到場景,這張表更直接:人像特寫→ 緩慢推鏡 / Dolly In,加 Intimate、Smooth。快速變焦會讓臉崩掉。風景全景→ 緩慢橫移 / Pan / Aerial,加 Cinematic、Dreamy。手持風格和大全景天然矛盾,別用。動作追逐→ Tracking + Handheld,加 Fast、Aggressive。這是少數適合用 Handheld 晃動的場景,固定機位拍追逐像在看監控。產品展示→ 環繞推進 / Orbit + Zoom,加 Smooth、Subtle。產品要穩,大幅度運動會搶主體的注意力。開場結尾→ 升降搖移 / Crane Up + Pan,加 Cinematic、Slow。多重複合運鏡在這裡很誘人,忍住,兩個夠了。回憶夢境→ Dolly Zoom / Slow Pan,加 Dreamy、Subtle。城市夜景→ 俯衝 / Aerial Crane Down,加 Cyberpunk、Cinematic。去那裡用現在用 Seedance 2.0 有兩個入口:小雲雀 APP,專業版,功能更全,參數控制更細。適合已經知道自己想要什麼的人。豆包 APP,剛全量推送,免費使用。打開對話方塊就能看到 Seedance 2.0 入口,支援 5 秒和 10 秒視訊。還有個「分身視訊」功能——通過人臉識別建立你自己的視訊分身。豆包內建了不少範本,新手可以先從這些範本起步,熟悉了再用萬能範本自訂。操作流程很簡單:把萬能範本 + 你選好的運鏡組合一起發給 AI(ChatGPT / Gemini / Kimi),讓它生成完整的提示詞在小雲雀或豆包裡上傳參考圖 + 貼上提示詞。注意檢查 @圖片引用是否生效參數設 16:9、時長約 5 秒,點生成。想更長可以試 10 秒,但對提示詞精度要求更高一個限制:豆包目前不允許上傳真人圖片作為主體參考,想用真人形象只能走分身視訊的人臉驗證流程。最後這些範本和術語能解決「從 0 到 80 分」的問題。結構不塌,運鏡不亂,畫面穩定,角色不變形——做到這四點,你的出片質量已經超過大部分人了。但 80 分以上靠的不是提示詞寫得多精確。是你知道這個鏡頭為什麼要這樣切,這個節奏為什麼要這樣走,這個故事為什麼值得講。工具在被拉平,範本在被公開,運鏡術語人人可查。最後拼的還是那個老問題:你拍的東西,有沒有人想看? (Kinpoe Ray)
實測Seedance 2.0:普通人做短片只需3步,效果炸裂
沒想到,我們的國產AI視訊生成模型能做到這種程度!不說廢話,先看效果!這是我輸入到Seedance 2.0的圖,一個有點傲氣的小雞我讓ChatGPT寫了個劇情,想看看Seedance2.0能不能按照劇情給我生成視訊小公雞走在路上,面向鏡頭。突然,它遇到了一隻笨拙的。鏡頭迅速切換,聚焦在小公雞和狼之間,展現出它們都懵懂、驚訝的神情。 小公雞嚇壞了,它立刻使出絕招——“裝死”。它毫不猶豫地跌倒在地,身體僵硬,舌頭垂出,腦袋一片空白。 狼滿臉困惑,它用鼻子湊近小公雞,疑惑地戳了戳它,狼更加迷茫, 最終,小公雞憋氣憋得難受,忍不住猛地跳起來,劇烈地咳嗽,嚇得狼魂飛魄散,。狼很慌張,撞上了小公雞,一同跌倒。狼和小公雞都暈了過去結果超出我的預期了。劇情在視訊裡沒有遺漏,表情刻畫非常細膩,分鏡切換流暢絲滑,幾乎沒有AI的痕跡。最關鍵是,這個視訊一次性出片!Seedance2.0強在那裡?精細化的提示詞控制、場景切換時的任務一致性,是Seedance 2.0出彩的地方。在最開始的例子裡面,我們構思的劇情, Sedance 2.0完全幫我們實現了。但是,讓我覺得Seedance 2.0強悍的,不只是他精準控制的提示詞!Seedance2.0不只是AI視訊生辰工具,更是AI導演+剪輯師!說實話,Seedance 2.0 表面上是個視訊生成工具,實際上干的是導演+剪輯的活。那種自然流暢的分鏡切換、專業的鏡頭語言、角色表情的細膩刻畫——這些都是影視從業者靠實戰才能培養出來的經驗,是他們的護城河。但 Seedance 2.0 直接把這道護城河炸了。以前需要導演腦子裡構思、剪輯師手上實現的東西,現在一句提示詞就能搞定。以前,技術很值錢。會剪輯、會調色、會分鏡,就能吃香。但未來,人人都可以做視訊。個體經營來一大波機遇。工具越來越平權,拼的不再是技術,而是腦子裡的創意。你能想到什麼樣的故事?你能設計什麼樣的情節?你的腦洞有多大?創意才是唯一的護城河。下面我找了幾個真實案例,看完你就知道這個工具有多顛覆。真實使用效果動畫片跟Sora相比,我更推薦打擊用Sendance 2.0做動漫,因為,Sendance2.0沒有跟Sora一樣,對於IP形象卡的死死的。我曾經用Nano banana pro生成了鬼滅之刃的一個小小的漫畫現在,直接把他拿給Seedance 2.0,直接可以生成對應的視訊了!小互(@xiaohu)的這個case,更是驚豔,看到我震驚了,下面的這個是原始圖然後用的是這個提示詞將@圖1以從左到右從上到下的順序進行漫畫演繹,保持人物說的台詞與圖片上的一致,分鏡切換以及重點的情節演繹加入特殊音效,整體風格詼諧幽默;演繹方式參考@視訊1具體效果,各位老闆欣賞下吧真人短劇Seedance 2.0生成的這個打鬥視訊效果絕對是NO 1的,即便是Sora也比不上。我試過很多模型,但是發現生成的打鬥視訊不是在生成的過程中崩了,就是沒有能夠很好的表現出打鬥的精彩。Seedance 2.0處理的就非常好。這種效果,完全可以用來做真人短劇了。現在短劇那麼火,但普通人沒有資本根本沒有辦法入局,有了Seedance 2.0,說不定可以嘗試一下。我那位朋友如果還做電商的話,估計要高興壞了,再也不用花巨額的廣告視訊製作費了。廣告視訊以前我有位做電商的朋友,新開發了一個產品,然後找人做了個視訊廣告。來來回回搞了一個多月,最後花了5萬多塊錢(我不知道他是不是被坑了)現在,用Seedance 2.0完全可以自己做一個類似的視訊,所花費的積分可能也就幾百塊錢。我找了位網友做的廣告視訊,大家看看這個視訊能否入的了法眼 我那位朋友如果還做電商的話,估計要高興壞了,再也不用花巨額的廣告視訊製作費了。 (GoWalker)
字節王炸引爆A股,AI大牛股5天狂飆60%
過去一周(2月9日—2月13日)的牛股榜中,掌閱科技(603533.SH)以61.11%的周漲幅奪魁。公開資料顯示,掌閱科技主營業務是網際網路數字閱讀平台服務、衍生業務、版權產品等。公司的主要產品是網際網路數字閱讀平台。二級市場方面,公司股價過去一周強勢走高斬獲5連板。截至2月13日,公司股價報收37.62元/股,創下2023年以來新高,公司總市值突破165億元。公司近期亦獲主力資金持續加倉,Wind顯示,本周主力資金已連續5日“加倉”掌閱科技,累計淨流入超12億元,其中13日單日淨流入超8億元。消息面上,字節跳動旗下視訊生成模型Seedance 2.0正式發佈,在全網快速出圈。據21世紀經濟報導,Seedance 2.0可根據文字或圖像建立電影級視訊,支援根據描述的情節自動規劃分鏡和運鏡,支援音畫同步,支援多鏡頭敘事等複雜需求。Seedance 2.0會自動保持所有場景切換中角色、視覺風格和氛圍的一致性,無需手動編輯。業內也“好評”頻頻。遊戲科學創始人、CEO馮驥甚至在其微博上寫道,“Seedance 2.0是當前地表最強視訊生成模型。”面對連日刷屏的Seedance 2.0生成視訊,馬斯克也在社交平台上點評,“模型發展太快了。”華泰證券指出,Seedance 2.0有望為國內AI漫劇、AI短劇等的規模化落地,及AI電影等的行業發展提供技術支撐。A視訊工業化能力逐步成熟將推動內容產業鏈價值分配結構變化。利多影響下,本周AI應用概念股快速走強,其中AI漫劇備受關注。例如,最牛股掌閱科技曾披露,2025年上半年短劇等衍生業務收入,同比增長149.09%,已成為公司第一大業務(2025年半年報)。公司正持續推進AI大模型在數字閱讀及短劇中的深度融合(2025年9月互動平台)。股價大幅波動下,公司周內兩次發佈異動公告並提示,日常經營情況及外部環境未發生重大變化,2025年度AI短劇業務收入預計不超過2025年度主營業務收入的1%。值得注意的是,公司2025年業績預計轉虧。掌閱科技發佈的2025年度業績預告顯示,預計2025年年度實現歸母淨利潤約為-1.95億元,原因為國內外雙線發展模式帶來短期投入的大幅增加,短期對整體盈利能力形成一定拖累。(21世紀經濟報導)
字節狂飆、阿里亮劍…大模型混戰春節檔
除夕的煙花尚未綻放,AI戰場早已硝煙瀰漫。2026年馬年春節,表面上是百度5億、騰訊元寶10億紅包、阿里30億免單的混戰,實則是國產大模型陣營一次史無前例的“集體亮劍”。從臘月二十開始,字節、智譜、MiniMax、Kimi扔出王炸,DeepSeek悄無聲息地完成了關鍵迭代,阿里Qwen3.5箭在弦上,百度O計畫秘而不宣,騰訊則請來姚順雨這位“關鍵先生”在技術部落格裡埋下伏筆。這不是一場擠牙膏式的常規更新,而是一場關於“大模型下半場往那走”的路線對壘。每一家都在賭:未來兩年,使用者和開發者真正離不開的那個模型,究竟長什麼樣?大廠篇:字節暫領風騷阿里磨刀,百度織網,騰訊“深潛”字節跳動:Seedance 2.0 是截至目前這春節檔唯一的“破圈者”。如果只選一個模型定義2026年春節,那一定是字節的Seedance 2.0。2月7日,沒有發佈會,沒有媒體通稿,字節只是在飛書文件裡輕描淡寫扔下一句“Kill the game”。隨後發生的事情超出了所有人的預期:《黑神話》製作人馮驥稱其為“地表最強視訊生成模型,沒有之一”;影視颶風Tim連說六次“恐怖”;二級市場影視傳媒類股掀漲停潮;海外X平台上,外國網友四處求中國手機號體驗Seedance 2.0。憑什麼?因為Seedance 2.0完成了視訊生成從“玩具”到“工具”的關鍵一躍。它不僅支援圖文音視四模態輸入、多鏡頭連貫生成,更可怕的是它對物理世界的“理解”,你上傳一張建築正面照,它能自動生成繞到建築背面的運鏡,且與現實幾乎一致。字節這一仗打出了兩個結論:第一,視訊生成不是Sora的專利,中國大廠不僅能跟,還能超;第二,DeepSeek之後,字節是第二個讓矽谷感受到“技術代差焦慮”的中國玩家。當然,狂歡背後也有隱憂。上線僅兩天,即夢就緊急限制真人圖生視訊——當造假成本趨近於零,監管的達摩克利斯之劍隨時可能落下。2月12日,網信中國公眾號發文稱網信部門督促網站平台深入排查整治,依法依約處置帳號13421個,清理違法違規資訊54.3萬餘條。下一步網信部門將對無AI標識的虛假不實資訊保持高壓嚴管態勢,發現即處置,嚴厲打擊違規行為。阿里:Qwen3.5發佈在即,這一次要做“看得懂世界”的基座。相比於字節的高調,阿里的春節顯得“蓄勢待發”。2月9日,Hugging Face頁面上悄然出現Qwen3.5提交程式碼合併的PR,開發者從中扒出關鍵資訊:全新混合注意力機制,極有可能是原生視覺語言模型(VLM),且計畫開源2B密集版和35B-A3B的MoE版 。這是阿里一次明確的戰略轉向。此前千問系列雖然強大,但始終是“純文字學霸”。而Qwen3.5一旦以原生VLM(視覺語言模型)形態登場,意味著阿里決心把視覺理解直接塞進基座,而不是像多數廠商那樣靠“視覺編碼器+大語言模型”拼湊。如果落地順利,這將是國產開源模型在多模態原生能力上的一次重要卡位。百度:O計畫“深潛”,入口才是護城河百度是今年春節最早砸紅包的玩家,5億、北京台春晚首席AI合作夥伴,攻勢不可謂不猛。但在模型層面,百度顯得異常安靜。近期,百度“O計畫”的代號在圈內流傳,內部人士僅透露“與百度APP有關” 。這其實透露出百度現階段的核心邏輯,也就是不急於發一個新模型秀肌肉,而是守住2億月活的文心助手,把百度APP做成AI時代的超級入口。這未必是錯。當字節、阿里、騰訊都在為“入口”瘋狂撒錢時,百度手裡本就攥著一個國民級入口。O計畫究竟是在訓練新模型、重構搜尋體驗,還是醞釀Agent應用?懸念可能要留到節後了。騰訊:沒有新模型,卻可能是最深遠的佈局。盤點春節檔時最容易漏掉騰訊,畢竟元寶的紅包大戰看起來只是“跟牌”,並沒有像字節、智譜那樣扔出重磅模型。但懂行的人盯著另一件事:AI大拿姚順雨加入騰訊後首次帶隊發佈研究成果。2月3日,騰訊混元技術部落格上線,開篇就是姚順雨團隊的CL-bench基準研究。結論非常“狠”:全球前十的語言模型在“從上下文中學習新知識”這項能力上,平均解決率只有17.2%——這些頂級的做題家,其實根本不會利用上下文 。這意味著什麼?姚順雨給出了一個極具野心的願景:未來競爭的焦點不是誰能把模型訓練得更好,而是誰能為任務提供最豐富、最相關的上下文。使用者將從“資料提供者”轉變為“上下文提供者”。這或許解釋了為什麼騰訊春節沒有搶發基座模型——他們在押注一條更長的賽道:定義大模型下一階段的核心能力標準。一旦CL-bench成為行業共識的評估基準,騰訊就握住了下一代模型迭代的方向盤。創業公司篇四小龍分化,各有各的“護城河”如果說大廠的春節檔是“入口+模型”雙線作戰,那麼創業公司的牌桌上只剩下純粹的模型硬仗。智譜:Agentic Engineering的開路先鋒。2月12日,智譜GLM-5上線即開源。744B參數、SWE-bench 77.8分、全球開源第一、國產晶片全適配 。但參數不是重點,重點是智譜為這代模型重新定義了角色:不是對話助手,是“系統架構師”。GLM-5能自主拆解需求、呼叫工具、偵錯程式碼、交付可部署產品。一位開發者用它做出了橫版解謎遊戲,另一個做出了論文版“抖音”,已提交商店稽核 。智譜賭的是,2026年,大模型必須從“寫程式碼”進化到“寫工程”。從GLM-5開始,他們不再和同行比誰更會聊天,而是比誰能真正替代初級工程師。MiniMax:把Agent做成白菜價。MiniMax M2.5在同一天發佈,走了另一條路。10B啟動參數,SWE-bench 80.2%,超越Claude Opus 4.6。但真正讓行業側目的是它的成本:1萬美元理論上可支援4個Agent連續工作一年 。這是MiniMax一貫的風格,不做最聰明的模型,做最便宜的生產級模型。當別人還在卷榜單分數時,MiniMax已經在算“Agent小時單價”。創始人閆俊傑的邏輯很清晰,Agent規模化部署的最大瓶頸從來不是能力,是成本。M2.5把推理速度做到主流模型2倍,把價格打到幾分之一,這是在為Agent經濟鋪路。Kimi:Agent叢集,把多模態玩出花。Kimi K2.5趕在2月初發佈,是春節檔的“早鳥”。它的亮點是原生多模態架構和Agent叢集——模型可以自主建立多個分身智能體,按需組成團隊平行工作 。大規模搜尋場景下,效率碾壓單Agent。同時上線的Kimi Code已整合VSCode、Cursor,開發者可以直接丟進一張UI設計圖,讓AI照著寫程式碼 。這是目前國內把“視覺理解→程式設計執行”鏈路跑得最順的產品。DeepSeek:V4還在憋,但長上下文已封頂。整個春節檔,DeepSeek沒有任何官方發佈,卻在使用者端“被更新”了。網友們發現,DeepSeek的回覆風格變了:上下文窗口從128K飆升至1M,知識庫更新至2025年5月 。這依然是那家倔強的公司——不做多模態,不追風口,把文字推理和長程式碼理解死磕到極致。1M上下文意味著什麼?你可以把《三體》全集、或者一個中大型公司的完整程式碼倉庫一次性喂給它。這不僅是技術領先,更是對Agent場景的戰略預判:真正的複雜任務,從來不是靠幾輪對話完成的。據爆料,DeepSeek V4的程式設計能力內部測試已超越Claude 。它遲遲不發,要麼是在攻克更難的關卡,要麼是在等一個“壓軸登場”的時機。2026年,沒人再提“通用”回顧這二十多天的密集出牌,一個清晰的圖景浮現出來:大模型行業已經告別“大一統”的幻想。字節押注視訊生成,賭的是AIGC工業化;智譜All in Agent工程,賭的是程式設計師生產力重構;MiniMax死磕推理成本,賭的是Agent規模化落地;Kimi走通多模態原生+端側,賭的是開發者的手邊工具;DeepSeek固守長文字高地,賭的是複雜推理的不可替代性;阿里即將亮劍原生VLM,賭的是多模態基座的開源生態;百度織網入口,賭的是場景和資料;騰訊深潛上下文學習,賭的是下一階段的定義權。沒有那一家是“全面領先”,但每一家都在自己的賽道上跑到了極致。這其實是健康的訊號。當一個行業從“所有人都想造出同一個神”轉向“各造各的神”,說明它正在走向成熟。最後,如果你問我,我的答案是:我pick字節Seedance 2.0。不是因為它的技術參數最漂亮,也不是因為它引發的股票漲停潮最猛烈。而是因為它讓圈外人又一次真正感知到了AI的衝擊。一位從業者看完AI生成的15秒短片後說“《流浪地球3》的預算可能要砍了”,這正是技術跨越鴻溝的時刻。當然,這只是春節檔的開幕戰。Qwen3.5還未正式亮相,DeepSeek V4這頭“房間裡的大象”還在踱步,百度的O計畫仍是黑盒,騰訊的上下文學習革命才剛剛寫在紙上。但有一點已經確定:2026年,單純靠“會聊天”已經拿不到牌桌入場券了。煙花散去,留在場上的只能是那些能真正捲入工作流、嵌入生產線、重構成本結構的狠角色。這一票,我投給那些讓對手感到脊背發涼的玩家。 (TechWeb)
整整21個月,豆包大模型正式進入2.0時代!
在Seedance 2.0和Seedream 5.0 Lite,一波接一波爆火之後,豆包把完全體拿出來了——豆包大模型2.0。這是時隔21個月以來的最大版本的更新。像Seedance 2.0已經成為全民玩轉的AI,我們也試著做了一個視訊:短短5秒鐘,效果確實是足夠逼真。也難怪老外也開始研究怎麼註冊中國手機號來體驗了……再如Seedream 5.0 Lite,首次支援聯網檢索,生成的圖片也達到了商業化的水平:而就在今天,在視覺模型火爆之後,豆包終於把那個最核心的大腦拿出來了——豆包大模型2.0。整體來看,這次豆包大模型2.0在多模態理解、企業級Agent、推理和程式碼能力上都有了不少的提升:更強多模態理解:在多模態感知、高精度文字提取、圖表理解、空間理解、運動理解、視覺知識和推理、長視訊理解等方面表現出色。企業級Agent能力:模型能更好支援對技能(Skills)的理解和應用,Function Call 、多輪指令遵循、搜尋和工具呼叫能力顯著增強,格式輸出更穩定,支援靈活的上下文管理,更好地支援企業級複雜、長程任務,在資料分析和客服Agent等企業場景中表現出色。數學和程式碼推理能力:模型具備更強推理能力,支援思考長度可調節,且各思考長度下,Tokens效率都有大幅提升。在ICPC、IMO、CMO測試中均獲得金牌成績。更直觀的提升,體現在榜單測評中。例如在MathVista、MathVision、MathKangaroo、MathCanvas等數學推理基準上達到業界最優水平。同時,在 LogicVista、VisuLogic等視覺解謎與邏輯推理基準上,Seed2.0 Pro得分較Seed1.8顯著提升。並且在VLMsAreBiased、VLMsAreBlind、BabyVision等基準中,豆包大模型2.0取得了業界最高分!那麼接下來,還是老規矩,一波實測,走起~零幀手搓《我的世界》首先,我們就要測試最近各家都在主推的程式碼能力。在字節旗下的AI程式設計軟體TRAE中,我們目前就能體驗豆包大模型2.0的能力:我們就先以3D模仿求解器的案例,來小試牛刀一下:你幫我寫一個能解決魔方的群論演算法,然後用前端頁面演示下吧,要求美觀,本地當前資料夾下的所有檔案都可以直接編輯刪除和覆蓋。不難看出,豆包大模型2.0很好的理解了基於群論的智能演算法,並且在視覺和互動上也是比較驚豔。面對複雜的物理模擬,也是不在話下:接下來,我們來一個更加複雜且長任務的測試——3D版大富翁遊戲。請欣賞效果:可以看到,豆包大模型2.0依舊是穩穩拿捏。難度再上一層樓,這次我們直接做一個《我的世界》:同樣也是稍等幾分鐘,高仿版《我的世界》就誕生了:並且豆包官方也展示了通過豆包大模型2.0和TRAE生成的“AI春節廟會”:當然,像模擬可互動的蘋果電腦系統這種任務,也是非常輕鬆實現:除了程式設計之外,像複雜的圖解問題,豆包大模型2.0也是可以輕鬆拿捏。例如我們直接丟給它這樣一張圖:豆包大模型2.0在接收到問題之後,立即給出了正確答案:類似的,複雜的數學問題也是不在話下。由此可見,豆包大模型2.0在推理、程式設計和數學問題上,都有明顯的性能提升。為什麼現在才是2.0的節點?實測下來,最直觀的感受是:豆包大模型2.0變穩了。它不再滿足於陪你聊天,而是試圖幫你寫完一個項目、算出一個難題、畫出一張商用級海報。這也引出了一個問題:為什麼現在才是2.0的節點?過去一年,大模型行業陷入了卷參數和卷價格的混戰。但字節跳動似乎一直在憋大招。這個時間點發佈2.0,或許是因為在資料質量、訓練效率,以及應用效果都突破了一個新的臨界點。特別是在Agent場景下。真正的企業級應用,不是靠聊天解決的,而是靠行動。豆包 2.0 展現出的工具呼叫能力和長程任務規劃能力,顯然是衝著ToB和生產力工具去的。性價比是否更具優勢?答案是肯定的。在測試中我們發現,雖然能力變強了,但推理速度並沒有明顯的延遲。據技術報告顯示,Seed-2.0系列(包括 Pro、Lite、Mini)在同等性能下,通過架構最佳化,大幅提升了Tokens效率。這意味著,企業用它來做客服、做資料分析、寫程式碼,成本會更低。現在,豆包大模型2.0已經全面上線,感興趣的小夥伴可以去試試嘍~ (量子位)
Seedance2.0震驚好萊塢: 外網爆火的10大頂級提示詞, 直接出大片
這次真的長臉!在外網Seedance2.0有多火呢?好萊塢完蛋了!!!什麼時候美國能用?交付了迪斯尼質量!真的像是爽劇一樣!前兩天還嘲笑中國AI只會搞奶茶紅包大戰,字節馬上就搞出了世界級SOTA視訊模型,話不多說,火爆外網的十大提示詞,送給大家1 霸總短劇https://x.com/i/status/2020687040853975223800贊,12萬閱讀🧙【風格】國產熱門短劇風(Mini-Drama Style),極致快剪節奏,高顏值濾鏡,情緒爆發,雨夜唯美虐心。 【時長】15秒 【角色】深情霸總男主(黑風衣,濕髮,眼眶通紅)VS 倔強破碎感女主(白裙,滿臉淚痕)。 [00:00-00:05] 鏡頭1:衝突快切組合(Rapid Cuts)。 暴雨街頭。女主決絕轉身要走(背影)。男主衝上來一把拉住她的手腕(特寫)。女主猛然回頭,眼神是愛恨交織的痛苦。 【對白口型指導】女主哭喊:“放手!我們結束了!” [00:05-00:10] 鏡頭2:真相爆發(Intense Close-ups)。 男主死不放手,雨水在兩人臉上橫流。男主急切地從懷裡掏出一枚戒指(或一份報告),舉到她眼前,手指顫抖。 【對白口型指導】男主嘶吼:“你看清楚!我從來沒有騙過你!” [00:10-00:15] 鏡頭3:情感決堤(Climax)。 女主看清手中之物的瞬間,瞳孔地震(極近特寫),摀住嘴巴,防線崩潰。下一秒,男主猛地將她拉入懷中死死抱住,彷彿要揉進骨子裡。鏡頭快速旋轉環繞拍攝相擁的兩人。 【對白口型指導】女主埋頭痛哭(無聲/嗚咽)。我改進後做的同款,已經不能做真人了🧙【風格】2D國漫動畫風格,極致快剪節奏,高顏值濾鏡,情緒爆發,雨夜唯美虐心。 【時長】15秒 【角色】深情霸總男主(五官立體的中國男子,黑風衣,濕髮)VS 倔強破碎感女主(甜美型中國美女,白裙,滿臉淚痕)。 [00:00-00:05] 鏡頭1:衝突快切組合(Rapid Cuts)。 暴雨街頭。女主決絕轉身要走(背影)。男主衝上來一把拉住她的手腕(特寫)。女主猛然回頭,眼神是愛恨交織的痛苦。 【對白口型指導】女主哭喊:“放手!我們結束了!” [00:05-00:10] 鏡頭2:真相爆發(Intense Close-ups)。 男主死不放手,雨水在兩人臉上橫流。男主急切地從懷裡掏出一枚戒指(或一份報告),舉到她眼前,手指顫抖。 【對白口型指導】男主嘶吼:“你看清楚!我從來沒有騙過你!” [00:10-00:15] 鏡頭3:情感決堤(Climax)。 女主看清手中之物的瞬間,瞳孔地震(極近特寫),摀住嘴巴,防線崩潰。下一秒,男主猛地將她拉入懷中死死抱住,彷彿要揉進骨子裡。鏡頭快速旋轉環繞拍攝相擁的兩人。 【對白口型指導】女主埋頭痛哭(無聲/嗚咽)。2 哪吒打敖丙https://x.com/Gorden_Sun/status/2020484410995319129 28w閱讀,100贊🧙第一段3D動畫電影大片,場景是圖片1的陰雲密佈的場景。 1. 激戰(冰火交鋒): 鏡頭急速推近, 圖片1中的幼年哪吒腳踏風火輪(此時若隱若現),手持火尖槍,化作一道赤紅的流火,在這個陰鬱的天空中撕開一道裂口。他對面,圖片2中的敖丙身姿修長,白衣勝雪,神情冷峻,雙手揮舞著散發極寒之氣的海雲雙錘。 哪吒一聲怒吼,長槍如龍,槍尖裹挾著熊熊烈焰直刺敖丙面門。敖丙身形優雅地迴旋,雙錘對撞,瞬間凝結出一面巨大的冰盾。“砰!”的一聲巨響,紅色的火焰與藍色的冰渣在空中炸裂,形成強烈的冷暖色調視覺衝擊。火星四濺,冰晶飛舞,鏡頭在兩人的武器碰撞點進行特寫,高溫蒸汽瞬間瀰漫。 2. 敗退(遭到重創): 幾個回合的快節奏攻防後,敖丙抓住破綻,眼中藍光一閃,周身爆發出數條冰龍虛影,雙錘帶著萬鈞之勢,裹挾著刺骨的寒霜,重重地砸向哪吒的肩膀。 哪吒招架不住,火尖槍被震得嗡嗡作響,整個人如同一顆隕石般被從半空中擊落。“轟隆”一聲,哪吒重重地砸向下方的一塊巨大的懸浮岩石(或地面),碎石崩飛,煙塵四起。敖丙懸停在高空,居高臨下,身後的冰霜之氣將周圍的烏雲都染成了幽藍色。3. 覺醒(火焰重生): 廢墟之中,哪吒艱難地撐起身體,嘴角掛著血跡,眼神中卻燃燒著不屈的狂怒。他看了一眼手中的火尖槍,猛地將其扔向一旁,兵器落地的清脆聲在寂靜中格外刺耳。 緊接著,一股恐怖的熱浪以他為中心向四周爆發。 4. 蛻變(少年降臨): 火焰的中心,那個幼小的身影在烈火的淬煉中發生變化。鏡頭透過扭曲的熱浪,隱約看到骨骼生長的輪廓。 隨著火焰猛然收縮而後炸開, 圖片3 中的少年哪吒赫然顯現。他身形挺拔,肌肉線條分明,原本的丸子頭變成了狂野的衝天刺蝟頭,額間的火紋熠熠生輝。他赤著上身,僅穿著那件殘破的紅色坎肩,腰間繫著金黃色的綢帶,雙手赤手空拳,不再使用武器。身高明顯變高,成為了少年哪吒。【結尾畫面】: 少年哪吒赤足踩在岩石上,他緩緩抬頭,眼神更加銳利、冷酷且充滿力量。第二段圖1的少年哪吒與圖2的敖丙戰鬥,場景為圖片3的陰雲密佈的天空。 連續動作: 哪吒身法極快,在空中拉出一連串火紅的殘影。他側身閃過左錘的重擊,一記帶著火焰的上勾拳重重轟在右錘的側面,巨大的力量震得敖丙虎口發麻,原本完美的防禦架勢出現了一絲裂痕。哪吒快速連續使用拳頭攻擊,每一拳都像是燒紅的烙鐵,砸在敖丙的錘頭上。 敖丙雙錘猛擊互撞,爆發出一圈極寒衝擊波,試圖凍結哪吒的行動。哪吒感應到危險,雙腳猛蹬敖丙的錘面,借力向後極速倒飛。哪吒在空中向後滑行數百米,雙腳在虛空中劃出兩道長長的火焰軌跡,如同彗星拖尾。他在空中瀟灑地向後一個空翻,穩穩懸停,與敖丙遙遙相對。此時,他身上的紅色坎肩在狂風中獵獵作響,頭髮如火焰般豎立。 鏡頭切到哪吒身上,哪吒低著頭,聲音低沉而沙啞,彷彿來自地獄的火種。 突然,他猛地昂起頭,額間的火紋爆發出耀眼的金光。 特效爆發: 哪吒發出一聲長嘯,原本包裹在他周身的火焰瞬間變得狂暴,彷彿有生命一般在他背部瘋狂匯聚。 變形過程: 伴隨著骨骼生長的脆響和火焰的噴湧,哪吒的肩胛骨後方,烈焰凝聚成實修的肌肉線條。四條全新的手臂從背後的火焰圖騰中破體而出!最終變成了圖片4的六隻手臂的形象。 這四條新生的手臂同樣赤裸著肌肉,皮膚下流淌著岩漿般的紋路,手掌緊握,指尖纏繞著不滅的三昧真火。鏡頭緩緩推進,定格在圖片4變身完成的少年哪吒身上。 此時的他,擁有六條強壯的手臂。頭頂: 頭髮完全變成了燃燒的烈焰,衝天而起,髮梢跳動著火星。 身軀: 六隻手掌張開又握緊,每一隻手裡都抓著一團躁動的火球,隨時準備爆發。第三段圖片1為首幀。少年哪吒在虛空中盤起雙腿,呈現出打坐冥想的姿態,他的六條手臂的手掌心朝天。少年哪吒的身後首先出現了一輪金色的光輪,無數古老的梵文咒語在光輪中若隱若現,飛速旋轉,發出低沉的共鳴聲。緊接著,虛空中燃起一簇簇深紅色的火苗,它們迅速匯聚到哪吒身後。伴隨著一聲清脆的“叮”聲(如同水滴入海),一朵巨大的紅蓮業火幻象開始顯現。蓮花並不是直接出現的,而是由內向外,花瓣一片接一片地緩緩舒展、綻放,層層綻放。每一片花瓣都由高密度的烈焰構成,邊緣勾勒著金色的流光,花瓣脈絡中流淌著滾燙的岩漿。最終,巨大的紅蓮完全盛開,佔據了半個螢幕,漂浮在少年哪吒的身後。如圖片2的效果鏡頭切換至敖丙,敖丙漂浮在空中,深吸一口氣,眼神變得決絕而冷冽。他雙手緊握海雲雙錘,雙臂猛然發力,將雙錘在身體兩側極速揮舞,帶起兩道呼嘯的寒風龍卷。隨後,他將雙錘在胸前重重一擊,發出一聲震碎耳膜的脆響。隨著那一擊,以敖丙為中心,空氣中的水分瞬間凝結成無數尖銳的冰棱,懸浮在他四周。原本陰暗的背景被深邃的幽藍色光芒取代。敖丙身後的寒氣瘋狂湧動,匯聚成一條龐大無比的冰封巨龍(如參考圖2)。這條龍並非虛影,而是由萬年玄冰構築實體,通體晶瑩剔透,每一片龍鱗都反射著寒光,清晰可見。巨龍的頭顱巨大而威嚴,長鬚由凍氣凝結而成,在風中飄蕩。它盤旋在敖丙身後,巨大的身軀將敖丙環繞保護。龍眼閃爍著幽藍色的魂火,張開巨口,噴吐出肉眼可見的白色凍氣,彷彿能凍結時間。敖丙身穿白衣,在巨龍的襯托下顯得渺小卻極其強大。第四段圖片1里的哪吒眉心火紋一亮,懸浮在他身後的巨大紅蓮業火帶著沉重的轟鳴聲向上飄浮,最終懸停在哪吒背後、頭頂上方。紅蓮在上升過程中開始加速旋轉,花瓣邊緣的金色流光在空中劃出一道道絢爛的軌跡,無數燃燒的梵文符咒如同護衛般環繞在蓮座周圍,空氣被高溫炙烤得極度扭曲。鏡頭極速拉遠,給出一個史詩級的廣角全景畫面。畫面左側: 少年哪吒寶相莊嚴地懸浮於空,頭頂是那朵遮天蔽日的旋轉紅蓮,垂下的紅色混天綾在風中狂亂舞動,將半邊天際染成血紅。畫面右側: 敖丙身姿挺拔,那一頭巨大的冰封巨龍盤踞在他身後及頭頂,龍首高昂,巨大的龍鬚隨風飄擺,散發的凍氣將另半邊天空凍結成深藍。參考圖片2的畫面。哪吒六隻手掌同時向前一推,頭頂的紅蓮業火帶著毀滅一切的氣勢向畫面中央轟去,與此同時,敖丙雙錘揮下,身後的冰封巨龍發出一聲震天動地的龍吟,蜿蜒著龐大的身軀,裹挾著漫天冰棱,迎面撞向紅蓮。一紅一藍兩股巨大的能量體在空中劃出兩道耀眼的殘影,直奔螢幕正中央的交匯點。極近特寫鏡頭,聚焦於紅蓮與龍頭接觸的那個“奇點”。時間彷彿在這一刻靜止。高速旋轉的紅蓮花瓣像電鋸一樣切入冰龍的頭顱。極高溫的烈火與極低溫的玄冰在微觀層面發生劇烈反應。冰龍頭部瞬間崩碎,炸裂成億萬顆細小的冰晶鑽石。每一顆冰晶在被融化前都折射著紅色的火光,畫面晶瑩剔透又充滿破壞力。紅蓮的火焰因為受到極寒壓制,瞬間由赤紅轉為刺眼的白熾色。高溫瞬間氣化了冰塊,產生大量白色的高壓蒸汽,與周圍的黑煙混合,形成一朵巨大的蘑菇雲。“轟——!!!” 一道肉眼可見的環形衝擊波以撞擊點為圓心向四周擴散。紅色的火浪和藍色的寒潮相互糾纏、吞噬,形成了一個紅藍雙色的太極漩渦,瞬間填滿了整個螢幕,刺眼的光芒幾乎要穿透觀眾的視網膜。3 超現實主義巨物恐懼prompthttps://x.com/johnAGI168/status/20207278532816282767w閱讀,500贊提示詞🧙【風格】超現實主義(Surrealism),巨物恐懼症(Megalophobia),史詩級視覺奇觀,好萊塢特效質感,光影渲染極其真實。【時長】15秒【場景】晴朗的城市上空,或者一片開闊的麥田。[00:00-00:05] 鏡頭1:平靜的假象(The Calm)。畫面是一片萬里無雲的絕美藍天,陽光明媚,鳥兒飛過。鏡頭慢慢向上仰拍,給人一種歲月靜好的感覺。關鍵細節:突然,天空中出現了一道巨大的、銀色的金屬光澤——是一條貫穿天際的**“拉鏈”**。[00:05-00:10] 鏡頭2:拉鏈拉開(The Unzipping)。一隻巨大的、半透明的上帝之手,捏住了拉鏈頭,伴隨著巨大的轟鳴聲(音效感),緩緩拉開了藍天。動作:隨著拉鏈拉開,“藍天”像布料一樣褶皺、垂落。視覺奇觀:拉鏈後面露出的不是宇宙,而是一個充滿了霓虹燈、飛行汽車和巨大機械結構的賽博朋克未來世界(或者一個巨大的機械眼球正在注視著我們)。[00:10-00:15] 鏡頭3:兩個世界的對視(The Revelation)。藍天只剩下一角掛在天上。原來我們生活的世界只是一個被罩住的“生態箱”。結尾:鏡頭快速拉遠,發現我們的整個世界(城市/麥田)其實只是巨人桌子上的一個玻璃微縮景觀球。巨人正湊近臉在觀察我們。4 史詩級冰火對決【風格】史詩級災難動作片(Epic Disaster Action),真人特效(Live-Action VFX),冰火兩重天的極端環境,顆粒感戰損畫質,高速攝影,物理破壞真實感。【時長】15秒【場景】一個氣候被永久改變的島嶼中心。左側是噴發的火山和流淌的熔岩河;右側是萬年冰川和呼嘯的暴風雪。中間是蒸汽瀰漫的死亡地帶。【角色(真人化描述)】熔岩大將(The Magma Admiral):身穿燒焦的暗紅色西裝,戴著棒球帽,面容冷峻堅毅,半邊身體元素化為滾燙岩漿。寒冰大將(The Ice General):身穿帶冰霜的白色馬甲,身材高大慵懶,呼出的氣都結成了冰渣。[00:00-00:05] 鏡頭1:元素覺醒與環境重塑(Establishing the Power)。廣角/環繞鏡頭。兩人對峙。【熔岩方】熔岩大將腳下的大地瞬間融化成沸騰的紅色岩漿池,冒出滾滾黑煙,他抬手間,身後一座小火山噴發。【寒冰方】寒冰大將單手插兜,腳下瞬間蔓延出極速凍結的冰層,將湧來的岩漿凍結成黑色的黑曜石,空氣中瞬間佈滿尖銳的冰棱。[00:05-00:10] 鏡頭2:冰火近身格鬥(Intense CQC Combat)。極速快剪(Rapid Action Cuts)。兩人展開激烈的近身肉搏。【動作設計】寒冰大將手中瞬間凝聚出一把巨大的寒冰軍刀(Ice Saber),高速揮砍。熔岩大將用元素化的岩漿鐵拳(Magma Fist)硬格擋。【物理反饋】冰刀砍在岩漿拳上,瞬間汽化成大量高壓蒸汽,同時伴隨著冰塊碎裂飛濺和岩漿滴落的滋滋聲。每一次碰撞都引發小範圍的蒸汽爆炸。[00:10-00:15] 鏡頭3:宿命的絕招對轟(The Final Clash)。大遠景/震撼級破壞。兩人拉開距離,同時釋放大招。【特效奇觀】一條巨大的、咆哮的岩漿冥狗(熔岩巨犬形態)衝向對方;對面則是一隻巨大的、由無數冰塊組成的極寒冰鳥(暴風雪形態)迎面撞上。【結尾】兩者在畫面中心相撞,紅色的極致高溫與藍白色的絕對零度避險。瞬間產生了一個連接天地的超級蒸汽蘑菇雲,巨大的衝擊波將地面的冰川和火山同時震碎。畫面在白茫茫的蒸汽和能量閃光中結束。5 水墨國風武俠【風格】新國風武俠(Neo-Chinese Wuxia),水墨流體粒子特效(Ink Fluid Simulation),超高速攝影(High-speed Cinematography),真人實拍與CG結合,黑白紅三色視覺衝擊,節奏極快。【時長】15秒【角色】黑衣墨客(Black Ink Warrior):動作剛猛,每一擊都如潑墨山水般沉重。紅衣刺客(Red Assassin):動作輕靈詭異,如硃砂點漆般銳利。【場景】一個純白的虛無空間,地面鋪滿宣紙。[00:00-00:05] 鏡頭1:靜極思動(The Awakening)。極靜到極動。畫面最初是一幅靜止的黑白水墨畫,兩個墨點對峙。突然,古琴聲炸裂。【動作】兩個墨點瞬間化為真人的殘影衝向對方。黑衣人一記重拳轟出,空氣中瞬間炸開一團濃重的黑色墨汁(代替煙塵),墨汁在空中凝固成剛勁的書法筆觸。紅衣人側身閃避,手中匕首劃出一道鮮豔的硃砂紅線。[00:05-00:10] 鏡頭2:狂草對決(Ink Combat Choreography)。超高速快剪(Rapid Cuts)。兩人展開令人眼花繚亂的近身格鬥(武術指導級動作)。【視覺奇觀】每一次肢體碰撞(拳腳相加),都不是肉體的聲音,而是墨汁飛濺的爆炸聲。黑衣人的掃堂腿帶起一片黑色的墨浪海嘯;紅衣人的騰空連環踢在空中留下紅色的殘影軌跡。地面上的宣紙被他們的步伐撕裂,墨跡暈染。[00:10-00:15] 鏡頭3:破壁一擊(Breaking the Dimension)。慢動作升格。兩人同時使出絕招對撞。黑色的墨龍拳與紅色的朱雀刃在空中死死抵住。【高能時刻】巨大的能量讓整個二維的水墨世界崩塌。鏡頭猛地拉遠,發現他們竟然打破了“次元壁”,從一幅掛在牆上被撕裂的水墨畫中“跌落”到了現實世界的木地板上,周圍環繞著尚未散去的墨韻和紙屑,兩人保持著最後的格鬥姿態定格喘息。6 海賊王真人風格【風格】現代玄幻動作片,好萊塢大片特效,高對比度冷暖光,4K超清,慢動作升格。【時長】15秒【場景】崩塌的古代要塞廢墟,濃煙滾滾。【角色】紅衣大將(Magma General):身穿紅色軍大衣,戴著棒球帽,表情冷酷,整條右臂化為流動的暗紅岩漿。火焰少年(Fire Youth):赤裸上身,戴著牛仔帽,肌肉線條流暢,右拳纏繞著旋轉的橙色烈焰。[00:00-00:05] 鏡頭1:熔岩具象化(The Magma Fist)。特寫。紅衣大將冷漠地抬起右手。他的整條手臂瞬間元素化,變成了粘稠、沉重、滴落著高亮熔岩的實體岩漿巨拳。【物理細節】滾燙的岩漿滴落在地面,發出“滋滋”聲,石頭被瞬間融化成紅色的液體。黑煙升騰。[00:05-00:10] 鏡頭2:烈焰充能(The Fire Spiral)。特寫/側拍。火焰少年嘴角上揚,眼神不屈。他猛地握緊右拳,一股狂暴的橙色螺旋火焰瞬間從手臂噴發而出,照亮了他滿是汗水的側臉。【物理細節】因為高溫,他周圍的空氣發生劇烈扭曲(Heat Haze),原本飄舞的衣角被熱浪定格。[00:10-00:15] 鏡頭3:宿命對轟(Elemental Clash)。全景/衝擊波。兩人同時衝向對方揮出重拳。沉重的暗紅岩漿拳與輕盈狂暴的烈火拳在畫面中心猛烈對撞。【安全特效】沒有血腥,只有純粹的元素爆炸。岩漿吞噬了部分火焰,炸出一個巨大的環形衝擊波(Shockwave),將地面的碎石和灰塵瞬間震飛,畫面在刺眼的紅橙色白光中結束。7 換裝https://x.com/aigclink/status/2020793710670467392 官方案例精選,實用性強海報中的女生在不停的換裝,服裝參考@圖片1@圖片2的樣式,手中提著@圖片3的包,視訊節奏參考@視訊8 猴子說方言買奶茶🧙@圖片1的猴子走向奶茶店櫃檯,鏡頭跟隨在他身後,一位@圖片2的比熊服務員正在吧檯處擦拭製作工具,猴子向服務員用四川口音點單:“幺妹兒,霸王別姬有得沒得?” 切鏡,特寫。 服務員放下手裡的活,怪異地看了猴子一眼後回答:“沒得,美式要不要得嘛” 切鏡,鏡頭給到猴子。9 羽絨服廣告🧙參考視訊的廣告創意,用提供的羽絨服圖片,並參考鵝絨圖片、天鵝圖片,搭配以下廣告詞“這是根鵝絨,這是暖天鵝,這是能穿的極地天鵝絨羽絨服,新年穿得暖,生活過得暖”,生成新的羽絨服廣告視訊10 萬能範本提示詞範本【風格】[電影風格/藝術風格,例如 Pixar 動畫 / 寫實真人 / 水墨風]【時長】[5-15秒 或 30秒]【參考】@image1[角色參考圖] @video1[動作/鏡頭參考視訊]【場景】[詳細環境描述]【角色】[人物外貌、服裝、表情、動作特徵][00:00-00:05][鏡頭描述 + 動作 + 特效 + 物理細節][00:05-00:10][下一鏡頭...][結尾][高潮/淡出效果]知識庫《Seedance2.0全指南》已經都把他們放進去了,也會更新更多神仙玩法,敬請期待 (刀哥聊AI)