#Vidu
中國AI又贏麻了!Vidu Q3榜單殺到中國第一,AI漫劇短劇狂喜:16秒聲畫直出,效率起飛!
最近的AI視訊圈子真是越來越卷的,但是不知道大家有沒有跟我一樣的感覺:雖然工具在不斷的快速迭代,但是要做個精品視訊,其實還是很不科學的。為什麼這麼說呢?傳統AI視訊生成的痛點太明顯了:多個分鏡間的銜接不自然容易出現人物和場景不一致後期配音太麻煩:配音、配樂、配音效、對口型生成的視訊普遍還是 5-10 秒的小片段一個能拿得出手的精品視訊,背後是創作者花大量時間和精力,反覆抽卡、修改、磨出來的。最近,行者發現Vidu 升級了 Q3 視訊模型,可以支援最高 16S 的音視訊 聲畫同步同出高畫質直出,對創作效率的提升是實打實的。大家先看下行者生成的這個視訊:FVP視角,蜜蜂視角,鏡頭無限穿梭。更厲害的是,最新國際權威AI評測榜單Artificial Analysis剛放榜,Vidu Q3直接衝到中國第一、全球第二!硬剛馬斯克的xAI Grok,還把Runway Gen-4.5、Google Veo3.1、OpenAI Sora 2全都甩在身後。Vidu這是用實力告訴全世界:中國速度,真的來了!視訊生成下半場,我們已經開始領跑啦.一、Vidu Q3介紹先來說下Vidu Q3這次升級的內容。1.全球首個16秒音視訊直出: 這絕對是王炸。以前的視訊基本都是8秒、10秒,頂多算個鏡頭,而16秒,已經是一個 有劇本、有分鏡、有穩定角色、有統一美術風格 的,真正的作品。更關鍵的是,聲畫同步,高畫質直出。你輸入的台詞,Q3能直接生成帶配音、音效、背景音樂的視訊。2.鏡頭控制,自由切換: Q3的運鏡能力也進化了,它能根據你的描述,自動進行鏡頭切換,從跟拍切到特寫,從全景拉到俯瞰,讓視覺呈現更生動,敘事感更強。你不再只是一個“抽卡”的人,更像一個“導演”。3.支援文字渲染,多國語言: 這個功能很有意思,可以在視訊裡精準地渲染出中、英、日三種文字。讓文字在視訊裡演戲,對於做一些特效、片頭或者特殊視覺效果的視訊來說,非常實用。大家還記得前段時間很火的花瓣消失特效,我用Q3復刻了一下,並加上了文字渲染。圖生視訊提示詞:讓圖片中的場景人物動起來,她從頭到腳開始分解成啞光紅色的玫瑰花瓣,她的身形變成無數紅色花瓣消失在視訊中,向右吹走。銀光閃爍地拼出漂浮的字母:“消失的他”。在整個效果呈現過程中,背景保持完全不變。紅色的玫瑰花瓣應緩慢飄移,要確保分解過程看起來平滑且在規模和方向上保持一致,背景不得出現扭曲。人物分解成花瓣的過程非常平滑,最後花瓣匯聚成“消失的她”四個字,意境一下就出來了。這種視覺特效,以前得用AE做半天,現在一句話就搞定了。總的來說,這些亮點對創作效率是實打實的提升。它讓AI視訊創作,從【演技生成】進入到【視聽生成】的時代。二、實測場景每一次 AI 工具的進化,對我們創作效率的提升是非常大的。行者從影視創作、AI短劇、AI漫劇、電商廣告、數字人等幾個最主流的應用場景進行測試。1)影視創作首先是影視創作,看下Q3在電影質感和捕捉細膩情緒方面的能力。我選了兩個動態感和鏡頭感要求極高的場景。1.擂台格鬥在圖生視訊中,上傳我們的參考圖,選擇Q3 視訊模型,時長12S。圖生視訊提示詞:視訊從一個緊貼女鬥士側臉的特寫鏡頭開始,她的眼神銳利如刀,馬尾辮在空中劃出動態的弧線。隨著她身體的旋轉,鏡頭以一個流暢的弧形運鏡(arc shot)向外拉伸,同時時間流速急劇減慢進入子彈時間。當她修長的腿以完美的姿態踢中對手面部的瞬間,一圈由汗水和水珠組成的衝擊波以三維形態炸裂開來。每一顆水珠都在明亮的拳擊場頂光下折射出鑽石般的光芒,清晰可見。鏡頭持續環繞,最終定格在展示踢擊完整姿態和對手受擊後仰的經典構圖上,整個畫面充滿雕塑般的美感和極致的力量生成的視訊:這個子彈時間的效果太帥了!弧形運鏡、慢動作、汗水炸開的衝擊波,這些複雜的指令Q3都理解並執行了。整個畫面的力量感和美感都非常到位,完全是電影等級的動作鏡頭。2、香港雨後小巷午夜香港雨後小巷,身穿綠色旗袍的女子在斑駁的霓虹光影中行走。採用粗糙的 16mm 膠片質感,從手持跟拍切入慢動作面部特寫。空靈的女聲畫外音響起:是不是永遠都差一步?整體氛圍憂鬱、懷舊且充滿敘事感。從跟拍到面部特寫的切換很自然。那句“是不是永遠都差一步?的旁白,是直接生成的!無需再匯入剪映後期配音,視訊直出旁白,這效率提升可不是一點半點。2)AI 短劇創作分鏡驅動,一鍵成片。現在AI短劇仍然是視訊變現的一個主航道。傳統的做法是生成劇本和分鏡,文生圖,圖生視訊,再剪輯配音。製作上,我們可以用 Deepseek 或豆包生成劇本大綱。再生成連續的 9 宮格分鏡圖, 把分鏡圖給Vidu Q3。比如這個熱播動漫《仙逆》的二創視訊:我想看看它能不能根據分鏡圖驅動生成視訊並實現多鏡頭演繹。Q3的運鏡能力很強,它能根據分鏡圖,自動進行鏡頭切換,從中景到特寫,從全景拉到俯瞰,讓視覺呈現更生動,敘事感更強。3)AI 漫劇生成現在漫劇有多火,不用我多說了。經過半年發展,現在漫劇也在往精品化方向走了,對畫質和鏡頭感的要求越來越高。以往那種動態漫,已經滿足不了觀眾的胃口了。正好,拿我之前的漫劇分鏡圖生成一個酷炫的少年闖蕩江湖視訊:提示詞:根據上傳的 9 宮格漫畫圖片,生成動漫格鬥動畫視訊,不同的視角,動態感,畫面張力,特殊的透視這個效果讓我很驚喜。視訊裡有特寫、有全景、有仰拍、有俯瞰,鏡頭語言體現得非常好。還自動配上了一段非常中二但又很燃的旁白: 命運的齒輪開始轉動,少年將肩負起守護世界的重任。聲畫同步,一步到位,這對於漫劇創作者來說,簡直是神器。4)電商拍攝廣告降本增效,氛圍拉滿這兩年,電商領域的AI視訊應用也越來越廣。以前拍一組服裝大片,得飛倫敦實景拍攝——機票、酒店、場地、模特、攝影師,一套下來大幾萬。現在用Q3 流程簡單很多:1.建立一張 9 宮格的倫敦街拍時尚大片場景圖2.使用 Q3 生成”實拍視訊“圖生視訊提示詞:根據上傳的 6 宮格故事版,生成連續視訊,每一個網格一個鏡頭,動態感,電影質感成片效果非常棒,模特走在倫敦街頭,背景音是真實的街道環境音——汽車引擎聲、行人交談聲、咖啡館的輕音樂。Q3的音效渲染能力在這種場景下特別加分,氛圍感直接拉滿,讓廣告看起來更真實、更有質感。5)跨境電商跨境電商商家來說,Q3可以快速生成虛擬模特展示商品,成本極低。一條介紹視訊,可以一鍵生成多國語言版本,助力出海。日語版:ピンクの背景の前で、女性が両手で頬を支え、嬉しそうな表情を浮かべ、右手に化粧品の箱を載せている。女性のセリフ:「天然酸素で、肌にハリと活力を。內側から輝く美しさを引き出してくれるから、寢る前に使うのが好きなんです。」日語發音很標準,口型也對得上,人物表情和台詞的情緒很搭。對於需要快速本地化的跨境賣家來說,這個功能太香了。6)動漫二創據貓眼專業版資料,《瘋狂動物城 2》上映 61 天, 總票房破 44 億。基於它的二創視訊也獲得了不少流量。我簡單做了個尼克、朱迪在動物城的打鬥視訊,效果不錯。鬼殺隊蝴蝶忍我還測試了一個更複雜的場景,《鬼滅之刃》中蟲柱蝴蝶忍的特效大招,測試Q3在多個大幅度運動下能否始終保持穩定一致。圖生視訊提示詞:鏡頭始於劍尖的耀眼特寫,一道明亮的紫色光芒瞬間爆發。隨著女主角——鬼殺隊蟲柱蝴蝶忍向前疾衝,鏡頭迅速後拉並跟隨她的動作。她的劍身劃出一道巨大的紫色能量漩渦,無數發光的能量蝴蝶從中誕生,環繞著她飛舞。在滿月和紫藤花的背景下,她的蝴蝶羽織在高速移動中完全展開,色彩斑斕。鏡頭跟隨能量軌跡進行一次高速螺旋運鏡(spiral tracking shot),全方位展示這一招`蝶之舞·戲弄`的華麗與威力,最終在她突刺的終點定格,能量達到頂峰,照亮她那帶著一絲冷酷的微笑。這個長提示詞對AI的理解能力要求很高。Q3完成得相當不錯,螺旋運鏡、能量漩渦、發光蝴蝶這些核心元素都表現出來了,畫面非常華麗,大招有味。7)數字人現在很多博主開始用自己的AI形象出鏡了。我測試了用Q3生成虛擬IP演講和直播的場景。虛擬IP 演講提示詞:Mid shot, frontal perspective, fixed lens. Screen: Inside, a woman wearing a white camisole is wearing a microphone. Expression: Confident. Action: Open your hands and gesture while giving a speech. The woman speaks:英文台詞:seek out strong women, to be friends to align yourself with, follow your dreams,not your boyfriends, never doubt that you are valuable and powerful, and deserving of every chance and opportunity in the world。人物表情自信、自然,手部動作和演講內容匹配,鏡頭感很強。英文發音地道,口型精準。用這個來做知識付費課程或者分享視訊,完全沒問題。三、如何使用看了這麼多案例,是不是已經躍躍欲試了?行者跟大家介紹下使用方法。第一步:打開 Vidu 官網,點選左側菜單 "圖生視訊"或”文生視訊”傳送門:Vidu網站:https://www.vidu.cn/Vidu API:platform.vidu.cn第二步:按照下面的說明操作1.選擇 Vidu Q3 視訊模型:一定要選Q32.輸入視訊提示詞:包括動作、表情、運鏡,如果需要配音,就把台詞也寫進去。3.如果是圖生視訊,記得上傳一張高畫質的參考圖。4.選擇時長:根據你的場景和台詞長短,選擇8秒-16秒的時長。記住,不是非要16秒,合適的才是最好的。第三步: 點選創作按鈕,然後泡杯咖啡,等待你的大片誕生!四、評測體會生成了幾十個視訊之後,行者的真實體驗是:它不是在某個單點上有所突破,而是系統性地解決了AI視訊創作的核心痛點。首個支援16秒音視訊直出,聲畫同步,這讓AI視訊擁有了完整的視聽語言,創作效率指數級提升。從抽卡到導演: 人物一致性、動作連續性、口型精準性、畫面質感都做得非常好。加上多鏡頭自動切換和聲音驅動情緒,讓創作者可以真正地去“設計”和“導演”一個視訊,而不是靠運氣抽卡。為本土化而生: 支援中、英、日三種語言的文字渲染和配音,對國內創作者和出海業務都非常友好。可以說,Vidu Q3推動了AI視訊從【演技生成】到【視聽生成】時代的到來, 對於我們這些內容創作者來說,它是一個可以真正投入生產線的強大工具。五、寫在最後每次測評完一個強大的AI工具,我都會有些感慨。技術的進步,最終目的不是為了炫技,而是為瞭解放生產力,解放創造力。Vidu Q3的出現,把我們從繁瑣的視訊剪輯的工作中解放出來。我們不再需要為鏡頭不連貫而頭疼,不再需要為後期配音而熬夜。我們可以把更多的精力,投入到真正重要的事情上——講好一個故事,表達一種情緒,創造一個世界。AI的浪潮滾滾向前,它不會停下來等待任何人。作為創作者,我們唯一能做的,就是擁抱它,駕馭它,用它來武裝我們的思想,放大我們的創意。工具本身沒有價值,用工具創造出的作品才有。好了,今天就聊到這。我是行者,一個只講乾貨的AI實戰派。大家趕緊去試試Vidu Q3吧,期待看到你們的創想無界! (行者AI視訊)
OpenAI還在卷生圖,中國AI已一鍵成片!馬斯克免費代言
【新智元導讀】AI一鍵成片神器來臨!今天,Vidu Agent開啟全球內測,一句話復刻爆款,從廣告到創意短片,分鏡級可控一鍵短片。視訊AI,正在進入真正的「硬仗階段」。2025年,GoogleVeo 3、OpenAI Sora 2、Runway Gen-4.5,本土Vidu等競相角逐,激烈交鋒。模型能力不斷狂飆,參數和demo一個比一個驚豔。但所有模型都繞不開一個現實問題:AI是能生成視訊片段了,可真正「會拍片」的,還是少數。創意如何拆解?鏡頭怎麼設計?節奏、情緒、結構怎麼控?就在今天,全新Vidu Agent出世,讓所有人看到了一種更親民的創新路徑:一個專業視訊創作夥伴,打破了單純的片段式視訊素材拼接的舊範式。Vidu Agent,主打一個「一鍵成片」。無論是產品廣告、品牌TVC,還是動畫短片,創意短片,你只負責想像,AI負責把創意100%落地。這一新功能,主要帶來了以下三大核心亮點——一站式創意輸出: 專業級內容質感,想像力x分鏡級可控力x精細化編輯力高效率高性價比: 支援一鍵成片、範本復刻與批次創作,讓創作高效簡單多元化場景定製: 從靈感發散到結構化成片,覆蓋多語種、多場景創作需求從12月16日起,Vidu Agent 全球開放內測,使用者進入Vidu官網(Vidu.cn)申請Agent內測,並加入社群即可優先獲得體驗權限。使用邀請碼:XINZHIYUAN,立即註冊即送100積分提前拿到內測資格的小編,對Vidu Agent展開了一次最完整、最真實的實測體驗。一手實測進入Vidu首頁,點選左側欄中「AI Agent」,即刻體驗一鍵成片和視訊復刻。傳送門:https://www.vidu.cn/上手實操第一步,選定場景,上傳幾張產品圖+產品功能資訊+主題要求,Vidu Agent便開始自主工作了。張口提需求,AI一鍵成片傳統的電商視訊製作,堪稱一場「持久戰」。一條短短幾分鐘的廣告,素材成本獲取高昂,涉及攝影師、剪輯師等多工種協作,動輒數萬元成本。而且,製作周期長,迭代慢。尤其是,在大促前夕,傳統方式無法快速批次產出變體視訊,導致投放效果衰減快。更致命的是,創意與轉化的兩難:有趣的視訊,點贊率高但轉化差;但直擊賣點的「硬廣」,又容易被使用者劃走。一些平台的廣告投放資料顯示,前3秒未能有效吸引注意力,退出率特別高。產品功能展示不吸引人,觀眾難以產生「必須買」的衝動。此外,跨境電商還面臨多語種、本地化痛點:不同市場文化差異大,傳統拍攝難以覆蓋。早期AI視訊工具看似「解決」但往往陷入了「雞肋」的境地。除了多主體一致性差,質量不穩定,更常見的問題是「生成即結束」——AI只提供半成品,缺少爆點設計、情感敘事、行動號召(CTA)....而最新推出的Vidu Agent的「一鍵成片」,便直擊這些痛點,生成可直接投放的廣告成片。先來體驗一波「電商廣告」場景的視訊生成。上傳兩張圖片,一張是BOLON太陽鏡的產品圖,一張是奧黛麗赫本照片,看看Vidu Agent如何聯動起來。輸入一句話後,Vidu Agent直出一個分鏡指令碼。整個廣告片的劇情,它都幫你寫好了。若是對指令碼中的內容不滿意,可以自行編輯完善。然後對話方塊輸入「生成視訊」,由赫本代言的暴龍太陽鏡的廣告片就生成了!讓馬斯克穿上潮牌Supreme,展示上身效果,Vidu Agent一鍵搞定。無需複雜提示詞,全程只需「簡單式操作」即可完成——在Agent介面上傳所有圖片素材,來一句「圖片中的男子穿上潮牌紅衣」,分鏡指令碼視訊全由Vidu Agent瞬間完成。亦或是CHANEL蔚藍,想要一種美學效果的短片,還是得找專業的Vidu Agent。當香奈兒香水從綻放花苞當中閃現,那種神秘優雅感油然而生。它甚至自動完成「音畫同步」,一鍵生成配音。再比如,還是同款產品,這一次,選擇讓一位男模為這瓶香水代言。簡簡單單一句話——男模特拿著BLEU DE CHANEL香水瓶,Vidu Agent同樣直出高品質的視覺與創意短片。從人物形象、動作氣質,到香水瓶的外觀細節,鏡頭中的呈現方式,都能夠穩定一致,不會出現走樣的問題。或者直接告訴Agent想要的文案——令人驚豔的是,Vidu Agent瞬間就自動完成了,從畫面構思到鏡頭編排的全過程,一支拿來即用的品牌廣告片出爐了。一鍵成片,即刻上手是Vidu Agent的最大亮點之一。而且這並不是「一次性生成、不可修改」的成片,Vidu Agent具備「精細化編輯力」,不論是想調整文案、鏡頭節奏,還是修改動作、補充情緒表達,皆可隨時修改指令碼和視訊內容。最重要的是,Vidu Agent的「分鏡級可控力」,產品、人物、場景在15秒或者30秒視訊中能始終保持一致,生成直接可商用的廣告成片。再比如,為蘋果AirPods Max做一個創意宣傳片——戴著耳機在咖啡廳喝咖啡。令人驚喜的是,Vidu Agent巧妙地將Apple AirPods Max與尼克角色自然結合,生動詮釋出產品的高品質音效與其時尚的外觀設計。再比如,讓Vidu Agent生成一段耳機廣告,它能一鍵直出沉浸感十足的視覺場景,營造出所需氛圍與意境。不僅如此,Vidu Agent還可以支援多語言、多場景定製,從中文到多語種電商廣告,都能無縫適配,跨境電商只需簡單改一句話,就能生成不同語種的產品廣告了。在如下的宣傳視訊中,AI原生直出英文。以上這些廣告成片凸顯了Vidu Agent在電商廣告類場景中的應用效果——它不只是生成視訊,還最佳化了「爆點」。比如,產品特寫、指令碼情感過渡、產品使用場景、產品功能展示、使用者感受等,以提升廣告片的吸引力和使用者購買力。從簡單一句話+產品圖即可生成敘事完整的廣告大片,釋放從1到100的創意產能。此外,視訊復刻,是Vidu Agent另一大殺器。對於廣告電商從業者,營運的核心痛點在於,沒有專業編導和剪輯師,不懂平台演算法和使用者喜好,做視訊如同開盲盒,費了九牛二虎做的視訊,播放量卻是個位數,始終與爆款無緣。而「視訊復刻」功能就是廣告電商從業者上手立即可用的解決方案,上傳1分鐘以內爆款視訊以及產品參考圖,只描述想要的效果即可生成同樣高品質的爆款視訊。從此產出爆款不再是玄學,而是可以批次產出的可靠方法論。生成即成片,成片即投放像Vidu Agent這樣的AI視訊工具,正在深刻重塑內容生成的鏈條。對於2B領域的品牌主和行銷團隊來說,品牌廣告片、產品宣傳視訊的製作門檻被大幅降低。只需一個產品圖,加上幾句提示,就能立即把腦海中的畫面變為現實。實現生成即成片,成片即投放。這意味著,企業可以更快速地響應市場熱點,一些天馬行空,但拍攝成本極高的想法,如今也能借助Vidu Agent低成本實現。這種高效低成本的內容生產範式,使品牌行銷更加敏捷多變,廣告的定製化和本地化也更易實現。對於內容創作者來說,Vidu Agent也是流量變現的利器,一鍵復刻爆款視訊DNA,快速迭代視訊,適應平台演算法。Vidu Agent更深層次的價值在於,推動了「人機共創」的模式,讓AI成為協作的夥伴,放大人類的想像力。我們正處於一場內容生產大變革的前夜——可以預見的是,不久的將來,AI視訊生成將在廣告、電商、動漫、短片等眾多領域中,釋放出巨大潛能。最後再劃個重點,多模態領域Vidu首推Agent API ,Vidu在深入場景為企業提供可端到端交付結果的API,不再是單點原子能力。 (新智元)
中國國產視訊大模型Vidu 2.0上線,生成速度從30秒降至10秒
1月15日,由北京生數科技有限公司開發的中國國產視訊大模型Vidu 2.0上線,新版模型視訊生成速度跑進10秒,同時上線“錯峰模式”,支援閒時不限量生成。 據介紹,相比上一代,Vidu 2.0生成速度從30秒降至10秒,可有效提高廣告製作、影視動畫等專業內容創作效率。“以廣告商業片為例,傳統廣告製作流程繁雜,要經歷策劃、拍攝、後期剪輯、配音等環節,拍攝周期3-5天,加上後期製作需5-15天不等。在Vidu 2.0的理想狀態下,5分鐘可生成足夠1分鐘時長的視訊素材。”北京生數科技有限公司介紹,目前市面上的視訊模型採用訂閱制,除了不菲的訂閱費,每月還有積分限制。以Runway為例,產出一條素材花費25積分,每月625積分只能產出25條5秒左右的素材片段。若生成質量不高,仍需提升會員權益。Sora上線時也有海外使用者吐槽Sora價格“太貴”,生成一個5秒480P視訊成本為0.5美元,生成一段1080P視訊成本27元。 以720P視訊為例,Vidu 2.0收費標準為0.258元/秒,行業平均價格約0.6元/秒。目前市面上的視訊模型,10元平均能生成20秒視訊,而Vidu 2.0可生成38秒。採用Vidu 2.0生成1分鐘商業廣告片素材的成本在3-5元,考慮到素材有效率和後期剪輯配音等成本,1分鐘廣告片成本約為100元。如果按照Vidu2.0-4s-512模型計算,一次生成抵扣4積分,生成單秒視訊僅需4分錢。想進一步薅羊毛,還可以採用“錯峰模式”,使用者申請的任務將排隊等待流量低峰時執行,錯峰生成不扣使用者現有積分,支援生成素材無限量。 (澎湃新聞科技頻道)