科技大廠既眼紅AI視訊的好生意,沉重的算力消耗也讓人望而卻步。AI短劇帶來的極致成本優勢與工業化生產效率,引爆了資本熱情,也讓AI視訊賽道格局重構。4月初,一匹黑馬殺出:視訊生成模型HappyHorse-1.0在第三方測評平台Artificial Analysis登頂,文生視訊Elo得分1333、圖生視訊Elo得分1392,雙雙超越字節跳動Seedance 2.0與快手可靈,成為不容忽視的新變數。4月10日中午,阿里下場“認領”HappyHorse為“ATH事業群”旗下的AI創新事業部自研,API將在4月30日開放。此前,阿里並非視訊生成的核心玩家。但3月16日,阿里新成立以Token 為核心的“ATH事業群”後,提升多模態能力變成了拉高Token效率的抓手——而HappyHorse可視為這場戰略大轉向的重磅成果之一。不只阿里,科技巨頭正在視訊生成賽道集體壓境。憑藉Seedance系列的生成質量與成熟商業化,字節跳動已構築起顯著壁壘。據瞭解,火山引擎面向企業開放的Seedance API介面,有些機構得到的最低年消費門檻高達1000萬元。以高門檻開放API的底氣,來自市場的極度供不應求。《中國企業家》獲悉,在火山引擎近期的招商會上,許多城市與火山引擎和視訊生成業務洽談合作,有城市為此投入了數千萬、上億元資金,將算力支援作為招商引資的重要配套。另一巨頭騰訊也已下場。知情人士向《中國企業家》透露,騰訊挖走了Seedance開發團隊中的數名核心成員,計畫在5月推出混元視訊大模型新版本,與Seedance正面對壘。“5月的視訊模型賽道,將會格外熱鬧。”01 阿里認真了HappyHorse亮相之前,阿里雖有通義萬相視訊模型,但表現始終不溫不火。作為大模型生態的附屬功能,萬相此前在清晰度、運動連貫性、長視訊穩定性等核心指標上,與Seedance、快手可靈等有明顯差距,也未打通專屬商業化場景。這一次,阿里好像認真了。HappyHorse採用150億參數,將文字、視訊、音訊三種模態Token置於同一序列聯合建模,從底層解決了音畫不同步、語氣與表情不匹配等問題。“它的物理模擬更貼近真實環境。”一位測評人士告訴《中國企業家》。另外,HappyHorse原生支援七國語言唇形同步,詞錯誤率顯著降低。同時,它在成本與速度上表現優異:單張H100生成5秒1080p視訊約38秒,DMD-2蒸餾技術將去噪步驟壓縮到了8步。但HappyHorse的短板同樣突出。測評人士表示,在完成複雜動作與多人互動時,HappyHorse易出現肢體錯亂、軌跡不穩。相比於Seedance,HappyHorse更擅長鏡頭呈現,不擅長動作敘事。在應用方面,HappyHorse的API尚未開放,在內測中,其支援的時長僅為5~10秒,場景上限較低,更適合做短影片、廣告、AI漫劇素材,還難以支撐劇情長片。其本地部署也有門檻,需配備H100或A100顯示卡,消費級顯示卡無法運行。阿里突然在視訊模型戰場投入火力,意欲何為?相關人士表示,HappyHorse誕生於淘天未來生活實驗室,或許意味著阿里希望其能與電商場景碰撞融合。阿里擁有完整的商品、商家、交易與廣告生態,但商品視訊一直是中小商家的痛點:場景搭建、拍攝剪輯成本高,白底圖難以展現賣點。而AI視訊可批次生成多版本、多場景、多語言內容,大幅降低了創作門檻。更關鍵的是,阿里的商品詳情、使用者評價、搜尋行為、轉化資料、直播表現等全鏈路資訊,也可反向訓練電商專屬視訊能力,讓HappyHorse成長為懂電商、能帶貨的內容生產引擎。但這條商業閉環要跑通,除了技術攻堅,還必須先解決阿里的算力問題。接近阿里的人士向《中國企業家》透露,目前阿里內部GPU分配非常緊張。“此前,像月之暗面作為阿里雲大客戶,雖然與Qwen存在競爭,還是能獲得比較充足的算力。現在阿里要支援基模研發、電商、雲服務多條戰線,未來要重新考慮GPU的投入產出比了。”而視訊生成是算力消耗大戶,如果HappyHorse逐步開放推廣,算力需求更將指數級增長。這匹黑馬能跑多快、多遠,很大程度上取決於阿里能否破解算力這一核心瓶頸。02 Seedance的好生意被盯上了儘管挑戰重重,各大廠商仍爭相湧入AI視訊賽道,只因這是一門想像空間極強的生意。目前,紅果短劇等平台收一部劇的最高價格約2000元/分鐘,一部常規短劇的時長約120分鐘,價格約24萬元。而市場上AI短劇的外包製作報價已經低至400元一分鐘,甚至有團隊用自動化工具實現了一天800~1000分鐘的漫劇內容產出。巨大的成本優勢和生產效率,讓AI短劇成為資本追逐的熱點。有AI視訊製作公司負責人告訴《中國企業家》,短短半個月,就有好幾家資本來談收購、併購,目前給他們的估值已超5億元,但他們和合夥人都覺得,這個出價還不夠“美麗”。更有地方政府直接找上門來,希望直接獨家買斷公司的AI漫劇自動化生成工具。Agent技術的進展,也正讓一人公司(OPC)大量湧現。幾個擅長高效使用AI工具的員工,便能頂得上過去一個甚至幾個團隊的工作量。各地政府敏銳地捕捉到了這一趨勢,紛紛對AI視訊、AIGC、AI短劇推出算力補貼、內容獎勵、園區集聚等扶植政策,吸引OPC進入。2月27日,武漢東湖高新區發佈“微短劇八條”,對重大產業項目最高支援5000萬元,爆款短劇單部獎勵50萬元。3月10日,上海市徐匯區發佈《“AI+微短劇”產業扶持意見》,對頭部企業最高給予1000萬元發展支援,同時發放最高100萬元算力券、100萬元語料券,並為OPC減免工位費用。3月13日,深圳市施行新版微短劇扶持政策:AIGC微短劇單項目最高資助200萬元。需求的旺盛和政策扶植,讓字節成為最早嘗到甜頭的公司。據《中國企業家》瞭解,雖然火山引擎向大型影視公司、內容製作公司、特定機構等開放的Seedance API介面“白名單”,有些機構被要求“最低消費”1000萬元/年,客戶仍趨之若鶩。接近火山引擎的人士告訴《中國企業家》,地方政府已將算力扶持作為招商引資的重要配套。一些AI短劇公司以“拼盤”接入API,不少算力費用由政府出面解決,以吸引相關公司落地。“有些城市採購了火山3000萬、7000萬,甚至過億的費用,用於內容扶植。當然其產出的內容也將對本地稅收和GDP產生極大拉動,這個帳很好算的。”清晰可見的變現路徑,疊加千億級的市場增量,點燃了巨頭間的競爭熱情。阿里、騰訊紛紛加碼AI視訊賽道,試圖從字節手中分走一杯羹。接近騰訊的相關人士向《中國企業家》透露,混元視訊模型其實早就有了,“只是效果很差”。近期,騰訊痛下決心,“開出高薪,差不多把Seedance開發組整個挖走了”。新款模型大約5月上線,有望和Seedance掰掰手腕,在短時間內實現技術突破。依託騰訊生態,混元新視訊模型還有望深度融入到視訊號的內容生產、分發、商業化全鏈路,放大騰訊的內容生產力與商業變現空間。03 視訊模型的高風險抉擇雖然所有人都看到了AI視訊在短劇、電商、廣告等領域打開的兆級商業潛力,但這條賽道的燒錢速度,也遠超想像。投入矛盾與定價分化,以及擺在巨頭面前的規模化盈利困境,正在考驗著各家的平衡智慧。雖然火山引擎的收入不菲,但其算力成本負擔依然沉重,收入中的絕大部分,都要用來採購GPU和支付電力成本。4月,火山引擎總裁譚待告訴《中國企業家》:“我們去年已經修改了商業計畫,把目標提升了不少。但目前我們還沒有做3年的盈利規劃,暫時沒有這方面的具體安排。”OpenAI關停Sora,更給狂熱的市場潑下一盆冷水。視訊生成的算力消耗,是大模型的上百倍甚至上千倍,即便全球最具財力的科技公司,也難以承受這種無底洞式投入。OpenAI雖宣稱,關停Sora是為了將資源轉向企業智能體、編碼工具與具身智能等方向,但業內普遍認為,成本與付費嚴重倒掛才是核心原因:Sora單條1080p的視訊生成成本約0.5~1美元,而使用者平均付費意願不足0.1美元,根本無法支撐持續營運。更深層的挑戰,還來自於科技大廠技術路線的高風險抉擇。業內人士向《中國企業家》指出:多模態任務過度消耗算力,在Token用量已經暴漲的情況下,廠商有再多算力依舊不夠燒,要把算力留給誰,就成了關鍵問題。由於忌憚視訊的無底洞式算力投入,Google始終不敢大規模開放API,也未推出獨立的視訊生成C端應用。“去年Google的多模態路線備受推崇,但今年便在Agent浪潮下被Anthropic趕超,現在只能說勉強留在牌桌上。大模型的核心技術路線,往往需要提前一兩年佈局,效果卻要滯後顯現。有時候真的像玄學。”行業成本與收入失衡,近期利益和遠期發展,迫使所有玩家重新審視視訊模型的商業模式與定價邏輯,這也直接催生了行業內的定價策略分化。摩根大通曾判斷:頭部領先模型可以維持溢價,追趕者則不得不通過降價搶佔市場份額。Sora停服後,字節率先選擇漲價。4月8日,即夢宣佈:基礎、標準、高級會員的月度積分分別從1080、4000、15000下調至725、2210、6160,積分縮水近六成,相當於變相漲價。相比之下,Google和快手則選擇用降價換市場:Google在3月底放出的Veo 3.1 Lite版本,將720p視訊生成價格壓至0.05美元/秒。可靈緊隨其後,推出會員限時8折優惠,部分圖片生成功能甚至完全免費。定價的兩極分化,本質上是競爭烈度的直接體現。長期來看,平台、API、廣告、電商都只是外層變數,決定勝負的關鍵因素仍然是:強化模型本身的同時,誰能在效果和成本之間找到最佳平衡點,誰能結合自身生態,找到不可替代的落地場景。 (中國企業家雜誌)