#豆包
Google太狠了!要統治幾十億手機
在上月底舉辦的三星 Galaxy S26 發佈會上,三星和Google官宣將在 Galaxy S26 上首發基於 Gemini 的 Screen Automation(螢幕自動化)的能力。簡單來說,就是 Gemini 可以直接在手機螢幕上操作應用:打開 APP、識別螢幕、點選滑動、輸入文字……完成一連串 UI 操作,最後再把確認步驟交給使用者。圖片來源:三星沒錯,聽起來就和努比亞 M153(坊間俗稱「豆包手機」)上的豆包手機助手一樣,都是能替代人類在手機上進行「代理」操作,實現一句話點外賣、叫車、網購等需求。從海外媒體和論壇的反饋來看,這項功能終於在最近的測試版更新中上線了。不過我們也發現,Google並沒有全盤學習豆包手機助手的做法。雖然在技術實現路徑上同樣基於 GUI 的 Agent,但 Gemini 會基於 Android 開啟一個本地的虛擬沙盒,同時還主動限制了首批開放 Gemini「操作」的 APP,僅限少數一批應用。這種處理方式與國內廠商顯然不太一樣。甚至可以對比字節的豆包手機助手和阿里的千問,Google選擇了一條看起來既激進、又保守的路線。讓 AI 作業系統,而不是接管手機只看功能表面,Gemini 的「螢幕自動化」很容易被理解為另一種「豆包手機助手」。它同樣可以替你點外賣、叫車、下單,看起來也像一個能替人操作手機的 AI 代理。但如果把視角往下再挖一層,就會發現Google的方案其實完全不是一回事。豆包手機助手的邏輯很簡單:AI 讀取螢幕像素,像人眼一樣識別按鈕和輸入框,然後模擬手指點選。這種方式最大的優點就是通用——理論上任何 APP 都能操作,因為 AI 看到的只是螢幕。Gemini 明顯更「保守」。在實際執行任務時,Gemini 並不會直接在你的手機桌面上操作應用,而是會在 Android 系統裡開啟一個本地的虛擬沙盒窗口,讓 AI 在這個環境裡運行目標 APP。整個過程是可見的,使用者可以隨時終止任務,也可以在任何一步接管操作。圖片來源:Android Central簡單來說,Gemini「螢幕自動化」在產品定位上並不是一個可以隨意操控手機的萬能代理,而是一個被系統嚴格約束的自動化能力。Google還主動限制了第一批支援自動化的應用數量。目前開放的主要是打車、外賣和餐飲類服務,僅支援 Lyft、Uber、GrubHub、DoorDash、Uber Eats 和星巴克。也限制了「使用者範圍」。目前除了三星 Galaxy S26 系列已經可以在測試版中體驗,Google也僅規劃了 Pixel 10 系列支援,同時 Gemini 免費使用者每天僅有 5 次使用額度、Plus 會員 12 次、Pro 會員 20 次、Ultra 會員 120 次。這裡既有算力的考量,也在於使用者對 AI「亂動手機」的擔憂,尤其是在歐美市場。所以Google做了權限隔離、關鍵步驟必須要使用者手動操作、可以即時中斷 AI 操作等。但說到底,這只是過渡階段,Google的野心絕不止是讓 Gemini 僅僅能夠操作幾個特定 APP。圖片來源:Google很多人注意到 Gemini 的 GUI 操作能力,卻忽略了 Android 在系統層面正在發生的一件事情。就在三星 Galaxy S26 系列發佈會前夕,Google官方發佈了一篇博文名為《智能作業系統:讓 AI 代理對Android應用更有幫助》,並正式推出了一套新的應用能力介面體系——AppFunctions,允許 APP 主動向系統聲明自己可以被 AI 呼叫的功能。舉個例子,一個外賣 APP 可以告訴系統:支援搜尋餐廳、加入商品、提交訂單這些能力。當使用者對 Gemini 說「幫我點一份披薩」時,AI 並不一定需要逐步點選介面,它可以直接呼叫這些能力完成任務。如果把這套機制理解成 AI 的「函數呼叫」,事情就變得非常清晰了。在Google的設計裡,AI 代理其實有兩條路徑可以執行任務,一種是通過系統介面直接呼叫應用能力,另一種才是通過識別螢幕介面來進行 GUI 自動化。前者效率更高、穩定性更好;後者則是為了相容那些沒有適配新介面的應用。這意味著 Gemini 未來的裝置自動化能力,本質上並不是單純的「AI 看螢幕操作手機」,而是一種系統 API 與 GUI 混合的架構。AppFunctions 的應用示例,圖片來源:雷科技這個差異聽起來有點技術化,但它背後的產品邏輯其實非常簡單。相比豆包手機助手讓 AI 像人一樣使用手機,Google想做的事情是讓 AI 像系統一樣調度應用。當 AI 只是讀取螢幕像素時,它始終站在系統之外,只能模仿人的操作邏輯;但一旦 AI 被放進作業系統內部,它就可以直接協調應用之間的能力。從這個角度看,Gemini Screen Automation 的真正目標或許並不是點外賣、叫車這些場景。Google真正想建立的,是一種新的 Android 運行邏輯和生態。從這裡出發,我們也能在一定程度上明白,為什麼Google要和高通聯手推動「Android電腦」(非 Chromebook)。也解釋了為什麼 Gemini 的方案看起來既激進又保守。激進的地方在於,它試圖把 AI 變成 Android 的調度中心;保守在於,Google並不打算讓 AI 隨意接管整個手機,而是通過系統介面、權限控制和應用白名單,一步一步推進這種變化。相比「萬能 AI 代理」的想像,這種路線顯然更慢,也更克制。但對於一個擁有數十億裝置的作業系統來說,Google可能也沒有太多激進試錯的空間。豆包向左,千問向右,Gemini 走中間相比Google在手機上的做法,去年底亮相的豆包手機助手選擇了最簡單、也最激進的一種方式:讓 AI 像人一樣使用手機。在這套方案裡,AI 讀取螢幕像素,識別按鈕、輸入框和頁面結構,然後模擬手指點選完成操作。無論是點外賣、比價購物還是下單支付,AI 都是在手機介面上一步步執行。這種方式最大的優勢就是通用。因為 AI 看到的只是螢幕,它不需要任何 APP 的介面支援,也不需要平台授權。理論上,只要是人能操作的應用,AI 都可以完成同樣的操作。這也是為什麼很多人第一次體驗豆包手機助手時,會覺得它像一種「真正的 AI 手機」。圖片來源:豆包但問題也同樣明顯。當 AI 可以讀取整個螢幕並操作所有應用時,權限和安全問題就不可避免。同時,很多網際網路平台也並不歡迎這種自動化行為,因為它繞過了平台自身的入口和推薦體系。簡單說,豆包的路線技術上非常直接,但也天然會和應用生態產生摩擦。相比之下,阿里的千問走的是另一條思路,利用阿里自己的服務生態,讓 AI 成為一個調度中心。在這套體系裡,使用者的一句話會被拆解成具體任務,然後分別呼叫淘寶、支付寶、高德、飛豬等服務來完成。比如搜尋商品、下單支付、規劃路線,都是直接呼叫真實業務能力,而不是模擬介面操作。因為所有操作都發生在生態內部,AI 不需要繞過應用權限,也不會觸發平颱風控,又因為直接呼叫服務介面,執行效率往往也更高。圖片來源:雷科技但問題同樣清晰:生態邊界。千問能夠調度的服務,本質上還是阿里系應用。一旦使用者需求涉及其他平台,能力就會明顯下降。從這個角度看,豆包和千問其實代表了兩種非常典型的 AI 代理路徑。前者試圖讓 AI 接管手機本身,追求的是通用能力;後者則通過生態整合,讓 AI 接管服務流程,追求的是業務深度。而Google的 Gemini,某種程度上站在二者之間。在當前階段,Gemini 依然保留了 GUI 自動化能力,這意味著它在必要時也可以像豆包一樣,通過識別介面來操作應用。但與此同時,Google又在 Android 系統裡引入了新的應用能力介面,讓 APP 主動向系統開放可以被 AI 呼叫的功能。如果應用支援這些介面,Gemini 就不需要再逐步點選介面,而是可以直接呼叫應用能力完成任務。換句話說,Google的方案其實是一種混合路徑:系統介面優先,GUI 自動化兜底。從短期來看,這種方式顯然沒有豆包那樣驚豔,也不像千問那樣能夠迅速整合成熟生態。但它的好處在於,既避免了和應用生態的正面衝突,又保留了足夠的通用性。寫在最後把視角再拉遠一點,其實不難理解三種路線為什麼會分化成現在這樣。字節沒有作業系統,也沒有本地生活生態,所以只能讓 AI 直接接管手機;阿里擁有龐大的服務體系,於是讓 AI 去調度自己的業務網路;而Google真正擁有的,則是 Android 這個覆蓋數十億裝置的作業系統。因此,Gemini 的目標從一開始就不是做一個更強的手機助手,而是把 AI 變成系統的一部分,讓 Android 從「運行應用的平台」慢慢變成「調度應用的智能系統」。從這個角度看,Gemini 的克制並不是保守,而更像是一種平台級公司的必然選擇。 (雷科技)
阿里、抖音、京東徹底瘋狂,新的大戰一觸即發
槍響之後,沒有退路。去年還在卷大模型參數,今年巨頭們已經真刀真槍幹起了AI電商。年關前後,三家巨頭集體出手,京東AI購獨立App悄然上線,阿里千問接通電商生態、用30億紅包砸出1.2億筆AI訂單,抖音豆包開始內測購物功能。硝煙逐漸瀰漫,一場屬於AI時代的電商大戰,即將爆發。阿里、抖音、京東集體出手 AI電商時代正在到來AI時代,一場新的變革正在醞釀。近期,輝達創始人黃仁勳罕見地發表了一篇長文,他在文中直言:“人工智慧(AI)是當今塑造世界的最強大力量之一......它是如同電力和網際網路一樣不可或缺的基礎設施。”聯絡現實,AI確實已經以勢不可擋之勢席捲了全球各行各業。回望二十多年前,網際網路的興起與普及將購物與交易從線下帶到了線上,催生了電商這一劃時代的產物。而如今,當AI逐漸成為新一代基礎設施,也必然會對電商產生深遠的影響。事實上,行業巨頭已紛紛行動,一場“電商AI化”的轉型浪潮正悄然啟動。以抖音和阿里為代表的企業,已不約而同地將旗下AI助手全面接入各自的電商生態。最近,抖音豆包開始內測一項新功能——“購物下單”,即使用者在對話中能直接完成購物。當聊到相關需求時,AI會自動推送商品卡片,點選即可進入購買流程,無需跳出應用。圖源:豆包這是繼去年10月豆包接入抖音商城連結後,其AI購物體驗的又一大飛躍。據QuestMobile資料,今年央視春晚期間,豆包的日活躍使用者數(DAU)峰值達到1.45億,是國內AI原生應用當之無愧的斷層領先者。這也意味著,豆包手裡握著數量極其龐大的使用者。圖源:QuestMobile對此,抖音表示,抖音電商和豆包是相互獨立但有合作的關係,抖音電商沒有直接“接入”豆包(比如成為豆包的內建功能)。從這個角度來說,豆包嵌入抖音電商,本質還是利用AI提升站內轉化效率。在推薦購買的過程中,AI扮演的是加速成交的催化劑角色。相比抖音克制的態度,阿里千問的戰略則顯得更加激進。據多家媒體披露,去年底,阿里將千問APP、夸克及AI硬體等多個業務聚合,成立全新的千問C端事業群,由集團副總裁吳嘉親自掛帥,目標直指將千問打造為AI時代的“超級應用”與智能樞紐。今年1月,千問已邁出實質性一步,全面接入淘寶、支付寶、飛豬等阿里核心生態。這意味著,使用者與千問的對話不再止於資訊獲取,而是可以直接完成訂機票、點外賣、購物等一系列真實生活事務。千問正從一個聊天對象演變為能實際辦事的智能體,以“超級入口”之姿強力推進阿里在C端的AI戰略。圖源:千問當然,更核心的激進之處在於阿里春節期間砸下的30億。春節AI大戰中,千問選擇了一條最親民的路徑來實現使用者的拉新:下載即送25元代金券,一單羊毛撬動一個使用者。玩法十分樸素,效果卻很震撼。千問通過“請客活動”實現爆發式拉新,DAU從707萬飆升至7352萬,增速高達940%,活動期間累計使用者下單超2億次,吸引1.3億人首次體驗AI購物。更關鍵的是,其憑藉實用場景實現高留存,活動後DAU穩定在4000萬,雖然曝光量不及豆包,但仍被摩根士丹利和AI產品資料平台AICPB評為使用者留存率最強,證明了以真實交易驅動的增長策略具備持續生命力。這背後是阿里對AI的獨特理解。正如馬雲所說,科技的意義在於“呵護人間煙火”。千問的路徑很清晰:從對話式聊天轉向能辦事的智能體,用補貼這種最樸素的手段,快速完成使用者心智教育。它不追求炫技,只追求讓更多人用起來。當電商購物的繁瑣流程被濃縮為幾句AI指令,就有機會擊穿更多使用者群體的使用壁壘。不同於抖音和阿里,京東的選擇,是從零建構一個原生AI購物工具。去年底,京東悄悄上架了一款獨立App——京東AI購,搭載自研的JoyAI大模型。圖源:APP STORE京東沒有把現有AI揉進電商體系,而是選擇了一條更徹底的路徑:用自然語言互動取代傳統的貨架與搜尋,實現“一句話購物”。使用者不再需要瀏覽、比價,只需描述需求,AI便直接匹配商品並完成下單。與此同時,京東也在供應鏈端發力。物流調度、工業供應鏈等環節都部署了專用AI系統。正如京東CEO許冉所說,依託自營業務和物流履約能力,京東正在成為AI技術應用場景最豐富的企業。三巨頭,三條路:抖音把AI嵌入現有生態,阿里用補貼砸開使用者心智,京東另起爐灶造原生工具。路徑不同,目標卻一致,即爭奪AI電商時代的下一張門票。AI正在重寫電商的底層邏輯摩根士丹利分析師曾預測,未來幾年AI購物代理將t重塑線上零售格局,到2030年,近半數電商交易有望通過AI代理完成。事實上,AI對電商的改造早已啟動,從商家到平台,使用者往往是感知最晚的一環。首先,AI正在系統性地降低電商的門檻。對中小商家而言,數字人直播、AIGC內容生成、智能客服等工具,讓原本依賴專業技能和人力的線上生意,開始被“數字員工”分擔。其次,AI也在重塑供應鏈。隨著AI對基礎設施的改造,平台甚至可以轉向AI預測使用者要什麼,供應鏈從被動響應走向主動預判。以京東為例,其物流與倉儲環節的AI系統已在推動這一轉變。今年,京東“AI年貨地圖”首次上線,其基於巨量資料與人工智慧,能夠預測不同區域的消費偏好,提前指導商品分倉與布貨,提升時效。圖源:京東而在使用者側,AI購物助手的普及,正在顛覆過去二十年的遊戲規則:流量分配。過去,誰佔據搜尋首頁誰就能贏,商家為此投入巨大預算。而未來,如果使用者不再主動搜尋,而是直接告訴AI需求,那麼流量入口就將從關鍵詞排名轉向需求匹配。商家的任務從搶排名,變成讓AI理解自己的商品。平台的角色也從分發流量轉向分發需求——這是一場權力的重新洗牌。這意味著,誰掌握AI入口,誰就掌握使用者。當人們習慣用豆包購物、用千問點外賣、用京東AI下單,傳統電商的流量壁壘將被逐步瓦解。但挑戰同樣真實存在。一是算力瓶頸。億級使用者同時呼叫AI下單,算力消耗遠超傳統操作,平台必須持續加碼AI基礎設施的建設,這無疑是一筆巨大的投入。二是使用者心智的培育。對商家而言,AI帶來降本增效是明確的剛需,但對使用者來說,用AI購物是否真的是“真需求”,仍需檢驗。在今年的春節AI大戰中,補貼換來的下載高峰,未必完成了有效的使用者篩選。如何讓使用者從薅羊毛走向真習慣,是每個平台都必須回答的問題。但無論如何,槍聲已經響起。這一次,不僅僅是概念或試點,而是巨頭們真金白銀的投入、千萬級使用者的驗證、商業閉環的打通。雖然結果如何還尚未可知,但唯一可以預見的是,時代的變化,一定比想像中來得更快。 (電商之家)
擋住豆包的那堵牆,被“龍蝦”推倒了
“安全”不再是超級APP的擋箭牌。豆包還沒做成的AI手機助手,小米、三星和蘋果三大手機廠商正試圖捷足先登,而關鍵催化劑正是風靡全球的開源多智能體框架OpenClaw。上周,小米啟動移動端AI Agent產品miclaw的小規模封閉測試。根據官方介紹,這是一款基於小米自研MiMo大模型建構的AI互動測試產品,旨在探索模型從“對話能力”向“系統級執行能力”的落地路徑。雷軍難掩興奮之情,連發三條微博,將miclaw稱為“手機龍蝦”。試圖搶先做出移動版OpenClaw的,還有三星和Google。2月底,三星發佈新款手機Galaxy S26。新品的最大亮點之一,是搭載了GoogleGemini手機智能體,能夠實現一鍵點外賣、叫車等跨應用操作。三星手機+GoogleGemini的手機端組合,技術路徑與PC端OpenClaw迥然不同,且前者需要使用者主動發出需求,而後者可以主動找活兒、自動完成任務。但兩者的終極目的非常一致,都是想讓AI變得更“有用”、能辦事。倘若“手機龍蝦”做成了,對誰的威脅最大?很可能是AI常年拉胯、Siri完全扶不起來的蘋果。或許正是因為看清了這一點,蘋果在2026年初終於放下了與生俱來的孤傲,向Google伸出橄欖枝,宣佈下一代基礎模型將基於Gemimi打造。蘋果向Google請救兵的時間點,恰逢OpenClaw誕生一個月,全球AI行業即將迎來“小龍蝦時刻”。長時間充當科技行業“探照燈”的蘋果,技術嗅覺還是線上的。至此,小米、三星和蘋果在手機端OpenClaw這條賽道上聚首,儘管實現方式和進度並不相同。而這三家公司,也是2025年全球智慧型手機出貨量的TOP3。比技術和產品更重要的是,OpenClaw還證明了一道看似無解的難題:對於AI掌握個人資料這件事,一般人的接受度和信任度有多高?在OpenClaw橫空出世之前,AI行業乃至整個科技圈普遍認為,普通使用者格外注重個人資訊安全和私密性,不可能輕易把敏感資料交給軟體,更不要說黑箱狀態的AI大模型和智能體。而在AI公司的各種使用者協議中,資料安全是最重要的內容之一。但在“小龍蝦”席捲全球的100天裡,AI圈子關於資料安全的迷思和困擾,被“不講武德”的OpenClaw以一記重錘徹底打破。OpenClaw上線之初,就天然存在一條規則:使用者提供的資料越多、權限越大,自身的能力就越強、越全面。而成千上萬的使用者蜂擁而至,以實際行動證明,自己願意讓渡一部分資料控制權,換取更先進的AI技術、產品和體驗。使用者亮明態度,反過來又促使科技公司做出改變——無論大中小廠,都在馬不停蹄地全方位擁抱“小龍蝦”。過去一周,字節、阿里、騰訊、百度、月之暗面、MiniMax等公司相繼推出一系列OpenClaw相關服務和產品,比如可一鍵部署OpenClaw的雲服務、AI APP內嵌OpenClaw、即時通訊APP接入OpenClaw,乃至類OpenClaw產品,等等。“小龍蝦”全面入駐各大網際網路產品,帶來了一個新問題:超級APP此前經常以安全為由,將潛在競爭對手拒之門外;但在向OpenClaw敞開大門後,“接入第三方服務不安全”的說法事實上已經站不住腳。恰在此時,小米、三星等廠商開始發力移動端智能體,Agent手機顯露雛形。超級APP以安全之名構築的壁壘,正在被OpenClaw撬動。假以時日,Agent手機很可能取代超級APP,成為AI時代的超級入口。這張價值無可估量的“早鳥票”,字節原本有機會拿到。然而,在多方圍堵下,豆包手機助手停滯不前。如今,這種圍堵正在鬆動。手機廠商正在乘著OpenClaw的東風快馬加鞭,而字節也有了再度加速發展豆包手機助手的契機。01OpenClaw在PC端爆紅後,三大手機廠商集體搶灘手機端“小龍蝦”——這場戰役或許是AI行業邁入OpenClaw時代後的又一個里程碑。現階段,手機端“小龍蝦”的能力遠沒有OpenClaw全面和強大。不過,那怕被侷限在自家軟硬體生態中,miclaw們依舊展現了驚人潛力,足以證明手機Agent化的廣闊前景。但對於如何挖掘這種潛力、挖掘的力度和方式,三大廠商都顯得有些謹慎。小米等公司做“小龍蝦”,各有自己的特點,但目前都給自己增加了限制,並沒有像之前的豆包手機助手那樣猛打猛衝。甚至可以說,他們似乎都在等待超級APP的“通行證”。其中,小米宣稱miclaw聚焦驗證大模型在小米“人車家全生態”系統中的執行能力,目的是讓手機成為AI的工具,在理解意圖和給予授權後,呼叫一方應用、生態能力,也能自主選擇系統級工具完成命令。根據小米的介紹,miclaw把手機的系統能力封裝成了超50項系統能力和生態服務,涵蓋了常見的通訊、日曆、系統工具、智能家居、定時任務等。對於第三方應用,小米提供了兩種接入方式:一種是MCP(模型上下文協議),這是一種AI工具整合的開放標準。miclaw實現了完整的MCP客戶端,支援標準化通訊協議、流式響應和非同步服務發現。小米方面稱,PC上已有的數千個MCP工具,理論上可以直接接入手機AI。另一種則是開放SDK,第三方 App 主動聲明自己能提供的工具能力,Xiaomi miclaw 動態發現和呼叫。然而,小米並沒有發揮miclaw的全部能力。例如,小米明確表示,當前版本的miclaw程式碼中沒有任何支付、轉帳、下單相關的工具註冊。這意味著,如果沒有指紋驗證、密碼輸入等使用者確認的動作,miclaw並不能執行購物付款等略微高階的操作。相比小米,三星和Google的Agent合作又往前邁了一步,但也僅僅是一步而已。據介紹,Gemini在三星新款手機實現自動跨應用操作,採用了基於視覺識別和模擬點選的GUI(圖形使用者介面)方案。這一點和豆包手機助手類似,而miclaw並不具備這一能力。但與此同時,Google還準備了“另一條腿”,推出了AppFunctions技術框架。在這套框架下,開發者可以定義功能介面,Gemini就可以呼叫APP功能。相比GUI方案,這套方案要保守和穩當得多,也更容易讓APP開發者接受。這從側面表明,就算強如三星、Google,一時間也無法霸王硬上弓,讓第三方APP——尤其是超級APP——接受GUI方案,跑步接入agent。至於蘋果,它顯然希望借力Google,讓iPhone的AI能力實現質的飛躍;但與此同時,它依然會把重心放在AI呼叫自家軟體上,並沒有表現出讓AI操控一切APP的姿態。這並不難理解——蘋果很少力推一款第三方APP,而是希望一切都親力親為,拿出自己的解決方案。即便是微軟佔據絕對優勢的辦公軟體,蘋果也有自家的辦公套裝與之分庭抗禮。在這樣的傳統下,蘋果在邁入AI時代後,恐怕也不會允許iPhone搭載的Agent自主選擇該用那些APP。在可預見的未來,蘋果AI大機率是究極增強版Siri,而非脫胎換骨的蘋果版OpenClaw。這符合蘋果的利益,也是超級APP希望看到的局面。02小米、三星們的謹慎,可能是因為在Agent技術還沒有成熟、整個閉環還沒有徹底跑通的情況下,並不想過度刺激第三方APP。畢竟,豆包手機助手的出師不利,已經是前車之鑑。問題是,miclaw們的謹小慎微,能夠換來超級APP的“寬容”和接納嗎?如果放在以往,答案大機率是否定的。手機端Agent天然對超級APP存在替代效應,而且是改寫使用習慣和入口邏輯的釜底抽薪。就算miclaw們再“恭順”,超級APP也完全沒必要讓手機裡多一個競爭對手。然而,OpenClaw的到來,正在迅速改寫這一切。在時代浪潮面前,超級APP需要“養蝦”,必須向OpenClaw敞開大門。事實上,他們也是這樣做的。這就造成了“患不均”的矛盾:既然如此積極地接納“小龍蝦”,憑什麼將中國的同類產品拒之門外?同時,超級APP的這一舉動,也給其他人指明了新的路徑:只有採用類似OpenClaw的技術方案,在移動端建構Agent框架,而非強推GUI虛擬點選,才能避免過度刺激第三方APP,做出了真正的Agent手機。小米和三星已經看清了這一點。一度被逼到牆角的豆包手機助手,也有了柳暗花明之感。這款產品上線之初捲起的風浪,一點兒都不比“小龍蝦”弱,卻陷入了高開低走的曲線。豆包手機助手與OpenClaw的原型產品都是在去年11月底、12月初亮相。雖然技術原理差別很大,但兩者的底層邏輯是相通的:繞開繁雜的APP/軟體,讓AI自動幹活兒。一個面向移動端,一個面向PC端,豆包手機助手原本有機會與OpenClaw並駕齊驅。更何況,它背靠字節,論及各方面的條件和資源,都比一個國外退休老哥折騰出的“小龍蝦”優越太多。如今,100天過去了,“OpenClaw時刻”成為全球熱度第一的AI大事件,所有科技公司都在拼盡全力卡位,FOMO情緒濃厚。豆包手機助手卻命運多舛。它先是被各個超級APP阻擊,功能大打折扣;又被馬化騰在內部會議上抨擊“極其不安全、不負責任”,陷入一場安全隱私爭議。造成這一局面的原因有很多,比如大廠競爭等等。單從技術維度來看,豆包手機助手的GUI方案,對於2026年的中國科技行業還是太超前了。恰在此時,OpenClaw不可阻擋地叩開了超級APP緊閉的大門。從飛書到QQ,從企業微信到釘釘,但凡有點兒名聲的APP,都快馬加鞭地把“小龍蝦”納入自家平台。OpenClaw時刻的到來,也給豆包手機助手指明了一條新的路線。一個越來越清晰的邏輯是,Agent手機不應該強求過於生猛的GUI方案,也不必完全寄希望於一個個APP主動接入(這也是現版本Siri拉胯的原因),而是應該搭建手機版OpenClaw,只提供智能體框架,讓智能體自己去想辦法、解決問題。另一個潛在的好處是,在舊的技術路徑下,豆包手機助手非常依賴手機廠商的合作。但如果轉向“手機養蝦”,那麼它對於硬體適配的需求就會減少,甚至不需要看手機廠商的臉色了。字節已經在悄悄準備。就在本周一,字節旗下的火山引擎上線了ArkClaw,號稱點選即用、輕鬆“養蝦”。這是OpenClaw的雲端SaaS版本,騰訊、阿里也推出了同類產品。這一動作或許暗示了豆包手機助手的技術堆疊的遷移。自從去年底火爆以來,豆包手機助手至今未能上新,反而因GUI方案遭到質疑。與此同時,OpenClaw的崛起,展示了AI應當如何順暢達成“幫使用者辦事”的目標,其中折射的技術哲學,不僅適用於PC端,對於手機端Agent也有巨大價值。全面學習OpenClaw,或許就是豆包手機助手的下一個突破口。03站在大廠的視角上,OpenClaw的出現,讓超級APP陷入了一個前所未有的難題:它很難繼續以使用者資料安全為由,繼續紮緊籬笆、把競爭對手擋在門外。資料安全,一直是超級APP的城牆的一部分。只要第三方試圖破壁,超級APP總是會拿安全說事兒,再把大門關得更緊一些。這樣的事情,在新BAT的競爭中一再發生。前幾年“互聯互通”東風勁吹,超級APP依然不為所動,只在一些小地方做了妥協和讓步。與此同時,不少使用者也或多或少相信了這一點,覺得超級APP接入其他產品和服務後,自己的個人資訊、行為資料等將被洩露給不可靠的第三方。但OpenClaw打破了這一舊觀念。它證明,只要產品足夠好、足夠有用,絕大多數使用者是願意讓渡一部分所謂的“安全感”,使用新技術、提升工作效率。當然,OpenClaw官方和不少從業人員都曾發出警告,現階段Agent存在大量漏洞,甚至有許多惡意軟體。但整體來看,大多數使用者願意讓Agent更深入地接觸到自己的私人資料,甚至幫自己下判斷、做決策,預示著AI Agent時代,資料安全觀念正在面臨一場重塑。新的安全觀念,在移動端的普及速度甚至會比PC端更快。由於PC作業系統和軟體的低權限門檻,OpenClaw幾乎進出自由。相比之下,Android和iOS的權限管理都要嚴格得多。目前,手機版“小龍蝦”的功能距離OpenClaw仍有巨大差距,但這也在客觀上進一步提高了手機版的安全性。另一方面,手機廠商也不太敢、不太想一上來就做得很激進。小米、三星都有千萬等級的使用者基數,任何牽扯到使用者資料的新功能都必須格外謹慎。此外,“小龍蝦”能夠實現的功能,比如一句話打開空調之類,可以通過原有技術比較完美地實現。因此,把“小龍蝦”搬到移動端,更多是探索和驗證技術,而非馬上要取代現有的技術堆疊。手機廠商都看到了OpenClaw的驚人潛力,卻也沒必要立刻沖上去,而是更希望小步快跑,邊做邊看。可以說,在OpenClaw的助推下,超級APP對第三方的“小龍蝦”敞開大門,條件和時機正在成熟。無論大廠多麼糾結,“使用者資料安全”這一舊時代的防守利器,正不可避免地走向終結。但另一方面,手機版“小龍蝦”註定是超級APP的宿命之敵。大廠紛紛擁抱OpenClaw,甚至將來對類似產品敞開大門,本質上仍然是AI超級入口爭奪戰的一部分。要想贏得這場戰爭,大廠除了把自家的類OpenClaw產品做好,還要把自家產品、技術與泛OpenClaw生態掛鉤。但這一過程,又會潛移默化地削弱超級APP的打開率和使用時長。隨著Agent掌握越來越多的資料、功能越來越完善,使用者會形成新的習慣甚至依賴,而這恰恰是超級APP最不願意看到的,也和“放行”泛OpenClaw產品的初衷背道而馳。OpenClaw不僅動搖了舊的安全觀念,給手機廠商及豆包等創造了機會,更讓大廠不得不打一場面向新時代的戰爭。這場戰爭在推動大廠向AI時代躍遷的同時,也讓大廠承受著舊領地遭受持續侵蝕的風險。中國科技行業的“養蝦大戰”方興未艾,而超級APP的黃昏卻在悄然到來。 (字母AI)
OpenClaw,給中國AI開闢了一個彎道超車的大市場
OpenClaw可以說是AI圈裡最熱門的話題,一丁點風吹草動都能牽動全球所有AI廠商的神經。無數產品經理在OpenClaw上進行創意大比拚。嗅覺靈敏的中國廠商也都紛紛開始行動,他們看到的不只是OpenClaw這個產品本身,而是它背後代表的整個agent市場。這個市場需要雲伺服器、需要模型API、需要本土化的產品、需要更低門檻的部署方案。中國AI想要彎道超車,必須要在Anthropic和Google先後對其進行打壓的時機,緊緊抓住這個機會。騰訊雲、阿里雲上線了一鍵部署服務,他們想要趁著這個機會,成為AI圈那個賣鏟子的人。月之暗面推出了雲端版的Kimi Claw,MiniMax也緊隨其後發佈了MaxClaw,道理很簡單,本土化的OpenClaw仍然是市場的一大空缺。智譜和字節雖然沒有在OpenClaw上面明確表態,但他們其實也沒閒著。OpenClaw的成功讓智譜和字節對agent的產品更有信心。01. 月之暗面的雲端OpenClaw在OpenClaw出現之前,大模型的使用主要是“對話式”的,使用者問一句,模型答一句,單次呼叫的token消耗有限。但OpenClaw創造了全新的“模型消費場景”。一個配置合理的OpenClaw,每天可能向模型發起數百次甚至上千次呼叫,每次呼叫還要攜帶完整的上下文資訊。這意味著,單個OpenClaw使用者產生的token消耗,可能是傳統聊天使用者的幾十倍甚至上百倍。因此,OpenClaw變成了OpenRouter上token消耗最大的應用。那個模型能接入OpenClaw生態,就等於獲得了一個指數級增長的需求管道。當OpenClaw使用者選擇底層模型時,他們實際上選的不是模型性能或者模型知識儲備,使用者選的是一個持續、穩定、高頻的供貨商。誰耐用,誰便宜,誰才是OpenClaw生態下的大贏家。所以月之暗面和MiniMax就在OpenClaw的這場巨浪之中收穫頗豐。先說說前者吧,他們在OpenClaw生態中的角色,經歷了兩個階段的演變。2026年1月,Kimi K2.5因其便宜且agent能力較強,成為OpenRouter平台上OpenClaw呼叫量最高的模型。OpenRouter資料顯示,Kimi K2.5的周token使用量環比增長最高達261%。其呼叫場景主要來自OpenClaw.究其原因,Kimi K2.5支援最多100個子agent平行執行、1500次以上的工具呼叫,這些能力讓它在agent場景下表現出色。於是OpenClaw官方在1.30版本後,將Kimi K2.5設為“首個官方免費主力模型”,使用者安裝OpenClaw時可以選擇MoonshotAI通道,甚至可以留空API Key繼續使用,OpenClaw官方會補貼算力。這種爆發式增長直接帶來了商業回報。受全球付費使用者及API呼叫量大漲的共同推動,Kimi K2.5發佈不到一個月,近20天累計收入已超過2025年全年總收入。正是因為OpenClaw,Kimi的海外付費使用者數快速增長,海外收入首次超過國內。SimilarWeb資料顯示,Kimi上月訪問量達3300萬,中國地區訪問量佔比從去年的77%降低到了今年的60%多。這個階段,月之暗面扮演的是“模型供應商”的角色,被動地提供 API 服務。但Kimi團隊很快意識到,與其被動地提供API,不如主動降低使用者使用門檻。一個月後,Kimi正式推出Kimi Claw。這是一個雲端託管的OpenClaw服務。使用者無需本地部署,直接在瀏覽器中就能使用完整的OpenClaw功能。Kimi Claw把原版OpenClaw的複雜步驟全部省略了,使用者只需擁有Kimi Allegretto及以上會員,就能在網頁端一鍵建立自己的“雲端OpenClaw”,整個過程不超過1分鐘。Kimi Claw內建了Kimi K2.5模型,自動關聯使用者的Kimi Code會員權益額度。使用者無需額外配置API Key,也不用擔心突然燒掉大量token導致帳單爆炸。在功能層面,Kimi Claw直接整合了ClawHub社區的5000多個技能庫,使用者可以在網頁介面中一鍵啟用,包括天氣查詢、網頁搜尋、瀏覽器操作、郵件處理等高頻場景。原版OpenClaw的Skills需要使用者通過命令列手動搜尋、安裝、配置,這個過程對普通使用者來說又是一道門檻。Kimi Claw則是把這些技能都整合到了介面裡,使用者只需要點選就能啟用,降低了使用者使用難度。原版OpenClaw的核心理念是“本地優先”,所有對話記憶和檔案都儲存在使用者自己的裝置上。這種設計保護了隱私,但也帶來了不便,使用者換了裝置就得重新配置,AI助手的記憶也無法延續。Kimi Claw則提供了40GB的雲端儲存空間,使用者可以在辦公室電腦、家裡電腦、手機上無縫切換,AI助手的記憶始終保持一致。這種體驗對於需要在多個裝置間切換的使用者來說,是個很實用的功能。02. MiniMax也這麼幹了2月25日,MiniMax也推出了自己的MaxClaw,走的是與Kimi Claw類似但更激進的路線。MaxClaw基於MiniMax M2.5模型,雖然這是一個模型總參數量約2300億,單次推理僅啟動約100億的大模型,但它的API價格非常便宜。M2.5在OpenRouter上的表現也很亮眼。發佈後12小時內登頂OpenRouter熱度榜,一周內登頂呼叫量榜首,周呼叫量暴漲至3.07兆token,超過Kimi K2.5、GLM-5與DeepSeek V3.2三家的總和。發佈7天內token使用量突破3兆,2月單月token使用量達4.55兆,空降榜首。為什麼M2.5能在短時間內實現如此驚人的增長?答案同樣是OpenClaw。MiniMax M2.5的定價策略是“極端性價比”。在每秒輸出100token的情況下,連續工作一小時只需花費1美金;而在每秒輸出50個token的情況下,只需要0.3美金。這意味著,同樣是運行一個7×24小時這樣的OpenClaw實例中,M2.5的成本可能只有Claude Sonnet的1/10到1/20。對於需要高頻呼叫工具的agent場景來說,這種成本差異是決定性的。OpenClaw社區的開發者很快發現了這一點。在外網論壇上,大量關於“如何在OpenClaw中配置 M2.5”的教學湧現,甚至有開發者專門編寫了“從Claude遷移到M2.5”的遷移指南。這種開源社區中的傳播,比任何廣告投放都更有效,要知道OpenClaw能走到今天,也是被開源社區帶火的。MiniMax還將MaxClaw整合到自家的MiniMax Agent生態中,與Expert 2.0同步升級,形成了“對話式AI + agent 工作流”的完整產品矩陣。資本市場的反應更為直接。2月20日,也就是馬年港股開市首個交易日,MiniMax的股價單日暴漲14.52%,市值一度衝破3042億港元,創下公司上市新高。自上市以來,MiniMax股價累計漲幅最高超過480%,2026年初至今股價最高漲幅超450%,成功躋身港股AI核心標的行列。摩根大通給予MiniMax “增持”評級,目標價700港元。3月2日,MiniMax發佈財報,2025財年收入為7900萬美元,同比增長158.9%。OpenClaw帶來的流量紅利,讓月之暗面和MiniMax轉化為了自家的使用者資產。想想看,當一個使用者通過OpenClaw使用Kimi K2.5一個月後,他已經習慣了這個模型的輸出風格、響應速度和能力邊界。這時候搬出Kimi Claw給他,然後說:“你不用自己維護伺服器了,不用配置API Key了,直接在我們的平台上用,還能多端同步。”這轉化率能低得了嗎?這兩家公司的雲端OpenClaw產品,本質上是在用SaaS的方式去做agent服務,你給我錢,那我給你一個低門檻的產品。雖然沒有原版OpenClaw那麼能擴展,但是勝在便宜好用。事實上絕大多數 人其實都沒有那麼尖端的需求。他們可能只是想讓AI幫忙檢查郵件、整理文件、定時提醒、查詢資訊。回到段落開頭,Kimi和MiniMax也都明白這個道理,agent的價值不在於單次對話的質量,而在於長期、持續、穩定的任務執行能力。所以他們剛好填補了市場的一片空白。03. 騰訊、阿里的“賣鏟子”生意OpenClaw對普通使用者來說門檻不低。你得有自己的伺服器,得會配置 Node.js 環境,得懂怎麼申請各家模型的 API Key,還得知道怎麼設定消息通道。整個過程下來,沒有半小時到一小時搞不定,技術小白基本上看到教學就放棄了。這種極客屬性很強的產品,註定只能在開發者圈子裡流行,很難真正普及到大眾市場。騰訊和阿里看到的,恰恰就是這個痛點。與其讓使用者自己折騰,不如直接提供一套開箱即用的解決方案。於是在OpenClaw爆火後,騰訊雲和阿里雲幾乎同時推出了OpenClaw的一鍵部署服務。這些雲廠商提供的,不僅僅是一台伺服器那麼簡單。他們把整個OpenClaw的運行環境都打包好了,包括預配置的鏡像、自動化的部署指令碼、已經偵錯好的依賴包,甚至還有現成的模型 API 接入方案。使用者只需要點幾下滑鼠,選擇配置,付款,然後等幾分鐘,一個完整的OpenClaw實例就跑起來了。騰訊雲的方案相對簡潔直接。他們在輕量應用伺服器上推出了“雲應用”功能,使用者通過這個功能可以三步完成OpenClaw部署。系統默認配置的是 DeepSeek API 作為模型供應商,但使用者可以在 Dashboard 中自由切換到 Kimi、MiniMax 或者其他國產模型。騰訊雲的官方文件裡寫得很明白:“OpenClaw來自開源社區,雲應用不收費”,但緊接著又補充了一句,“雲伺服器和 API 按照實際消耗計費”。騰訊賺的不是OpenClaw的錢,而是雲伺服器租賃費、流量費、還有模型 API 呼叫產生的費用。他們不強制繫結自家模型,給使用者留了選擇空間,但基礎設施這一層,你跑不掉。阿里雲的打法則更加“生態化”。使用者在輕量應用伺服器上部署OpenClaw後,系統會引導使用者前往“阿里雲百煉大模型控制台”建立 API Key,默認呼叫的就是通義千問系列模型。阿里雲還推出了一個叫“Coding Plan”,這是阿里雲百煉面向全品類 AI 編碼工具推出的通用訂閱套餐,相容OpenClaw接入。換句話說,阿里就是想通過OpenClaw的代安裝服務,推廣自己家的 AI 程式設計以及模型API。阿里和騰訊想要的,是要佔領agent時代的“水電煤”。OpenClaw的爆火證明了一個趨勢,未來的 AI 應用不是簡單的“聊天機器人”,而是一個 24 小時線上、能執行複雜任務、需要穩定算力支援的 agent。當個人使用者和中小企業開始部署 agent 時,他們需要的不僅是模型的 API,還需要雲伺服器、儲存空間、網路頻寬,以及飛書、釘釘、企業微信這樣的消息整合,還有安全沙箱環境等一整套基礎設施,最後更不能少了像是 AI 程式設計這樣具體的執行工具。所以騰訊雲和阿里雲才提供了“一鍵部署OpenClaw”這個服務,以此搶佔這個新興市場的入口。他們的邏輯很清楚,今天使用者因為OpenClaw來了,明天可能因為其他 agent 產品來,但只要使用者習慣了在他們的雲平台上部署 agent,那麼這些使用者就成了長期客戶。更重要的是,當每個企業都需要部署自己的 agent 時,誰能提供最便捷、最穩定、最本土化的基礎設施,誰就能佔據這個兆級市場的底層。雲廠商們看得很明白,賣鏟子的生意,往往比挖金子的人更穩定,也更賺錢。不僅是這樣,OpenClaw它代表的是一個訊號,未來的agent產品只多不少。雲廠商們現在做的,就是提前佔位,建立使用者習慣,建構生態壁壘。當agent成為企業和個人的標配時,誰能提供更多配套的服務,誰就掌握了話語權。04. 智譜和豆包為何不激進在這場圍繞OpenClaw的競爭中,智譜和字節的態度顯得有些微妙。不過這不代表他們在agent這個賽道上落後了,恰恰相反,他們選擇了一條更獨特的路。智譜對OpenClaw的態度可以概括為“技術上支援,戰略上不主推”。智譜GLM-5在官方文件中明確提供了OpenClaw接入指南,GLM的Coding Plan套餐也支援OpenClaw配置。智譜甚至還推出了“AutoGLM版本的OpenClaw”,支援OpenClaw與飛書的一體化配置。從這些動作來看,智譜並沒有忽視OpenClaw,提供了作為一家中國AI廠商該有的一些基本支援。智譜更看重的是AutoGLM,這是一個具備“Phone Use”能力的agent。AutoGLM在2025年12月開源,能夠完成外賣點單、機票預訂等數十步複雜操作,還支援微信、淘寶、抖音等超50個高頻中文應用。AutoGLM的核心技術是視覺語言模型,它不依賴傳統的API,而是像人眼一樣“看”螢幕,通過理解UI元素的語義直接預測下一步動作。這種方式的優勢在於,它只要能看到介面,就能進行操作。這意味著AutoGLM可以操作任何應用,包括那些沒有開放API的應用。OpenClaw 的核心場景是桌面端,需要配置海外消息平台,這些平台在中國的使用率並不高。相比之下,AutoGLM 直接在使用者最常用的中文應用中執行任務,不需要依賴海外消息平台,更符合中國使用者的使用習慣。智譜的想法是,既然OpenClaw證明了agent的市場需求,那真正適合中國使用者的agent,更應該是能操作微信、淘寶、抖音的AutoGLM。字節跳動對OpenClaw的態度更加微妙。表面上看,只有前文提到的,火山引擎提供的一鍵部署OpenClaw。這是因為字節對agent的注意力集中在移動端。去年字節跳動與中興努比亞合作推出nubia M153測試手機,內建了“豆包手機助手技術預覽版”。其核心技術是UI-TARS,一個純視覺驅動的GUI agent模型。與OpenClaw相比,豆包手機助手更有優勢。豆包是直接整合到Android系統層,可以不打開應用就從底層進行操作,完全不會影響使用者當下使用。OpenClaw需要通過瀏覽器控制或API呼叫來操作應用,權限和穩定性都受限。同時,豆包手機助手能夠實現跨應用的複雜操作,比如“幫我在三個外賣平台比價,然後下單最便宜的”。OpenClaw的跨應用能力有限,很多任務不能跨應用完成,而且在不同應用之間切換的速度很慢。字節跳動官方始終強調,agent應該是整合到作業系統中、能直接操作所有應用的系統級能力,而不是一個需要使用者手動配置、運行在伺服器上的獨立程序。這種理念上的差異,決定了字節不會在OpenClaw上投入太多資源。字節對OpenClaw保持距離,是因為它正在打造一個更高維度的解決方案。當然,智譜和字節的這種戰略選擇也有代價。在OpenClaw熱度最高的這段時間,錯過了一波流量紅利。不過從長期來看,誰的選擇更正確,還需要時間來驗證。agent這個賽道才剛剛開始,現在下結論還為時過早。 (字母AI)
暴漲 263%!日均 37 兆 tokens,中國企業級大模型市場格局定局:三強領跑,頭部集中
AI 產業再迎關鍵里程碑!國際權威諮詢機構沙利文(Frost & Sullivan)最新發佈《中國 GenAI 市場洞察:企業級大模型呼叫全景研究,2025H2》報告顯示,2025 年下半年中國企業級大模型市場迎來爆發式增長,行業從早期試水全面邁入規模化落地階段,市場格局也迎來清晰洗牌。資料顯示,中國企業級大模型日均呼叫量已從 2025 年上半年的10.2 兆 tokens,激增至下半年的37.0 兆 tokens,半年內漲幅高達263%。這一跨越式增長,直觀印證了中國企業對大模型的接受度、依賴度與應用深度正在全面提速,AI 真正從 “技術概念” 變成 “生產工具”。隨著市場放量,行業競爭邏輯徹底轉變,頭部效應急劇放大,曾經熱鬧的 “百模大戰” 正式落幕,取而代之的是頭部廠商憑藉技術、生態與服務能力形成的穩定格局。三強格局固化:阿里雲領跑,字節、DeepSeek 緊隨其後報告清晰勾勒出當前中國企業級大模型市場的 TOP3 陣營,三家廠商合計佔據超七成市場份額,行業集中度顯著提升。1. 阿里雲千問(Qwen):翻倍增長,穩居行業第一作為市場領頭羊,阿里雲千問展現出壓倒性的增長勢頭。其市場佔比從上半年的17.7%大幅躍升至32.1%,近乎實現翻倍增長,持續鞏固行業第一的位置。依託阿里雲完善的雲端運算基礎設施、企業服務生態與多場景落地能力,千問在文字創作、資料處理、程式碼輔助、企業知識庫等核心場景中佔據主流,成為大量企業數位化轉型的首選大模型。2. 字節跳動豆包:高滲透力,穩居第二字節跳動豆包以 21.3% 的呼叫量佔比位列第二,保持著強勁的市場滲透力。依託字節生態的產品矩陣與高效的工程化能力,豆包在內容生成、智能助手、多模態互動等場景中廣受青睞,快速覆蓋大量中小企業與網際網路場景,成為國產大模型中使用者覆蓋面最廣的選手之一。3. DeepSeek:異軍突起,行業黑馬躋身前三作為賽道中的新銳力量,DeepSeek 憑藉突出的技術實力與開源策略異軍突起,以 18.4% 的市場份額拿下第三名。其在程式碼生成、推理效率與成本最佳化上的優勢,快速獲得開發者與企業市場認可,成為國產大模型中 “技術派” 的典型代表,也證明了差異化路線在成熟市場中依然具備突圍空間。行業大變局:從 “百模大戰” 到 “生態決勝”此次沙利文報告披露的市場資料,不僅是份額的更迭,更標誌著中國企業級大模型行業進入全新發展階段。應用落地全面提速企業對大模型的使用從 “試點測試” 轉向 “核心業務常態化呼叫”,文字創作、資料處理、程式碼輔助、內部知識庫等場景成為主流,AI 真正融入生產流程。競爭核心徹底轉變行業不再單純比拚參數、榜單成績,而是轉向生態完善度、服務穩定性、部署成本、場景適配能力的綜合較量。能為企業帶來真實降本增效的模型,才能佔據市場。頭部集中趨勢不可逆中小模型逐步退出主流競爭,資源、客戶、技術持續向頭部廠商匯聚,未來市場將長期保持 “頭部引領、細分補充” 的格局。日均 37 兆 tokens 的呼叫量,是中國企業級 AI 市場的 “成人禮”。從 2025 年上半年的試探性佈局,到下半年的爆發式增長,中國大模型產業完成了從技術創新到產業價值的關鍵一躍。阿里雲千問、字節豆包、DeepSeek 組成的第一梯隊,也為行業樹立了清晰的發展標竿。未來,隨著大模型與各行業深度融合,更高效、更普惠、更貼合產業需求的 AI 服務,將持續推動中國企業數位化、智能化升級,而這場由技術驅動的產業變革,才剛剛開始。 (相進化的猿)
豆包進入2.0階段,字節不想只贏AI春節檔
砸錢上春晚的底氣,來自豆包2.0紮實的技術實力。去年春節,DeepSeek升級了中國大模型競爭;今年春節,中國AI戰火向上燒到應用層。千問、元寶和文心等多家大廠旗下的AI應用,在春節累計投入超50億資金吸引使用者,爭搶新時代的AI船票。但如果把今年春節的AI行銷簡單理解為“又一輪紅包大戰”,其實容易誤讀這場競爭的底層邏輯。表面看,玩法仍然熟悉:冠名春晚、紅包裂變、補貼拉新,這些都延續移動網際網路時代的流量打法。誰能在最短時間內獲取最多使用者,誰就更有機會鎖定未來生態。但AI時代的競爭,不再完全遵循這一邏輯。大模型競爭的核心變數並非單純日活規模,而是技術突破與真實生產力。即便是日活過億的產品,只要出現技術代際躍遷,也可能迅速被替代。這意味著,春節行銷所帶來的流量高峰,並不天然對應長期留存。在移動網際網路時代,因為社交關係、內容沉澱與資料資產會形成天然護城河。但在AI技術尚未完全收斂的階段,使用者忠誠度極低。真正決定留存的,從來不是補貼力度,而是產品是否足夠好用。這也使DAU的重要性需要全新定義。在打車、外賣等平台競爭時代,使用者數量直接決定勝負;而在大模型競爭中,低粘性使用者規模的價值有限。更有意義的是深度使用與真實付費,當使用者願意長期依賴某一模型完成複雜任務,甚至付費訂閱,這類使用者才構成真正的留存資產。換句話說,AI時代的DAU更接近“生產力活躍度”,而非單純訪問頻次。這也解釋了為何各家在春節節點大規模砸錢拉新使用者的同時,幾乎同步推進底層模型升級。春節前夕,中國大模型行業迎來密集迭代窗口。千問斥資數十億元加速生態建構,元寶依託社交關係鏈強化入口,而字節跳動則選擇在春晚流量高峰前後完成模型能力的跨代躍遷。2月14日,在連續發佈Seedance 2.0視訊模型、Seedream 5.0 Lite圖像模型後,字節正式推出豆包大模型2.0系列。官方將其定位為面向大規模生產環境最佳化的一次系統性升級,核心目標是提升複雜真實任務的執行能力。這是豆包自2024年5月發佈以來首次跨代升級。在春晚倒計時這一國民級流量節點,字節“三箭齊發”,全端AI佈局野心盡顯。01 春晚只是豆包2.0的起點微信用“搖一搖”改寫了春晚互動形態,網際網路紅包大戰自此成為春晚的固定節目。誰能把春晚流量轉化為產品留存,誰就更接近下一個國民級入口。但今年,使用者不再只是搖晃手機搶紅包,而是輸入一段文字、說出一句祝福,就能即時生成專屬的新春圖景。春晚互動從“流量分發”轉向“內容共創”。字節跳動正是這場轉變背後的技術推手。豆包視訊生成模型 Seedance 2.0、圖像創作模型 Seedream,以及語音模型被深度應用於春晚節目製作與互動環節。從舞台影像到全民互動,生成、理解與表達能力第一次在同一國民級舞台完成協同。資料顯示,除夕當天豆包AI互動總數達 19億次,“豆包過年”活動生成超過5000萬張新春頭像、1億條祝福內容。但更值得注意的時間點,是2月14日,除夕前一天豆包大模型2.0正式發佈。春晚因此不僅是曝光場,更是一場國民級產品壓力測試。一條驗證線發生在舞台之上。2026年春晚成為中國國產AI技術的“全民秀場”。節目《馭風歌》中,以馬為元素的水墨長卷由 Seedance 2.0 動態生成。此前導演組嘗試多款國際視訊模型,均難以精準把握水墨留白與構圖邏輯。而 Seedance 2.0 在保持水墨筆觸神韻時,還做到“形神兼備”。與此同時,多家機器人品牌參與表演,背後均有火山引擎的技術支援。以宇樹機器人為例,此次參與春晚表演以及豆包APP 春晚互動抽獎送出的宇樹 G1人形機器人,搭載了豆包大模型和豆包語音合成模型,使其具備更擬人的音色、更自然的語音互動。另一條驗證線發生在使用者互動層面。19 億次互動,不只是流量資料,更是模型能力在高並行環境下的真實呼叫記錄。在這一節點,豆包完成了一次身份躍遷:從聊天框裡的AI搭子,走向被廣泛呼叫的國民級AI助手。但字節顯然並不滿足於此。春晚帶來的使用者增長,能否轉化為長期留存,最終取決於豆包2.0在真實場景中的生產力價值:能否處理複雜任務、呼叫多工具、連接多終端,真正成為使用者工作與生活中的智能執行中樞。換句話說,字節給了豆包一次站上國民舞台的機會,但決定這波流量能否沉澱的,是2.0的 Agent執行能力。從這個意義上看,春節流量只是起點,而跨代的Agent升級,才是決定豆包能走多遠的關鍵變數。02 換腦開啟Agent跨代升級春晚只是能力被看見的時刻。2 月中旬的模型三連發,才是豆包真正完成“換腦”的關鍵。無論是Seedance 2.0 在春晚舞台的驚豔亮相,還是Seedream在理解與推理層面的顯著進步,最終構成底座的仍是隨後發佈的豆包大模型 2.0 系列。豆包大模型2.0的升級,核心並非單點能力提升,而是面向大規模生產環境的系統性最佳化。這是其自2024年5月發佈以來,首次明確意義上的跨代版本躍遷。這次“換腦”,首先發生在推理結構上。在推理與數學等評測維度中,豆包 2.0 已進入與 Gemini 3 Pro 同一梯隊區間。但比榜單更關鍵的,是其在真實任務執行中的穩定性:模型能夠完成複雜需求拆解,建立因果鏈條,進行多步規劃,並在輸出前進行自檢校驗。對Agent來說,這意味著“思考”從一次性回答,變成可持續推進的執行骨架。推理決定模型“能想多深”,多模態能力則決定它“能看多廣”。豆包2.0的多模態升級,明顯對準生產環境輸入:截圖識別、複雜文件解析、圖表理解與流程圖閱讀被重點最佳化。在空間理解MMSIBench、運動理解MotionBench、視訊理解VideoMME等評測集中,其綜合表現已進入第一梯隊;圖表理解CharXiv-RQ 能力亦明顯提升。但評測只是表層。在工程可用性上,模型對時間序列與運動變化的理解能力被強化,對“動作、節奏、狀態變化”的捕捉更為穩定。這使其能夠進入即時視訊流分析、環境感知與動態決策場景。例如在長視訊互動中,模型可作為AI助手完成環境判斷、動作糾錯與主動提示,從被動問答升級為過程指導,可應用於健身陪練、穿搭輔助等陪伴式場景。當空間理解與運動理解能力提升後,模型不僅能識別畫面“有什麼”,還更容易判斷“它們之間如何關聯、如何運動、如何作用”。這使多模態感知不再是展示能力,而成為執行決策的輸入來源。但Agent能否進入生產系統,真正的門檻仍在任務鏈完整性。過去多數 Agent 方案依賴外掛外掛或外層工作流拼接。模型負責理解,工具負責執行,長鏈路任務中極易出現上下文斷裂、目標漂移或輸出失控。豆包2.0的變化在於,多Skills呼叫、Function Call、搜尋與結構化輸出能力,被原生納入模型推理過程。工具呼叫不再是外層補丁,而成為思考鏈條的一部分。結構化輸出與長上下文管理能力的提升,本質是在修復Agent執行中的“斷片”問題。讓模型在更長任務周期中保持狀態連續,理解當前步驟在整體流程中的位置。這種持續狀態感,正是 Agent 從演示走向生產的分水嶺。03 開啟萬物豆包時代今年春晚,豆包送出超過10萬份科技好禮。更關鍵的是,這些硬體幾乎全部接入豆包大模型。手機、機器人、智能音箱、家電終端,被納入同一套 AI 互動體系之中。這並不是一次簡單的“品牌露出”,而是一場面向全民的終端驗證。在移動網際網路時代,入口意味著“被打開的App”。而在大模型時代,入口的含義正在發生變化。它不再只存在於螢幕之內,而開始嵌入終端之中。當 AI 既存在於手機應用,也存在於汽車中控、機器人軀體、家電語音模組時,使用者接觸 AI 的路徑將從“打開應用”轉向“進入場景”。春晚舞台因此既是內容秀場,也是一場終端能力展。這種終端擴張的底氣,來自模型在產業側的滲透深度。截至2025年底,豆包大模型累計服務上百萬家企業與開發者,覆蓋汽車、手機、教育、金融、網際網路等多個行業。Token呼叫規模達到極高量級,企業側呼叫持續增長。這意味著,模型能力早已不止存在於消費端應用,而是在產業系統中持續運轉。從產品策略上看,豆包2.0提供 Pro、Lite、Mini 多規格的通用Agent 模型,以及Code專用模型,覆蓋不同延遲、成本與推理強度需求。這種分層結構帶來的靈活部署和更具性價比的成本,本質是在為“規模化部署”準備彈性空間。既能滿足高強度推理場景,也能適配終端側的低時延需求。當模型具備跨場景部署能力,終端就不再是展示窗口,而成為調度節點。在移動網際網路時代,入口爭奪的是流量分發權;在大模型時代,入口爭奪的是場景調度權。誰的模型能夠嵌入更多真實世界的硬體與系統,誰就更接近下一個階段的控制中樞。因此,與其比較那家AI應用年底擁有更多日活,不如觀察那家模型正在進入更多終端。當AI成為終端默認能力,而不是被主動打開的工具,競爭的維度也隨之改變。春晚帶來的流量,是豆包成為“國民助手”的起點;2.0的跨代升級,則為其提供執行能力;而終端生態的鋪開,才真正決定它能否成為萬物入口。如果說 2026 年春節是 AI 大模型集體亮相的高光時刻,那麼對豆包而言,這或許只是一個能力周期的開端。從聊天工具,到國民助手,再到終端底座,登上春晚的豆包,正在開啟屬於自己的2.0階段。 (市象)
AI原生應用億級俱樂部:「BAT+DeepSeek 」格局初成
隨著2026春節假期結束,中國國產AI“億級俱樂部”也正式宣告上線。根據機構最新統計及各家官方最新披露資料,豆包、元寶、千問、DeepSeek這四款應用的月活躍使用者(MAU)均已穩穩突破一億大關。也就是說,這個春節之後,國產 AI 已經正式走出了實驗室的象牙塔,越過了極客圈層的窄門,成為了真正的國民級應用工具。站在2026農曆新年的節點上回頭來復盤生成式人工智慧這近四年時間,技術的進展多少是有點“時間玄學”的。從ChatGPT在2023年1月之後開始席捲全球,到2024 年從矽谷到中國的“百模大戰”,再到2025 年春節前後DeepSeek轟動全球,可以說幾乎每一年的農曆春節,AI都出現了堪稱爆炸性的變化。2026年春節,也沒有例外。隨著中國一眾國產AI爭相上春晚、發紅包、不斷刷新應用程式商店下載記錄,這也直接意味著,2025年年末一度興起的AI泡沫論可能要暫時告一段落,人工智慧,這一次是真的開始要改變人類世界了。2013年上映科幻電影《Her》中經典場景,元寶AI生成最佳化。01拆掉AI門檻回顧網際網路發展史,任何一項新技術想要實現“全民普惠”,都必須經過春節這個中國社交能量爆發最極致的洗禮。當年的微信支付如此,短影片如此,今天的AI亦然。雖然這一輪AI革命到今年已經三年多時間,但對於絕大多數人來說,AI到底怎麼用、能用來幹嘛?大多數人還是不清晰的。更重要的是,ChatGPT一直都還有付費門檻,這把更多人擋在了門外。因此,AI想要真正成為科技革命,還有關鍵一關要過,那就是下沉。而中國網際網路科技公司最擅長什麼?從歷史經驗來看,答案很明確,那就是拆掉技術落地的門檻。在這一輪AI行銷中,率先掀起紅包浪潮的騰訊元寶,應該是這一輪“AI普惠下沉”浪潮中的典型樣本。在此之前,AI應用的普及率雖然在提升,但主要集中在職場白領與學生群體。今年春節前夕,元寶先是通過“10億紅包”的強力槓桿,利用騰訊獨特的社交生態,將AI推向了更廣泛的普通使用者和下沉民眾。除了發紅包之外,騰訊元寶還開啟了新功能元寶派。在“元寶派”的邏輯裡,AI 變成了群聊裡的“高情商搭子”和“社交潤滑劑”。它可以自動總結群組裡幾百條碎碎念,提煉出有效資訊;也可以在你和朋友陷入沉默時突然“拋梗”調解氛圍。據報導,在元寶裡領紅包的網友,有近一半來自三四線及以下城市。此外,使用者通過元寶累計完成超10億次AI創作,產品團隊在21天內迭代了159個功能。這個量級說明,大量使用者不只是被動領紅包,而是開始養成了AI的使用習慣。阿里旗下的千問,在春節前推動的用AI點奶茶邏輯和元寶是類似的。因為大家都看到了同一件事:春節只是AI應用場景的開篇,當AI真正成為了國民級技術,其競爭維度也就從演算法和智能層面的比拚,下沉到了對人類生活場景滲透率的較量。其實對於普通使用者來說,他們並不關心大模型的參數到底是多少,也不在意技術架構的演進,他們真正在意的是——AI能不能幫我一鍵生成一個有我全家名字的春聯?能不能在我忙的時候一句話幫我點一杯奶茶?能不能在群聊裡幫連電話都害怕接的賽博社恐患者回那些尷尬的親戚問候?這些在日常生活中真實存在的需求,才是AI產品革新的真正動力來源。2026 年春節的這場AI行銷大戰,說到底是一場關於“AI 互動習慣”的大規模心智植入。紅包、奶茶其實都是形式,本質是強化技術的擴散,AI 廠商們成功地讓甚至不曾聽說過“大語言模型”的下沉市場使用者,也能夠熟練地輸入提示詞,甚至通過簡單的語音指令指揮 AI 幫自己完成繁瑣的任務。更直接點說,國產AI這個春節最大的成就,是讓爺爺奶奶輩的那些以往可能連AI是什麼都不知道的使用者,開始用上了AI。02億級俱樂部今年另一個肉眼可見的變化是,AI不止是戰場變了,玩家也變了。如果說上一輪AI“百模大戰”中誕生了曾經被寄予厚望的“AI 四小龍”,那麼到了2026年的今天,行業已經進入了真正的“四強爭霸賽”。豆包、元寶、千問、DeepSeek,這四家擠進“億級俱樂部”的玩家,代表了四種完全不同的底層邏輯和進化路徑。首先來看豆包。無論是短影片使用者原創的情緒互動,還是春節前seedance2.0突破了視訊製作的新可能,它的核心邏輯是明確的,那就是內容消費的延伸,讓 AI 成為短影片生態中的新型創作者和互動者。而2025年春節的黑馬DeepSeek,則是這一輪格局中的“極客之王”。一定程度上,它甚至是“反使用者”的存在。就在過年前,關於DeepSeek最熱門的話題是,這款AI為了性能,和使用者互動時開始變得冷淡了。但從另一面來看,這證明技術本身的“純粹性”依然能夠開闢出一塊巨大的、高粘性的專業版圖。而作為阿里系的代表千問,走的是一條“AI 驅動商業閉環”的道路。從一分錢外賣奶茶到阿里的電商生態聯動,千問正在探索如何讓 AI 直接觸達消費者的錢包。它試圖回答的是:AI 到底能不能幫人買東西、幫商戶賣貨?騰訊元寶所選擇的,看起來簡單,但事實上是AI在落地處理程序中最難的一部分——AI社交。這條路,早在2025年11月OpenAI就試圖嘗試過,但ChatGPT的群聊功能上線後,並沒有帶來太多的水花,畢竟在不菲的付費牆中,它依然是極客圈層的遊戲。而從今年春節元寶的成績來看,元寶很快通過技術普惠,利用圖生圖這一類似表情包的傳播模式,打開了AI社交的更多想像空間。資料顯示,自 2 月 1 日活動上線以來,元寶的 AI 生圖能力日均呼叫量增長了30倍。除夕當天,全網通過元寶 AI 生成的微信紅包封面、拜年金色朋友圈海報成為了社交場上的“硬通貨”。這種“零門檻”的創作體驗,讓新使用者與元寶的平均每天互動問答超過了8輪。使用者通過“創作”欄完成的AI任務累計超過 10 億次。其實,從元寶到整個國產AI億級俱樂部的對比背後,也暗藏的也是國產AI與美國AI的路徑選擇分化。ChatGPT和Gemini更多聚焦於模型智能的絕對峰值,追求的是“上帝視角”下的通用解決能力,但問題是,他們都有不菲的付費牆門檻。而對比之下,中國 AI 則更多聚焦在“技術擴散”層面,即如何將最前沿的技術以最低的成本、最自然的形式接入到現有的社交、消費和內容體系中。這不僅是市場環境的差異,更是中國網際網路基因中對“應用層創新”的極致追求。也正因為這樣,可以預見的是,2026年將會是“億級俱樂部”四強的主戰場。這一年真正的考驗是,能不能在各自的賽道把產品價值做到極致。當然在億級俱樂部之外,未來也一定會湧現出更多細分、垂直的AI物種。但無論如何,2026 年的春節一定會被視為AI技術發展史上的一個分水嶺:AI從此不再是實驗室裡的程式碼,而是群聊裡、飯桌前那個不可或缺的存在。03物種大爆炸相信很多人都有類似的感受:此刻的我們,彷彿再一次站在了2011年移動網際網路萌動之初的場景之下。那幾年裡,人們還在討論KIK、米聊,用的最多的即時通訊工具,可能還是營運商的簡訊和飛信。沒人能想到,最終是一個名叫“微信”的應用,通過整合社交關係鏈、內容生態和支付體系,徹底重塑了中國人的生活。今天的AI網際網路生態,也非常類似當年微信誕生前後的“物種大爆炸”階段。從矽谷的Openclaw風行到國內的AI社交、點單,如今的AI主打一個“能用”。而且,現在的AI革命已經進入了一個技術革新和模式革新雙重驅動的階段。首先是底層技術邏輯正在發生躍遷。姚順雨加入騰訊後,在一次內部會議中的分享點出了行業未來的關鍵:未來AI to C應用的瓶頸不再是更強的模型,而是 Context(上下文)和場景(Scenarios)。當各家的基礎模型能力都達到一定水位後,技術本身就不再是不可踰越的壁壘,真正的決勝點在於:誰能更精準地捕捉、理解並利用上下文。這或許也是為什麼騰訊將重心放在了“Context Learners(上下文學習者)”這一方向。在群聊這樣高度碎片化、流式資料的社交場景中,AI所面臨的挑戰是極度苛刻的。它不是在回答一個單純的問題,而是在處理一段連續的且充滿了潛台詞以及人際關係的對話流。如果AI不能理解使用者在一個不斷有數百條消息產生的群聊中的細微語境,它就永遠無法成為真正意義的社交夥伴。比如在元寶派,當使用者試圖在一個擁有數百條消息的群聊中讓AI總結重點,或者在一段長達數月的私聊記錄中尋找某個約定的細節時,AI 面臨的挑戰是:它必須在不依賴外部通用知識的前提下,精準地理解這段封閉對話中特有的語境、人際關係和隱含邏輯。這個核心問題正是騰訊AI首席科學家姚順雨領銜的混元團隊正在重點攻克的難關。但相信技術的進化會越來越快。隨著2026 年春節這一波億級使用者的洗禮,AI的資料回饋回路已經閉環。海量的、帶有強烈中國本土社交特徵的資料,正在喂養出更懂中國人的AI模型。另外,模式創新的進化也在同步加速。除了使用者本身圖生圖的工具屬性之外,在元寶公佈的最新AI應用場景中,在元寶派裡,已經可以實現“一起看視訊”“一起聽歌”類似的強社交行為。這也意味著,AI正在超越工具、成為現實人際關係中的一個節點。從目前來看,最符合人性的AI時代的社交,一定不會是讓機器模仿人說話,而是讓機器更好介入人與人的互動。站在這個視角看,對AI取代人類的擔憂目前或許還是為時過早,因為從社交角度來觀察,AI依然是在加深人與人的連結,而非取代人類社交本身。無論如何,2026年一定會是一個關鍵時刻。就像當年移動網際網路生態的成長過程一樣,最初的領先者未必是最終的定局者,在這個物種大爆炸的時代,一切都充滿了不確定性。如果非要在當下找到確定性,那就是——AI 已經徹底改變了數字世界的運行邏輯。從這一年開始,AI網際網路的新世界,已經為我們拉開了帷幕。 (深水研究)
春節檔狂降37%?不,AI洗牌才是真“震撼”
春節檔下降37%、seedance2.0發佈、豆包千問以及機器人大量應用於春晚上、恆生科技指數大跌,請問以上那個才是2026年春節最重要的大事?在電影製片人宇哥看來,這或許都是一件事:文娛行業的範式變了,AI才是未來。在這種恐慌之下,他聽過各種激進的說法,比如說“春節電影都值得用SeeDance重做一遍,成本只要幾十萬就行(不考慮版權和肖像權)”、比如說“影視業會真正工業化,從業人員工資不應該高於富士康”……但在這些電影老炮開腦洞的時候,真正的AI漫劇公司已經在行動了。就在立春(2月4日)那天,AI漫劇公司老闆羽毛(化名)正帶著疲憊團隊團建。排播表已鎖定,大家只想喘口氣。然而僅僅三天後,一枚“核彈”拋下來了——SeeDance 2.0,炸碎了這份寧靜。羽毛刷著那些流暢得不可思議的生成視訊,徹夜未眠。第二天,他取消了剩餘的團建,帶著核心骨幹緊急折返杭州的公司。一個迫在眉睫的問題壓在心頭:這把突然降臨的利器,還是行業洗牌的開端?率先洗牌的甚至不是AI漫劇,而是電影和電視。春節前,以Kanye West為主要角色的《新鴛鴦蝴蝶夢》MV從微博火到了X,製作工具正是SeeDance 2.0。春晚節目《賀花神》的動態舞台同樣由SeeDance 2.0製作完成,驚豔了所有人。海外電影製片人利用Seedance 2.0在一天時間內打造了一部號稱價值2億美元的AI短片,三天的播放突破1900萬。海外電影製片人使用SeeDance 2.0製作的短片羽毛的輾轉反側,精準折射出整個行業的興奮與擔憂。興奮的是新工具或許帶來的是又一輪影視內容生產力的大幅度提升;擔憂的是,如果稍不小心,自己之前的業務非常容易被先進的AI工具所取代。現在看來,SeeDance 2.0對影視行業不僅僅是多了一個可用的工具那麼簡單。SeeDance 2.0可以直接影響影視公司的戰略決策。整個製作流程中一些工種的地位得到進一步加強。不過,生產鏈路越完善的公司,往往受到SeeDance 2.0的衝擊就越小。當技術門檻被部分削平,產能不再構成絕對壁壘時,行業的競爭重心將不可逆轉地向產業鏈上游回溯,內容創意與IP沉澱將成為影視公司的制勝法寶。可以預見,一場深度洗牌即將開始。提效50%,降本37%,SeeDance掀桌傳統影視“行業要大變革了,要掀桌了。”這是興藝凱晨漫劇版權負責人呂卓熹在試用SeeDance 2.0之後的第一感受。呂卓熹表示,SeeDance 2.0對提示詞的敏感度遠高於其他模型,穩定性比其他模型稍高一點,在打鬥或是其他情況中不會出現三渲二的效果,打戲鏡頭的效果提升是非常明顯的,馬賽克和一團糊的情況基本可以規避,對文戲和鏡頭語言的理解也不錯,測試中可以理解特寫、側面、俯視等;在不給鏡頭提示的情況下能夠很好的進行畫面鏡頭景別的銜接和切換。SeeDance 2.0最核心的優勢,還是內容生產效率的提升。羽毛給小娛簡單地估算過,原來公司內部的一個五人團隊,製作一部漫劇需要接近一個月。現在,製作周期已經大幅縮減至半個月。興藝凱晨的產業鏈更複雜,但據呂卓熹預估,SeeDance 2.0可以給團隊的部分工作環節效率提升50%。其他影視內容的製作效率也有機會得到快速提升。《賀花神》裡蜀葵花和金魚的製作都使用了SeeDance 2.0模型,為每位演員的表演定製了“一月一人一景,一花一態一觀”的視覺奇觀,以“AI 生成影像+實景舞台擴展”的模式,建構出一種全新的舞台視聽敘事結構。SeeDance 2.0發佈後,春晚就是它第一個客戶。SeeDance 2.0參與製作的《賀花神》生產效率的提升伴隨而來是成本的削減。傳統影視工業中需要數萬元才能實現的特效效果,在SeeDance 2.0等大模型的加持下只需要幾百元。華泰證券測算,影視特效的成本有機會降低37%。中銀證券認為,製作一部90分鐘的漫劇,成本可從萬元等級降至2000元左右,降幅達80%。提升效率之後,一些落後產能將受到SeeDance 2.0的衝擊。這次率先遭到衝擊的是所有AI漫劇公司自建的工作流工具(AI agent)。羽毛所在的公司不僅有AI漫劇業務,他們還在幫助線下文旅產業開發一套AI agent系統。通過這套系統,線下景區既可以調教NPC演員,又可以生成特定的AI劇本。在深度體驗SeeDance 2.0之後,羽毛對於是否要繼續製作這類AI agent變得沒有那麼篤定了。羽毛說:“從技術角度來推演,AI現在什麼都可以實現。如果你的AI agent只能提升效率和生產力,沒有其他的功能,那麼買單的客戶早晚會全部跑光。”或許有人會認為,現在最慌的可能是巨日祿這樣的AI agent公司,但呂卓熹似乎並不認同類似的看法。他認為,以SeeDance 2.0目前的價格,對AI真人漫解等廉價作品來說並不是完全適用。而且,模型的迭代速度驚人,誰也不知道未來會有什麼樣的變化。可靈3.0,也才發佈不到半個月(圖源:可靈AI官方微博)興藝凱晨內部分成普通組和精品組兩個不同的組別。他們可能會考慮在普通組內搭建自己的AI agent。精品內容需要保障畫面和人物的細膩程度。自己搭建的AI agent勢必無法達到要求的效果。所以,興藝凱晨的精品組一直都是各個軟體拆分到不同生產環節去使用。如果SeeDance 2.0真的能長期全面商業化應用的話,興藝凱晨的團隊也不會無法適應。不少AI漫劇公司都有意願將內部的工作流工具化,進而向其他公司推廣甚至銷售。小娛曾經採訪過不少公司都有類似的計畫。SeeDance 2.0出現之後,這類公司還會不會繼續推進自身的計畫,值得持續觀察。SeeDance重構分鏡師職能,導演審美決定作品質量去年下半年開始,娛樂資本論和行業內眾多影視公司有過交流。影視公司有一個觀點是高度一致的,即導演、編劇、分鏡和動捕演員將在AI時代發揮關鍵作用。他們是一家影視公司的核心競爭力。SeeDance 2.0的出現,不僅沒有削弱這一共識,反而在無形中將這些工種推向了更中心的位置。技術的飛躍,正使得“從創意到執行”之間的鴻溝被急劇縮小,人的審美與專業判斷由此變得前所未有的重要。分鏡師的工作模式正被率先重構。SeeDance 2.0的亮點之一就是對分鏡的理解。創作者只需提供一段視訊分鏡,它便能快速學習並遷移到新作品中。這帶來的最直觀改變是效率的倍增。更富想像力的是,部分創作者已開發出“真人拍攝+AI學習”的新玩法。創作者按自己的構想表演並拍攝一段分鏡視訊,交由SeeDance 2.0學習後產出成片。最終的成片彷彿由專業動捕演員完成。這使得分鏡師從煩瑣的抽卡中解放出來,更專注於鏡頭設計與節奏把控。動捕演員及相關真人演示的價值,在新時代被進一步放大和確認。羽毛的公司在去年9月份的時候就已經為AI內容製作引入動捕演員。起因是羽毛髮現很多動作無法用提示詞來約束AI,那麼找動捕演員或者武術指導來拍攝視訊錄影並進行最終的遷移是最便捷的手段。創作者也能化身動捕演員(圖源:歸藏的X帳號)SeeDance 2.0更高成功率與一致性的生成能力,非但沒有讓武術指導和動捕演員等工種過時,反而證明了其必要性。尤其是對於武術、特殊打鬥等包含大量非套路化、高表現力動作的設計,真人演示提供的精準藍本,結合AI的強大遷移能力,正成為產出精品動作戲的黃金組合。導演的職能在SeeDance時代經歷了內涵的深化。呂卓熹坦言,SeeDance 2.0的分鏡能力非常強,但這不意味著SeeDance讓導演的地位一落千丈。導演的閱片量和審美決定了作品最終要選擇怎樣的鏡頭語言。AI能生成無數種可能,但究竟選擇何種運鏡風格和情緒節奏,依然依賴於導演基於深厚積累所做的判斷。AI製圖 by娛樂資本論這些工種的職能依舊重要,但AI工具的愈發便利會讓製作團隊的規模不斷縮小。超級個體未來有機會實現個人獨立創作,也就是所謂的“一人劇組”。同時,創作者將把更多精力放到提升閱片量或者審美水平的行動上,部分工序將會被AI所取代。興奮與焦慮並舉,孵化IP,還是走出去?SeeDance 2.0並非一款完美無缺的視訊模型。和各位創作者交流下來,小娛總結出SeeDance 2.0的兩大痛點,一個是“慢”,另一個是“貴”(相對其他AI模型)。2月10日開始,SeeDance 2.0的知名度已經從國內傳播到了海外,大批新使用者註冊會員並製作自己的作品。這就使得SeeDance 2.0生成一條視訊的速度變得非常緩慢。有網友指出,最高峰時刻SeeDance 2.0生成一條視訊的等待時間要2個小時。不過,生成速度緩慢的問題正在得到解決。2月12日,豆包正式官宣了SeeDance 2.0視訊模型,並在豆包App內實裝了SeeDance 2.0 Fast分流了部分普通使用者的需求。無論是剪映還是即夢AI以及雲雀,都能有更多空間給專業的內容生產助力加持。2月12日,SeeDance 2.0才全量鋪開費用也是很多創作者的痛點。SeeDance 2.0發佈初期,主流創作者都是通過雲雀AI進行體驗。雲雀AI的訂閱會員每月需要39元,套餐裡贈送1200積分。這樣的積分額度顯然無法滿足專業創作者的需求。目前,SeeDance 2.0還沒有發佈針對專業創作者的套餐和合作機制,這也是後續觀察視訊模型發展的一個重點。不過,創作者們顯然沒有去多想其他的事情,全都投入到了創作之中。春節期間,小娛已經看到了不少極具創意的作品,比較多見的是將兩個IP進行融合。比如經典林正英殭屍鬼片裡亂入了戰錘40K的《星際道士之風雲再起》。這部作品在B站已經收穫了近60萬播放,入圍了B站AI創作大賽。星際道士之風雲再起(源自UP主崔耶拉)SeeDance 2.0給創作者們帶來的顯然不止有興奮,還有焦慮。羽毛的身份是AI漫劇的承製方,他最擔心的莫過於以往的合作模式是否還會持續。過去,IP版權公司出劇本,他的團隊負責製作,雙方按比例分享後端收益。現在,手握SeeDance 2.0這類強大工具,劇本公司是否還需要一個外部製作夥伴?這種焦慮並非空穴來風,在廣告等領域已有先兆。羽毛提到,他身邊的許多廣告導演的第一反應就是失業了。對於精度和藝術水準要求不那麼高的項目,工具的高效足以構成對傳統人力服務的嚴峻挑戰。肖像和IP版權算是當下各個視訊大模型的暗雷。好萊塢製片廠和日本動畫公司可以向SeeDance揮起法律大棒,但那些中小IP版權方卻更焦慮。過去,內容製作還有一定的門檻,小IP找準市場也能賺得盆滿缽滿。現在已經進入技術平權的時代。IP方如果沒法把自身知名度提升,變得家喻戶曉,他們就失去了議價權。IP失去議價權的後果,自然是被AI浪潮拍死在沙灘上。面對即將到來的行業洗牌,焦慮之中也催生著新的發展策略。羽毛的想法代表了一部分從業者的前瞻性思考:一是向上游突圍,孵化自有IP,從代工廠轉向掌握核心內容IP的品牌方;二是橫向尋找新藍海,例如利用技術紅利與資訊差,開拓海外非英語市場,在全球化競爭中尋找先機。剛剛和同事開完會的電影製片人宇哥也是如此,雖然去年他們公司賺錢了,但他清楚,遊戲規則已變,他手裡那些開發成本數百萬的項目,“繼續開發也不是,扔也不是”。至於他們公司之前積累的版權和旗下藝人的肖像權,似乎也變得無足輕重,現在只剩下唯一一條清晰的足跡:要麼向上把IP做到真正的家喻戶曉,然後變成一個授權公司;要麼向外尋找新的藍海。被SeeDance 2.0重塑的這個春節,選擇一定比努力更重要。 (娛樂資本論)