#火山引擎
字節又賭贏了
豆包成為字節新“王牌”上周,豆包刷足了存在感。先是有媒體報導,火山引擎將攜豆包站上春晚 AI 雲獨家合作的 C 位;接著豆包 DAU(日活躍使用者數)破 1 億的消息不脛而走——若再結合火山引擎披露豆包大模型日均 Token 呼叫量已超 50 兆,一場事先張揚的 AI 輿論戰便在 2026 年前夕打響了。躁動的不止字節跳動:前腳,阿里調集數百名工程師聚集在西溪園區 C4 樓封閉開發千問;後腳,騰訊成立 AI Infra 部、AI Data 部及資料計算平台部,全面強化 AI 研發體系。種種跡象顯示,網際網路巨頭正在 AI 賽道不遺餘力推進 “模型研發與 ToC 產品落地平行” 的商業化佈局。這恰恰讓字節回到了最熟悉的“舒適區”——極致 ROI、極致商業效率早已刻進這家公司的 DNA,從資訊、短影片到電商、短劇,字節跳動向來擅長以“閃電戰”在軍備競賽中彎道超車;如今,字節跳動正在 AI 混戰中,不動聲色完成階段性成果驗收。字節迎頭趕上復盤字節跳動的崛起路徑,除在本地生活、遊戲賽道“短暫躊躇”外,其在資訊、短影片、電商、短劇等核心賽道都非先發者,卻最終上演了後來居上的戲碼。2024 年初,字節跳動 CEO 梁汝波在 All Hands 全員會上多次提及“危機感”。他坦言,不少內部人士反饋,現在字節“該有的大公司病全有了”,最大的危機感是擔心字節跳動作為一個組織,正變得平庸,無法取得新突破;尤其,在應對這波大模型浪潮時顯得遲鈍。這場會議成為戰略轉向的明確訊號,也是字節跳動奮起直追的關鍵註腳——此後兩年間,多篇媒體報導均提及,張一鳴對 AI 業務展現出濃厚興趣:不僅會在新加坡與研究員深度交流,還會定期回國與核心技術骨幹溝通。這一系列動態,也讓今年 6 月下旬“張一鳴重回字節跳動業務一線”的傳聞愈演愈烈——畢竟,他曾帶領字節跳動闖入騰訊、阿里的“狩獵禁地”,即便遭遇重火力阻擊,仍成功改寫了資訊、短影片、電商行業格局,打造出數款 DAU 破億的產品。據虎嗅瞭解,自 2024 年下半年起,豆包大模型所屬的字節跳動 Seed 團隊,被視為公司核心戰略業務,集團核心高管不僅親自參加 Seed 團隊復盤會,還深度參與 AI 技術路線、模型策略及前沿課題的規劃,字節跳動也從之前的反應遲緩快速切換至全力追趕的姿態。與此同時,2025 年 Seed 團隊完成了 AI Lab 等數個部門的整合,吳永輝肩挑“一號位”,全面統籌大模型基礎研究與應用落地,盡顯“畢功於一役”的戰略決心。背後的深層原因在於,當下中國移動網際網路已進入使用者、流量趨於見頂的成熟期,監管層面更側重產業網際網路的推進與建設,這意味著技術已走到平台重構生態的關鍵節點,張一鳴自然無法“作壁上觀”。正如四年前他卸任時預判的那樣:“科技公司面臨的外部環境正在變化,科技對社會的影響越來越大,這些因素決定了字節跳動‘需要突破業務的慣性去探索’。”與此同時,字節跳動的大模型敘事也搖身一變成了“逆襲樣本”,豆包的競爭優勢正逐步擴大。從使用者規模來看,2025 年初 QuestMobile 資料顯示,截至 2024 年 11 月底,中國 AIGC APP 整體月活使用者數量突破 1 億,較 2024 年 6 月實現翻倍;其中,豆包佔據行業一半的月活使用者份額,處於第一梯隊的 Kimi 智能助手、文小言與豆包的月活差距也在持續拉大。如今,豆包的 DAU 已突破 1 億,且使用者增長過程中的市場推廣成本是字節跳動歷史上所有 DAU 破億產品中最低的。資料來源:AppGrowing(2025年)據 DataEye 研究院資料,2025 年 11 月大陸市場原生 AI 產品投放素材達 89.1 萬組;其中,騰訊元寶素材量佔比 46%、千問佔比 34%、豆包僅 11%。從整體市場投放格局來看,2025 年騰訊元寶、阿里夸克、字節豆包穩居前三。其中,騰訊元寶的投放策略最為激進:AppGrowing 資料顯示,自 2025 年 2 月起,元寶的投放力度持續走高,尤其春節後,騰訊元寶憑藉高額投入在 APP Store 免費榜先後超越豆包、DeepSeek,最終於 3 月 3 日登頂中國區 APP Store 免費榜。阿里同樣來勢洶洶,千問 APP 於 11 月 17 日開啟公測,據第三方資料,其創下國內 AI 應用最快增長紀錄,成為不容小覷的“攻擂者”。至此,網際網路大廠在 AIGC 這一新賽點,似乎又回到了移動網際網路時代卷投放、搶管道入口的“暴力燒錢”模式。一位大模型行業從業者向虎嗅表示,字節跳動在 AI 領域展現出了體系化的執行力,核心體現在三方面:精準把握戰略方向、高效配置研發資源以及快速響應市場的迭代能力。“梁汝波內部反思至今不足兩年,字節跳動卻能快速鎖定關鍵戰略方向、調整資源分配,在大模型領域迎頭趕上——C 端推出豆包、貓箱(AI 虛擬陪伴應用)、剪映(視訊編輯工具)、扣子(AI 智能體開發平台)等貼合需求的產品;B 端通過火山引擎持續最佳化 AI 雲服務。相比之下,部分大廠在市場響應速度與技術支援上有所保留,導致其在競爭中逐漸顯現頹勢。”上述人士補充道。對此,火山引擎智能演算法負責人吳迪曾向虎嗅表示,AI 是一項需要長期投入的事業,未來 10 年、20 年才會逐漸顯現真正價值,眼下的快慢在漫長的歷史周期中影響有限——這一邏輯與移動網際網路 3G、4G、5G 的普及處理程序類似,技術變革需建立在使用場景充分落地、使用者心智深度滲透的基礎上,只是 C 端使用者與媒體往往會過度關注短期進展並加以解讀。“做好產品本身更為關鍵:B 端客戶注重產品性價比,C 端使用者則關注使用體驗,本質是讓使用者無論選擇那款產品,都能獲得更便捷、實用的服務。”吳迪強調。事實上,從抖音到紅果,從豆包到即夢、貓箱,字節跳動全面的產品策略與靈活的市場定位,使其能夠覆蓋不同使用者群體需求,持續強化對流量入口的掌控力:一方面,豆包、貓箱、剪映、扣子等 C 端應用通過使用者互動沉澱資料,反哺模型性能最佳化,進而提升使用者粘性與忠誠度;另一方面,AI 應用的“幻覺”問題需通過持續最佳化資料質量、模型架構與評估機制來解決,而廣泛收集、清洗、標註資料是關鍵,這能有效避免模型過度擬合,提升泛化能力。尤其隨著市場競爭格局逐漸明朗,大模型的核心競爭力已轉向推理效率、精準性與即時性,頭部大廠紛紛推出模型開發平台,建構開放生態:火山引擎 2023 年 6 月推出 MaaS 模式大模型服務平台“火山方舟”,整合多家 AI 科技公司及科研院所的大模型,提供企業級精調、推理、評測全流程服務,同時逐步向個人開發者開放。阿里雲 2023 年 10 月上線“阿里雲百煉”,整合通義千問系列、DeepSeek 等主流模型,支援文字生成、多模態處理、程式碼生成等核心能力,通過 MCP 服務等開放生態及行業解決方案推動 AI 規模化落地。騰訊雲 2025 年 5 月 21 日將“大模型知識引擎”升級為騰訊雲智能體開發平台(TCADP/ADP),依託混元大模型與優圖實驗室演算法優勢,支援低程式碼/無程式碼搭建專屬智能體。一位大模型創業者認為,這些優質的模型開發平台,可以助力中小團隊向更垂直的細分領域突破:一是聚焦技術研發,深耕特定應用場景,最佳化模型性能,提供高品質專項服務;二是建構完整解決方案,圍繞模型打造資料採集、預處理、部署等全流程服務,提升使用者體驗;三是探索創新商業模式,積極佈局訂閱服務、技術支援、定製化開發等增值服務,增強盈利能力。這與火山引擎總裁譚待的期待不謀而合。他認為,AI 如同一場馬拉松,早期階段無需緊盯最終目標,而應聚焦“成功的早期訊號”——基於這一理念,團隊重心會放在產品最佳化上,通過與客戶高頻互動、響應市場迭代,持續驗證產品是否走在正確的發展軌道上。一個獨特的全球化樣本隨著豆包一路狂飆,市場浮現了一個不容忽視的訊號。誠然,阿里雲、騰訊雲、百度智能雲憑藉自身資源已然佔據先發優勢與人才優勢,火山引擎晚了近十年才“上桌”;但憑藉豆包的爆發式增長,其大模型日均 Token 呼叫量已超 50 兆(半年內增長 200%),規模全球僅次於 OpenAI 和 Google Cloud,以至於被媒體調侃:字節跳動正在變成“Token 跳動”。對此,火山引擎總裁譚待表示,不同於雲端運算時代,AI 雲時代模型是軟體核心,尤其隨著大模型能力持續提升,偏向 C 端的行業增長更快,例如網際網路、C 端零售(含手機、汽車)、教育等領域。“但 B 端也不錯,有個客戶內部做了大概 100 多個智能體,每天有幾十億 Token 消耗。”他進一步補充,雲端運算時代 Token 消耗符合二八定律,企業與個人的用量佔比約為 8.5:1.5,而在 AI 雲時代,這一比值正動態調整至 7.5:2.5,“我覺得未來,個人可能還會再高一點”。究其本質,大模型時代的 AI 應用開發是全新的技術範式,核心競爭力聚焦三點:模型智能度、響應速度、成本控制——這三大因素直接決定 AI 應用的使用體驗與使用者普及度,也成為 AI 雲廠商競爭的 “新賽點”。譚待還透露了一組關鍵資料,“我們內部算了一下,火山兆 Tokens 客戶有 100 個,比 AWS 多一些,說明整個 AI 的進展還是比較好的”;至於客戶分佈,火山引擎曾對外公佈,覆蓋八成頭部咖啡茶飲品牌、九成主流汽車品牌、八成頭部券商、八成系統重要性銀行、七成 985 高校,以及 9 家全球出貨量前十的手機廠商。作為對照,2025 年 10 月 OpenAI 曾披露,其 Token 呼叫量過兆的客戶僅 30 家,且集中在教育、銷售、程式設計(Coding)等場景。“模型競爭日益激烈,每兩三個月就有新的 SOTA(最優性能)模型誕生;預計到 2026 年,全球 MaaS 賽道大機率只會剩五六家在第一梯隊。” 一位資深行業觀察人士向虎嗅分析,如此激烈的競爭格局下,基礎模型能力的提升將倒逼企業持續加大算力投入,而工程化升級則要求更低成本、更高易用性,兩者疊加比拚的仍是模型“性價比”。AI 業務的狂飆,也在推動字節跳動向著一家具備全球影響力的科技公司邁進。過去一年,字節跳動在電商、短劇、AI 領域的擴張速度明顯加快,旗下所有應用的月活躍使用者數預估超 40 億,商業化能力也節節攀高。先是 2025 年 7 月,外媒報導今年前三月,字節跳動收入超過 430 億美元,首次超過 Meta 同期的 423.1 億美元,成為 2025Q1 全球收入最高的社交媒體公司。圖源:Tech News Hub12 月 19 日,外媒援引知情人士消息,字節跳動 2025 年淨利潤或將站穩 500 億美元關口,超額完成全年盈利目標,營收也將從 2024 年的 1550 億美元增至約 1860 億美元。要知道,美國科技巨頭 Meta 2025 年的營收預計約 2000 億美元,利潤或將維持在 600 億美元,字節跳動在全球使用者規模、營收、利潤等核心指標上,均在持續縮小與 Meta 的差距。此外,12 月 23 日外媒報導,字節跳動計畫在 2026 年投入 1600 億元加碼 AI,其中一半預算將用於 AI 晶片採購——若按照 2025 年 500 億美元的預估利潤計算,字節跳動 2026 年的 AI 投入將佔 2025 年全年利潤的近一半。從 AI 賽道的加速狂飆到 AI 晶片投入的愈發激進,資本市場也給出了積極反饋:先是軟銀願景基金將字節跳動估值上調至 4000 億美元以上;隨後,富達投資與 T. Rowe Price 在各自的持倉與估值模型中,分別給予字節跳動約 4100-4500 億美元的估值區間。更高的估值溢價則來自近期的二級市場交易:今日資本創始人徐新掌舵的機構,以約 4800 億美元的整體估值買入字節跳動股份——即便如此,字節跳動的估值與 Meta 當前 1.7 兆美元市值相比,仍存在不小差距。對此,科技行業觀察者魏亞輝認為,字節跳動是中國網際網路領域一個獨特的全球化樣本——這家公司成立後兩三年便實現大規模盈利,這在之前的中國網際網路公司中屈指可數;同時,它在海外市場與國際巨頭展開勢均力敵的競爭,憑藉一年近 500 億美元的淨利潤(接近騰訊兩倍,基本與 Meta 持平),真正實現了全球級盈利水平。“此前中國部分網際網路公司盈利不佳,原因在於那一代創業者大多不以利潤為核心導向,指望這類企業在短期內實現高額盈利並不現實;而以字節、大疆、拼多多、米哈游為代表的新一代企業,顯著特點是盈利能力極強,應該把希望放到這些新公司上來。”魏亞輝說道。 (虎嗅APP)
火山引擎有了它自己的Token經濟學
Token,Token,還是Token。在12月18日的FORCE原動力大會上,火山引擎總裁譚待半小時的開場演講裡提了18次“Token”,而“雲”則只出現了7次。火山也再次更新了備受矚目的豆包大模型最新日均Token呼叫量:50兆。這一指標從發佈至今實現了417 倍增長,相比去年 12 月則是超 10 倍增長。作為對比,Google10月最新公佈的月均Token直接換算為日均量的資料是43兆。豆包大模型的呼叫量已經是中國第一、全球第三。而根據IDC的報告,火山引擎在中國的公有雲大模型的服務呼叫量上也是穩居第一,MaaS市場份額從2024年的46.4%進一步提升到了今年的49.2%。“也就是說,在中國公有雲上每產生的兩個Tokens就有一個是火山引擎生產的。”譚待在當天面對台下5000名觀眾說道。在當天的發佈中,一如既往由火山來更新了字節最新模型的進展。豆包大模型1.8正式亮相,它在多項指標上顯著提升,繼續走All-in-One的技術路線,文字、程式碼、Agent、音訊,圖視訊等能力,全部在同一個基礎模型裡演進;而專門為視訊生成服務的Seedance 1.5 pro也同步推出,在音畫同步、中文及方言處理上做到了“世界領先水平”。字節要傳達的資訊明顯:豆包大模型創造著Token,且它的進化方向也正對應著今天Token消耗的結構性變化——從“推理取代訓練”推動Token消耗,到今天多模態+Agent成為Token的絕對大頭,這些需求都可以被火山提供的服務滿足。這一切迅猛增長的背後,火山引擎正在建立起一套它自己的Token經濟學。更多的Token就是代表更多智能Token,是大模型處理資訊的基本單位。無論是文字、圖像還是視訊,在模型中都在被轉換為Token序列進行計算。本質上,Token就是人們對AI的呼叫量。但這背後存在一個問題:由於Token的計算方式基於長度,所以一篇文章和一段關鍵的程式碼可能消耗相似的Token數量。那麼,純粹的以Token數量來衡量,能否真實反映AI創造的價值?火山引擎的演算法人員在和我們的交流中回憶,其實曾經火山內部也有過類似爭論,但最終的結論是:Token量一定是對的指標。“AI要在實際場景產生價值,大家肯定要把它用起來,不管單位價值有大有小,但實際上一定是跟Token用量正相關的。可能你最終的那個關鍵決策對應的只是‘是’或者‘否’,一個Token,但得出這個結論必然已經用掉了大量Token。”所以火山內部最終明確,更多的Token就是代表更多智能。而今天Token的增長,其內在結構也在悄然變化。火山引擎智能演算法負責人吳迪提供了一個演化路徑:“可能到了2027,2028年,一個普通的C端使用者從AI助手得到的很多的訊號就是視覺的,你不會看到大段大段的文字了。那麼,到時候LLM會以coding和agent的形式下沉到整個數字世界的底層運行邏輯裡。”換言之,Token會分層,LLM會向下成為底座,多模態的視覺、互動Token將在上層湧現。這就會讓Token成為一個持續增長的指標,也是一個有效指標。吳迪預測,到2030年,國內市場的Token消耗量將是現在的百倍以上。屆時,衡量企業智能化程度的核心指標,將從其擁有的GPU數量轉變為消耗的Token總量,因為它是唯一能同時穿透“模型能力、使用頻率和真實需求”的統一指標。雲設施必須以模型為中心重構更多Token意味更多智能,那麼如何讓企業客戶更好生成它們需要的Token,就是火山作為從字節內部走出的“AI雲原生”基礎設施的任務。過往雲端運算所習慣的一整套體系也因此出現“不適”,它更多是一個圍繞算力設計的體系,而火山認為新的需求註定是圍繞模型的。“傳統 IaaS、PaaS、SaaS分層規劃的IT架構不再有效,以模型為中心的AI雲原生架構正在形成。”譚待說。此次的一整套體系也由此誕生。火山推出了“推理代工”,企業可將訓練好的模型託管至火山,按實際Token消耗付費,無需自建推理叢集;Agent開髮套件(ADK) 全面升級,支援動態執行階段、多會話共享、強身份傳遞與內建工具鏈;智能端點(Endpoint) 支援模型路由,可根據效果、成本等策略自動分流至豆包、DeepSeek、Kimi等多模型後端;方舟平台進一步升級,支援客戶在自有場景中做RL 強化學習等的微調。而且這一系列產品裡的很多細節,都體現出很多根本性差異。例如,Agent開髮套件(ADK) 的動態執行階段設計,直接挑戰了行業慣例。AWS AgentCore為每個會話啟動一個獨立執行階段,而火山採用多會話共享模式。火山引擎雲基礎產品負責人田濤濤直言,這是一個行業慣性的問題,AgentCore為每個session起一個Runtime,過去可以,但進入模型時代就太奢侈了,而火山對成本敏感,字節自己內部就一直有不同的更AI原生的需求,因此本就有不同的設計,現在可以推廣給更多模型使用者。在火山看來,人們最終會“躍過”對算力的關注,最終直接衝著模型而來。“你很難想像五年後新的創業者還會去雲上租GPU、開資料庫。到時候在他們創業的第一天,他們會直接向雲服務商‘要Token’,直接要的就是呼叫模型和配套工具。”吳迪說。“我們已經把像Response API、分佈式的KV Cache、良好的P/D分離、一大堆高品質的內建Tools組裝好了,等著你把你的一個齒輪裝上來,這輛車就能跑。”火山還配套改進了模型服務的定價模式,推出了一個“AI節省計畫”,讓企業達到模型使用成本的全域最優解。“客戶只需要為用了的Token付錢。”模型訓練和市場需求一桿子打通現在我們可以來看看字節和火山今天已經有了什麼:最大規模的雲端運算需求:內部支撐抖音等國民級產品帶來的規模效應和成本優勢。最多使用者的大模型產品:豆包。而且在火山的視角,它也是一個最大的Agent產品。第一的Token呼叫量:50兆/天,且還在猛漲。以及支援著豆包app和抖音這種巨量真實需求的多模態和推理大一統的豆包大模型。這種全端系統能力是今天最重要AI玩家必備的能力,橫向對比,可以把目前的玩家分為三種路線:OpenAI + 微軟路線:模型自己的,雲設施是戰略夥伴的。阿里雲路線:開源模型長在自己雲上,然後近期在強推產品。Google路線:全部自研,模型閉源,產品到研發直接全面打通。這裡面,字節的路線很像Google。豆包就對應著Gemini,一個大一統的多模態agent模型。Seedance 1.5緊跟Veo3,甚至超過了對方。這一切的技術基礎也和Google類似,都長在自己的以AI為核心的機器學習平台和雲服務上,然後這些“Gemini同款”和“豆包同款”細化成產品再提供給外界。而尚未被太多關注到的另一個“相似”,則是對待模型技術的方式上。Google在Gemini 3的“翻身仗”後分享了很多內部復盤,其中最重要一個因素就是模型、研發、產品和需求的統一打通。而字節如何訓練模型此前並未被外界瞭解,它與大多模型公司一個非常大的不同是,它把真實市場需求直接一桿子打通到了模型訓練層面。火山引擎作為模型對外統一的出口,也有自己的演算法人員,他們和字節的模型部門Seed緊密合作,甚至是“混合辦公”和各種靈活的配合方式,而火山引擎團隊所獲取到的市場需求情況,可以直接影響模型研發方向和決策。火山的模型策略團隊會把市場上的需求反饋收集和抽象出來,直接影響到模型的重要功能和研發方向。這都直接體現在豆包大模型的身上:豆包之所以是一個大一統的模型,除了技術路線的選擇,也是從客戶體驗出發:火山的客戶們認為模型版本太多了,甚至字節內部的“使用者”都搞不清楚各方面的區別,所以這個模型必須all in one來降低選擇成本。字節認為,今天訓練模型最重要的是評估體系,而它絕對不應該只是公開的benchmark,必須用真實業務價值來衡量模型能力。字節內部已經為B端建設了大量benchmark,模型開發成果必須真正符合實際的經濟價值要求。於是Seedance會在模型層面增加一個Draft樣片的能力,讓使用者不是抽卡,而是提前做預覽判斷;豆包模型在建設工具呼叫能力之外,直接在配套API中就配套做了許多built in的工具。128k上下文這種看起來能用來炫技但事實上實際需求並不高的能力,就會被去掉。“在25年,有超過100萬家企業和個人使用了火山引擎的大模型服務,覆蓋了100多個行業,我們也對他們在火山方舟上的用量進行了匿名統計,我們發現,有超過100家企業在火山引擎累計Tokens使用量超過了1兆。”譚待在發佈會上說。這可能是比市場份額增長更值得玩味的一組資料。 它最能體現字節這種用需求指引模型發展的方式所帶來的收益。所以,如果我們來拆解一下,字節的Token經濟學就是:1. 越多的Token意味越高智能Token是智能的度量衡,其增長與結構變化指引技術演進。2. 服務AI的雲必須以模型為中心重構傳統雲廠商的慣性已經太大,而火山服務的最大客戶就是字節自己,字節就是一個長在AI和模型上的公司,火山解決的一直是AI的需求,現在這些需求變成外界的廣泛需求,它的技術思路就可以用來重構整個雲行業的方案。3. Agent的普及會讓Token從原材料變為更高級的智能單元,進而帶來更大價值譚待曾經形容,目前基於Token的商業模式還很原始,而今天他認為,隨著Agent的進步和在企業裡的普及,Token最終會走出今天“原材料”的定位。Agent 可將模型串聯,雲平台和中介軟體進一步把Tokens組裝成Agents,並實現Agent和現有工作流、Agent和Agent之間的智能互通,以 API 或完整 Agent 的方式提供服務,從更高抽象層次創造價值。“今天討論Token,是從底層作業系統角度看,是在 IT 預算環節考慮;而抽象成 Agent 後,可從 BPO (業務流程外包)角度看待,那麼它就是在擴大整個市場的規模了。”譚待說。“人們常說的10兆Agent市場,核心就是這個邏輯。” (矽星人Pro)
豆包大模型1.8正式發佈,擁有更強多模態Agent能力,豆包日均使用量超過50兆,推出成本節省計畫降幅達47%
豆包大模型1.8具備更強的多模態Agent能力,256K超長上下文使其能夠處理更複雜的資訊,擅長處理複雜多步任務。火山引擎正式發佈的"AI節省計畫",普惠覆蓋豆包大模型、豆包視訊及圖像創作模型與第三方開源大模型,全面最佳化使用者呼叫成本,最高節省幅度達47%。火山引擎在2025原動力大會上發佈豆包大模型1.8,具備更強的多模態Agent能力,256K超長上下文和原生API上下文管理,擅長處理複雜多步任務。火山引擎總裁譚待在12月18日的大會上透露,平台"兆Tokens俱樂部"成員已突破100家。並披露豆包大模型日均使用量超50兆Tokens,自發佈以來增長417倍,同時推出最高節省47%的AI成本最佳化計畫。除主力模型外,火山引擎同步發佈圖像創作模型Doubao-Seedream-4.5和視訊生成模型Seedance系列,進一步完善多模態能力版圖。新推出的Seedance-1.0-Pro支援2至12秒1080P自由生成,可實現多人語言對白和多鏡頭敘事。火山引擎正式推出"AI節省計畫",一次加入即可覆蓋豆包大模型、視訊圖像創作模型及第三方開源大模型,支援全預付、零預付等靈活付款方式。開源證券研報指出,此次發佈有望推動AI在企業生產場景中的落地應用。火山引擎總裁譚待在回應對明年模型行業的競爭時表示,“明年模型之間最重要的還不是競爭,最重要的是要把市場做大。明年這個市場可能還要再漲10倍,大家其實就不是存量的競爭,不是零和博弈,而是說大家一起把市場做大。同時,明年模型還需要進一步降價,這個市場才能做大。”01 核心模型能力全面升級豆包大模型1.8在多模態理解上實現顯著提升。模型的長視訊理解和安防監控場景能力得到增強,256K超長上下文使其能夠處理更複雜的資訊。通過更靈活的上下文管理,新模型可輔助公司處理複雜任務並支援決策。在圖像生成領域,火山引擎發佈的Doubao-Seedream-4.5具備多圖組合、創意寫真、圖片拆解、複雜組圖、虛擬試穿與海報設計等能力。視訊生成能力同步增強,Seedance系列包含兩個版本:Seedance-1.0-Lite以成本優先兼顧速度,適配高頻創作;Seedance-1.0-Pro提供影視級畫質與原生音效,滿足電影級感官敘事需求。豆包大模型已落地智能硬體與語音助手,應用場景覆蓋日常溝通、專業服務與報告解讀、聯網搜尋等。配合使用者認證的邊想邊搜互動體驗,使豆包成為隨身智能夥伴。02 推理與開發服務生態完善火山引擎推出"火山方舟"推理代工服務,已接入Qwen、GLM、Seed-OSS等主流開源大模型,支援企業將精調後的模型一鍵Serverless部署。平台提供海量資源、專屬推理加速與極致彈性調度,承諾"你訓練,我推理"。Viking系列產品在大會上亮相,VikingAI搜尋與VikingDB向量資料庫雙輪驅動,為終端使用者提供優質輸入,為模型與Agent快速建構知識庫和記憶庫。配套的多模態搜尋支援文字、圖像跨模態檢索,個性化推薦實現"千人千面",Agentic問答基於豆包大模型精準識別意圖。在Agent開發方面,火山引擎發佈企業級AI Agent平台AgentKit與TRAE(CN)企業版,已獲NIO、PwC、匯付天下、銳捷、軟通動力、高頓等頭部客戶採用。平台依託企業級GPU叢集,支援10萬檔案、5億行程式碼超長上下文,可靈活配置企業規則、知識庫與Agent,即時追蹤AI生成率與程式碼量,程式碼全鏈路加密傳輸、雲端零儲存。03 成本最佳化計畫釋放普惠紅利火山引擎正式發佈的"AI節省計畫"採用一次性加入機制,普惠覆蓋豆包大模型、豆包視訊及圖像創作模型與第三方開源大模型,全面最佳化使用者呼叫成本。最高節省幅度達47%,支援全預付、零預付等多種付款方式,實現"多用多省"。火山引擎此次還發佈了MaSS on AICC服務。開源證券研報稱,火山引擎此次發佈有望實現性能提升與成本降低,特別是視訊生成模型的進一步升級。研報建議關注字節產業鏈及AI應用投資機會,認為Agent開發工具的升級與Agent生態的擴容將推動AI在企業生產場景中的落地應用。 (硬AI)
聽說字節要造機器人,月薪開12萬
宇宙廠要造機器人?據科創板日報、第一財經等多家媒體報導,字節跳動旗下的火山引擎團隊,正以高達9.5萬至12萬的月薪招聘操作演算法資深專家(具身智能)。按照職位描述,這個崗位主導研發“人形具身機器人”的操作演算法,包括但不限於演算法架構設計,抓取演算法,VLA模型研發,靈巧手等方向的工作。職位描述中的五大核心職責,包括“主導研發人形具身機器人的操作演算法”、“參與具身大模型的預訓練與部署”以及“推動演算法在硬體上的系統整合與部署”等。這份對人才的要求,勾勒出字節跳動意在打造一個整合先進大模型、具備複雜操作能力的具身智能體。除了操作演算法資深專家,字節跳動同時也在招聘具身智能資料開發工程師、具身智能推理性能最佳化工程師、運動控制演算法資深專家等具身領域相關崗位。開這麼高的工資,說明不是“端側小應用”,而是面向通用具身智能棧的投入。字節造機器人不是新鮮事,只不過之前造的是輪式物流機器人。據“晚點LatePost”披露,字節跳動的機器人探索始於 2020 年,2023年7月時已有50人團隊。到2025年已累計量產超千台。今年開始在具身智能發力。7月,字節跳動Seed團隊今日發佈通用機器人模型GR-3。這是一款VLA模型,也就是機器人的大腦,能讓機器人理解指令、操作柔性物體,甚至雙手協同幹活。同樣是7月,發佈高自由度靈巧手ByteDexter,具備20個自由度,可以通過遙操作等輔助裝置實現人手的靈巧操作。9月, Seed 團隊發佈最新的機器人研究成果——Robix,一個旨在提升機器人思考、規劃與靈活互動能力的“機器人大腦”。據“機器之心”報導,搭載 Robix 的機器人已展現出一系列過去難以實現的複雜互動能力。比如,在做飯時,它不僅能根據菜名(如“魚香肉絲”)準備食材,還能主動發現缺少配料並詢問是否需要補齊。10月,火山引擎還與賽力斯集團旗下重慶鳳凰技術有限公司簽署具身智能業務合作協議,合作範圍包括“面向多模態雲邊協同的機器人決策、控制與人機協作技術”。字節提供AI技術支援——包括AI演算法、算力、多模態模型等;賽力斯提供產業場景和落地經驗——包括真實的產業需求、測試環境,並負責將技術最終落地到汽車、機器人產品中。如果把機器人“拆”開來,字節跳動已經在機器人的大腦、手、腿、演算法、場景等都開始各自有所進展了。為什麼現在又要招人做完整的機器人?字節跳動的優勢在於多模態大模型與流量分發。而具身智能需要長時程、閉環互動資料(視覺-觸覺-動作-語言)。把機器人引入“倉配/門店/內容生產”多場景,能產生高價值對齊資料,反哺其Agent與VLA模型。“未來程式碼局”則認為,全球網際網路的線上使用者增長和使用時長都已見頂,“線上流量”枯竭了。新的流量在物理世界。具身智慧型手機器人是終極的資料採集終端。它擁有視覺、聽覺、觸覺,它在現實世界中24小時不間斷地與環境互動、收集資料。這些資料是訓練更強大AI的“完美燃料”。對於字節來說,佈局具身智能,不僅是開闢新業務,更是為了獲取“下一代流量”——物理世界的資料流,從而延續其“資料-演算法-產品”的核心優勢。另外,由前字節跳動財務投資部負責人楊潔創立的錦秋基金(字節跳動為其出資方之一),正在深度佈局具身智能產業鏈正在深度佈局具身智能產業鏈,已投了星塵智能、樂享機器人、首形科技等機器人公司。 (鉛筆道)
中國市值第二車進軍具身智能:這次牽手字節
兩個身價超千億的巨頭,聯手具身智能合作了。如今市值已躋身車企第二的賽力斯,在具身智能賽道潛心佈局已久,剛剛以一則公告,正式官宣了其具身智能的最新動向。不過這次攜手的隊友,不是「好大哥」華為,而是另一家大家熟知的科技巨頭——字節跳動。看起來,這似乎是賽力斯首次明確對外官宣具身智能進展,但深挖之下,實際上早在兩年前,賽力斯就在為打造機器人做準備了。賽力斯官宣具身智能,隊友是字節火山賽力斯最新發佈公告,官宣旗下的子公司重慶鳳凰技術有限公司(以下簡稱「重慶鳳凰」),攜手北京火山引擎科技有限公司,簽訂了一份關於共同研發智慧機器人技術的初步合作協議。重慶鳳凰,是賽力斯的全資子公司,營運範圍包括智慧機器人的研發、製造、銷售等等。火山引擎,大家可能比較熟悉了,2020年成立的科技公司,專注做AI、雲端運算和資料服務,母公司是最新估值約超3,300億美元(約2.35兆元)的字節跳動。根據公告介紹,雙方打算透過「技術研發+場景驗證」的模式,圍繞著「多模態雲邊協同的智慧機器人決策、控制與人機增強技術」展開合作。簡單理解就是:字節提供AI技術支援:包括AI演算法、算力、多模態模型等;賽力斯提供產業場景和落地經驗:包括提供真實的產業需求、測試環境,並負責將技術最終落地到汽車、機器人產品中。不過呢,這次簽署的還只是一個框架性協議,等於意向書,目前還沒有揭露更多細節。賽力斯也明確了,協議不會對2025年財務表現造成什麼重大影響。至於怎麼具體合作、做什麼項目,涉及金額幾何,就要看後續簽訂更具體的合約內容了。另外,公告也提到了,賽力斯官宣入局具身智能的緣由:其一,是響應國家「人工智慧+」政策的號召,推動AI與實體經濟深度融合。其二,是從賽力斯自身角度出發,可以提前佈局前沿技術,為未來的智慧汽車、智慧製造領域做準備,也符合公司的長期發展策略。事實上,賽力斯瞄準具身智能已久,早在兩年前就開始暗藏珠璣,埋好了伏筆。車企具身智慧佈局,集體浮出水面捋捋時間線,賽力斯從2023年底開始,就被外界感知到了入局具身智能的動作。這一過程,可以大致分為三條線:第一條線是成立專門的公司、註冊品牌,為具身智慧業務搭建實體架構。早在2023年12月,賽力斯就連同重慶市財政局,共同出資成立了重慶賽力斯鳳凰智創科技,專門用於承接機器人業務。2024年9月,賽力斯申請了「ROBOREX」 商標,不久前已獲國家智慧財產局核准註冊。當時外界普遍推測,這很可能就是賽力斯機器人產品的潛在品牌。還有本次簽署協議的重慶鳳凰,也是賽力斯在今年3月17日創立的新公司。而且重慶鳳凰成立不過半月,也攜手北京航空航太大學,合資成立了北京賽航具身智慧科技有限公司,專注於智慧機器人的研發與銷售,賽力斯透過重慶鳳凰持股70%。第二條線,體現在賽力斯正在為具身智慧業務「招兵買馬」。從2024年下半年開始,賽力斯的招募資訊中,就已多次出現具身智慧相關的需求,涵蓋具身智慧控制工程師、嵌入式軟體開發等職缺。例如今年的春季校招,賽力斯首次設立了「具身智能大模型工程師」崗位;秋季校招還有「具身智能大模型演算法工程師」等崗位,現在還能在其招募官網中看到。第三條線,實際和第一條線相輔相成,就是與外在力量進行策略合作。像是和前面提到的重慶市財政局、北航,以及本次合作的字節等等。梳理下來,其實在具身智能這條路上,賽力斯排兵布陣已久,各方面都做了鋪墊,這次明確宣佈合作,更像是時機恰到好處的進場宣言。不只是賽力斯,如今國內眾多主流車企,都在追趕具身智能這一熱潮。「參賽」方式無非兩種,要麼自主研發——已有產品亮相的包括廣汽的GoSide、GoMove、GoMate人形機器人“家族”,小鵬的PX5和Iron,小米的Cyber​​One和鐵蛋(Cyber​​Dog)等等。△廣汽GoMate人形機器人理想、蔚來、東風等也都明確表態,正在具身智能領域加快動作。要嘛就是砸錢投資,尋找合作機會。像是比亞迪、上汽投資智元機器人,長安攜聯手海爾集團…還有奇瑞攜手AI公司Aimoga,打造了墨甲人形機器人墨茵,上半年已經完成首批交付,有消息稱,這個月就會面向經銷商和個人售賣了。△奇瑞人形機器人墨茵車企們集體跨界入局,當然不單純是因為這條賽道火熱,還因為這些主機廠有得天獨厚的優勢。汽車,尤其是智慧汽車,本身就類似一個搭載了大量感測器和強大運算平台的「機器人」。車企在智慧輔助駕駛、環境感知、智慧決策等領域累積的技術,與人形機器人很大程度共通。且車圈當前競爭異常激烈,車企迫切需要尋找第二成長曲線。被視為下一個兆級賽道的人形機器人,自然很適合成為巨頭們爭奪的入口,想像空間無限。就拿賽力斯來說-當初賽力斯(彼時還是小康股份)在危急邊緣掙扎求生,與華為深度綁定後才脫離了至暗時刻,5年間市值從200億元左右,暴漲到今天超2700億元,幾乎翻了12倍還多。在國內車企中,賽力斯已名列市值第二,僅次於比亞迪。而現在,賽力斯開始了具身智能的新旅程,不能再以單純車企造車來看了。重估賽力斯,是時候了…嗎? (智慧車參考)