華為搶走了輝達的劇本

“華為雲不追逐Token數量,也不在乎收入總量。”

頭圖來源|視覺中國

今年5月,輝達CEO黃仁勳對媒體坦言:“很大程度上,我們已經把中國AI晶片市場,讓給華為了。”

事實的確如此,華為正從Plan B選項躍升為至關重要的AI算力支撐平台,並吸引了一批網際網路大廠主動“遷移”至華為雲。

《中國企業家》獲悉,小紅書大模型基建部門披露,目前,小紅書MaaS規模已達日均萬億級Token規模,約有40%的Token計算在昇騰系列晶片上運行。未來3個月,小紅書計畫將昇騰的推理產能提升至60%,長期目標是讓昇騰成為其AI推理底座。

除了小紅書,華為雲的客戶名單上還有美團、B站、DeepSeek、月之暗面和更多網際網路大廠。

華為基於910C晶片的A3超節點,以及將在不久後推出的950晶片系列超節點,也被大廠搶先下單。一家計算伺服器公司的高層告訴《中國企業家》:“在推理需求的帶動下,2026年,網際網路大廠對超節點的需求猛增,訂單已經排到了兩年後。”

位元組、阿里圍繞MaaS、Token消耗激戰正酣之際,華為卻不準備進入熱戰中心,而是將注意力投向to B和產業落地。

6月5日,在“華為雲創想者峰會”上,華為公司董事、華為雲CEO周躍峰公佈了華為雲的開放戰略,擁抱“百模千態”——開源模型即日可部署,上線“智果園”智能體平台,提供包括智譜、Kimi、DeepSeek在內的開源模型接入。

周躍峰  來源:受訪者

會後,周躍峰告訴《中國企業家》等媒體,華為雲不追逐Token數量,也不在乎收入總量。“我們看重每一個Token給生產力帶來的價值,尤其是落地to B行業帶來的價值。”

周躍峰以金融舉例:“我們要看防範了多少金融風險,提升了個人多少工作和信貸業務的效率等。不能簡單說,產生了多少Token,模型被呼叫了多少次,這是沒有意義的。”

一位資深投資人告訴《中國企業家》:華為雲與華為計算,未來對標的是輝達。

除了直接賣GPU算力,“華為雲+華為計算”也倣傚輝達,搭建起算力叢集、超節點與高規格基礎設施。“價值導向”而非“規模導向”的定位,也讓華為將主攻方向鎖定在公共雲賽道,重點服務政企、金融、汽車等領域。

在行業AI解決方案上,輝達佈局了工業孿生、汽車智駕晶片、機器人大腦模型等領域;華為則推出了具身智能、智慧醫療、智能製造、科學發現等4類行業AI工廠。

黃仁勳將輝達的故事描述為“Token工廠”,追求高吞吐,低成本。最近,華為半導體業務部總裁何庭波宣佈了韜(τ)定律,提出了晶片的邏輯摺疊技術。

華為雲峰會上,周躍峰也提出了一個新公式:Agentic Infra新範式=高效Token工廠+持續學習+通智一體化調度+安全自治。

攝影:閆俊文

不過,華為還需要補齊大模型一塊關鍵拼圖。採訪中,周躍峰沒有太多提及自家“盤古”大模型。

上一次盤古大模型版本更新還是在2025年6月。2026年3月,華為諾亞方舟實驗室主任、華為盤古大模型負責人王雲鶴宣佈離職。而《中國企業家》獲悉,華為自研的盤古大模型正在推倒重來,預計下半年會推出新版本。

01

不追逐Token數量

Token消耗和銷售的戰事,還在不斷升級。6月8日,阿里宣佈合併通義大模型事業部和未來生活實驗室,成立Token Foundry事業部,由集團CEO吳泳銘直接負責。

豆包則是在6月內測推出專業版,一腳踏進訂閱付費領域。媒體報導稱,位元組負責模型研發的Seed團隊今年的重點是:世界模型、視訊模型、Coding和辦公場景的商業化。

華為雲則選擇從三個層面與對手實施差異化競爭:開放模型、AI Coding與RL(強化學習)的產業落地。

一位華為雲前置銷售告訴《中國企業家》,友商對賣MaaS和Token給予了超額激勵,華為雲也給了銷售人員賣Token一定的壓力。

但考慮到華為盤古大模型“目前不是主推模型”,該銷售表示,華為考核的是客戶在華為雲上對第三方模型的Token消耗。但面對未來,該銷售仍然樂觀。AI發展還在初期,“使用者就像流水一樣,他們會隨著價格、模型能力等流動”。

用周躍峰的話說,在智能體時代,華為雲要成為一朵最開放的雲。6月5日的大會現場,華為雲攜手智譜、DeepSeek、MiniMax、月之暗面、階躍星辰、百度、美團LongCat、訊飛星火、愛詩科技、生數科技等20余家頭部AI廠商,發佈了“百模千態,雲聚共贏”的生態合作計畫。

來源:受訪者

華為雲也在強化銷售體系,華為高級副總裁、華為雲全球行銷服總裁楊友桂在演講中說,加強與夥伴的合作永遠不動搖。未來華為雲50%的收入將來自華為直銷,50%來自夥伴銷售。華為雲要讓夥伴:更信任、更掙錢、更簡單、更好成長。

除了行業大客戶,華為雲還推出了OPC(超級個體)創新支援計畫,提供包括算力與AI Coding等工具的支援。在AI Coding戰場,華為雲上線了AI程式設計智能體“碼道”(CodeArts)。周躍峰表示,華為雲將以“范佛裡特彈藥量”(不計成本)來打造這一能力。

雖然華為雲沒有披露盤古大模型訓練的最新進展,但周躍峰表示:強化學習與企業資料,是行業落地非常關鍵的一個步驟。“調整模型參數已經解決不了行業落地問題,必須結合企業私有資料進行強化學習。比如需要分鐘級建立萬級沙箱,並且RL過程要可觀測、可儲存。”

02

軟、硬、芯協同,瞄準公有雲

華為雲一位高層在演講中判斷,雲端運算已經跨入了“Token工業時代”。

這意味著Token大基建時代正在到來。頭部大模型公司DeepSeek、月之暗面、智譜、MiniMax仍在通過上市或持續融資儲備更多的彈藥,投入AI基礎設施建設——主要是Infra層。

但周躍峰告訴《中國企業家》等媒體:不可能每一個機構和公司都打造萬卡叢集,公共雲才是承載超大規模通用大模型的最優解。“通過機密推理和訓練,平衡安全和資源高效共享。”

公共雲是華為雲主攻的市場,也是阿里、百度、騰訊等廠商集中炮火的領域。對華為雲來說,其核心優勢在於軟、硬、芯的協同:

其中軟體層指模型路由、Agent運行環境等Infra工具,實現硬體與模型的最優配合。華為雲已上線“模型路由”能力,讓智能體自主選擇適配模型,運行成本可下降20%以上。

硬體層指超節點產品以及各類算力叢集,華為的靈衢智算叢集支援10萬卡叢集規模,單一叢集達到200EFLOPS算力,並可將Token生成時延降低到10毫秒以內,千卡每秒吞吐高達500萬Token。

晶片層則是華為自研昇騰(AI)、鯤鵬(CPU)等晶片,可以提供算子最佳化、計算加速等各類支援。

更具前瞻性的是對Agent時代基礎設施的重新定義。華為公司Fellow、雲系統首席專家余洲提出,傳統電腦關注算力與記憶體的資源堆積,而Agent時代的電腦應關注“任務如何被拆解、調度、執行、訪問狀態,以及從錯誤中恢復”。

“未來的基礎設施將以Token作為最小單位去考量,”余洲說,“不必暴露底層資源組成,重要的是如何高效生產、執行任務。”

業界普遍擔憂,記憶體而非計算才是Agent時代的“卡脖子”環節——KV Cache(鍵值快取)大小與模型生成序列長度成正比,文字越長,快取的Key和Value向量越多,視訊記憶體佔用越大。

為此,華為雲推出AMS Agentic(記憶儲存解決方案),依託昇騰NPU,構築PB級超大上下文記憶空間,規模優於業界1倍;全新盤級儲存架構與三合一晶片實現TB級記憶極速讀取,整體性能領先業界50%。

03

黑土地形成需要時間

5月25日,華為半導體業務部總裁何庭波宣佈,基於華為過去6年做出381款晶片的經驗提出了新理論——韜(τ)定律。

韜(τ)定律以“時間縮微”替代“幾何縮微”,通過邏輯摺疊等創新技術,壓縮晶片內的走線距離、互聯時延,提高電訊號傳輸效率,讓晶片從2D平面進化為3D立體,從而開拓出一條有別於追求製程納米節點的新路。

周躍峰在採訪中提到韜(τ)定律時表示:“華為沒有辦法建構萬國牌的硅基黑土地,我們的硅基黑土地會越來越厚。”

攝影:閆俊文

但黑土地的形成需要時間。一位半導體領域的投資人告訴《中國企業家》:華為提出韜(τ)定律,需要開放更多技術細節和進展,他們才會敢於出手投資產業鏈上下游。

生態的建構是一項長期的任務,也不是華為一家可以完成的事情。在峰會上,華為雲宣佈,要聯合開發者在“黑土地”上共同打造“行業AI夢工廠”,通過建構垂直領域開發社區,開放華為在醫療、自動駕駛、具身智能等領域積累的技術能力、工具鏈與行業實踐經驗,支援開發者落地。

這也與輝達的路徑形成了對應。輝達正嘗試將CUDA生態從資料中心擴展到PC和人形機器人領域,試圖讓所有算力場景都離不開它的標準。今年6月,輝達又聯合微軟推出了全新RTX Spark智能體電腦。黃仁勳說:“家庭AI超級電腦將像現代家電一樣普及,這場PC再發明與智慧型手機的誕生同等量級。”

東北黑土地每形成1釐米厚的黑土,就需要200年至400年的時間。而輝達的CUDA生態,也歷經了十餘年培養開發者黏性。對於華為雲來說,這場硅基黑土地的長征才剛剛開始。 (中國企業家雜誌)