華為搶走了輝達的劇本

2026/06/12

•

AI速讀

華為雲正採取差異化競爭策略，放棄與阿里、字節跳動在Token規模上的消耗戰，轉而深耕B2B產業價值。憑藉昇騰晶片與「軟硬芯」協同優勢，華為吸引了大量網際網路巨頭遷移算力底座。透過提出「韜定律」以邏輯摺疊技術突破製程限制，並建構開放的「百模千態」生態，華為意圖打造對標輝達CUDA的「硅基黑土地」，將AI能力滲透至金融、醫療及製造等垂直領域，將公有雲定位為AI時代的最優基礎設施。

“華為雲不追逐Token數量，也不在乎收入總量。”

今年5月，輝達CEO黃仁勳對媒體坦言：“很大程度上，我們已經把中國AI晶片市場，讓給華為了。”

事實的確如此，華為正從Plan B選項躍升為至關重要的AI算力支撐平台，並吸引了一批網際網路大廠主動“遷移”至華為雲。

《中國企業家》獲悉，小紅書大模型基建部門披露，目前，小紅書MaaS規模已達日均萬億級Token規模，約有40%的Token計算在昇騰系列晶片上運行。未來3個月，小紅書計畫將昇騰的推理產能提升至60%，長期目標是讓昇騰成為其AI推理底座。

除了小紅書，華為雲的客戶名單上還有美團、B站、DeepSeek、月之暗面和更多網際網路大廠。

華為基於910C晶片的A3超節點，以及將在不久後推出的950晶片系列超節點，也被大廠搶先下單。一家計算伺服器公司的高層告訴《中國企業家》：“在推理需求的帶動下，2026年，網際網路大廠對超節點的需求猛增，訂單已經排到了兩年後。”

位元組、阿里圍繞MaaS、Token消耗激戰正酣之際，華為卻不準備進入熱戰中心，而是將注意力投向to B和產業落地。

6月5日，在“華為雲創想者峰會”上，華為公司董事、華為雲CEO周躍峰公佈了華為雲的開放戰略，擁抱“百模千態”——開源模型即日可部署，上線“智果園”智能體平台，提供包括智譜、Kimi、DeepSeek在內的開源模型接入。

會後，周躍峰告訴《中國企業家》等媒體，華為雲不追逐Token數量，也不在乎收入總量。“我們看重每一個Token給生產力帶來的價值，尤其是落地to B行業帶來的價值。”

周躍峰以金融舉例：“我們要看防範了多少金融風險，提升了個人多少工作和信貸業務的效率等。不能簡單說，產生了多少Token，模型被呼叫了多少次，這是沒有意義的。”

一位資深投資人告訴《中國企業家》：華為雲與華為計算，未來對標的是輝達。

除了直接賣GPU算力，“華為雲+華為計算”也倣傚輝達，搭建起算力叢集、超節點與高規格基礎設施。“價值導向”而非“規模導向”的定位，也讓華為將主攻方向鎖定在公共雲賽道，重點服務政企、金融、汽車等領域。

在行業AI解決方案上，輝達佈局了工業孿生、汽車智駕晶片、機器人大腦模型等領域；華為則推出了具身智能、智慧醫療、智能製造、科學發現等4類行業AI工廠。

黃仁勳將輝達的故事描述為“Token工廠”，追求高吞吐，低成本。最近，華為半導體業務部總裁何庭波宣佈了韜（τ）定律，提出了晶片的邏輯摺疊技術。

華為雲峰會上，周躍峰也提出了一個新公式：Agentic Infra新範式=高效Token工廠+持續學習+通智一體化調度+安全自治。

不過，華為還需要補齊大模型一塊關鍵拼圖。採訪中，周躍峰沒有太多提及自家“盤古”大模型。

上一次盤古大模型版本更新還是在2025年6月。2026年3月，華為諾亞方舟實驗室主任、華為盤古大模型負責人王雲鶴宣佈離職。而《中國企業家》獲悉，華為自研的盤古大模型正在推倒重來，預計下半年會推出新版本。

01 不追逐Token數量

Token消耗和銷售的戰事，還在不斷升級。6月8日，阿里宣佈合併通義大模型事業部和未來生活實驗室，成立Token Foundry事業部，由集團CEO吳泳銘直接負責。

豆包則是在6月內測推出專業版，一腳踏進訂閱付費領域。媒體報導稱，位元組負責模型研發的Seed團隊今年的重點是：世界模型、視訊模型、Coding和辦公場景的商業化。

華為雲則選擇從三個層面與對手實施差異化競爭：開放模型、AI Coding與RL（強化學習）的產業落地。

一位華為雲前置銷售告訴《中國企業家》，友商對賣MaaS和Token給予了超額激勵，華為雲也給了銷售人員賣Token一定的壓力。

但考慮到華為盤古大模型“目前不是主推模型”，該銷售表示，華為考核的是客戶在華為雲上對第三方模型的Token消耗。但面對未來，該銷售仍然樂觀。AI發展還在初期，“使用者就像流水一樣，他們會隨著價格、模型能力等流動”。

用周躍峰的話說，在智能體時代，華為雲要成為一朵最開放的雲。6月5日的大會現場，華為雲攜手智譜、DeepSeek、MiniMax、月之暗面、階躍星辰、百度、美團LongCat、訊飛星火、愛詩科技、生數科技等20余家頭部AI廠商，發佈了“百模千態，雲聚共贏”的生態合作計畫。

華為雲也在強化銷售體系，華為高級副總裁、華為雲全球行銷服總裁楊友桂在演講中說，加強與夥伴的合作永遠不動搖。未來華為雲50%的收入將來自華為直銷，50%來自夥伴銷售。華為雲要讓夥伴：更信任、更掙錢、更簡單、更好成長。

除了行業大客戶，華為雲還推出了OPC（超級個體）創新支援計畫，提供包括算力與AI Coding等工具的支援。在AI Coding戰場，華為雲上線了AI程式設計智能體“碼道”（CodeArts）。周躍峰表示，華為雲將以“范佛裡特彈藥量”（不計成本）來打造這一能力。

雖然華為雲沒有披露盤古大模型訓練的最新進展，但周躍峰表示：強化學習與企業資料，是行業落地非常關鍵的一個步驟。“調整模型參數已經解決不了行業落地問題，必須結合企業私有資料進行強化學習。比如需要分鐘級建立萬級沙箱，並且RL過程要可觀測、可儲存。”

02 軟、硬、芯協同，瞄準公有雲

華為雲一位高層在演講中判斷，雲端運算已經跨入了“Token工業時代”。

這意味著Token大基建時代正在到來。頭部大模型公司DeepSeek、月之暗面、智譜、MiniMax仍在通過上市或持續融資儲備更多的彈藥，投入AI基礎設施建設——主要是Infra層。

但周躍峰告訴《中國企業家》等媒體：不可能每一個機構和公司都打造萬卡叢集，公共雲才是承載超大規模通用大模型的最優解。“通過機密推理和訓練，平衡安全和資源高效共享。”

公共雲是華為雲主攻的市場，也是阿里、百度、騰訊等廠商集中炮火的領域。對華為雲來說，其核心優勢在於軟、硬、芯的協同：

其中軟體層指模型路由、Agent運行環境等Infra工具，實現硬體與模型的最優配合。華為雲已上線“模型路由”能力，讓智能體自主選擇適配模型，運行成本可下降20%以上。

硬體層指超節點產品以及各類算力叢集，華為的靈衢智算叢集支援10萬卡叢集規模，單一叢集達到200EFLOPS算力，並可將Token生成時延降低到10毫秒以內，千卡每秒吞吐高達500萬Token。

晶片層則是華為自研昇騰（AI）、鯤鵬（CPU）等晶片，可以提供算子最佳化、計算加速等各類支援。

更具前瞻性的是對Agent時代基礎設施的重新定義。華為公司Fellow、雲系統首席專家余洲提出，傳統電腦關注算力與記憶體的資源堆積，而Agent時代的電腦應關注“任務如何被拆解、調度、執行、訪問狀態，以及從錯誤中恢復”。

“未來的基礎設施將以Token作為最小單位去考量，”余洲說，“不必暴露底層資源組成，重要的是如何高效生產、執行任務。”

業界普遍擔憂，記憶體而非計算才是Agent時代的“卡脖子”環節——KV Cache（鍵值快取）大小與模型生成序列長度成正比，文字越長，快取的Key和Value向量越多，視訊記憶體佔用越大。

為此，華為雲推出AMS Agentic（記憶儲存解決方案），依託昇騰NPU，構築PB級超大上下文記憶空間，規模優於業界1倍；全新盤級儲存架構與三合一晶片實現TB級記憶極速讀取，整體性能領先業界50%。

03 黑土地形成需要時間

5月25日，華為半導體業務部總裁何庭波宣佈，基於華為過去6年做出381款晶片的經驗提出了新理論——韜（τ）定律。

韜（τ）定律以“時間縮微”替代“幾何縮微”，通過邏輯摺疊等創新技術，壓縮晶片內的走線距離、互聯時延，提高電訊號傳輸效率，讓晶片從2D平面進化為3D立體，從而開拓出一條有別於追求製程納米節點的新路。

周躍峰在採訪中提到韜（τ）定律時表示：“華為沒有辦法建構萬國牌的硅基黑土地，我們的硅基黑土地會越來越厚。”

但黑土地的形成需要時間。一位半導體領域的投資人告訴《中國企業家》：華為提出韜（τ）定律，需要開放更多技術細節和進展，他們才會敢於出手投資產業鏈上下游。

生態的建構是一項長期的任務，也不是華為一家可以完成的事情。在峰會上，華為雲宣佈，要聯合開發者在“黑土地”上共同打造“行業AI夢工廠”，通過建構垂直領域開發社區，開放華為在醫療、自動駕駛、具身智能等領域積累的技術能力、工具鏈與行業實踐經驗，支援開發者落地。

這也與輝達的路徑形成了對應。輝達正嘗試將CUDA生態從資料中心擴展到PC和人形機器人領域，試圖讓所有算力場景都離不開它的標準。今年6月，輝達又聯合微軟推出了全新RTX Spark智能體電腦。黃仁勳說：“家庭AI超級電腦將像現代家電一樣普及，這場PC再發明與智慧型手機的誕生同等量級。”

東北黑土地每形成1釐米厚的黑土，就需要200年至400年的時間。而輝達的CUDA生態，也歷經了十餘年培養開發者黏性。對於華為雲來說，這場硅基黑土地的長征才剛剛開始。 (中國企業家雜誌)

科技