Agent時代，華為雲開始重新造地基了

2026/06/14

•

AI速讀

華為雲於 INSPIRE 大會發表全套 Agentic 基礎設施，旨在解決 AI Agent 的算力延遲、記憶丟失與安全風險。推出 AICS 叢集、AMS 儲存、Volcano Next 調度及 AgentSphere 安全沙箱，並以 ModelArts Next 重新定義 MaaS。同步打造「行業 AI 夢工廠」，將 AI 能力深植於醫療、工業、具身智能等垂直領域。最後透過發布《先進公共雲》白皮書，試圖定義 AI 時代的雲端標準，將雲端角色從單純的軟體底座轉化為能支撐智能體自主運行與演進的「矽基黑土地」。

許多人抱怨OpenClaw等Agent不夠好用。

它反應慢還總失憶，聊著聊著突然不理人，經常施加冷暴力。

這不是調整Prompt、或者換個模型就能解決的。根子在於：底層的基礎設施，還沒有為Agent時代做好準備。

6月5日，華為雲在上海舉辦INSPIRE創想者大會，會上密集發佈了一批Agentic的「鏟子」。

它們堪稱Agent時代的新基建，瞄準的，都是Agent「幹不了的活」背後的具體卡點。

Agent時代的新基建

Agent時代來了，但大多數企業還沒準備好。

算力跟不上、記憶撐不住、調度亂成一鍋粥、安全更是黑盒——這些問題不解決，Agent就很難進入企業核心業務。

這次，華為雲發佈了一整套Agentic基礎設施。四個新產品，分別對準一個卡脖子的問題。

先來看AICS靈衢智算叢集，它負責「算得快」。

Agent需要連續推理、多步決策、即時響應，它的算力需求，比大模型高得多，Token的消耗量級也完全不同。

AICS靈衢智算叢集要解決的問題是：如何讓成千上萬張晶片高效協同工作，實現「低時延、高吞吐、高可用」。

它能把推理時延壓到10毫秒以內，叢集規模拉到10萬卡，單叢集算力達到200 EFLOPS，千卡每秒吞吐500萬Tokens，線上推理服務可用度達到99.95%。

華為雲表示，這套AICS靈衢智算叢集，是國產智算雲的Top 1。

光算得快不夠，Agent還得「記得住」。

與AI聊過天的人都有體會，在長上下文場景下，聊著聊著，它就忘了你前面說過什麼。

如果只是普通聊天，當大模型「健忘」，開啟一場新會話就罷了。但企業場景不行。Agent得記住上下文，沉澱經驗，理解使用者偏好，撐住持續好幾天的長任務。

華為雲拿出的AMS Agentic記憶儲存，給Agent設計了一套分層記憶系統。

它擁有PB級記憶空間，規模比業界大一倍；它的全新盤級儲存架構加三合一晶片，達TB級讀取速度，整體性能領先業界50%；DRAM記憶體池化與分層聯動，能把記憶快取命中率做到95%。

~~有了它，媽媽再也不用擔心Agent的學習。~~

第三個新產品是CCE Volcano Next，它是一個算力調度引擎，解決的是Agent「調得動」的問題。

在真實企業場景中，訓練、推理、Agent執行、儲存呼叫往往同時跑，僧多粥少，經常互相搶有限的CPU、NPU、網路頻寬資源。

Volcano Next扮演的就是「交通指揮員」，協同調度通算、智算、儲存，確保互不干擾，還能共享資源。

憑藉它，典型場景資源利用率提高了30%（省下來的算力，就是省下來的錢）。

最後一個新品AgentSphere，是一個「安全可靠」的智能體運行環境。

Agent跟聊天機器人最大的區別，就是它真的會動手。這也意味著，如果操作不當，它有越權、洩密、行為無法追溯的安全風險。

AgentSphere給Agent劃了一塊「安全工作間」：依託核心級沙箱隔離，搭配雙向網路防護、會話級權限管控及惡意意圖防控，能滿足業務場景的安全自治需求。

同時，性能也沒掉鏈子：羽量級沙箱能實現100毫秒級啟動，每分鐘能建立銷毀十萬個沙箱，支撐Agent訓練與運行不卡殼。

除了以上「地基」四件套，華為雲還同步發佈了平台層產品——重新定義MaaS的ModelArts Next。

傳統MaaS是「模型即服務」，企業呼叫模型的 API；但到了Agent時代，企業需要的是一整套能力。

華為雲把四項能力打包進來：

模型矩陣，解決「有那些模型可用」的問題，DeepSeek、Kimi、GLM等主流模型Day 0上架；

模型路由，解決「任務派給那個模型最合適」的問題，三種調度策略自動切，精準率超95%，呼叫成本平均降低20%以上；

機密推理，解決「敏感資料敢不敢用AI」的問題，依託硬體級TEE，資料用完就銷毀，連雲廠商維運都碰不到；

RLaaS，解決「Agent能不能越用越聰明」的問題，1分鐘建任務，支援超10天長穩訓練，雲南交投拿來跑交通流量預測，精度提升約10%。

最後還有一個有意思的新品：「智果園」，它是一個Agentic雲入口。

華為雲認為，以後用雲平台的，可能不是人，而是Agent。

過去，人通過控制台、API、命令列來購買資源、配置環境、部署應用；但在Agentic AI時代，這些操作有可能被智能體接管。

智果園就是為「矽基使用者」提供的入口，使用者只需在對話方塊說出目標，Agent就能自己買雲、建雲、用雲、管雲。

換句話說，它把原本分散在雲控制台裡的產品、資源和流程，重新組織成Agent可以呼叫的能力。雲平台不再只是給人看的操作介面，而開始變成一套可被智能體理解、呼叫和執行的基礎設施。

行業AI夢工廠

基礎設施搭好了，Agent能不能真正落地，還要看行業。

去年12月，華為公司董事、華為雲CEO周躍峰提出了一個概念：「行業AI夢工廠」。

它的核心邏輯是，華為雲不只提供算力和平台，還把自己在醫療、自動駕駛、具身智能等領域長期積累的技術能力、工具鏈和行業實踐經驗，全部開放，賦能開發者，共同推動行業AI落地。

智慧醫療專區，是「行業AI夢工廠」的首個專區。

面向基層醫院、醫生、產業夥伴、開發者，華為雲搭了一套端到端的醫療AI支撐體系，包括智慧病理服務、醫療AI使能平台、醫療AI社區等。

其中，智慧病理服務具備「少樣本訓練、消費級PC推理」能力。

也就是說，科室醫生不需要懂AI，用自己日常辦公的電腦，加上雲上的能力，就能部署一個專屬病理模型，訓練資料量只要傳統方案的十分之一。

它的底座，是上海瑞金醫院的病理臨床經驗，加上華為自己的ICT、雲和AI技術。

目前，這套智慧病理方案已經在全國鋪開，覆蓋頂級三甲、地市級、縣域醫院。

本次大會上，另有20多家醫院正式入駐。醫療AI使能平台將在6月30日開啟公測。

除了醫療，華為雲還切入了火熱的具身智能賽道。

當前，具身智能開發麵臨一個普遍問題：資料散、模型雜、工具鏈不統一，一個機器人團隊光搭基建，就要耗掉大量精力。

華為雲發佈的CloudRobo，是全球首個全流程具身智能開發平台，從資料生產、評測、模型訓練、模擬強化到真機部署，一條線拉通。

資料側，它支援PB級平行處理和跨本體對應，還打造了業界首個全國產的Real-Sim資料生產體系。

訓練側，它搞了個「樂高式」可插拔模型引擎，讓不同模組可以靈活組合。基於這套引擎打造的雙系統VLA，主動預測力控能力已經達到行業SOTA水平。

華為雲還舉辦了首屆具身智能大賽，線上模擬初賽，線下真機決賽。以賽代練，推動整個行業拓寬技術邊界。

「行業AI夢工廠」的另外兩個專區，也值得一提。

科學計算專區，面向的是AI4S這條更「硬核」的賽道。

生命科學、材料化學、氣象海洋……這些領域的研究門檻高、資料稀缺、專業性極強，通用大模型很難直接適用。

專區把華為自研的天籌求解器、盤古預測大模型，跟外部夥伴的科研實踐成果打包在一起，通過API統一開放，讓AI加速科學發現。

目前，專區已經聚了20多所頂級院校及科研院所，以及5家科學計算模型企業。

智能製造專區，則為開發者提供一站式工業Agent創新環境。

專區重點提供三大核心能力：

全場景多模態資料融合分析能力——負責「打通資料」；

工業本體建模能力——負責「統一語義」；

工業增強知識圖譜能力——負責「沉澱行業知識」。

有了它，AI在工業場景裡不再是「外掛」，而是長在產線上的「原住民」。

這四個專區，都指向同一個目標：讓開發者不用從零開始造輪子，可以在華為雲提供的「矽基黑土地」上，真正把AI種進行業土壤裡。

Agent時代，雲是什麼樣子？

基礎設施搭好了，行業專區鋪開了，華為雲還試圖探討一個更底層的問題：Agent時代，雲應該成為什麼樣子？

這個問題，要先從頂層設計說起。

2026年，「公共雲」第一次寫進了政府工作報告，它已成為AI時代的公共基礎設施。

然而，過去公共雲行業存在標準不統一、形態割裂、評價體系碎片化等問題，制約了整個產業的規範化和規模化發展。

本次大會，華為雲與羅蘭貝格聯合發佈《先進公共雲》白皮書，試圖給公共雲立標準。

白皮書提出，先進公共雲應具備六個核心特徵：全面普惠、集約高效、融合賦能、智能泛在、安全可控、國際引領，並搭建了一套三級評估體系。

相比公共雲，混合雲離政企客戶更近。

混合雲可以幫助企業在本地建立完整的智能體開發、訓練與運行環境，實現資料不出域、安全可控以及核心能力自主掌握。

華為雲同步發佈了《企業如何建構面向智能體的混合雲》白皮書，這本實操手冊，從架構選型到資料、安全、維運等九個維度，給出了落地指南。

過去十年，華為雲Stack已經服務了全球超過5500家客戶，在政務、金融、央國企等國計民生關鍵行業，連續多年保持市場份額第一。

舉幾個例子，可以更好地理解華為雲的作用。

國家統計局選擇華為雲Stack共建自主創新的統計雲工程，基於華為雲Stack先進的平台架構、敏捷的雲原生技術和高性能的GaussDB雲資料庫，支撐五經普資料採集處理系統資料採集毫秒級響應、同時線上使用者數超過30萬人、叢集並行會話超過13萬。

中鋁集團基於華為雲Stack打造坤安大模型，在鋁電解生產場景中，實現了出鋁作業、氧化鋁和氟化鋁加入量的智能預測和自動化調度。據測算，僅雲鋁文山一個500千安電解系列，一年就能省8500多萬元。

巴基斯坦基於華為雲Stack提供的平台和服務，為450多個高等教育機構、400萬學生提供更廣泛、更高品質、更平等的數字教育。

回頭看，華為雲的這一系列發佈，指向的是同一個趨勢：Agent時代，雲正在從「應用的底座」升級為「智能體的底座」。

過去，雲負責把軟體跑起來。未來，雲還要讓Agent算得快、記得住、調得動、跑得安全、學得會——並最終落地應用，解決現實世界裡的真問題。

這是基礎設施的一次代際躍遷，也是華為雲押注的下一個十年。 (量子位)

科技