許多人抱怨OpenClaw等Agent不夠好用。
它反應慢還總失憶,聊著聊著突然不理人,經常施加冷暴力。
這不是調整Prompt、或者換個模型就能解決的。根子在於:底層的基礎設施,還沒有為Agent時代做好準備。
6月5日,華為雲在上海舉辦INSPIRE創想者大會,會上密集發佈了一批Agentic的「鏟子」。
它們堪稱Agent時代的新基建,瞄準的,都是Agent「幹不了的活」背後的具體卡點。
Agent時代的新基建
Agent時代來了,但大多數企業還沒準備好。
算力跟不上、記憶撐不住、調度亂成一鍋粥、安全更是黑盒——這些問題不解決,Agent就很難進入企業核心業務。
這次,華為雲發佈了一整套Agentic基礎設施。四個新產品,分別對準一個卡脖子的問題。
先來看AICS靈衢智算叢集,它負責「算得快」。
Agent需要連續推理、多步決策、即時響應,它的算力需求,比大模型高得多,Token的消耗量級也完全不同。
AICS靈衢智算叢集要解決的問題是:如何讓成千上萬張晶片高效協同工作,實現「低時延、高吞吐、高可用」。
它能把推理時延壓到10毫秒以內,叢集規模拉到10萬卡,單叢集算力達到200 EFLOPS,千卡每秒吞吐500萬Tokens,線上推理服務可用度達到99.95%。
華為雲表示,這套AICS靈衢智算叢集,是國產智算雲的Top 1。
光算得快不夠,Agent還得「記得住」。
與AI聊過天的人都有體會,在長上下文場景下,聊著聊著,它就忘了你前面說過什麼。
如果只是普通聊天,當大模型「健忘」,開啟一場新會話就罷了。但企業場景不行。Agent得記住上下文,沉澱經驗,理解使用者偏好,撐住持續好幾天的長任務。
華為雲拿出的AMS Agentic記憶儲存,給Agent設計了一套分層記憶系統。
它擁有PB級記憶空間,規模比業界大一倍;它的全新盤級儲存架構加三合一晶片,達TB級讀取速度,整體性能領先業界50%;DRAM記憶體池化與分層聯動,能把記憶快取命中率做到95%。
有了它,媽媽再也不用擔心Agent的學習。
第三個新產品是CCE Volcano Next,它是一個算力調度引擎,解決的是Agent「調得動」的問題。
在真實企業場景中,訓練、推理、Agent執行、儲存呼叫往往同時跑,僧多粥少,經常互相搶有限的CPU、NPU、網路頻寬資源。
Volcano Next扮演的就是「交通指揮員」,協同調度通算、智算、儲存,確保互不干擾,還能共享資源。
憑藉它,典型場景資源利用率提高了30%(省下來的算力,就是省下來的錢)。
最後一個新品AgentSphere,是一個「安全可靠」的智能體運行環境。
Agent跟聊天機器人最大的區別,就是它真的會動手。這也意味著,如果操作不當,它有越權、洩密、行為無法追溯的安全風險。
AgentSphere給Agent劃了一塊「安全工作間」:依託核心級沙箱隔離,搭配雙向網路防護、會話級權限管控及惡意意圖防控,能滿足業務場景的安全自治需求。
同時,性能也沒掉鏈子:羽量級沙箱能實現100毫秒級啟動,每分鐘能建立銷毀十萬個沙箱,支撐Agent訓練與運行不卡殼。
除了以上「地基」四件套,華為雲還同步發佈了平台層產品——重新定義MaaS的ModelArts Next。
傳統MaaS是「模型即服務」,企業呼叫模型的 API;但到了Agent時代,企業需要的是一整套能力。
華為雲把四項能力打包進來:
模型矩陣,解決「有那些模型可用」的問題,DeepSeek、Kimi、GLM等主流模型Day 0上架;
模型路由,解決「任務派給那個模型最合適」的問題,三種調度策略自動切,精準率超95%,呼叫成本平均降低20%以上;
機密推理,解決「敏感資料敢不敢用AI」的問題,依託硬體級TEE,資料用完就銷毀,連雲廠商維運都碰不到;
RLaaS,解決「Agent能不能越用越聰明」的問題,1分鐘建任務,支援超10天長穩訓練,雲南交投拿來跑交通流量預測,精度提升約10%。
最後還有一個有意思的新品:「智果園」,它是一個Agentic雲入口。
華為雲認為,以後用雲平台的,可能不是人,而是Agent。
過去,人通過控制台、API、命令列來購買資源、配置環境、部署應用;但在Agentic AI時代,這些操作有可能被智能體接管。
智果園就是為「矽基使用者」提供的入口,使用者只需在對話方塊說出目標,Agent就能自己買雲、建雲、用雲、管雲。
換句話說,它把原本分散在雲控制台裡的產品、資源和流程,重新組織成Agent可以呼叫的能力。雲平台不再只是給人看的操作介面,而開始變成一套可被智能體理解、呼叫和執行的基礎設施。
行業AI夢工廠
基礎設施搭好了,Agent能不能真正落地,還要看行業。
去年12月,華為公司董事、華為雲CEO周躍峰提出了一個概念:「行業AI夢工廠」。
它的核心邏輯是,華為雲不只提供算力和平台,還把自己在醫療、自動駕駛、具身智能等領域長期積累的技術能力、工具鏈和行業實踐經驗,全部開放,賦能開發者,共同推動行業AI落地。
智慧醫療專區,是「行業AI夢工廠」的首個專區。
面向基層醫院、醫生、產業夥伴、開發者,華為雲搭了一套端到端的醫療AI支撐體系,包括智慧病理服務、醫療AI使能平台、醫療AI社區等。
其中,智慧病理服務具備「少樣本訓練、消費級PC推理」能力。
也就是說,科室醫生不需要懂AI,用自己日常辦公的電腦,加上雲上的能力,就能部署一個專屬病理模型,訓練資料量只要傳統方案的十分之一。
它的底座,是上海瑞金醫院的病理臨床經驗,加上華為自己的ICT、雲和AI技術。
目前,這套智慧病理方案已經在全國鋪開,覆蓋頂級三甲、地市級、縣域醫院。
本次大會上,另有20多家醫院正式入駐。醫療AI使能平台將在6月30日開啟公測。
除了醫療,華為雲還切入了火熱的具身智能賽道。
當前,具身智能開發麵臨一個普遍問題:資料散、模型雜、工具鏈不統一,一個機器人團隊光搭基建,就要耗掉大量精力。
華為雲發佈的CloudRobo,是全球首個全流程具身智能開發平台,從資料生產、評測、模型訓練、模擬強化到真機部署,一條線拉通。
資料側,它支援PB級平行處理和跨本體對應,還打造了業界首個全國產的Real-Sim資料生產體系。
訓練側,它搞了個「樂高式」可插拔模型引擎,讓不同模組可以靈活組合。基於這套引擎打造的雙系統VLA,主動預測力控能力已經達到行業SOTA水平。
華為雲還舉辦了首屆具身智能大賽,線上模擬初賽,線下真機決賽。以賽代練,推動整個行業拓寬技術邊界。
「行業AI夢工廠」的另外兩個專區,也值得一提。
科學計算專區,面向的是AI4S這條更「硬核」的賽道。
生命科學、材料化學、氣象海洋……這些領域的研究門檻高、資料稀缺、專業性極強,通用大模型很難直接適用。
專區把華為自研的天籌求解器、盤古預測大模型,跟外部夥伴的科研實踐成果打包在一起,通過API統一開放,讓AI加速科學發現。
目前,專區已經聚了20多所頂級院校及科研院所,以及5家科學計算模型企業。
智能製造專區,則為開發者提供一站式工業Agent創新環境。
專區重點提供三大核心能力:
全場景多模態資料融合分析能力——負責「打通資料」;
工業本體建模能力——負責「統一語義」;
工業增強知識圖譜能力——負責「沉澱行業知識」。
有了它,AI在工業場景裡不再是「外掛」,而是長在產線上的「原住民」。
這四個專區,都指向同一個目標:讓開發者不用從零開始造輪子,可以在華為雲提供的「矽基黑土地」上,真正把AI種進行業土壤裡。
Agent時代,雲是什麼樣子?
基礎設施搭好了,行業專區鋪開了,華為雲還試圖探討一個更底層的問題:Agent時代,雲應該成為什麼樣子?
這個問題,要先從頂層設計說起。
2026年,「公共雲」第一次寫進了政府工作報告,它已成為AI時代的公共基礎設施。
然而,過去公共雲行業存在標準不統一、形態割裂、評價體系碎片化等問題,制約了整個產業的規範化和規模化發展。
本次大會,華為雲與羅蘭貝格聯合發佈《先進公共雲》白皮書,試圖給公共雲立標準。
白皮書提出,先進公共雲應具備六個核心特徵:全面普惠、集約高效、融合賦能、智能泛在、安全可控、國際引領,並搭建了一套三級評估體系。
相比公共雲,混合雲離政企客戶更近。
混合雲可以幫助企業在本地建立完整的智能體開發、訓練與運行環境,實現資料不出域、安全可控以及核心能力自主掌握。
華為雲同步發佈了《企業如何建構面向智能體的混合雲》白皮書,這本實操手冊,從架構選型到資料、安全、維運等九個維度,給出了落地指南。
過去十年,華為雲Stack已經服務了全球超過5500家客戶,在政務、金融、央國企等國計民生關鍵行業,連續多年保持市場份額第一。
舉幾個例子,可以更好地理解華為雲的作用。
國家統計局選擇華為雲Stack共建自主創新的統計雲工程,基於華為雲Stack先進的平台架構、敏捷的雲原生技術和高性能的GaussDB雲資料庫,支撐五經普資料採集處理系統資料採集毫秒級響應、同時線上使用者數超過30萬人、叢集並行會話超過13萬。
中鋁集團基於華為雲Stack打造坤安大模型,在鋁電解生產場景中,實現了出鋁作業、氧化鋁和氟化鋁加入量的智能預測和自動化調度。據測算,僅雲鋁文山一個500千安電解系列,一年就能省8500多萬元。
巴基斯坦基於華為雲Stack提供的平台和服務,為450多個高等教育機構、400萬學生提供更廣泛、更高品質、更平等的數字教育。
回頭看,華為雲的這一系列發佈,指向的是同一個趨勢:Agent時代,雲正在從「應用的底座」升級為「智能體的底座」。
過去,雲負責把軟體跑起來。未來,雲還要讓Agent算得快、記得住、調得動、跑得安全、學得會——並最終落地應用,解決現實世界裡的真問題。
這是基礎設施的一次代際躍遷,也是華為雲押注的下一個十年。 (量子位)
