科技巨頭同日押注Agent化,阿里雲交出“芯-雲-模型-推理”全端答卷

5月20日,阿里雲在2026阿里雲峰會上宣佈完成"晶片-雲-模型-推理"全端Agent化升級,同步推出全新AI產品官網"千問雲"、搭載自研AI晶片真武M890的超節點伺服器,以及最新旗艦模型Qwen3.7-Max。

千問雲是阿里雲成立17年來首次在主官網之外推出的全新產品官網,據阿里雲介紹,也是國內雲廠商率先專門面向Agent(智能體)設計的模型服務入口。而從晶片到推理引擎的這次全端升級,更是國內雲廠商首次圍繞Agent進行完整的產品體系發佈。

就在不到24小時前,Google剛在I/O開發者大會上把開發平台Antigravity升級為agent-first架構,發佈了定位為"24/7 personal agent"的Gemini Spark,宣佈Gemini從AI助手全面轉向自主執行任務的Agent。

Google和阿里雲在同一天做了同一個判斷:雲和AI的主要消費者正在從人變成Agent。

智能體作為AI的下一個主戰場的判斷在全球科技行業已經接近共識,但想要體系化圍繞Agent做全端重構,要求一家公司同時在底層AI晶片、中間層雲端運算基礎設施和前沿大模型三個領域擁有頂級自研能力,晶片決定算力自主性,雲決定規模化服務能力,模型決定Agent的智能上限,缺任何一層都交不出完整答卷。放眼全球能同時滿足這三個條件的科技公司屈指可數。

阿里雲資深副總裁劉偉光在現場表示,Agent突破臨界點之後可以24小時不間斷工作,對AI和雲的需求無窮無盡。"雲的使用者正在從人變成Agent,而阿里雲決定讓整套技術體係為此全面重構。"

千問雲的設計正是這次全端變革的一個註腳。網站同時提供了兩套入口:人類使用者看到的是模型對比、體驗和API接入的完整介面,Agent看到的是一條標準化的Skills安裝指令,解析後即可獲取平台全部能力並根據需求自主呼叫。

01. 自研晶片走向商用:真武M890與128卡超節點

阿里雲本次智能體全端重構從最底層開始發力。

在晶片層面,阿里發佈了基於新一代AI晶片真武M890的磐久AL128超節點伺服器,搭載自研互聯晶片ICN Switch 1.0,128張AI晶片組成一台電腦,P2P時延低於150ns,主打解決Agent場景下的海量並行推理和大模型訓練需求。

真武M890擁有144GB視訊記憶體,片間互聯頻寬800GB/s,晶片原生支援FP32到FP4多種資料精度,性能是上一代真武810E的3倍。

在阿里雲峰會上,平頭哥同時首次公佈真武系列晶片路線規劃,未來兩年將陸續推出真武V900、真武J900兩代晶片。

目前真武系列AI晶片累計出貨56萬片,服務了中國電信、中國一汽、浦發銀行等20多個行業的400多家客戶。

平頭哥半導體副總裁高慧表示,Agentic時代一個Agent在執行任務時可能在毫秒間連續發起數十次模型呼叫,同時需要CPU、GPU、網路和儲存緊密協同。平頭哥建構全端自研晶片矩陣,核心是實現算力、網力、存力的系統級協同。

磐久AL128超節點已上線阿里雲百煉,支援Qwen、DeepSeek、Kimi等主流模型。新一代真武晶片由此進入了百煉的對外模型服務鏈路。

02. 從控制台到一行程式碼:雲平台的Agent化重構

晶片是地基,地基之上,阿里雲開始改造雲平台本身。

傳統雲產品的互動邏輯面向人:控制台、菜單、配置項、儀表盤。阿里雲CTO李飛飛指出,Agent工作負載是"無規律彈性、短生命周期、瞬時起量即走",與傳統雲端運算的穩態負載截然不同。

阿里雲據此對雲產品進行了Skill化、MCP化和CLI化改造,每一個雲產品都變成Agent可以像調函數一樣呼叫的標準化能力模組。Skills門戶同步上線,使用者僅需一句自然語言指令,Agent即可完成從資源識別到應用部署的全流程。

千問雲是這套邏輯的集中體現。150多款主流模型的API被封裝為標準化Skills和CLI工具,OpenClaw、Hermes Agent、Claude Code等主流智能體框架僅需一條指令即可"學會"平台全部能力,根據使用者需求自主呼叫模型、處理圖片、生成視訊。人類開發者同樣可以通過千問雲完成模型選型、對比、體驗和接入的全流程。

上一次中國頭部科技公司以這種力度重構產品入口,可能要追溯到移動網際網路早期所有人把PC官網的流量讓位給App的階段。

阿里雲還為Agent建構了完整的運行環境支撐,包括輕量高效的沙箱執行環境、多Agent協同能力、跨任務記憶能力,以及全域智能維運能力。

03. 35小時自主進化:旗艦模型從"說得好"到"做得到"

平台為Agent準備了運行環境,Agent能做什麼,取決於驅動它的模型。

Qwen3.7-Max是阿里新一代旗艦大模型,在第三方評測機構Arena全球大模型盲測總榜中,Qwen3.7-Max超過Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,與GPT、Claude、Gemini最強模型接近,位列國產模型第一。

阿里同時披露了一個實戰案例。在訓練時從未接觸過的真武M890晶片上,Qwen3.7-Max僅憑一份任務說明,從零開始自主工作35小時,獨立進行了432次核心評估和1158次工具呼叫,完成了一個生產級AI計算核心的編寫與調優,最終性能較SGLang Triton官方參考實現提升10倍。全程沒有人類干預。測試軌跡顯示,模型在運行超過30小時後仍能發現有效最佳化點,甚至主動發起了一次架構重設計。

這個案例的含金量需要放在行業語境下理解。晶片級的算子最佳化,過去是資深AI Infra工程師最核心的工作之一,需要極強的硬體經驗、演算法能力和反覆偵錯迭代。Qwen3.7-Max在一塊從未見過的晶片上完成了這件事,而且結果比官方參考實現好一個數量級。Agent正在從"替人寫程式碼"進入"替人最佳化硬體性能"的階段,這個門檻的跨越,比跑分榜上的名次變化更能說明問題。

阿里巴巴通義大模型事業部負責人周靖人表示,大模型正在經歷核心範式轉移,從對齊人類偏好到對齊任務目標。"過去我們追求的是模型'說得好',現在要求模型'做得到'。"

近3個月內,千問旗艦模型連續迭代了3.5、3.6、3.7三個版本,阿里在刻意加速模型進化,匹配Agent場景對模型能力的指數級需求。據瞭解,千問3.7系列後續還將推出Qwen3.7-Plus等版本,覆蓋從程式設計智能體到視覺智能體的全場景。

04. 百煉開放與資本驗證:增長引擎已經在切換

模型能力到位之後,規模化的問題交給了百煉。

阿里雲在百煉平台上建構了大規模GPU資源叢集,通過並池調度、上下文快取、吞吐彈性調度應對Agent場景下的並行挑戰。百煉內建安全治理能力,確保24小時不間斷運行的Agent始終在預設權限範圍內行動。

李飛飛強調,在Agent自主運行的語境下,一個全天候執行任務的Agent如果沒有邊界約束,後果不可控。

生態策略上,百煉保持開放接入。除阿里自研的千問模型矩陣外,平台已接入智譜GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、可靈、Vidu Q3等第三方模型。GLM-5.1、Kimi K2.6、MiniMax M2.7是當下國內最強的幾個競品模型,阿里雲把它們全部放上了自家平台。這個動作的邏輯很清楚:阿里雲賭的不是千問一家模型贏,是百煉成為Agent呼叫模型的默認入口。當Agent需要根據任務動態選擇最合適的模型時,誰的平台上模型最全、切換成本最低,誰就是Agent的第一站。百煉正在做的是Agent時代的模型超市。

比產品發佈更早的訊號來自資本市場。上周阿里財報電話會上披露,AI模型及應用服務ARR已超過80億元,預計年底突破300億元,消息發佈當天阿里股價飆漲8%。截至2026年3月,百煉平台客戶數量同比增長8倍,過去三個月token消耗規模較上一季度大幅提升。

按管理層預計,此次全端升級之後,Agent驅動的MaaS收入將取代ECS成為阿里雲最大的產品線。如果兌現,將是阿里雲收入結構的一次重大切換。

過去,阿里雲賣的是算力時長,企業按小時、按核數付費;現在賣的是Token消耗量,Agent按呼叫次數和生成長度付費。計量單位變了,增長邏輯也跟著變了:人類有工作時間上限,Agent沒有。當Agent開始7x24小時消費Token,雲的增長天花板就不再由人類的工作時長決定。按公開資料看,ARR從80億到年底300億的增速,在阿里雲歷史上罕見。

Omdia資料顯示,阿里雲是國內雲市場份額第一的廠商。這樣一家公司在這個時間窗口裡把晶片、雲平台、模型和推理引擎全部圍繞Agent重新配置一遍,本身就是一個重要的行業訊號。

上一次阿里雲做這種等級的技術體系調整,還是2019年全面擁抱雲原生的時候。那次重構花了兩年消化,奠定了此後五年雲原生時代的競爭優勢。而在旗艦模型三個月迭代三個版本的AI時代,率先完成全端重構的速度本身就是壁壘。 (觀網財經)