科技巨頭同日押注Agent化，阿里雲交出“芯-雲-模型-推理”全端答卷

2026/05/21

•

5月20日，阿里雲在2026阿里雲峰會上宣佈完成"晶片-雲-模型-推理"全端Agent化升級，同步推出全新AI產品官網"千問雲"、搭載自研AI晶片真武M890的超節點伺服器，以及最新旗艦模型Qwen3.7-Max。

千問雲是阿里雲成立17年來首次在主官網之外推出的全新產品官網，據阿里雲介紹，也是國內雲廠商率先專門面向Agent（智能體）設計的模型服務入口。而從晶片到推理引擎的這次全端升級，更是國內雲廠商首次圍繞Agent進行完整的產品體系發佈。

就在不到24小時前，Google剛在I/O開發者大會上把開發平台Antigravity升級為agent-first架構，發佈了定位為"24/7 personal agent"的Gemini Spark，宣佈Gemini從AI助手全面轉向自主執行任務的Agent。

Google和阿里雲在同一天做了同一個判斷：雲和AI的主要消費者正在從人變成Agent。

智能體作為AI的下一個主戰場的判斷在全球科技行業已經接近共識，但想要體系化圍繞Agent做全端重構，要求一家公司同時在底層AI晶片、中間層雲端運算基礎設施和前沿大模型三個領域擁有頂級自研能力，晶片決定算力自主性，雲決定規模化服務能力，模型決定Agent的智能上限，缺任何一層都交不出完整答卷。放眼全球能同時滿足這三個條件的科技公司屈指可數。

阿里雲資深副總裁劉偉光在現場表示，Agent突破臨界點之後可以24小時不間斷工作，對AI和雲的需求無窮無盡。"雲的使用者正在從人變成Agent，而阿里雲決定讓整套技術體係為此全面重構。"

千問雲的設計正是這次全端變革的一個註腳。網站同時提供了兩套入口：人類使用者看到的是模型對比、體驗和API接入的完整介面，Agent看到的是一條標準化的Skills安裝指令，解析後即可獲取平台全部能力並根據需求自主呼叫。

01. 自研晶片走向商用：真武M890與128卡超節點

阿里雲本次智能體全端重構從最底層開始發力。

在晶片層面，阿里發佈了基於新一代AI晶片真武M890的磐久AL128超節點伺服器，搭載自研互聯晶片ICN Switch 1.0，128張AI晶片組成一台電腦，P2P時延低於150ns，主打解決Agent場景下的海量並行推理和大模型訓練需求。

真武M890擁有144GB視訊記憶體，片間互聯頻寬800GB/s，晶片原生支援FP32到FP4多種資料精度，性能是上一代真武810E的3倍。

在阿里雲峰會上，平頭哥同時首次公佈真武系列晶片路線規劃，未來兩年將陸續推出真武V900、真武J900兩代晶片。

目前真武系列AI晶片累計出貨56萬片，服務了中國電信、中國一汽、浦發銀行等20多個行業的400多家客戶。

平頭哥半導體副總裁高慧表示，Agentic時代一個Agent在執行任務時可能在毫秒間連續發起數十次模型呼叫，同時需要CPU、GPU、網路和儲存緊密協同。平頭哥建構全端自研晶片矩陣，核心是實現算力、網力、存力的系統級協同。

磐久AL128超節點已上線阿里雲百煉，支援Qwen、DeepSeek、Kimi等主流模型。新一代真武晶片由此進入了百煉的對外模型服務鏈路。

02. 從控制台到一行程式碼：雲平台的Agent化重構

晶片是地基，地基之上，阿里雲開始改造雲平台本身。

傳統雲產品的互動邏輯面向人：控制台、菜單、配置項、儀表盤。阿里雲CTO李飛飛指出，Agent工作負載是"無規律彈性、短生命周期、瞬時起量即走"，與傳統雲端運算的穩態負載截然不同。

阿里雲據此對雲產品進行了Skill化、MCP化和CLI化改造，每一個雲產品都變成Agent可以像調函數一樣呼叫的標準化能力模組。Skills門戶同步上線，使用者僅需一句自然語言指令，Agent即可完成從資源識別到應用部署的全流程。

千問雲是這套邏輯的集中體現。150多款主流模型的API被封裝為標準化Skills和CLI工具，OpenClaw、Hermes Agent、Claude Code等主流智能體框架僅需一條指令即可"學會"平台全部能力，根據使用者需求自主呼叫模型、處理圖片、生成視訊。人類開發者同樣可以通過千問雲完成模型選型、對比、體驗和接入的全流程。

上一次中國頭部科技公司以這種力度重構產品入口，可能要追溯到移動網際網路早期所有人把PC官網的流量讓位給App的階段。

阿里雲還為Agent建構了完整的運行環境支撐，包括輕量高效的沙箱執行環境、多Agent協同能力、跨任務記憶能力，以及全域智能維運能力。

03. 35小時自主進化：旗艦模型從"說得好"到"做得到"

平台為Agent準備了運行環境，Agent能做什麼，取決於驅動它的模型。

Qwen3.7-Max是阿里新一代旗艦大模型，在第三方評測機構Arena全球大模型盲測總榜中，Qwen3.7-Max超過Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，與GPT、Claude、Gemini最強模型接近，位列國產模型第一。

阿里同時披露了一個實戰案例。在訓練時從未接觸過的真武M890晶片上，Qwen3.7-Max僅憑一份任務說明，從零開始自主工作35小時，獨立進行了432次核心評估和1158次工具呼叫，完成了一個生產級AI計算核心的編寫與調優，最終性能較SGLang Triton官方參考實現提升10倍。全程沒有人類干預。測試軌跡顯示，模型在運行超過30小時後仍能發現有效最佳化點，甚至主動發起了一次架構重設計。

這個案例的含金量需要放在行業語境下理解。晶片級的算子最佳化，過去是資深AI Infra工程師最核心的工作之一，需要極強的硬體經驗、演算法能力和反覆偵錯迭代。Qwen3.7-Max在一塊從未見過的晶片上完成了這件事，而且結果比官方參考實現好一個數量級。Agent正在從"替人寫程式碼"進入"替人最佳化硬體性能"的階段，這個門檻的跨越，比跑分榜上的名次變化更能說明問題。

阿里巴巴通義大模型事業部負責人周靖人表示，大模型正在經歷核心範式轉移，從對齊人類偏好到對齊任務目標。"過去我們追求的是模型'說得好'，現在要求模型'做得到'。"

近3個月內，千問旗艦模型連續迭代了3.5、3.6、3.7三個版本，阿里在刻意加速模型進化，匹配Agent場景對模型能力的指數級需求。據瞭解，千問3.7系列後續還將推出Qwen3.7-Plus等版本，覆蓋從程式設計智能體到視覺智能體的全場景。

04. 百煉開放與資本驗證：增長引擎已經在切換

模型能力到位之後，規模化的問題交給了百煉。

阿里雲在百煉平台上建構了大規模GPU資源叢集，通過並池調度、上下文快取、吞吐彈性調度應對Agent場景下的並行挑戰。百煉內建安全治理能力，確保24小時不間斷運行的Agent始終在預設權限範圍內行動。

李飛飛強調，在Agent自主運行的語境下，一個全天候執行任務的Agent如果沒有邊界約束，後果不可控。

生態策略上，百煉保持開放接入。除阿里自研的千問模型矩陣外，平台已接入智譜GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、可靈、Vidu Q3等第三方模型。GLM-5.1、Kimi K2.6、MiniMax M2.7是當下國內最強的幾個競品模型，阿里雲把它們全部放上了自家平台。這個動作的邏輯很清楚：阿里雲賭的不是千問一家模型贏，是百煉成為Agent呼叫模型的默認入口。當Agent需要根據任務動態選擇最合適的模型時，誰的平台上模型最全、切換成本最低，誰就是Agent的第一站。百煉正在做的是Agent時代的模型超市。

比產品發佈更早的訊號來自資本市場。上周阿里財報電話會上披露，AI模型及應用服務ARR已超過80億元，預計年底突破300億元，消息發佈當天阿里股價飆漲8%。截至2026年3月，百煉平台客戶數量同比增長8倍，過去三個月token消耗規模較上一季度大幅提升。

按管理層預計，此次全端升級之後，Agent驅動的MaaS收入將取代ECS成為阿里雲最大的產品線。如果兌現，將是阿里雲收入結構的一次重大切換。

過去，阿里雲賣的是算力時長，企業按小時、按核數付費；現在賣的是Token消耗量，Agent按呼叫次數和生成長度付費。計量單位變了，增長邏輯也跟著變了：人類有工作時間上限，Agent沒有。當Agent開始7x24小時消費Token，雲的增長天花板就不再由人類的工作時長決定。按公開資料看，ARR從80億到年底300億的增速，在阿里雲歷史上罕見。

Omdia資料顯示，阿里雲是國內雲市場份額第一的廠商。這樣一家公司在這個時間窗口裡把晶片、雲平台、模型和推理引擎全部圍繞Agent重新配置一遍，本身就是一個重要的行業訊號。

上一次阿里雲做這種等級的技術體系調整，還是2019年全面擁抱雲原生的時候。那次重構花了兩年消化，奠定了此後五年雲原生時代的競爭優勢。而在旗艦模型三個月迭代三個版本的AI時代，率先完成全端重構的速度本身就是壁壘。 (觀網財經)

科技