平頭哥公佈AI晶片規劃,真武GPU已出貨56萬片

5月20日,在2026阿里雲峰會上,阿里發佈基於平頭哥新一代AI晶片真武M890的128卡超節點伺服器,搭載互聯晶片ICN Switch 1.0,通訊時延低至百納秒級,可讓128張AI晶片組成一台電腦,滿足海量Agent並行推理和大模型訓練需求。這是面向Agentic時代全面升級的重要部分,當天阿里雲推出了全新“芯-雲-模型-推理”技術體系。

Agentic時代,算力叢集需要承載成千上萬個Agent同時運行,每個Agent在一次任務中可能連續發起數十次模型呼叫,這對通訊時延和頻寬有極高要求。磐久AL128超節點伺服器基於自研AI晶片和互聯晶片打造,通過單機櫃128卡緊密耦合互聯,P2P時延低於150ns,單櫃頻寬達到Pb/s級,可支海量Agent的並行請求。該超節點伺服器已上線阿里雲百煉,支援Qwen、DeepSeek、Kimi等主流模型。

據介紹,首次亮相的真武M890採用自研平行計算架構,內建144GB視訊記憶體,性能是真武810E的3倍,片間互聯頻寬達到800GB/s,晶片原生支援FP32到FP4等多種資料精度,可應用於高精度訓練、低精度和超低精度推理的全場景,低精度推理場景下,不僅可以保證模型輸出質量,還能顯著降低單次推理的算力開銷。

平頭哥互聯晶片ICN Switch 1.0支援自研ICN互聯匯流排協議和PCCL通訊庫,吞吐量達25.6Tbps,可支援真武M890的高效互聯,提升AI叢集的算力效率。真武M890搭配ICN Switch1.0晶片,可實現64卡全頻寬互聯,顯著提升大規模智算叢集計算的效率與穩定性。基於平頭哥自研T-Head SAIL軟體棧的軟硬協同,可最大程度釋放晶片的算力。

大會現場,平頭哥首次公佈真武系列晶片的規劃,未來兩年將陸續推出算力更強的真武V900、真武J900兩代晶片,以滿足Agentic時代千行百業的AI算力需求。目前,真武系列晶片已累計出貨56萬片,服務了中國電信、中國一汽、浦發銀行等20多個行業的400多家客戶。

隨著Agent應用的爆發,AI的核心任務逐漸從純對話轉向任務執行,這不僅需要高AI算力支撐,其任務規劃、狀態管理、工具呼叫等環節極其依賴CPU,CPU成為影響Agent執行效率的關鍵部件。平頭哥擁有自研的伺服器CPU倚天系列,可與真武AI晶片高效協同,大幅提升AI推理效率,有效應對Agent高並行任務的負載壓力。

目前,平頭哥已推出真武系列AI晶片、倚天系列Arm伺服器CPU、磐脈系列智能網路卡、鎮岳系列儲存主控晶片、ICN Switch互聯晶片等資料中心核心晶片,實現算力、網力和存力的全端自研。 (半導體芯聞)