#真武M890
平頭哥公佈AI晶片規劃,真武GPU已出貨56萬片
5月20日,在2026阿里雲峰會上,阿里發佈基於平頭哥新一代AI晶片真武M890的128卡超節點伺服器,搭載互聯晶片ICN Switch 1.0,通訊時延低至百納秒級,可讓128張AI晶片組成一台電腦,滿足海量Agent並行推理和大模型訓練需求。這是面向Agentic時代全面升級的重要部分,當天阿里雲推出了全新“芯-雲-模型-推理”技術體系。 Agentic時代,算力叢集需要承載成千上萬個Agent同時運行,每個Agent在一次任務中可能連續發起數十次模型呼叫,這對通訊時延和頻寬有極高要求。磐久AL128超節點伺服器基於自研AI晶片和互聯晶片打造,通過單機櫃128卡緊密耦合互聯,P2P時延低於150ns,單櫃頻寬達到Pb/s級,可支海量Agent的並行請求。該超節點伺服器已上線阿里雲百煉,支援Qwen、DeepSeek、Kimi等主流模型。 據介紹,首次亮相的真武M890採用自研平行計算架構,內建144GB視訊記憶體,性能是真武810E的3倍,片間互聯頻寬達到800GB/s,晶片原生支援FP32到FP4等多種資料精度,可應用於高精度訓練、低精度和超低精度推理的全場景,低精度推理場景下,不僅可以保證模型輸出質量,還能顯著降低單次推理的算力開銷。 平頭哥互聯晶片ICN Switch 1.0支援自研ICN互聯匯流排協議和PCCL通訊庫,吞吐量達25.6Tbps,可支援真武M890的高效互聯,提升AI叢集的算力效率。真武M890搭配ICN Switch1.0晶片,可實現64卡全頻寬互聯,顯著提升大規模智算叢集計算的效率與穩定性。基於平頭哥自研T-Head SAIL軟體棧的軟硬協同,可最大程度釋放晶片的算力。