首發自研HBM記憶體!華為昇騰950/960/970晶片全公佈,全球最強超節點來了

在今日舉辦的華為全聯接大會2025上,華為輪值董事長徐直軍表示超節點成為AI基礎設施建設新常態,目前CloudMatrix 384超節點累計部署300+套,服務20+客戶

華為將推出全球最強超節點Atlas 950 SuperPoD,算力規模8192卡,預計於今年四季度上市。此外新一代產品Atlas 960 SuperPoD ,算力規模15488卡,預計2027年四季度上市。

會上,徐直軍還發佈了全球首個通算超節點TaiShan950 SuperPoD計畫2026年一季度上市。徐直軍稱,其將成為大型機、小型機終結者。

此外,他還表示,算力過去是,未來也將繼續是,人工智慧的關鍵,更是中國人工智慧的關鍵。

徐直軍還首次公佈了昇騰晶片演進和目標。他表示,未來三年,華為已經規劃了昇騰多款晶片,包括昇騰950PR、950DT以及昇騰960、970。

其中昇騰950PR 2026年第一季度對外推出,該晶片採用了華為自研HBM。

根據現場公佈的資訊,昇騰950PR晶片架構新增支援低精度資料格式,其中FP8/MXFP8/HIF8: 1 PFLOPS,MXFP4: 2 PFLOPS,重點提升向量算力,提升互聯寬頻2.5倍,支援華為自研HBM高頻寬記憶體,分為HiBL 1.0和HiZQ 2.0兩個版本。

規格方面,HiBL 1.0容量128GB,頻寬1.6TB/s;HiZQ 2.0容量144GB,頻寬4TB/s。


其中,昇騰950PR晶片採用950核心+HiBL 1.0記憶體,可提升推理Prefill(預填充)性能,提升推薦業務性能。

昇騰950DT採用HiZQ 2.0記憶體,可提升推理Decode(解碼)性能,提升訓練性能,提升記憶體容量和頻寬。

延伸閱讀:

在大模型推理中,Prefill階段負責接收完整輸入資料(如文字或圖像),並計算快取。這一過程需要強大的算力支援,通常由高性能晶片完成。 該階段強調算力而非記憶體頻寬,因此更適合在HBM(高頻寬記憶體)晶片上運行。相比之下,後續的Decode階段更依賴高速記憶體傳輸和互聯方案。

HBM(High Bandwidth Memory,高頻寬記憶體)是一種基於3D堆疊技術的先進DRAM解決方案,多層DRAM晶片垂直整合,顯著提升資料傳輸效率。具有超高頻寬與低延遲、高容量密度、高能效比等優勢,能協助快速處理資料密集型的AI任務。

美國國際戰略研究中心(CSIS)AI專家艾倫(Gregory Allen)解釋,HBM對於製造先進AI晶片至關重要,價值約佔整體晶片的一半。

AI推理需頻繁呼叫海量模型參數(如千億級權重)和即時輸入資料。HBM的高頻寬和大容量允許GPU直接訪問完整模型,可避免傳統DDR記憶體因頻寬不足導致的算力閒置。對於千億參數以上的大模型,HBM可顯著提升響應速度。

當下,HBM已成為高端AI晶片的標配,訓練側滲透率接近100%,推理側隨模型複雜化加速普及。 (快科技)