首發自研HBM記憶體！華為昇騰950/960/970晶片全公佈，全球最強超節點來了

2025/09/19

•

在今日舉辦的華為全聯接大會2025上，華為輪值董事長徐直軍表示超節點成為AI基礎設施建設新常態，目前CloudMatrix 384超節點累計部署300+套，服務20+客戶。

華為將推出全球最強超節點Atlas 950 SuperPoD，算力規模8192卡，預計於今年四季度上市。此外新一代產品Atlas 960 SuperPoD ，算力規模15488卡，預計2027年四季度上市。

會上，徐直軍還發佈了全球首個通算超節點TaiShan950 SuperPoD，計畫2026年一季度上市。徐直軍稱，其將成為大型機、小型機終結者。

此外，他還表示，算力過去是，未來也將繼續是，人工智慧的關鍵，更是中國人工智慧的關鍵。

徐直軍還首次公佈了昇騰晶片演進和目標。他表示，未來三年，華為已經規劃了昇騰多款晶片，包括昇騰950PR、950DT以及昇騰960、970。

其中昇騰950PR 2026年第一季度對外推出，該晶片採用了華為自研HBM。

根據現場公佈的資訊，昇騰950PR晶片架構新增支援低精度資料格式，其中FP8/MXFP8/HIF8: 1 PFLOPS，MXFP4: 2 PFLOPS，重點提升向量算力，提升互聯寬頻2.5倍，支援華為自研HBM高頻寬記憶體，分為HiBL 1.0和HiZQ 2.0兩個版本。

規格方面，HiBL 1.0容量128GB，頻寬1.6TB/s；HiZQ 2.0容量144GB，頻寬4TB/s。

其中，昇騰950PR晶片採用950核心+HiBL 1.0記憶體，可提升推理Prefill（預填充）性能，提升推薦業務性能。

昇騰950DT採用HiZQ 2.0記憶體，可提升推理Decode（解碼）性能，提升訓練性能，提升記憶體容量和頻寬。

延伸閱讀：

在大模型推理中，Prefill階段負責接收完整輸入資料（如文字或圖像），並計算快取。這一過程需要強大的算力支援，通常由高性能晶片完成。該階段強調算力而非記憶體頻寬，因此更適合在HBM（高頻寬記憶體）晶片上運行。相比之下，後續的Decode階段更依賴高速記憶體傳輸和互聯方案。

HBM（High Bandwidth Memory，高頻寬記憶體）是一種基於3D堆疊技術的先進DRAM解決方案，多層DRAM晶片垂直整合，顯著提升資料傳輸效率。具有超高頻寬與低延遲、高容量密度、高能效比等優勢，能協助快速處理資料密集型的AI任務。

美國國際戰略研究中心（CSIS）AI專家艾倫（Gregory Allen）解釋，HBM對於製造先進AI晶片至關重要，價值約佔整體晶片的一半。

AI推理需頻繁呼叫海量模型參數（如千億級權重）和即時輸入資料。HBM的高頻寬和大容量允許GPU直接訪問完整模型，可避免傳統DDR記憶體因頻寬不足導致的算力閒置。對於千億參數以上的大模型，HBM可顯著提升響應速度。

當下，HBM已成為高端AI晶片的標配，訓練側滲透率接近100%，推理側隨模型複雜化加速普及。 (快科技)