【WAIC 2025】中國晶片突破封鎖！華為“算力核彈”誕生，性能暴打輝達旗艦

2025/07/29

•

近日，上海世界人工智慧大會現場，華為最新昇騰384超節點真機霸氣亮相，成了整個展會中極具份量的 “鎮館之寶”。

這個由12個計算櫃和4個匯流排櫃組成的大型裝置，集合了384顆昇騰NPU與192顆鯤鵬CPU，其總算力達到300Pflops，是輝達旗艦產品NVL72系統的1.7倍；網路頻寬達到269TB/s，較其提升107%；記憶體頻寬為1229TB/s，提升幅度達113%。

在以往的普遍認知裡，單顆昇騰晶片的性能僅為輝達Blackwell架構GPU三分之一。然而，華為憑藉 “系統工程” 的思路實現了突破性進展，昇騰384超節點運用全互連拓撲架構，借助華為自主研發的MatrixLink高速網路，達成了全對等互聯。

這一創新舉措，徹底改變了傳統以CPU為核心的馮諾依曼架構。華為將高速互聯匯流排從伺服器內部拓展至整機櫃乃至跨機櫃範圍，實現CPU、NPU、DPU、儲存和記憶體等資源的全面互聯與池化。這樣就能去除掉繁多的中轉環節，從而實現真正的點對點互聯，進而實現更大的算力密度和互聯頻寬。

其性能測試結果表明，在昇騰超節點叢集上運行LLaMA3等千億參數的稠密模型時，其性能比傳統叢集提高了2.5倍以上。在處理多模態以及MoE專家混合模型時，性能提升甚至能達到3倍。昇騰384超節點所取得的突破，意味著長期以來全球AI算力市場被輝達壟斷（佔比超過90%）的格局被打破，國產產品的市場份額正從不足10%向30%邁進。

更為關鍵的是，在當前西方技術封鎖的嚴峻形勢下，華為昇騰384憑藉自主創新的MatrixLink匯流排協議，徹底擺脫了對西方“拼湊式”技術標準的依賴，打造出全球領先的互聯架構。這不僅僅是一次技術突破，更是中國算力從“跟跑”到“領跑”的歷史性跨越！ (極果網)