•
近日,上海世界人工智慧大會現場,華為最新昇騰384超節點真機霸氣亮相,成了整個展會中極具份量的 “鎮館之寶”。
這個由12個計算櫃和4個匯流排櫃組成的大型裝置,集合了384顆昇騰NPU與192顆鯤鵬CPU,其總算力達到300Pflops,是輝達旗艦產品NVL72系統的1.7倍;網路頻寬達到269TB/s,較其提升107%;記憶體頻寬為1229TB/s,提升幅度達113%。
在以往的普遍認知裡,單顆昇騰晶片的性能僅為輝達Blackwell架構GPU三分之一。然而,華為憑藉 “系統工程” 的思路實現了突破性進展,昇騰384超節點運用全互連拓撲架構,借助華為自主研發的MatrixLink高速網路,達成了全對等互聯。
這一創新舉措,徹底改變了傳統以CPU為核心的馮諾依曼架構。華為將高速互聯匯流排從伺服器內部拓展至整機櫃乃至跨機櫃範圍,實現CPU、NPU、DPU、儲存和記憶體等資源的全面互聯與池化。這樣就能去除掉繁多的中轉環節,從而實現真正的點對點互聯,進而實現更大的算力密度和互聯頻寬。
其性能測試結果表明,在昇騰超節點叢集上運行LLaMA3等千億參數的稠密模型時,其性能比傳統叢集提高了2.5倍以上。在處理多模態以及MoE專家混合模型時,性能提升甚至能達到3倍。昇騰384超節點所取得的突破,意味著長期以來全球AI算力市場被輝達壟斷(佔比超過90%)的格局被打破,國產產品的市場份額正從不足10%向30%邁進。
更為關鍵的是,在當前西方技術封鎖的嚴峻形勢下,華為昇騰384憑藉自主創新的MatrixLink匯流排協議,徹底擺脫了對西方“拼湊式”技術標準的依賴,打造出全球領先的互聯架構。這不僅僅是一次技術突破,更是中國算力從“跟跑”到“領跑”的歷史性跨越! (極果網)