華為、阿里押注“超節點”

機構指出,中美AI競爭正從「單卡性能」走向「系統級效率」。

人工智慧正以史無前例的速度重塑各行業,這場變革背後離不開海量算力的支援。當AI模型參數從億級躍升至兆級,「超節點」開始逐漸取代單機與傳統叢集,成為新一代的「算力法寶」。

超節點,即Superpod,是一種用於建構大規模算力叢集的技術架構。此概念最早由輝達提出,指將數千張GPU整合在一個邏輯單元內,形成類似「超級計算節點」的系統。與傳統架構不同的是,超節點可以通過高速互聯技術,彌補原先伺服器間頻寬不足以及高時延等問題,以期實現算力效率的最佳化。

在不久前舉行的2025雲棲大會上,阿里雲發佈了磐久128超節點AI伺服器。據悉,該伺服器整合阿里自研CIPU 2.0晶片和EIC/MOC高性能網路卡,單櫃支援128個AI計算晶片。同等算力下,相較於傳統架構,此伺服器推理效能可提升50%。

除推理場景外,超節點亦可用於AI訓練。今年4月,華為推出CloudMatrix 384超節點,透過建構超過萬片的大叢集提供算力。對於兆、十兆參數的大模型訓練任務,在雲端資料中心,可將432個超節點級聯成最高16萬卡的超大叢集。

在9月召開的華為全連接大會上,華為表示CloudMatrix 384超節點已銷售300余套,共服務20余家客戶,主要需求來自政企。未來,華為還將推出Atlas 950 SuperPoD超節點,算力規模8,192卡,預計2026年第四季上市。新一代產品Atlas 960 SuperPoD算力規模將達到15,488張卡,預計2027年第四季上市。

華龍證券指出,中美AI競爭正從“單卡性能”走向“系統級效率”,中國正在用叢集建設+開源生態+工程化交付的方式完成AI基建方面的彎道超車。事實上,當前還有更多國產硬體廠商正在加速佈局超節點:

8月7日,浪潮資訊發佈面向兆參數大模型的超節點AI伺服器「元腦SD200」。
沐曦股份已發佈多種超節點形態,包括光互連超節點、耀龍3D Mesh超節點、Shanghai Cube國產高密度液冷整櫃以及高密度液冷算力POD。
8月28日,百度智能雲發佈百舸AI計算平台5.0版本。在算力方面,崑崙芯超節點正式啟用。

從技術方向來看,超節點正成為AI基礎設施建設的新常態。民生證券認為,先前市場更關注晶片算力,但伴隨Scale up產業趨勢崛起,超節點已重新定義AI基礎設施的範式

以華為超節點為例,其櫃間採用全光互聯,具有高可靠、高頻寬、低時延等優勢;另一方面,華為的Atlas 950通過正交架構,實現零線纜電互聯,其獨創的材料和工藝讓光模組液冷可靠性提升1倍。相較之下輝達將在明年下半年上市的NVL144,Atlas950超節點卡的規模是其56.8倍,總算力是其6.7倍,記憶體容量是其15倍,互聯頻寬是其62倍,在各方面均呈領先。

該機構進一步指出,當超節點速率大幅提升,AIDC功率將迎來新挑戰。由於包括華為CloudMatrix 384、輝達GB200NVL72在內的超節點單機櫃功耗普遍突破100KW,因此在算力密度指數級增加的情況下,超節點機櫃的溫控和電源系統將面臨挑戰。而當Atas950超節點採用全液冷模式時,其互聯頻寬速率和算力速率均可望迎來大幅提升。

從投資層面來看,國金證券表示,華為超節點等新平台在算力、頻寬、記憶等關鍵指標上全面領先,可望推動國產算力基礎設施加速落地。看好超節點滲透率的持續提升,帶動光連接供應鏈的放量。 (科創板日報)