阿里的磐久超節點和供應鏈

昨天趕在阿里雲棲大會的最後一天,特意從上海趕去杭州看了阿里的超節點,在現場拍了一個視訊,但現場環境比較雜亂,人非常多。

但後來發現視訊中有兩個地方表述有誤,下面我們再詳細分析一下阿里的這個超節點,跟輝達的NVL72和華為的CM384做個對比。

如果看了這個文章還不太明白的讀者,我們明晚視訊號的直播還會講阿里的這個超節點。

1、GPU數量

阿里的這個磐久超節點,是採用兩個64個GPU超節點的方式,每個計算節點上有4顆阿里的自研GPU,因此上下各有16個計算節點,總共是16 x 4(4顆GPU) x 2(上下) = 128個GPU。

其中64個GPU是一組的scale up。

華為的CM384是包括384顆昇騰910C,輝達的GB200/GB300 NVL72,是包含72顆GPU。

2、互聯

輝達的NVL72中,採用的CabelTray的互聯方式,即Compute tray和Switch Tray是通過線纜進行連接,走的是NVLink的私有協議。

華為的CM384中,由於是採用了多個Rack作為一個超節點,昇騰伺服器和交換機之間也是通過線纜進行互聯。

阿里的超節點則完全不同,採用的是無背板的正互動聯,計算節點在前面,都是橫著放的,Switch節點在後面,是豎著放的。

他們都是直接插在一起的,中間並沒有通過PCB。

這種方式的有點顯而易見,沒有中了“中間商”,訊號傳輸的損耗會小很多。

3、電和光

在輝達的NVL72里面的scale up,都是使用的銅來連接,這些我們之前的文章都分析過,用光的話,成本和功耗都會增加非常多。

華為的CM384里面,採用的是全光互聯,但這裡的光互聯,其實指的也是第一層的UB Switch和第二層UB Switch之間是光互聯。如果只算scale up,CM384中,NPU:光模組=1:14,如果再加上scale out,那麼一個CM384中,就需要6912個400G的光模組,所以功耗和成本都居高不下。

在NPU和第一層UB Switch,CPU和第一層UB Switch之間的互聯,也都是電互聯。

在阿里的超節點中,一組64個GPU內部是scale up,採用的是電互聯,有的是PCB直接連接,有的是銅纜,這一層並沒有光。

在連接兩個ALink Switch之間,使用了光互聯,但目前還不清楚光的用量是多少。

4、參數對比

在所有參數中,大家最關心的是算力,但阿里目前並沒有給出算力參數。下面這個圖是SemiAnalysis給出的輝達GB200 NVL72和華為昇騰CM384的參數對比。

目前阿里給出的參數其實不多,我們列舉一下:

內建 CIPU 2.0 + EIC/MOC 網路卡,Scale-Up 頻寬 Pb/s 級,延遲百 ns,儲存網 800 Gbps,GPU 直聯 6.4 Tbps。

關於功耗,並沒有查到阿里的官網參數,但有報告中給出的是超過300kW,CM384是559kW,GB200 NVL72是145kW。

5、生態相容性

按照阿里官方的描述,說是可以相容多家GPU/ASIC,但前提是要支援ALink協議。這一點是比較難的,目前國內外的大廠們,都不想去相容別家的私有協議。

而阿里的GPU是可以相容cuda的,在目前這個階段,算是一個不錯的優勢。

6、GPU和CPU的互聯

華為CM384的GPU和CPU互聯可以參考我們上面給出的圖,GPU和CPU都連到了UB Switch上。

輝達的Bianc板卡中,GB200和Grace CPU是通過NVLink-C2C互聯。

輝達和華為的方案中,GPU/NPU都是和CPU在一起的,而阿里的方案中,GPU和CPU是兩個獨立計算節點,中間通過PCIe進行互聯的。

GPU計算節點:

這個互聯的線,是藏在了機箱的背部。

7、阿里的伺服器供應鏈

結合業內的一些資訊,講一下大家最關心的供應鏈,僅供大家參考,不構成投資建議。

AI及通用伺服器整合:

浪潮佔據 33% - 35% 的份額;華勤的份額為 23%;另有企業並列第三,所佔份額為 18%。若單看通用伺服器細分領域,浪潮的份額為 30%,中興通訊佔比 27%,華勤以 18% 的份額緊隨其後,新華三則佔據 15% 的市場份額。從合作動態來看,阿里今年的相關招標工作已全部完成,市場份額的變動預計要到明年年中才會顯現。中興通訊設定了明確目標,計畫從浪潮手中奪取市場份額第一的位置。

液冷:

高瀾和英維克是主要參與者,其中高瀾佔據 30% 的份額,英維克的份額區間在 30% - 40%;申菱環境的市場份額處於 20% - 30% 之間;剩餘的市場份額則由其他企業瓜分。在企業動態方面,科華資料剛剛成功進入液冷白名單,按照發展預期,到 2026 年其在液冷領域的業務規模有望快速擴大,這一增長態勢可能會對目前佔據頭部位置的三家企業(高瀾、英維克、申菱環境)的市場份額產生稀釋作用。

光模組: 華工科技是阿里雲光模組業務的核心供應商,其在該合作中的份額超過 25% - 30%;光迅科技在阿里雲 400G 光模組市場中表現突出,市佔率位居第一,達到 30% - 40%,同時,其 800G 光模組已實現批次供貨,並且與阿里雲採用 “聯合開發”(JDM)的模式開展合作;中際旭創、航錦科技及其他企業則佔據了剩餘的市場份額。

PCB: 從技術與價值層面來看,超節點主機板的層數已提升至 24 - 30 層,其中超低損耗材料的佔比超過 60%,這一技術升級使得單卡 PCB 的價值量從原先的 900 元上升至 1900 元。在企業競爭方面,滬電股份是阿里雲伺服器主機板及加速卡的主力供應商,2024 年其 AI 伺服器 PCB 業務收入佔比已提升至 35%,隨著磐久 128 產品的放量,滬電股份的產品結構有望得到進一步最佳化,且其高端板的毛利率超過 35%,顯著高於傳統通訊板的毛利率水平。深南電路與滬電股份在訂單方面存在共享情況,二者在相關市場的供給份額合計超過 50% - 60%;剩餘的市場供給則由國內其他幾家主流 PCB 廠商承擔。

伺服器電源: 當前,中恆電氣與歐陸通是該領域的核心電源裝置供應商,二者的產品幾乎覆蓋了當下伺服器電源的主要供應量。在合作方面,它們為阿里雲資料中心提供高效的供電系統,同時也供應應用於磐久伺服器的浸沒式液冷集中式供電電源。近期市場動態顯示,科華資料剛剛進入阿里 UPS 白名單,從發展趨勢來看,科華資料後續有望成為阿里伺服器電源領域的第三大供應商,目前科華已經在騰訊伺服器電源中佔了比較大的份額,後續看他們如何爭取在阿里的份額了。 (傅里葉的貓)