輝達開卷價格!最新Blackwell GPU架構/成本揭秘,彰顯老黃的「仁慈」



【導讀】老黃新GPU深夜炸場,超高規格的背後也付出了不小的代價,小編帶大家深入了解一下新架構的硬體細節與成本,新顯示卡的售價究竟高不高?輝達也得開始捲了

老黃的新GPU又在深夜炸場,震撼了所有的觀眾。

除了硬體參數上的震撼之外,大傢伙最想知道的還是新GPU的售價會不會同樣震撼。

以下就讓我們從規格參數、製程節點、封裝設計等方面來深入分析新一代Blackwell GPU的系統、定價、利潤,以及Jensen's Benevolence(老黃的仁慈)


在這個大模型的時代,輝達正處於世界之巔,擁有至高無上的定價權。

需要AI算力的使用者沒有更好的選擇,於是不得不接受輝達「用銀湯匙餵給他們的東西」,--毛利率超過85%的H100就是最好的例子。

而這一代B100在性能和整體擁有成本方面的優勢依然保持不變,超越了AMD的MI300X、英特爾的Gaudi 3。


不過這次新系列GPU的定價,可能會讓很多人大吃一驚,也許我們會說「B」代表的不是「Blackwell」架構,而是「Benevolence」(老黃的仁慈)。

——因為AI時代的主宰和救世主黃仁勳正在向全世界微笑,尤其是對於「GPU-poor」(缺乏GPU的用戶)來說。


B100 / B200規格

首先,Blackwell架構將2個GPU晶片黏在了一起,而製程製程仍然保持在4nm,跟上一代的Hopper架構一樣。


——在以往發表的最新資料中心GPU上,輝達都會採用更新的製程流程,但這次沒有。

這是因為台積電最初的3奈米N3B製程有問題,所以輝達不但沒有吃到提升過程的紅利,還得把矽片的總量增加一倍。

此外,新架構使用了8-hi HBM3E,容量高達192GB,這些記憶體的供應商是SK Hynix和Micron。


儘管其中絕大部分來自SK Hynix,但也改變了SK Hynix作為H100顯存唯一供應商的局面。

至於早就宣布要開發"世界上最快"的HBM3E的三星,目前仍然差點意思。

GPU的演化趨勢是在更大的封裝中使用更多的矽片(包括邏輯和記憶體),而目前矽基插值器(silicon-based interposers)的尺寸已達到極限。


尺寸的增大會使矽片的生產面臨更多問題,進而降低產量。相較於上一代,B100的封裝尺寸要大得多,它將成為首款採用CoWoS-L的大容量產品(CoWoS-L是一種帶有被動矽橋的有機RDL基底面)。


Umbriel 和Miranda

Blackwell的第一個版本代號叫Umbriel,它保留了前代PCIe Gen 5、400G網路等,B100風冷式700W甚至可以無縫接入現有的H100和H200伺服器底板。

不過B200的功率上限將提高到1000W,就需要重新設計伺服器了。當然也有資訊顯示,1000W版本仍然可以採用風冷方式,令人感到意外。


標準版GPU的代號是Miranda,擁有PCIe Gen 6和800G的網絡,而顯存容量更是高達192GB。

目前,輝達已經買斷了所有36GB HBM的供應,SK Hynix和Micron將在明年初開始生產。這意味著,每塊GPU的容量實際上可以達到288GB。


GB200平台

在供應鏈中,每個人都在討論的產品是Oberon GB200平台,新平台解決了GH200的許多問題。


首先,GB200將所需的CPU數量減半,從而在總體擁有成本(TCO)上佔據了優勢。 ——GH200的價格實在太貴了,而大多數的AI負載,實際上用不到伺服器上昂貴的輝達Grace CPU所提供的功能。

很多時候,GH200中的Grace晶片只是充當了世界上最昂貴的記憶體控制器。在可以單獨購買GPU的場景下,基本上所有AI大公司都會選擇買更多的GPU,而不是輝達的CPU。


另一方面,輝達正試圖銷售帶有液體冷卻的整合式機架。

輝達不願意單賣GPU或NVSwitch,雖然讓一些用戶感到不滿,但由於交換器背板、電源匯流排和冷卻系統的整合度要求很高,也算是無可厚非。

在新的液冷機架中,CPU、GPU、NVSwitches和ConnectX7網卡全部採用水冷技術。

機架有兩個版本:一個是120kW,可容納72個GPU(總功率有點過分了),機架頂部有10個運算托盤,中間有9個NVSwitch托盤,底部有8個運算托盤。

每個運算托盤包含4個GPU、4個網路卡、2個CPU、768GB HBM和2,000GB LPDDR5X。這個版本會晚一點上市。


另一種是功率較低的版本,這版本的機架有36個GPU和9個運算托盤,可以透過NVLink擴展連接兩個機架。

對大多數公司來說,這個版本可能更容易部署。輝達已通知機架的ODM廠商準備明年生產5萬個機架。


被捲到了

儘管B100為最終用戶提供了更好的性價比,但本身的製造成本卻增加了一倍以上。

SemiAnalysis表示,對於大批量超大規模定價,B100基板的平均售價僅約24 萬美元。這對許多人來說是一個驚喜,因為這遠低於ASP逐代成長50%的預期。

那麼為什麼老黃的定價會如此仁慈?答案是被捲到了。

AMD的MI300目前成為了合格的競爭對手,已經成功拿到了輝達最大的兩個客戶Meta和微軟的大訂單,儘管AMD為此承擔了很大的技術風險、並盡力降低了利潤。


而另一方面,輝達的所有主要客戶都在設計自己的晶片。雖然迄今為止,只有谷歌取得了成功,但亞馬遜仍在繼續推出Inferentia和Trainium,Meta也在長期押注MTIA,微軟同樣開啟了晶片之旅。


輝達的防禦形態

很明顯,生產成本翻倍,但售價增加得不算太多,B100的利潤率肯定是趕不上前代了。

H200也是如此,它的ASP與H100相同,但HBM顯著增加,從而增加了BOM。

而H20則更糟糕,儘管價格賣的更低,但實際上它與H100使用了相同的GPU晶片,HBM容量也從80GB增加到96GB,因此總體BOM成本實際上也增加了。

——以上的分析雖然聽起來很可怕,不過別擔心,毛利率只會再下降幾個百分點而已。


SemiAnalysis對此評論:「輝達更關心毛利和市場份額,而不是毛利率。過分擔心幾個百分點是精打細算的人所做的事情,而不是像黃仁勳這樣的有遠見的人所做的,他想以仁慈的計算獨裁者的身份統治世界。”

畢竟,輝達在資料中心上的收入持續飆升,並且正在實現供應鏈多元化,從800G收發器到電力傳輸組件,——老黃正在下一盤大棋。

也許,隨著時代的發展,輝達這個顯示卡帝國可能不得不轉換成防禦形態,因為硬體和軟體上的護城河,都不會永遠堅不可摧。

但也許,新的帝國正在誕生中。(新智元)

參考資料:

https://www.semianalysis.com/p/nvidia-b100-b200-gb200-cogs-pricing