重磅!輝達H100伺服器現貨價格暴跌

得益於生成式AI的火爆,用於AI伺服器的輝達H100一直供不應求,價格也很堅挺。而由於美國對中國的禁售,在銷往中國的通路,搭載H100的伺服器現貨價格水漲船高,一度高達300多萬元,而其官方價格僅28-30萬美元,除去物流及稅費成本,這意味著一些中間商可以輕鬆獲利超10%以上。


但最近,據業內人士透露,H100服務器現貨價格開始鬆動,甚至出現下跌,4月香港現貨價已跌到260萬元左右,而國內通路價在270萬-280萬元左右,相對高峰時期,已跌去了20萬-30萬元,中間商的利潤也隨之大打折扣。


究其原因,據相關人士透露,根據輝達的計劃,今年第二季將正式開售H200新品,時間很可能就在6月。而現在只有不到2個月的時間,一些中間商擔心新品發售將對H100的價格造成劇烈衝擊,急於出掉手中的庫存,最終導致H100服務器價格下跌。


或許受此影響,輝達在上週五(4月19日)的股價暴跌10%,同時帶動全球大部分晶片公司,包括AMD、Meta、美光等均出現不同程度跌幅。


據悉,輝達H200於去(2023)年11月13日的全球超算大會(SC23)發布,相比於H100,其性能提升了約60%到90%。


此外,H200也採用了H100相同的Hopper架構,因此它們的浮點速率基本上相同。而其主要升級點轉向了內存容量和頻寬,具體包括141GB的HBM3E內存,比H100提升了80%,顯存頻寬則從H100的3.35TB/s增加到了4.8TB/s,提升40%。

在大模型推理表現上,其提升卻極為明顯,H200在700億參數的Llama2大模型的推理速度比H100快了一倍,能耗卻直接降低了一半。

輝達表示,H200計畫於2024年第二季正式出貨,包括Google、亞馬遜、微軟等大型電腦廠商和雲端伺服器供應商將成為H200的首批使用者。(閃德資訊)