當供需關係變得更清晰,下游A1廠商、算力方逐漸用更理性的眼光看待輝達產品。
文|邱曉芬
編輯|蘇建勳
封面來源|視覺中國
近期,輝達卡租賃價格崩潰的話題,引起了AI業的熱議。外網一篇流傳甚廣的文章中,用「輝達GPU租賃泡沫破裂」這一驚悚的表達,來形容當下這一趨勢。
36氪了解到,輝達核心產品在中國的租賃價格劇烈波動確實是事實,輝達熱門晶片在2024年的租賃價格走勢如下——
輝達H100,一般以8卡為一張節點的形式出租。一張卡月初的市場報價在12-18萬/月之間浮動,如今徘徊在7萬元前後;
消費級顯示卡“輝達4090”,此前“挖礦熱”時一度被炒至一萬八、九,一卡難求。今年年初,「輝達4090」單片的年租賃價格為一萬三左右,目前的租賃價格大概是七、八千。
也就是說,輝達這兩款熱門晶片租賃價在10個月內雙雙降了50%,不再是前兩年一卡難求的香餑餑。
不過,多位業者表示,不像外網文章那樣聳人聽聞,這並不需要恐慌。有業界人士測算,過去常規算力晶片租賃價格,在五年內大致有80%的下滑——輝達H100、4090的發佈時間是2022年,距今2年,大致符合價格下降的客觀規律。
當然還有其他原因的綜合作用。輝達熱門晶片租賃價格的下滑,本質上是輝達產品周期、以及算力市場供需變化等因素的作用力。
而面對市場的新變化,國內的算力產業也緊急做出各種調整。
算力供需天平傾斜
輝達晶片租賃價格下降,與輝達當下處於新舊產品交接期有關。
一位行業人士表示,相比H100,輝達今年的Blackwell架構新品GB200,單位算力成本更低,而大部分AI公司基於降本考慮,基本選擇“蹲新品”,致使老產品一定程度上遇冷。
在黃仁勳的描述中,新品完全是另外一副光景——其稱,Blackwell芯片需求旺盛,導致份額分配就像“走鋼絲”,他一不小心就會“得罪大客戶們”。
但縱使萬眾期待,這款新品卻面臨尷尬延期問題。
輝達的工程師們把困境歸咎到台積電採用了一項全新的封裝技術上;台積電方面則指責輝達瘋狂催促生產流程,給予他們比以往過短的驗證時間。這導致,輝達本應在今年第三季就推向市場的新晶片,如今推遲到第四季甚至明年。
一位晶片產業人士向36氪預測,在GB200正式面世後,輝達老晶片租賃價格下跌態勢很有可能進一步加劇,其判斷,「預計近半年內不會恢復」。
此外,輝達產品租賃價格的猛烈下降,也與目前算力市場供給與需求不符有關。
在國內,算力產業的佈局模式與國外相反——國內是先搭好算力的池子,再逐步發展AI應用,是「拿著釘子找錘子」;而國外的算力產業更加商業化一些,更傾向於找到了確切客戶後,再建造與之相符的算力中心。
有產業統計顯示,最近兩年,國內總共湧現了大大小小1.3萬個智算中心,截至2024年上半年,國內算力規模已達全球第二(246 EFLOPS),智能算力年增速超過65%。
在這次建設潮中,國內也同步掀起了輝達H100晶片的囤積潮。當這些晶片以中國香港、新加坡為中轉站,好不容易憑藉各種隱密方式進入國內,算力行業卻悲觀發現,原本最消耗算力的預訓練,訴求普遍下滑。(詳情點擊:《大模型「六小虎」裡,至少兩家要放棄大模型了| 焦點分析》)
同時,2024年以來,儘管推理和模型微調的需求有所反超,大有超過預訓練的態勢,但也同樣沒有達到原先設想的「爆發」態勢,「目前還沒有看到AI的超級應用、或者明確的場景」。
當最近兩年囤積大量晶片所產生的算力,短時間內並沒有廣泛的AI應用得以消納,算力行業供給和需求的天平傾斜,價格的下滑也在意料之內。
從前買卡,現在租卡
在過去,算力行業一項目普遍的商業模式是賣輝達“裸金屬”,行業俗稱“賣鐵”。但在算力產業供需變化的當下,純賣硬體的模式過於簡單粗暴,很難持續。尤其是,當輝達租賃價格今年以來出現“崩盤”,下游AI行業對於算力晶片的觀念也悄然發生變化。
如果說,前兩年誰能買斷更多輝達晶片,就代表誰就最有機會更快訓出更強大的模型。而現在的AI公司們,更傾向選擇租賃晶片的方式取得算力,而非直接買斷晶片重資產、擠佔現金流。
為此,上游的算力產業也做出了相應調整來適應這種趨勢,嘗試推出更多樣化的租賃服務。
一位業者表示,過去AI廠商若租用輝達卡,基本需要多個節點、按年起租。但今年的變化是,有算力需求的客戶不僅變得分散,同時,他們對成本也變得格外敏感,分時租賃的要求變得很高。
「現在有些算力中心也允許你一次只租幾張輝達的卡片、只租幾個小時」。這有點像,過去你需要全年整租一兩層樓,但現在允許你短租一間房了。
不過,這種變化的直接後果是,算力產業的回本周期變得更長。有業者向36氪粗略測算,「一個用H100晶片搭建的算力中心,硬體回本周期高達5年以上」。
同時,算力產業從業人員們,正嘗試增加算力服務的顆粒度,有逐漸向上層的模型層、應用層延伸的趨勢。
36氪了解到,有些智算中心經營者在賣算力之餘,也會順帶幫助下游的AI客戶做好模型的微調;
或是直接深入幾個對算力需求較強的產業,如金融、醫藥、新能源,與具體的場景做結合,挖掘更多可以賣算力/租約力的潛在需求。
前述業者表示,他們經過測算,搭配種種AI服務,「硬體的成本回本周期,最短能縮減到2年左右」。
這些調整都不是壞事。當AI產業和算力產業共同經過兩年的高速狂奔,如今供需關係變得更清晰,而這兩方正用更理性的眼光,看待過去兩年他們視若珍寶的輝達晶片。(36氪Pro)