GPU泡沫將破?輝達再創新高



據路透社報告,Nvidia股票在周一收盤創下歷史新高,這家重量級人工智慧晶片製造商即將取代蘋果成為全球最有價值的公司。

由於投資者押注其當前和下一代人工智慧處理器的強勁需求,這家位於加利福尼亞州聖克拉拉的公司的股價當日上漲2.4%,收於138.07美元。今年6月,輝達一度成為全球市值最高的公司。後來,微軟超越了輝達,這三家科技巨頭的市值在過去幾個月裡一直不相上下。

最新的漲幅使Nvidia的市值升至3.39兆美元,略低於蘋果的3.52兆美元,但高於微軟的3.12兆美元。Nvidia是Alphabet、微軟、亞馬遜以及其他新型公司AI競爭中的最大贏家。

由於人工智慧熱潮,該公司先進半導體的需求旺盛,輝達股價今年已上漲了179%。相比之下,標準普爾500指數和科技股為主的納斯達克指數分別上漲了23%。該股本月迄今已上漲近14%。

那麼,為什麼輝達能成為贏家?


一、最新晶片全部賣光,客戶陷入囚徒困境

來自分析師的最新消息顯示,Nvidia即將推出的Blackwell處理器在未來12個月內已經銷售一空。摩根士丹利分析師約瑟夫·摩爾(Joseph Moore)在本周接待輝達首席執行官黃仁勳及公司其他高管後,在一份客戶報告中分享了這一消息。

據摩爾稱,產品的推出正在按計畫進行,Nvidia的Blackwell GPU“12個月內已被預訂一空”,這意味著尚未向該公司下訂單的客戶要到2025年底才能收到Blackwell產品。

Nvidia於今年3月發佈了Blackwell GPU系列。

Blackwell GPU採用定製的雙光罩極限4NP TSMC工藝製造,GPU晶片通過10TBps晶片到晶片鏈路連接到單個統一的GPU,擁有2080億個電晶體。相比Hopper系列的800億個有所增加,并包括第二代變壓器引擎和新的4位浮點AI推理功能。

本周早些時候,微軟成為首家部署Nvidia GB200 AI伺服器的雲服務商,該公司在X上發佈消息稱:“Microsoft Azure是首家運行Nvidia Blackwell系統並搭載GB200 AI伺服器的雲服務商。我們正在每一層進行最佳化,以支援世界上最先進的AI模型,並利用Infiniband網路和創新的閉環液體冷卻。”

Google、Meta和CoreWeave也已訂購了Blackwell GPU。產品預計將於本季度開始發貨,此前曾因意外出現的設計缺陷而延遲發貨,但現已解決。

8月,Nvidia首席財務官Colette Kress在公司2024年第三季度財報電話會議上告訴分析師,公司預計2024年最後一個季度將實現“數十億美元的Blackwell收入”。

在分析師看來,這家半導體公司的客戶陷入了“囚徒困境”。

根據TD Cowen分析師Joshua Buchalter所說,在該公司的超大規模客戶中,“每個客戶都有繼續支出的動力,因為不這樣做的代價(可能)是毀滅性的。”

Buchalter寫道,隨著Nvidia向Blackwell晶片系列過渡,這將支援對Nvidia硬體的持續需求。儘管投資者可能對Nvidia能否在Blackwell晶片延遲發佈的情況下跟上其“近期大幅上漲”的能力感到有些擔憂,但他對Blackwell晶片的生產以及Nvidia較舊的Hopper晶片系列可以填補一切假設空白的潛力充滿信心。

“此外,這種情況將對毛利率產生積極影響,因為該公司表示,相對不太成熟的Blackwell供應鏈將在短期內導致利潤率下滑,”Buchalter在談到Hopper的持續發展勢頭時寫道。

事實上,從Elon Musk最新的動作看來,GPU也似乎勢不可擋。

據報導,Elon Musk和xAI背後的團隊創造了一項工程奇蹟,他們在短短19天內就搭建了一個由100000個H200 Blackwell GPU組成的超級叢集。Nvidia首席執行官黃仁勳在X上向特斯拉車主矽谷成員講述了Elon Musk令人難以置信的安裝能力。

黃仁勳對Elon Musk 19天的冒險歷程充滿敬畏和敬意,稱其為“超人”的努力。據稱,xAI團隊在不到三周的時間內就從“概念”階段發展到與Nvidia“裝置”完全相容。這還包括在新建的超級叢集上運行xAI的首次AI訓練。

一般而言,整個過程涉及建造巨大的X工廠,GPU將存放在那裡,並為整個工廠配備液體冷卻和電源,以使所有200 000個GPU正常運行。更不用說Nvidia和Elon Musk的工程團隊之間的所有協調,以便以精確和協調的方式運送和安裝所有硬體和基礎設施。

不過黃仁勳表示,普通資料中心需要四年的時間才能完成Elon Musk及其團隊在19天內完成的工作。其中三年的時間用於規劃,最後一年用於運送裝置、安裝裝置並使其正常運行。


二、黃仁勳眼裡的公司護城河

輝達之所以能一往無前,這與公司在GPU方面打造的護城河有著重要的關係。

我們也看到,NVIDIA在過去十多年來一直在軟體方面進行投資,使其硬體性能超越普通矽片。這種優異的表現源於不斷更新的軟體最佳化和加速庫。展望未來,與其圖形處理單元相關的無形資產以及專有軟體所涉及的轉換成本應繼續成為推動力。

市場專家認為,就像iOS一樣,開發人員正在為iPhone開發應用程式,由此將客戶鎖定在iPhone上,NVIDIA也在做同樣的事情。AI工程師一直在學習使用CUDA平台來程式設計GPU。這應該有助於固定使用者群體。NVIDIA預計會進一步增長,預計2024年第三季度的收入將達到325億美元。該公司預計其Hopper架構和Blackwell產品將繼續擴展。

羅森布拉特證券分析師漢斯·莫斯曼(Hans Mosesmann)也表示:“輝達的競爭優勢非常強大,因為過去15年來,他們一直在投資軟體,通過不斷更新的軟體最佳化和加速庫,使他們的硬體性能優於普通矽片。”“他們比其他所有人都有這個優勢。”

CFRA Research分析師Angelo Zino直言,該公司的競爭優勢主要在軟體方面。

首先是Nvidia專有的CUDA軟體,用於加速GPU計算。CUDA平台包括編譯器、庫和開發人員工具,可幫助程式設計師加速其應用程式。全球有超過500萬開發人員使用CUDA。

根據輝達首席執行官黃仁勳的評論,Nvidia在人工智慧處理器方面的競爭優勢是可持續的,包括人工智慧推理領域。這對Nvidia來說是個好兆頭。

Melius Research分析師Ben Reitzes在周一的一份客戶報告中表示,Nvidia首席執行官黃仁勳(Jensen Huang)最近在BG2播客上談到了公司的競爭定位,因此,他對Nvidia的前景更加有信心。

Nvidia的懷疑者表示,與訓練相比,該公司在AI推理方面沒有競爭優勢。他們表示,定製專用積體電路將主導該市場。

但黃仁勳表示,得益於該公司的Cuda軟體和NVLink網路,Nvidia在推理領域的“護城河將會更大”。

此外,Reitzes表示,Nvidia也在不斷改進其演算法並確保其舊晶片能夠與新應用程式相容。

他還表示,Nvidia在製造完整的AI資料中心系統方面遠遠領先於競爭對手。

黃仁勳表示,資訊技術市場在升級系統以支援人工智慧方面才剛剛進入“第二階段”。他說,到目前為止,該市場已經花費了大約1500億美元,而升級“舊IT基礎設施”所需的資金為1兆美元。

“他似乎不僅關心股東,而且他的話也比任何人都好,”雷茨寫道。“嚴肅地說,這表明他對遠遠領先於競爭對手的戰略充滿信心——沒有什麼可隱瞞的。”

“然而,真正的原因是基於Nvidia的系統可以最大化投資回報,因為Nvidia不斷地改進其演算法並進行整合,以使其舊晶片與新晶片相容,”Reitzes寫道。他在一份研究報告中寫道:“Nvidia最大的成就是建立了一個可以在所有大型雲到最小雲上運行的基礎設施,並且能夠以最快的速度實現盈利。”

Reitzes表示,Nvidia是一家生產力極高的公司,其利潤規模應該會繼續讓投資者感到高興,這可能會推動其股價創下新高。Reitzes指出,Nvidia報告稱,Nvidia的人均收入為410萬美元,而蘋果為230萬美元,Meta Platforms為240萬美元。

護城河討論可能會讓那些擔心Nvidia在推理領域不再擁有與訓練市場同等優勢的投資者感到放心。


三、GPU,泡沫將破?

雖然輝達還是在高歌猛進,但在latent.space的作者Eugene Cheah看來,GPU的泡沫破裂風險大增。

據他在一篇分析文章建言——不要購買H100,這是因為他看到由於預留計算轉售、開放模型微調和新基礎模型公司的衰落,市場已從短缺(8美元/小時)轉變為供過於求(2美元/小時)。對於一般市場而言,由於目前供應過剩,使用者可以在需要時以接近成本的價格租用H100。

因此現在投資購買新的H100意義不大。

他表示,ChatGPT引爆的生成式AI熱潮,讓市場對GPU的需求暴增。於是,輝達推出了性能更強的H100。如他所說,與A100相比,新款H100的功能強大3倍,但標價僅為2倍。而隨著需求的增加,H100市場價格正在一路飆升。

據透露,H100最初的租金約為每小時4.70美元,但漲幅超過8美元。所有絕望的創始人都急於訓練他們的模型,以說服投資者進行下一輪1億美元的融資。這也是一筆很可靠的交易。於是,在2023年的大部分時間裡,H100每小時的租賃價格似乎會永遠高於4.70美元(除非你願意預付一大筆首付)。



但隨後,隨著競爭的加劇,GPU的租用價格將一路下降。

Eugene Cheah透露,2024年8月,如果有人願意拍賣一小段H100的使用時間(幾天到幾周),就有人可以開始以每小時1到2美元的價格找到H100 GPU。

Eugene Cheah預計,GPU的租用價格每年會下降≥40%,尤其是小型叢集。NVIDIA的市場預測是4年內,GPU每小時的租賃價格會下降到4美元,但不到1.5年就會蒸發殆盡。這很可怕,因為這意味著有人可能會承擔責任——尤其是如果他們只是購買了新GPU。

根據他在文章中計算所得,如果價格跌破1.65美元/小時,那麼基礎設施提供商註定會在5年內在H100上虧損。特別是如果有商家今年才購買節點和叢集的話。



在他看來,這種急劇下滑的趨勢主要由三種原因造成:

1. 大型模型建立者脫離公有雲平台

一個主要因素是,所有主要的模型建立者,例如Facebook、X.AI以及OpenAI(如果將它們算作微軟的一部分)正在脫離現有的公共提供商,並建構自己的價值數十億美元的叢集,從而消除了對現有叢集的需求。

2. 未使用/延遲供應上線

還記得2023年時或6個月或更長時間的所有H100大型出貨延遲嗎?它們現在正在上線——與H200、B200等一起。

與此同時,各種此前未使用的供應商也上線了(來自前面提到的現有初創公司、企業或風險投資公司)。

3. 更便宜的GPU替代品(尤其是用於推理)

另一個主要因素是,一旦你超出了訓練/微調空間,就會有很多替代方案,尤其當你運行的是較小的模型。

人們不需要為H100的Infiniband和/或nvidia支付額外費用。

基於這些分析,Eugene Cheah建議人們不要購買全新的H100。


四、寫在最後

分析人士表示,雖然Nvidia目前最暢銷的產品之一是其H100圖形處理單元(GPU)。Meta Platforms首席執行官馬克·祖克柏和特斯拉首席執行官埃隆·馬斯克都特別提到了H100技術對各自業務的生成式AI開發的重要性。

然而,儘管H100的需求持續旺盛,但Nvidia已經即將推出後續晶片組。該公司的新款Blackwell GPU定於今年晚些時候推出,華爾街和Nvidia自己的管理層都預測到今年年底銷售額將增加數十億美元。

此外,Meta、特斯拉、微軟、亞馬遜和Alphabet等公司繼續大力投入資本支出(capex),這應該會為Nvidia的計算和網路業務帶來良好的推動力。

考慮到這些,一旦Blackwell真正取得成功,Nvidia的股價可能在未來幾年內進一步上漲。

而為了鞏固自己的地位,輝達在過去一段時間裡不斷收購,以加深護城河,截至目前,Nvidia已在2024年進行了四次收購。今年4月,Nvidia同意收購以色列公司Run.ai,據報導,交易價值約為7億美元。Run.ai是ClearML的競爭對手。

Nvidia還投資了許多初創企業和科技公司,包括Arm Holdings(ARM)、Soundhound AI(SOUN)和Serve Robotics。

Enderle Group的總裁兼首席分析師Rob Enderle也直言,在他與HP和IBM等多家廠商交流以後得出結論:他們的AI服務戰略都嚴重依賴Nvidia。

但是,反壟斷擔憂也在威脅著輝達,所以,大家對GPU巨頭的未來怎麼看呢? (虎嗅APP)

參考連結:

https://www.reuters.com/technology/nvidia-rallies-poised-dethrone-apple-most-valuable-company-2024-10-14/

https://www.datacenterdynamics.com/en/news/nvidias-blackwell-gpus-sold-out-for-12-months/

https://www.marketwatch.com/amp/story/nvidias-stock-heads-for-first-record-high-in-months-as-customers-seem-locked-in-e24c22bf

https://www.latent.space/p/gpu-bubble