利潤暴漲628%,AI霸主輝達全產業鏈投資圖鑑


AI時代,如何搭上輝達的車?


5月22日,全球資本市場的“大網紅”輝達發佈了2025財年第一財季(截至2024年4月28日)的報告。

資料顯示,本季度輝達業績全面大超預期,尤其是在AI加速擴張的驅動下,資料中心業務更是表現亮眼。具體來看,報告期內輝達錄得營收260.4億美元,同比增長262%,其中資料中心業務營收226億美元,同比增長427%,營收佔比87%;與此同時,受益於資料中心業務的高利潤驅動,報告期內公司錄得淨利潤148.8億美元,同比增長628%。

在財報發佈前,市場對輝達本季度業績飆升已經有了較為明確的預期,受此影響,公司股價在美股盤前僅小幅上漲了0.02%;但在業績公佈後,全面超預期的財務資料還是給投資者帶來了不小的驚喜,美股盤後,公司股價突破1000美元,大幅上漲6.05%。

對遊戲愛好者而言,輝達並不陌生,其是全球遊戲顯示卡的龍頭。事實上,在很長一段時間裡,遊戲GPU及相關產品也確實是輝達的主要收入來源。2016財年,公司總營收50.1億美元,其中遊戲GPU業務達到28.18億美元,資料中心業務則為3.39億元。

但近幾年,隨著雲端運算的逐漸興起,遠端辦公、挖礦熱潮等推動輝達資料中心GPU業務相關的收入快速增長。2023財年(2022年2月-2023年1月),輝達資料中心業務首度營收超過遊戲,成為公司的第一大業務,當年輝達總營收269.74億美元,資料中心產品150.05億美元。

自此,輝達資料中心業務開啟狂飆模式。

2024財年,在大模型對GPU需求暴漲的大背景下,輝達總營收暴漲126%至609.22億美元,而資料中心業務的營收同比則激增217%至475.25億美元,在營收結構中的佔比接近80%;而在最新一季的財報中,其資料中心業務更是同比大幅增長了427%,營收佔比進一步增加至87%。


圖:輝達資料中心產品營收增長

資料來源:wind、36氪整理

資料中心GPU業務的持續放量,推動輝達身份屬性從硬體廠商向AI算力龍頭轉變。新的定位為其在資本市場帶來了巨大的估值想像空間,推升公司股價創下兩年五倍的神話,總市值更是躍升到2萬億美元之上。

輝達的崛起成為了AI浪潮下最真實的寫照——緊握AI時代的鑰匙,帶來意想不到的機會空間。那麼,輝達為何可以成為這一波AI浪潮下的最大受益者?我們又該如何搭上AI浪潮的快車,從輝達概念中掘金?


輝達崛起背後:算力需求的激增

我們認為,輝達業績的爆發主要受益於AI行業對算力需求的激增。

2022年底,ChatGPT的面世,正式將AI帶入大模型時代。

海內外大語言模型的快速湧現和迭代、模型性能的提升,使得訓練和推理持續擴張,帶動算力需求呈現出指數級增長趨勢。

海通證券指出,以OpenAI為例,訓練一次1750億參數的GPT-3大約需要的算力約為3640PFlops-day,共使用了1024塊A100(GPU)訓練了34天。而GPT-4參數量達到了GPT-3的500倍,使用約2-3萬張A100,訓練1個月左右時間。

在輝達GTC大會上,黃仁勳也講到,如果要訓練一個1.8萬億參數量的GPT模型,需要8000張H100 GPU,消耗15兆瓦的電力,連續跑上90天。

東吳證券預計,推理算力需求將是訓練的數倍,高達幾十萬張H100,隨著模型繼續迭代,算力需求只會越來越大。根據IDC預計,資料中心GPU市場預計將從2022年的103億美元增長至2027年的654億美元,CAGR達到44.55%。

算力的實現需要以AI伺服器為載體,而AI伺服器則是包含GPU、CPU、儲存、通訊技術等在內的龐大產業鏈。

根據TrendForce資料,2022年全球AI伺服器出貨量達到85.5萬台,預計2026年全球AI伺服器出貨量為236.9萬台,2022-2026年CAGR高達29.02%,遠超全球整體伺服器市場增速。

就中國市場而言,根據 IDC 和浪潮資訊聯合發佈的《2022-2023年中國人工智慧計算力發展評估報告》,2021年中國AI伺服器市場規模59.2億美元,預計到2026年將達到123.4億美元,2021-2026年CAGR達15.82%。

因此,AI伺服器需求的激增,使得市場對輝達資料中心GPU的需求高增,而輝達從GPU向AI伺服器整機的業務衍生,也給公司的營收帶來了巨大的增量。


瞭解輝達,要關注哪些產品?

根據輝達官網披露,在每一代的GPU架構下,公司會將旗下的GPU按品牌分類進入GeForce、NVIDIA RTX/Quadro、資料中心三個品類。其中,GeForce系列主要應用於遊戲行業,屬於消費級GPU;NVIDIA RTX/Quadro主要應用於工業設計、媒體開發等專業等級領域;從GPU的性能橫向對比來看,分類進入資料中心相關的GPU往往是輝達的王牌產品。

前文提到,AI伺服器需求的大爆發,已經使得資料中心GPU相關產品成為輝達最大的收入來源,且相關產品收入增速驚人。基於此,本文我們討論輝達供應鏈時,最大的增量即來自資料中心的GPU相關業務。

那麼,資料中心主要需要哪些GPU晶片?

我們可以根據輝達的命名規則,來大致推測其一款GPU晶片的主要應用方向。一般來說。名稱前綴帶GeForce的即主要應用於遊戲等消費領域;名稱中沒有GeForce但有RTX、Quadro的,主要應用於專業設計領域,其中RTX表明GPU具備光追功能;名稱中沒有前述所有字樣,但直接以GPU架構開頭字母命名的,如A100(Ampere)、H100(Hopper)、L4(Ada Lovelace)、B200(Blackwell)則主要應用於資料中心。

從GPU性能對比來看,2023年底AMD發佈的MI300X,在浮點運算能力方面曾短暫超過輝達當時的最新產品H200。但在2024年輝達Blackwell架構下的B200發佈後,B200的低精度運算能力又反超AMD。在終端需求,由於大模型的訓練、推理往往以低精度運算為主,因此輝達的最新GPU依然相較AMD有明顯優勢。此外,輝達耗時十餘年打造的CUDA軟體生態,也讓輝達在軟體層面建立了獨特的護城河,大大提高了市場對其GPU產品的認可度。


圖:輝達資料中心GPU產品性能

資料來源:招銀國際、36氪整理

不過,輝達的野心並不只單純侷限於GPU晶片。近年來,其不斷圍繞GPU拓展資料中心相關的衍生業務,力圖為資料中心提供一站式的產品服務與綜合解決方案。

其中最典型的產品有兩款,一是輝達利用多塊GPU建構的DGX系列伺服器,以及多個DGX伺服器組成的機架級伺服器。二是可滿足客戶定製化需求的HGX伺服器平台。

例如,在2024的GTC大會上,輝達就發佈了DGX GB200伺服器,以及DGX GB200 SuperPod機架級液冷伺服器。具體來看,DGX GB200 SuperPod由8台DGX GB200伺服器組成,一台DGX GB200伺服器由36個GB200組成,一個GB200又由2個B200 GPU和一個Grace CPU組成。


輝達對應的投資機會有哪些?

前文所述,我們提到當下大模型的快速迭代對算力支援提出了更高的要求,而輝達在AI伺服器方面的絕對優勢使得其對應業務呈現跨越式的擴張,同時,受益於行業前景樂觀預期疊加供不應求背景下公司業績的強確定性,2022年10月至今,輝達股價也實現了超7倍的增長,不僅如此,與其資料中心業務相關的供應鏈公司,也同步實現了飛躍。

輝達概念投資,主要是圍繞輝達王牌產品如DGX GB200 SuperPod機架級液冷伺服器等的產業鏈構成以及對應供應鏈公司展開。

從產業鏈構成上來看,我們常說的H100、A100實際上是GPU板卡,主要包括GPU晶片、HBM等電子元器件,在此基礎上,多個GPU+CPU+SSD組成AI伺服器,多個AI伺服器+交換機+機架,又組成伺服器叢集。

具體到AI伺服器,根據提供的功能不同,可以分為計算、儲存、互聯介面、I/O、功率、韌體和其它配套等板塊,具體又包括GPU、CPU、視訊記憶體HBM、DRAM、硬碟SSD+RAID、板內晶片互聯、伺服器互聯、網路卡、電源管理、BMS/BIOS、PCB、電源模組、散熱模組、其他元器件/線纜、代工等。

在各環節的BOM佔比方面,以輝達DGX A100系統為例,根據中金證券的資料,單環節價值量佔比由高到低分別為GPU(48%)、代工(15%)、SSD(10%)、視訊記憶體HBM(9%)、DRAM(9%)、CPU(7%)、網路卡(1%)、互聯介面(0.7%)、PCB(0.6%)、散熱(0.3%)、電源模組(0.3%)、其他元器件(0.1%)、電源管理(0.09%)、BIOS/BMS(0.02%)。

考慮到DGX B200系統在內部採用了銅纜連接,並配合液冷系統,因此,相對DGX100而言,預計銅纜、散熱模組的價值量有望提升。根據市場資料,預計銅纜在單伺服器的BOM佔比有望達到5-7%。

具體到各環節的公司構成上,詳細資料在下邊逐一展開:

| GPU

GPU晶片產業鏈上中下游分別為晶片設計、晶片製造及晶片封裝與測試。

輝達處於上游的晶片設計環節,在中下游的晶片製造環節,台積電憑藉先進的4nm、7nm工藝及CoWoS封裝技術,成為輝達GPU晶片製造,以及GPU晶片+HBM封裝的主要廠家。

簡單來說,台積電在為輝達製造出GPU晶片後,又將這塊GPU晶片與海力士的HBM晶片進行封裝,然後再將封裝後的產品交給其他廠商(如工業富聯)進行組裝,最終形成GPU板卡。目前國內企業可以參與的,主要集中在封測環節。


| CPU

AI伺服器中,CPU同樣是不可或缺的晶片。

如果說GPU的主要功能是運算,那麼CPU就是控制GPU運算的的“大腦”。例如,輝達DGX H100中就包括2塊CPU和8塊GPU晶片。

此前,輝達DGX H100伺服器中曾採用英特爾的CPU,但在其最新發佈的GB200超級GPU上,輝達採用了自研的Grace CPU。另外,輝達發佈的DGX B200和DGX GB200伺服器中,還搭載了專用於加速計算的DPU晶片。

| 視訊記憶體

目前,視訊記憶體主要包括GDDR、HBM(高頻寬儲存器)兩種類型,由於HBM擁有高頻寬優勢,因此成為輝達中高端資料中心GPU(如A100、H100、H200)的標配。

HBM是一款新型的高頻寬、高附加值DRAM產品。憑藉獨特的TSV訊號縱向連接技術,HBM內部將數個DRAM晶片在緩衝晶片上進行立體堆疊,其內部堆疊的DDR層數可達4層、8層以至12層,從而形成大容量、高位寬的DDR組合陣列。

除此之外,HBM堆疊不通過外部互連線的方式與GPU/CPU/Soc連接,而是通過中間介質層緊湊快速地連接訊號處理器晶片。HBM通過3D堆疊多層DDR提供海量平行處理能力、通過整合型HBM提供極高的儲存器頻寬,並使得資料參數距離核心計算單元更近,從而有效降低資料搬運的延遲和功耗。在系統整合方面,HBM將原本在PCB板上的DDR記憶體顆粒和計算晶片一起整合到SiP,有效利用空間、縮小面積。

以輝達A100 80GB組態4或8張GPU卡來計算,其HBM用量約為320-640GB,根據SK海力士預計,中長期內HBM需求的年增長率將達到約60%。不過,目前供給層面HBM幾乎被海力士、三星、美光三家企業壟斷,其中,SK海力士是輝達HBM第一大供應商,而A股的香農芯創等則通過供貨SK海力士間接繫結輝達。


| SSD

AI伺服器中,SSD是繼視訊記憶體外的另一大儲存晶片。值得注意的是,HBM是DRAM,類似於手機俗稱的運存,適用於短期儲存,而SSD是NAND,類似於手機俗稱的記憶體,適用於長期儲存。

SSD上游參與者主要包括快閃記憶體晶片、主控晶片廠商,中下游則主要為模組廠商。

一般來說,IDM廠商(又稱原廠)不僅掌握核心快閃記憶體晶片的設計,還可以一體化完成SSD所有設計和生產流程,在SSD和SSD主控晶片領域都佔有主導地位。模組廠商則主要做組裝,部分模組廠商也在拓展主控晶片技術。


從行業格局來看,SSD實際上與HBM類似,海力士和三星同樣佔據較高的市場份額。

| 互聯介面:晶片互聯和伺服器互聯

AI算力的提升方式,除了依靠單GPU性能升級外,還需要高速的晶片互聯技術、系統互聯技術作為支撐,從而提升GPU算力的可擴展性,形成強大的叢集算力。

就輝達而言,目前使用的互聯技術主要包括:PCIe Switch、NVLink、NVSwitch等。

PCIe的特點是相容性強,主要應用於不同製造商和裝置類型之間的高效通訊。目前,PCIe技術已經發展至第六代,且第七代標準已於2024年公佈,預計將在2025年正式推行。民生證券統計,PCIe Switch核心的晶片技術,主要被博通、微芯科技和祥碩科技三家壟斷,合計佔有全球約58%的份額,國內僅邊緣智芯等上市企業擁有相關技術。

此外,為瞭解決PCIe匯流排的訊號衰減問題,PCIe Retimer晶片作為為訊號中繼器,需求量也越來越高。目前,全球量產PCIe 5.0 Retimer晶片的企業主要是兩家,除了瀾起之外,另一家是Astera Labs。

輝達自研的NVLink是一種高速、低延遲的互聯技術,旨在連接多個GPU以實現高性能平行計算。與傳統的PCIe匯流排相比,NVLink提供了更高的頻寬和更低的延遲,使得GPU之間可以更加高效地共享資料和通訊。目前最新的第五代NVLink下,單個Blackwell架構的GPU可實現1.8TB/s的傳輸頻寬,超過PCle Gen 5.0頻寬的14倍。

此外,輝達自研的NVLink-C2C技術,還支援定製裸片與輝達GPU、CPU、DPU、NIC和SOC之間的互聯,其GB200超級晶片中,CPU與GPU的連接即採用了該技術。

而只要提及NVLink,NVSwitch也會伴隨出現,那麼二者到底是什麼關係?

NVIDIA中國區工程及解決方案總監賴俊傑在官方社區中指出,NVLink可以認為是一個網線,NVSwitch認為是交換機,但NVSwitch並不是一般意義上網路交換的裝置,NVLink由一些差分的訊號線所構成,然後NVSwitch可以接多個NVLink的連接埠,內部通過跨組完成資料在多個連接埠的轉發。

以GB200 NVL72為例,目前輝達使用了定製化的銅纜實現機櫃內9個NV Switch和18個計算節點的NVLink連接。輝達介紹NVIDIA GB200 NVL72可以在一個NVLink domain內連接576個GPU,總頻寬超過1PB/S和240TB的快閃記憶體。而最大的變化是NV Switch從伺服器PCB板載晶片的形式調整為機櫃內的9台交換機,連接能力提升至72個GPU,這就需要使用銅纜實現機櫃內的NVLink連接。

| 網路卡

伺服器通過網路卡與交換機互聯,將資料流通過資料幀交換方式傳輸到目的地。網路互聯技術包括乙太網路、InfiniBand和Omnipath等。其中InfiniBand憑藉高頻寬、低延時的優勢在AI資料中心和AI伺服器中廣泛應用。

目前InfiniBand產品為輝達旗下Mellanox生產的HDR,可以提供端到端200Gbps頻寬,輝達相關伺服器使用的網路卡均為Mellanox產品。

| PCB

PCB是顯示卡以及伺服器中起支撐作用的不可或缺部件,一向有“電子產品之母”的稱號。按產品類型劃分,主要分為單/雙面板、多層板、HDI、柔性板、IC 載板等,上游原材料主要包括覆銅板(CCL)、銅箔、半固化片及油墨等。

GPU中使用的PCB一般是多層數的高端PCB,主要應用於伺服器CPU、主機板、電源背板、硬碟背板、網路卡以及Riser卡等部分。平安證券統計,隨著當前伺服器平台持續迭代,對於伺服器PCB層數以及材料的要求也越來越高,PCB所需層數不僅從Purley平台的10-12層提升至Eagle Stream的14-20層,而且用料方面也要對CCL損耗等級有著更高的要求,相應帶來單機PCB價值量的提升。

目前,我國在全球PCB市場的份額超過50%。國金證券指出,從格局上來看,大陸PCB廠商因配合國內伺服器廠商研發和供應,已經在全球伺服器PCB競爭中佔有一席之地,其中滬電股份為輝達伺服器PCB供應商,勝宏科技則為輝達顯示卡PCB供應商。


| 散熱模組

伺服器散熱系統的作用是將伺服器內部產生的熱量以及外界傳遞的熱量吸收並行散到機櫃之外,從而保證內部積體電路的正常溫度,防止高溫損傷。主流散熱技術包括風冷和液冷兩大類。

人工智慧的快速發展帶來了大量的算力和機櫃需求。但受限於資料中心建設面積及環保要求,傳統風冷越來越難以滿足散熱需求,需要液冷的不斷升級彌補。在(1)晶片單點冷卻方面:晶片功率密度的不斷提升直接影響著晶片的散熱和可靠性,逼近風冷散熱上限800W左右,而液冷能有效滿足晶片的散熱需求;(2)機櫃整體冷卻方面:晶片功率的增加也導致整機櫃功率的增長,採用傳統風冷的資料中心通常可以解決12kW以內的機櫃製冷。隨著伺服器單位功耗增大,同樣尺寸的普通伺服器機櫃可容納的伺服器功率往往超過15kW,相對於現有的風冷資料中心,已逼近空氣對流散熱能力天花板,液冷或將成為最佳選擇。

目前輝達DGX GB200伺服器使用的就是液冷技術,液冷系統的主要合作夥伴是美股上市的維諦技術(Vertiv),國內部分供應商通過進入維諦技術產業鏈實現間接聯絡。


| 銅纜

如前文所述,目前在第五代NVLink技術下,GB200伺服器內部使用了約5000根銅纜(共計2英里)進行交換機和GPU之間的連接。DAC(高速銅纜,速率>10GB的短距離傳輸)是成本相對較低的的高速互聯方式,不包含電子元件,成本僅為光模組的1/5,且功耗低、延遲和插入損耗低,可以替代電子或光學連接器用於短距離的高速傳輸網路。

目前輝達高速銅連接的主要供應商是美國的安費諾,國內並無直接參與機構,但部分企業通過供貨安費諾實現了間接聯絡。


| 光模組

目前,輝達用第五代NVLink和第四代NVSwitch建構多層NVLink網路,實現576個GPU的直接互聯和共同訪存。在這種互聯方案中,GPU與機櫃內部NVSwitch之間採用銅纜連接,而不同層級的NVSwitch之間則仍然採用光互聯,因此光模組的數量仍然是穩中有升的。

根據SemiAnalysis的測算,鑑於DGX GB200 NVL72擁有72個OSFP連接埠,每個連接埠對應於1個400G或800G光模組,隨著GB200數量的增加,網路拓撲結構發生變化,最終GB200對應於800G光模組的數量關係將介於1:2.5到1:3.5之間。


| 交換機

如果將多台DGX伺服器組合成為一個叢集,那麼就需要用到交換機。

交換機是用於電光訊號轉發的網路裝置,可以為接入交換機的任意兩個網路節點提供獨享的電訊號通路。例如,輝達DGX H100 SuperPOD中就包含32台伺服器,以及12台交換機。

2019和2020年,輝達相繼收購交換機企業Mellanox和Cumulus,親自下場生產交換機產品。從硬體結構來看,交換機由機殼、電源、風扇、背板、管理引擎、系統控製器、交換模組、線卡構成。

目前,在交換機板塊,輝達主要是使用了自研的Spectrum-X800乙太網路交換機。

| ODM代工

在ODM/OEM代工方面,鴻海精密目前是輝達AI伺服器最主要的代工廠商,同時也是輝達AI伺服器晶片基板最大供應商(超50%),也是輝達最新的GH200晶片模組唯一的供應商,主要通過旗下工業富聯和鴻佰科技進行AI伺服器業務,同時,緯創、超微電腦等也有合作。


| 其他合作商

除了以上核心環節的供應鏈公司外,部分A股上市公司通過其他合作方式也進入了輝達概念名單。例如,在算力合作方面,鴻博股份、浪潮資訊均有合作;在境內智算場景方面,順網科技與輝達有合作;千方科技子公司則與輝達聯合開發伺服器;中電港則是輝達的授權分銷商;鼎陽科技為輝達提供電子測試測量儀器。 (36氪)