AI伺服器爆火,這些晶片賽道進入狂歡期

在現今社會,人工智慧的應用場景愈發廣泛,如小愛同學、天貓精靈等AI服務已深入人們的生活。隨著人工智慧時代的來臨,AI伺服器也開始在社會各行業中發揮重要作用。那麼,AI伺服器與傳統伺服器相比,究竟有何獨特之處呢?為何AI伺服器能在人工智慧時代逐漸取代普通伺服器,成為主流?

AI伺服器與傳統伺服器的區別

AI伺服器和傳統伺服器之間有顯著的差異。

AI伺服器是一種專門設計用於執行人工智慧、機器學習(ML)、深度學習(DL)等運算密集型任務的高效能伺服器。它可以透過收集數據、分析數據和模擬數據來學習如何有效地運行伺服器,也可以根據不同的應用程式和用戶請求來調整伺服器的效能,從而提供更好的伺服器效能。

傳統伺服器雖然也可以處理大量數據,但是需要人工幹預來提高伺服器效能。


從伺服器的硬體架構來看,AI伺服器通常配備有高效能的中央處理器(CPU)、圖形處理器(GPU)、張量處理器(TPU)或專用的AI加速器,以及大量的記憶體和儲存空間。在異質方式上,AI伺服器可以為CPU+GPU、CPU+FPGA、CPU+TPU、CPU+ASIC或CPU+多種加速卡。

目前,產品中最常見的是CPU+多塊GPU的方式。具體的設計和配置可以根據需要進行大量並行處理的具體任務來進行調整。

傳統伺服器主要以CPU為算力提供者,但在運作的過程中需要引入大量分支跳轉中斷處理,這使得CPU的內部結構複雜,並不能滿足AI時代的需求。

AI伺服器的主要優勢:

大數據處理: AI伺服器能夠處理和分析大量數據,這是訓練AI和ML模型的關鍵。

平行計算:由於AI和ML演算法需要對大量資料進行複雜的計算,AI伺服器通常使用可以並行處理大量資料的硬件,如GPU。

儲存和記憶體: AI伺服器通常具有大量的儲存空間和內存,以便儲存和處理大量的資料。

網路能力: AI伺服器需要高速和低延遲的網路連接,以便快速傳輸大量的資料。

事實上,這也正是大模型熱潮之後,AI伺服器搶購潮湧現的原因。大模型內部蘊含的資料參數極為龐大,無論是訓練或運行,都需要更強大的運算資源來支撐。因此,為了滿足這種需求,高效能的AI伺服器變得至關重要,從而引發了搶購熱潮。

呈現在具體應用中,AI伺服器廣泛應用於深度學習、高效能運算、醫療、搜尋引擎、遊戲、電子商務、金融、安全等產業。例如在醫學影像智慧分析應用中,AI伺服器可以透過機器視覺、知識地圖、深度學習等人工智慧技術,模擬醫學專家思維、推理診斷,幫助醫生定位疾病,協助診斷;在安全監控的應用中,AI伺服器可應用於人體分析、影像分析、車輛分析、行為分析等安全場景。


AI伺服器的兩大類別

依照AI應用情境的需求,AI伺服器主要分為兩類:深度學習訓練型和智慧型應用推理型。

訓練任務對伺服器算力要求較高,需要訓練型伺服器提供高密度算力支援;推理任務則是利用訓練後的模型提供服務,對算力無較高要求。


簡單來說,訓練過程就是一個學習的過程,訓練是一個搜尋和求解模型最優參數的階段;推理是將深度學習訓練成果投入使用的過程,即模型參數已經求解出來,使用和部署模型階段。

根據使用需求的不同,不同AI伺服器對GPU的採用也不同。

訓練階段要求GPU具有強大的運算能力和高儲存頻寬,以應對大規模的資料處理和複雜的數學運算。因此,在選擇用於訓練階段的GPU時,通常需要注意其效能、功耗、可靠性和軟體相容性等方面。具有高頻率、多核心和大顯存的GPU產品通常更適合訓練階段的需求。拿英偉達來說,訓練時可以選A100\V100\A800等顯示卡。

推理階段主要關注的是模型的快速反應和準確輸出。這一階段的計算量相對較小,但要求GPU能夠快速且穩定地執行預先訓練好的模型。因此,推理階段對GPU的需求更注重其穩定性和能源效率比。英偉達的P4、T4、A10等顯示卡,較適合推理階段的需求。


AI伺服器出貨量激增

AI伺服器作為算力的發動機,算力需求的成長將迎來AI伺服器需求的快速成長。

根據IDC統計,2023年全球AI伺服器市場規模預估為211億美元,2025年將達317.9億美元,2023-2025年CAGR為22.7%。出貨量方面,根據TrendForce數據,2023年AI伺服器出貨量逾120萬台,佔伺服器總出貨量的近9%,年增長達38.4%。預計2026年,AI伺服器出貨量為237萬台,佔15%,複合年增長率預計維持25%。


再來看中國市場,IDC預計2023年中國AI伺服器市場規模將達91億美元,年增82.5%;2027年將達134億美元,年均複合成長率為21.8%。主要原因是國內各大廠商紛紛佈置AI伺服器產業,升級產品技術規格。處理器方面,浪潮資訊產品主要透過搭建四代英特爾CPU+英偉達H800GPU超高算力組合,華為的昇騰系列和鯤鵬系列伺服器主要搭載自研鯤鵬處理器及昇騰處理器,中科可控搭載海光處理器滿足算力需求。此外,廠商普遍配置有32個DDR4記憶體插枝和SAS/SATA硬碟,以及支援0/1/10/5/50/6/60RAID。

運算晶片和儲存是伺服器的核心組成,在AI伺服器發展如日中天的當下,運算晶片和儲存自然而然跟著AI伺服器的步伐走上快車道。


這些晶片賽道,進入狂歡期 中中國產CPU迎來發展好時機

上文提到,如今的算力晶片通常是CPU+多塊GPU的方式。

當下主流的伺服器CPU 架構包括X86、ARM、MIPS和RISC-V等。其中X86架構處理器統治PC和伺服器市場,Arm架構處理器統治著行動市場和IoT市場,MIPS是基於RISC的衍生架構之一,近年來RISC-V架構則憑藉著開源、指令精簡、可擴展等優勢,在註重能效比的物聯網領域大受追捧,並開始進入更高效能需求的伺服器市場。

在當前市場格局中,英特爾和AMD兩大巨頭憑藉著深厚的技術累積和市場佈局,佔據了市場的絕大部分份額。

然而,隨著AI技術的快速發展,中國作為伺服器市場的成長引擎,也為許多伺服器晶片公司提供了前所未有的發展機會。這些公司紛紛瞄準這段黃金時期,加強研發力度,提升產品性能,以期在激烈的市場競爭中脫穎而出,分得一杯羹。

現今,中國產伺服器CPU正處於奮力追趕的關鍵時期,主流的廠商包括海光、兆芯、飛騰、華為鯕鵬、龍芯、申威。


海光完全相容於X86架構,擁有指令集永久授權,不僅具備了獨立設計CPU核心和SoC的能力,也可以對指令集進行自主擴展和最佳化。海光CPU系列產品中,海光三號為2023年主力銷售產品,海光四號、海光五號處於研發階段。海光CPU 既支援面向資料中心、雲端運算等複雜應用領域的高階伺服器;也支援面向政務、企業和教育領域的資訊化建置中的中低階伺服器以及工作站和邊緣運算伺服器,已應用於電信、金融、網路、教育、交通、工業設計、圖形影像處理等領域。

再來看飛騰,飛騰已與1,600餘家國內軟硬體廠商打造完整生態體系,並已完成與6大類1000餘種整機產品、2,600餘種軟體及週邊的適配。基於飛騰桌面CPU的終端已形成較完整的生態圖譜,可涵蓋從整機硬體、基礎軟體到上層的應用。

去年四月,龍芯推出2023年HPC CPU:3D5000,擁有32核心高達2 GHz和300W TDP,據稱比典型Arm晶片快4倍。龍芯3D5000的推出,進一步滿足了資料中心對效能的需求,也標誌著龍芯中科在伺服器CPU晶片領域進入國內領先行列。

此外國內企業也正在加快部署RISC-V晶片。例如去年10月,山東大學成功部署了基於RISC-V CPU的伺服器集群,該系統擁有3072個核心,並配置了48個64位元RISC-V CPU節點。中國科學院(CAS)正在開發「香山」RISC-V晶片。

目前,從架構路線來看,x86更具發展空間和潛力。

X86不僅是國際廣泛認可的通用運算架構,中國產CPU廠商透過獲得X86架構和指令集的授權,不斷消化、吸收與創新,目前已具備高度的自主發展和自由迭代的能力。

在自主發展方面,X86架構為中國產CPU廠商提供了一個廣闊的舞台。他們不僅可以在架構的基礎上進行微架構創新,還可以根據國內市場的特殊需求,客製化和優化指令集,開發出更符合本土用戶習慣和應用場景的CPU產品。這種客製化的能力使得中國產CPU在性能和功能上能夠與國際大廠的產品相媲美,甚至在某些特定領域實現超越。其次,在自由迭代方面,中國產CPU廠商具備了對X86架構進行持續升級與最佳化的能力。

因此,在安全性方面,中國產X86 CPU廠商具備自主可控的能力,他們可以透過自主研發和創新,確保CPU產品在設計和製造過程中的安全性。


GPU廠商更是進入黃金時刻

GPU市場的火熱程度還要遠誇張於CPU市場。

儘管FPGA、各類ASIC晶片也能執行大量運算,但GPU的通用性無疑讓它更具吸引力。

在AI伺服器的建置中,GPU的價值量顯著高於CPU。一台AI伺服器通常只搭載1-2塊CPU,但GPU的數量則可能大大增加。根據GPU數量的不同,AI伺服器可分為四路、八路和十六路伺服器,其中搭載8塊GPU的八路AI伺服器最為常見。這種配置使得AI伺服器在處理大規模資料和高複雜度演算法時具有更高的效率和穩定性。

以浪潮的伺服器產品為例,我們可以更直觀地感受到GPU在AI伺服器中的價值。浪潮的通用伺服器NF5280M6採用1~2顆第三代Intel Xeon可擴充處理器,每顆CPU的售價約為64000元,因此該伺服器的晶片成本大約在64000~128000元之間。然而,在浪潮的AI伺服器NF5688M6中,情況則大不相同。這台伺服器採用了2顆第三代Intel Xeon可擴充處理器和8顆英偉達A800 GPU的組合。根據英偉達官網顯示,每顆A800的售價高達104,000元。因此,僅計算晶片成本,此AI伺服器的晶片成本就達到了約96萬元。

可以看到,隨著AI伺服器的廣泛普及和應用,GPU也迎來量價齊升。

作為全球領先的GPU製造商,英偉達憑藉其卓越的技術和創新能力,成功抓住了AI發展的黃金機會。不斷推出效能更強大、功能更豐富的GPU產品,滿足了AI伺服器日益增長的運算需求。英偉達不僅收穫了接到手軟的訂單,也成功佔領了AI伺服器市場的製高點。

當然,中國產GPU廠商也不會錯過這一好時機。他們加強研發力度,努力提升產品效能和質量,以滿足國內AI伺服器市場的迫切需求。

2023年上半年,中國加速晶片的市場規模超過50萬張。從技術角度來看,GPU卡佔有90%的市佔率;從品牌角度來看,中國本土AI晶片品牌出貨超過5萬張,佔整個市場約10%的份額。

中國產GPU 有兩條主要的發展路線:分別為傳統的2D/3D 圖形渲染GPU 和專注高效能運算的GPGPU,近年來,中國產GPU 廠商在圖形渲染GPU 和高效能運算GPGPU 領域上均推出了較為成熟的產品。

中國產算力GPU的主要廠商包括海光資訊、寒武紀、平頭哥、華為昇騰、天數智芯、燧原科技、摩爾線程、壁仞科技、沐曦等公司,部分產品的單卡指標和參數已與英偉達產品接近或持平。目前中國產算力GPU晶片在推理場景應用較多且具備一定競爭力,如含光800、思元370、MTTS3000等等。


隨著國家對自主可控技術的重視與支持力度不斷加大,中國產GPU廠商的發展前景十分廣大。他們預計在未來透過技術創新和市場拓展,逐步縮小與國際巨頭的差距,實現中國產GPU在AI伺服器市場的更大突破。

DDR5、HBM成為AI伺服器標配

HBM(高頻寬記憶體)以其高頻寬、高容量、低延時和低功耗的優勢,成為AI伺服器中GPU的搭載標配。英偉達推出的多款用於AI訓練的晶片A100、H100和H200,均採用HBM顯存:

  • A100採用80GB HBM2顯存,峰值頻寬高達1.6TB/s。
  • H100採用80GB HBM3顯存,峰值頻寬高達3.2TB/s。
  • H200採用96GB HBM3顯存,峰值頻寬高達5.12TB/s。

HBM顯存的應用,大幅提升了AI訓練的速度和效率,是目前AI運算領域不可或缺的重要技術。

此外,針對AI伺服器的高效能要求,更強大的記憶體-DDR5需求隨之提升。與DDR4相比,DDR5具備更高速度、更大容量和更低能耗等特性。 DDR5記憶體的最高傳輸速率達6.4Gbps,比DDR4高出一倍。

美光科技先前曾表示,AI伺服器對DRAM和NAND的容量需求分別是常規伺服器的8倍和3倍。 AI伺服器的成長,對記憶體的拉動可謂是肉眼可見,而且需求相當明確。中金公司先前指出,2023-2025年僅AI即會為儲存帶來80億美元增量市場。


央企加快智算中心建設,中國產AI伺服器機遇大增

2月19日,國務院國資委召開中央企業人工智慧專題推進會。明確指出中央企業要加速佈局與發展人工智慧產業,加速建置一批智慧算力中心:同時進行AI+專案行動,加速重點產業賦能,建構一批產業多模態優質資料集,打造從基礎建設、演算法工具、智慧平台到解決方案的大模型賦能產業。央企帶頭加速智算中心建置、推動AI賦能產業,可望提升中國產算力需求,帶動相關產業發展。

根據2023年10月,中國電信發布的《AI算力伺服器(2023-2024年)集中採購項目》中標候選人結果顯示,總金額約84.63億元,包括AI伺服器4175台以及IB交換機1182台,其中使用中國產(鯕鵬)晶片的AI伺服器1977台,佔整體採購數量的47.35%。

近日,中國聯通發布2024年人工智慧伺服器集中採購項目資格預審公告,公告顯示,2024年中國聯通人工智慧伺服器集中採購項目已批准,招標人為中國聯合網路通訊有限公司及省分公司、聯通數位科技有限公司等。此次中國聯通將採購人工智慧伺服器合計2503台,關鍵網路設備RoCE交換機合計688台,本次採購不劃分標包。

在信創、中國產化趨勢下,此次招標中中國產伺服器或占大多數,而隨著營運商招標中國產伺服器佔比的提升,中國產伺服器廠商可望受益。

以下是數家在「AI伺服器」概念領域中備受矚目,被視為未來市場潛力巨大的黑馬公司。

IDC數據顯示,2023年上半年,從銷售額來看,浪潮、新華三、寧暢位居前三,佔據了70%以上的市場份額;從出貨台數看,浪潮、坤前、寧暢位居前三名,佔近60%的市佔率。

浪潮訊息,主營通用伺服器、邊緣伺服器、AI伺服器和儲存等。從2020年至2022年,伺服器業務的銷售收入在浪潮資訊總營收中佔比始終維持在95%以上。 2023年上半年,浪潮資訊的伺服器及零件業務實現營收244.99億元,在總營收中佔比高達98.80%。長期以來,浪潮伺服器在中國市佔率都在30%左右,位居中國第一,全球第二。

新華三為紫光股份旗下的核心企業,新華三擁有運算、儲存、網路、5G、安全、終端等全方位的數位化基礎設施整體能力。 2023年上半年,新華三伺服器以16%的市佔率穩居中國市場第二,其中刀鋒伺服器(一種高度整合的高效能伺服器系統)以54%的市佔率蟬聯中國市場第一。

寧暢資訊創立於2019年,成立時間雖短,但寧暢團隊在伺服器領域已有15年,公司員工中超90%是研發人員,是伺服器領域的「黑馬」公司之一。 2023年上半年,寧暢液冷伺服器市佔率成長位居第一,市佔率成長高達500%。

坤前電腦成立於2012年,是一家成熟伺服器生產商,包含AI伺服器、通用伺服器、儲存伺服器、邊緣運算伺服器、高密度伺服器以及中國產伺服器系列。中興通訊也是我國知名的伺服器供應商之一。根據IDC發布數據,2022年中興通訊伺服器銷售額和機架伺服器出貨量提升至國內前五名。在電信業,中興通訊伺服器及儲存產品出貨量多年蟬聯第一,市佔率超過30%,是中國移動、中國聯通、中國電信三大業者的主流供應商。(半導體產業縱橫)