【盤點】中國GPU乘勢而起

自從ChatGPT爆火後,GPU成為超級運算和全球大模型訓練戰的焦點。輝達更是憑藉其GPU在大模型計算中的出色發揮賺得盆滿缽滿。

2023年三季度,輝達在其資料中心硬體收入已達145億美元,幾乎是去年同期的兩倍。根據Omdia統計,2023年第四季輝達H100和A100 GPU銷量將超過50萬台。

根據《2023中國半導體投資深度分析與展望》顯示,目前GPU市場國產化率仍不足10%。同時,輝達GPU已成為各大AI公司開發大模型的首選利器,其算力需求激增直接導致輝達GPU「一卡難求」。





什麼是GPU


GPU(Graphics Processing Unit,圖形處理器)又被稱為顯示核心、視覺處理器、顯示晶片,是一種專為平行處理而設計的微型處理器,非常擅長處理大量簡單任務,包括圖形和視訊渲染。

GPU依接取系統方式分為整合型GPU(Integrated GPU,iGPU)與離散型GPU(Discrete GPU ,dGPU)兩種,前者就是我們日常所說的整合式顯示卡/核心顯示卡,後者就是我們日常所說的獨立顯示卡。


發展至今,GPU不僅為個人電腦、伺服器和行動裝置進行圖形處理工作,也主要應用在工作站、遊戲機、嵌入式裝置、資料中心等各種需要渲染圖形或高效能運算的場景。



GPU高效並發運算力


GPU的工作通俗理解是為完成3D圖形的生成,將圖形映射到相應的像素點上,對每個像素進行計算確定最終顏色並完成輸出。

其工作原理與CPU 類似,都是透過執行指令來完成計算任務。不同的是,CPU 是透過串列執行指令的方式來完成運算任務,而GPU是透過並行執行指令的方式來完成運算任務。GPU 的平行運算方式可同時執行多個任務,大幅提升運算效率與速度。

GPU的工作原理流程如下:

1. GPU包含多個核心,每個核心都可以獨立執行指令。

2. 每個核心具有自己的記憶體,用於儲存指令和資料。

3. GPU會接收來自CPU的指令,並將它們分發到多個核心中處理。

4. GPU會把處理後的資料傳回CPU,以便CPU可以使用它。

5. GPU的效能取決於其內部的核心數量、時脈頻率以及RAM容量。


GPU和CPU都有各自的優勢和適用場景,通常是相互協作。如在機器學習中,CPU通常用於資料的預處理和模型的訓練過程,而GPU則用於模型的計算推理過程。



全球GPU市場格局


根據Verified Market Research數據統計,2022年全球GPU市場規模達448.3億美元,預測2027年可望達到1,853.1億美元,年平均成長率高達32.82%。



根據IDC 數據顯示,預測2023 年中國GPU市場規模將達到43.2億美元(約298 億元人民幣),未來5年整體市場年複合成長率(CAGR)27.1%。



在眼下的算力時代,GPU通用運算技術發展在浮點運算、平行運算等部分運算方面,可提供數十倍乃至於上百倍於CPU 的效能。

隨著雲端運算、人工智慧等高效能異質運算的發展,GPU平行運算的優勢被進一步發掘,成為高效能運算領域的「寵兒」。從2020年開始,GPU便成為國內晶片領域「最吸金」賽道之一,融資總額已超過200億元。

目前,GPU賽道仍呈現寡頭高度壟斷的格局。輝達、AMD、英特爾幾乎壟斷整個GPU產業,佔市佔率高達63%。在中國市場中,三大巨頭也是分走了大部分「蛋糕」。

輝達是全球GPU領域的絕對龍頭,A100採用台積電7nm製程流程,支援FP16、FP32和FP64浮點運算,為人工智慧、資料分析和HPC資料中心等提供算力;

AMD可同時提供獨立GPU及整合GPU,其整合GPU主要運用於Ryzen APU、嵌入式、半客製化平台中,獨立GPU分為Radeon及Instinct系列,主要用於遊戲、專業視覺、伺服器等應用;

Intel能夠幫助公司在整合GPU領域實現寡占,並在2022年8月24日正式發布了全新資料中心GPUFlex系列。

相較之下,國產GPU仍處於起步階段。目前國產GPU的性能還沒有能與A100、H100、A800或H800相媲美的產品。但隨著國內自研GPU領導者逐漸嶄露頭角,各廠商已發展出了一系列的產品線,國產替代浪潮來臨,國內獨立GPU廠商的廣大市場空間已被打開。



融資持續火熱的GPU賽道 GPU創企陸續交出產品


GPU(Graphics Processing Unit,圖形處理器)又被稱為顯示核心、視覺處理器、顯示晶片,是一種專為平行處理而設計的微型處理器,非常擅長處理大量簡單任務,包括圖形和視訊渲染。

GPU的工作通俗理解是為完成3D圖形的生成,將圖形映射到相應的像素點上,對每個像素進行計算確定最終顏色並完成輸出。

2020年起,GPU便成為中國國內晶片領域「最吸金」的賽道之一,融資總額已超過200億元。根據統計,光是2020—2021年,通用GPU領域就有近20起融資事件發生。

2023年11月15日,摩爾線程完成新一輪數億元B+輪融資。

12月6日,壁仞科技近期獲得了廣州政府支持的投資機構約20億元人民幣(約2.8億美元)的投資。

近段時間,中國國產GPU廠商除了陸續獲得大筆超百億融資以外,也相繼推出GPU領域的最新產品。




芯動科技

2021年11月正式發布了其用於伺服器和桌面應用的風華一號GPU。它率先實現5-10TFLOPS的渲染能力,率先實現圖形API支援超過OpenGL 4.0等;

2022年8月,芯動科技又推出了針對於桌面市場的「風華2號」GPU,「風華2號」渲染能力突出,GPU像素填充率48GPixel/s,FP32單精度浮點性能1.5TFLOPS,AI運算(INT8)效能12.5TOPS,實測功耗4至15W,支援OpenGL4.3、DX11、Vulkan等API;

目前「風華3號」已基本完成研發,將為國內用戶提供超大算力光追等酷炫性能。


天數智芯

2021年3月31日,上海天數智芯對外正式發表了7nm的天垓100晶片及天垓100加速卡,實現了國內通用GPU從0到1的突破。天數智芯其首款7nm製程的雲端推理通用GPU產品“智鎧100”,該晶片已於今年5月點亮,將於2022年第四季正式發布,年底量產。

2022年5月8日,天數智芯第二款產品7nm雲邊推理晶片「智鎧100」成功點亮,產品迭代開發和商業應用領先國內同行。


摩爾線程

在短短18個月內,就發布了全新統一系統架構MUSA和全能GPU產品「蘇堤」等系列新品。

基於MUSA統一系統架構GPU蘇堤,摩爾線程推出了第一代桌面級顯示卡MTT S60,它採用12nm流程,包含2048個MUSA核心,單精度算力最高可達6TFlops;以及面向資料中心級多功能GPU產品MTT S2000,MTT S2000採用12nm製程,使用4096個MUSA核心。


沐曦

2022年1月,沐曦首款7nm製程的異構GPU產品啟動流片,預計2023年初實現規模量產。

沐曦致力於為異構運算提供安全可靠的通用GPU晶片及解決方案,推出MXN系列GPU(曦思)用於AI推理,MXC系列GPU(曦雲)用於AI訓練,以及MXG系列GPU(曦彩)用於圖形渲染,滿足資料中心對「高能效」和「高通用性」的算力需求。


壁仞科技

2022年8月10日,壁仞科技推出了首款通用GPU產品BR100系列,採用7nm製程,並創新應用Chiplet與2.5D CoWoS封裝技術,創下全球算力紀錄。據透露,其16位元浮點算力達到1000T以上、8位定點算力達到2000T以上,單晶片峰值算力達到PFLOPS級別,以「每秒1千萬億次的計算」算力紀錄,超過了輝達目前在售的旗艦運算產品A100 GPU的3倍,強勢對標輝達H100。


景嘉微

中國第一家GPU製造商,景嘉微2015年該公司推出了第一代GPU,稱為JM5400,採用65nm CMOS製程製造;

2018年8月,景嘉微推出第二代產品JM7200,主要應用於商務桌上型電腦;

2021年12月,該公司推出第三代14nm高性能GPU—JH920,該晶片採用14nm工藝,支援OpenGL4.0、OpenCL 3.0、Vulkan 1.1等,但不支援DX。關鍵指標上,JH920像素填滿率為32G Pixels/s,FP32浮點效能為1.5Tflops,功耗為30W。


芯瞳半導體

2020年8月,芯瞳半導體第一代GPU晶片GenBu01問世。enBu01顯示卡平均功耗3W,提供應用超長續航力,滿足對功耗有特殊需求的場景;滿足國產作業系統2D顯示、3D渲染需求,支援OpenGL 4.3圖形標準、1080P高清顯示器、多視窗顯示、具備VGA及HDMI雙路顯示輸出介面等,整合1GB DDR3儲存等。

據悉,芯瞳半導體的第二代晶片正在研發階段,預期2023年完成市場化應用。


智繪微

2020年10月,智繪微電子成功推出第一款GPU晶片IDM919。採用高效能SIMT指令實現架構和可程式統一著色器架構,不僅可用於2D和3D影像渲染,也可用於高效能運算等。

經過最新一輪的融資後,智繪微電子將提升旗下第二代GPU晶片IDM929流片進度與第三代GPU晶片IDM939的研發進度。


凌久微

已成功研發出凌久PCI圖形控制器GC101、圖形加速晶片GC69030、通用圖形處理器凌久GP100等多個系列GPU產品。2022年7月發表的GP200系列GPU,實現億門級超大規模積體電路設計,具備多螢幕4K高畫質顯示及兆次運算能力。

現如今,伴隨著中國GPU賽道上一個又一個交出新產品,國產GPU正迅速走過“從無到有”,進入下一個“迭代時刻”。(MoonCapital)

參考文獻:

https://mp.weixin.qq.com/s/Q0l2kQLn2PTAKbjEw5ZtVw