巨頭搶奪戰,HBM被徹底引爆


在輝達一步步站穩萬億市值腳根的道路上,少不了兩項關鍵技術支援,其中之一是由台積電主導的CoWoS先進封裝,另一個便是席捲當下的HBM(高頻寬儲存)。

輝達H200是首次採用HBM3E儲存器規格的AI加速卡。借助記憶體速度更快、容量更大的HBM3e,輝達H200以每秒4.8TB的速度提供141GB的記憶體,與A100相比,容量幾乎是其兩倍,頻寬也提升了43%,從而加速生成式AI和大語言模型,提高高性能計算(HPC)的工作負載。

隨著人工智慧的興起,HBM成為巨頭們搶佔的高地。三星、SK海力士、美光等儲存巨頭紛紛將HBM視為重點生產產品之一。

HBM的火熱,給市場掀起巨大波瀾。一起看看HBM這股熱潮給市場帶來了哪些轉折?

01 HBM走紅,帶來三大影響

HBM成為力挽行業下行的關鍵詞之一

數個季度的持續低迷下,頭部儲存廠商相繼展現出季度收入環比增長趨勢,其中以SK海力士的表現最為亮眼,背後就離不開由HBM拉動對DRAM的需求提升。

今年Q1,SK海力士收入創歷史同期新高,營業利潤也創下了市況最佳的2018年以來同期第二高,公司將其視為擺脫了長時間的低迷期,開始轉向了全面復甦期。 SK海力士表示:“憑藉HBM等面向AI的儲存器技術領導力,公司提升了面向AI伺服器的產品銷量,同時持續實施以盈利為主的經營活動,從而實現了營業利潤環比增長734%的業績。”

三星電子曾表示生成式AI市場應用將帶來HBM等支援大規模資料處理的記憶體產品需求快速增長,公司接到了大量客戶需求。預計2024年HBM的需求可能出現陡峭增長。

美光表示,AI伺服器的DRAM容量是普通伺服器的6倍到8倍,NAND容量是普通伺服器的3倍。輝達DGX GH200所需的DRAM容量是普通伺服器的數百倍。

通用DRAM恐缺貨漲價

通用型DRAM記憶體晶片面臨的供應短缺,主要源於業界對HBM等類型的DRAM進行了大量的投資,而通用型DRAM的產能利用率相對較低。目前,三星和SK海力士的產能利用率僅為80%到90%,遠低於NAND快閃記憶體的全速生產狀態。

自2024年初以來,通用型DRAM的產能僅提升了大約10%,但智慧型手機、PC和伺服器市場的增長率預計僅為2%到3%。全球雲端運算和科技公司在AI基礎設施上的投資削減,並未能顯著推動DRAM需求的復甦。

然而,在同一時期內,企業級固態硬碟(eSSD)的需求卻因人工智慧的普及而激增。因此,三星、SK海力士等主要製造商在第二季度滿負荷運行其NAND生產線。此外,鎧俠也在市場條件改善後結束了減產,NAND產能利用率恢復至100%。

由於通用DRAM記憶體晶片在消費市場,如個人電腦和移動終端等領域發揮著巨大作用,而隨著市場需求的放大,可能會出現大範圍的短缺。根據摩根士丹利最新報告,全球記憶體市場在2025年將迎來一次前所未有的供需失衡,2025年HBM的供應不足率將達到-11%,而整個DRAM市場的供應不足率將高達-23%。

爭奪戰,不只是技術

儲存巨頭在HBM技術領域的爭奪戰日益激烈,從HBM1到HBM2、HBM3,再到最新的HBM3e,每一代技術的演進都標誌著儲存性能的顯著提升和市場競爭的加劇。

HBM1最早於2014年由AMD與SK海力士共同推出,作為GDDR競品,為4層die堆疊,提供128GB/s頻寬,4GB記憶體,顯著優於同期GDDR5。

HBM2於2016年發佈,2018年正式推出,為4層DRAMdie,現在多為8層die,提供256GB/s頻寬,2.4Gbps傳輸速度,和8GB記憶體。

HBM2E於2018年發佈,於2020年正式提出,在傳輸速度和記憶體等方面均有較大提升,提供3.6Gbps傳輸速度,和16GB記憶體。

HBM3於2020年發佈,2022年正式推出,堆疊層數及管理通道數均有增加,提供6.4Gbps傳輸速度,傳輸速度最高可達819GB/s,和16GB記憶體。

HBM3E由SK海力士發佈HBM3的增強版,提供高達8Gbps的傳輸速度,24GB容量,2024年開始大規模量產。

然而這不僅僅是一場單純的技術較量,更是一場激烈無比的產能競賽。

根據儲存三巨頭表示,今年的HBM供應能力已全部耗盡,明年的產能也已經大部分售罄。據專業機構分析,今明兩年HBM需求的動態缺口約為產能的5.5%和3.5%。因此,三大廠商紛紛開啟產能衝刺競賽。比如SK海力士正在大幅擴產第5代1b DRAM,以應對HBM與DDR5 DRAM的需求增加。按照晶圓投入量看,公司計畫將1b DRAM月產能從今年一季度的1萬片增加到年末的9萬片,到明年上半年進一步提升至14萬-15萬片,是今年一季度產能的14-15倍。三星3月底曾表示,預計今年HBM產能將增至去年的2.9倍。美光正在美國建設先進的HBM測試生產線,並考慮首次在馬來西亞生產HBM,以抓住AI熱潮帶來的更多需求。

02 相比GDDR,HBM強在哪兒?

根據產品分類,DRAM 可以分為 DDR、LPDDR、GDDR、HBM。前三類產品主要用於傳統週期領域,HBM 則主要是 AI 市場的帶動。其中 DDR 主要用於消費電子、伺服器、PC 領域;LPDDR主要用於移動裝置、手機及汽車領域;GDDR 主要用於圖像處理方面的 GPU 等。

隨著資料量越發龐大加上AI晶片的加速發展,馮氏計算架構問題凸顯:“存”“算”之間性能失配,使得電腦的計算能力增長遇到瓶頸,雖然多核平行加速技術可以提高算力,但儲存頻寬的限制仍對計算系統的算力提升產生了制約。GDDR是目前應用較為廣泛的視訊記憶體技術,但在AI計算領域GDDR也難堪重任,於是製造商將目光投向HBM技術。



HBM具備高頻寬的優勢。通過多層堆疊,HBM能達到更高的I/O數量,使得視訊記憶體位寬達到1024位,幾乎是GDDR的32倍,視訊記憶體頻寬顯著提升。視訊記憶體頻寬顯著提升解決了過去AI計算“記憶體牆”的問題,HBM逐步提高在中高端資料中心GPU中的滲透比率。

HBM具備高密度、小體積等優勢。相比傳統DRAM,HBM在相同的物理空間內能夠容納更多的儲存單元,從而提供更高的儲存容量。這對於儲存千億參數乃至更大規模的大模型至關重要。此外,HBM通過3D封裝工藝實現DRAM die的垂直方向堆疊封裝,可以較大程度節約儲存晶片在片上佔據的面積。HBM晶片的尺寸比傳統的DDR4晶片小20%,比GDDR5晶片節省了94%的表面積。根據三星電子的統計,3D TSV工藝較傳統POP封裝形式節省了35%的封裝尺寸。

受構造影響,GDDR的總頻寬上限低於HBM。總頻寬=I/O資料速率(Gb/s)*位寬/8。為解決DDR頻寬較低的問題,本質上需要對單I/O的資料速率和位寬(I/O數*單I/O位寬)進行提升,可分為GDDR單體式方案和HBM堆疊式方案。單體式GDDR採取大幅提升單I/O資料速率的手段來改善總頻寬,GDDR5和GDDR6的單I/O資料速率已達到7 Gb/s到16Gb/s,超過HBM3的6.4 Gb/s。HBM利用TSV技術提升I/O數和單I/O位寬,從而大幅提升位寬,雖然維持較低的單I/O資料速率,但總頻寬遠優於GDDR。

HBM的綜合功耗也低於GDDR。HBM通過增加I/O引腳數量來降低匯流排頻率,從而實現更低的功耗。儘管片上分佈的大量快取能提供足夠的計算頻寬,但由於儲存結構和工藝制約,片上快取佔用了大部分的晶片面積(通常為1/3至2/3),限制了算力提升。

如今,HBM已經成為超級電腦、資料中心等核心設施中不可或缺的關鍵元件,為大規模平行計算提供了堅實的記憶體基礎。尤其在圖形處理領域,HBM的高頻寬特性使得GPU能夠更快速地訪問和處理圖像資料,從而為使用者帶來更加流暢、逼真的視覺體驗。

即便是業界領先的輝達,也對這一產品展現出了高度的依賴性。據悉,輝達近幾年發佈的多款旗艦產品(如A100、H100、H200)均搭配了不同數量的HBM。HBM已然是輝達AI晶片的必備搭檔。然而全球約九成的HBM市場被SK海力士和三星兩家韓系企業壟斷。

03 2024年末,HBM是持續短缺?還是供過於求?

在儲存三巨頭的競爭中,由於海力士HBM3產品性能領先,率先拿下輝達訂單,成為其伺服器GPU的主要供應商。

三星主攻一些雲端客戶的訂單,美光則直接跳過了HBM3,將主要精力放在了HBM3E產品上。僅從當下來看,美光的市場佔有率和前面兩個玩家有一些差距。

但不管怎樣,三位儲存晶片的大佬都在擴產能上不留餘力。比如海力士已經放下豪言壯語,計畫到2028年投資高達748億美元,其中80%將用於HBM的研發和生產,而且將下一代HBM4晶片的量產時間提前到2025年。

據專業機構分析,今明兩年HBM需求的動態缺口約為產能的5.5%和3.5%。

不過根據海豚投研的資料顯示,HBM有望從2023年末的“供不應求”轉為2024年末的“供大於求”。

海豚投研比較了2023—2024年HBM的供需關係情況。 從需求端來看,結合雲服務廠商的資本開支和AI出貨量情況,市場對HBM的需求有望從2023年的284MGB提升至512MGB; 從供給端來看,結合儲存主流廠商的產能計畫,HBM的供給端更可能從2023年的147MGB快速提升至1000MGB以上。

在此供需關係中,2023年供給端僅能滿足需求的1/2,嚴重供不應求。供不應求的局面,推動各家廠商大幅提升產能計畫。如果產能規劃如實落地,2024年的HBM供需關係可能會出現明顯反轉,供給端反而會超出整體的市場需求。


對於HBM的價格,當前由於供給仍相對緊張,因此整體價格在2024年將有所上漲。但隨著三星產品通過認證和產能端的釋放,HBM的產品價格也可能出現回落。

04 國產廠商加速突破

隨著AIGC技術應用的快速發展,AI伺服器和高端GPU的需求持續增長,將進一步推動HBM市場的高速增長。據預計,到2025年,中國HBM的需求量規模有望超過100萬顆。

而中國,在這一賽道還屬於後來者。

不久前,國家積體電路產業投資基金三期橫空出世。大基金三期註冊資本高達3440億元,這一規模遠超前兩期基金,顯示出國家對積體電路產業的重視和大力支援。如此龐大的資金注入,無疑將為積體電路產業的發展提供強大的動力。

目前,大基金三期對外投資重點還未正式披露。據悉,大基金三期有望增加覆蓋人工智慧晶片環節,在HBM產業鏈扶持大型晶圓廠。

今年3月,武漢新芯發佈了《高頻寬儲存芯粒先進封裝技術研發和產線建設》招標項目,這一行動標誌著該公司正式進軍HBM市場。通過利用三維整合多晶圓堆疊技術,武漢新芯旨在打造更高容量、更大頻寬、更小功耗的儲存解決方案,以滿足市場對高性能儲存晶片的需求。面對海外大廠對於 HBM3E 的量產,國記憶體儲廠商也在 HBM 技術上進行著加速突破,有望在 AI 大浪潮的需求下提升競爭實力。

面對海外大廠對於 HBM3E 的量產,國記憶體儲廠商也在 HBM 技術上進行著加速突破,有望在 AI 大浪潮的需求下提升競爭實力。

封測龍頭長電科技在投資者互動中表示,其XDFOI高密度扇出封裝解決方案也同樣適用於HBM的Chip to Wafer 和Chip to Chip TSV堆疊應用;通富微電此前表示,南通通富工廠先進封裝生產線建成後,公司將成為國內最先進的2.5D/3D先進封裝研發及量產基地,實現國內在HBM(高頻寬記憶體)高性能封裝技術領域的突破,對於國家在積體電路封測領域具有重要意義。

中國主要的儲存晶片公司也在與封測廠商通富微電合作開展HBM相關項目。

然而總體來看,國內廠商在HBM技術上的發展仍處於早期階段。儘管國際上已經有了更先進的HBM3和HBM3E產品,但國記憶體儲廠商目前還處於HBM2的研發和產業化階段。

面對海外大廠在HBM3E等先進技術上的量產優勢,國內廠商仍需加快追趕步伐,克服技術壁壘,實現從技術跟隨到技術引領的轉變。在此過程中,客戶對於AI伺服器性能、記憶體頻寬及記憶體大小的持續高要求,既是對HBM技術的巨大挑戰,也是推動其不斷前行的動力源泉。

值得注意的是,儘管HBM在頻寬性能上佔據優勢地位,但其高昂的成本與功耗也促使行業探索更多元化的解決方案。GDDR、LPDDR等記憶體技術的快速發展,為AI處理器提供了更多選擇,尤其是在成本、性能與功耗之間尋求最佳平衡點的應用場景中。例如,GDDR7的推出不僅顯著提升了記憶體容量與資料傳輸率,還因其相對較低的複雜度成為部分AI應用的理想之選。

綜上所述,隨著AI技術的不斷演進與市場需求的日益多樣化,HBM作為高性能儲存技術的代表,將繼續在特定領域發揮關鍵作用。同時,國內廠商需緊抓機遇,加速技術創新與產業升級,以更加靈活多樣的記憶體解決方案,滿足AI時代對高性能計算的多元化需求。 (半導體產業縱橫)