聊聊中國的HBM的進展

最近發的幾篇文章都比較敏感,敏感說明重要,無論是聊的話題,還是這些話題牽涉的公司,對於目前的中國,都非常重要,包括我們這篇文章要聊的長鑫儲存(CXMT)。在AI晶片中,大家可能對華為的升騰系列GPU最為關心,但HBM也同樣重要,沒有頻寬和容量足夠大的HBM,再厲害的GPU也無法發揮出最強的能力。

這篇文章也是海外的分析,我們把內容稍加整理。

HBM與輝達H20的需求成長

2024年12月,美國發表新出口管制措施,針對中國取得高頻寬儲存器(HBM)及半導體製造裝置(包括HBM製造及封裝所需工具)。新規還將140多家中國晶片製造商和工具廠商列入商務部實體清單。

此舉旨在透過限制HBM(全球由SK海力士、三星和美光三家公司控制)進一步遏制中國AI發展。同時,限制半導體製造裝置(SME)旨在阻礙中國自主開發HBM的能力。

image-20250418210354985

HBM幾乎為所有訓練大型語言模式的AI加速器提供支援。隨著推理模型和推理訓練的興起,記憶體頻寬和容量的重要性日益凸顯。中國的AI加速器同樣依賴HBM。例如,華為最新的AI加速器Ascend 910B和即將推出的910C分別配備4個和8個HBM2E,主要在2024年12月限制生效前從三星採購,部分在限制後採購。其他中國GPU廠商如壁仞科技(Biren)、燧原科技(Enflame)可能使用SK海力士或三星的HBM2和HBM2E。壁仞科技2022年推出的BR100 GPU整合4個HBM2E,燧原科技2021年底發表的DTU使用2個HBM2。

在中國先進推理模型快速發展下,對推理訓練和整體計算的需求正在加速。這一趨勢自1月底開始,推動了對配備最先進HBM的GPU(即輝達H20)的需求。

H20是中國市場上最先進且易於取得的外國GPU。華為的Ascend 910B性能與輝達A100相當,但在群集組態中僅達到H20性能的40%。其最新GPU Ascend 910C在計算和記憶體效能上具有競爭力,但在中國AI產業的採用規模尚不清楚。儘管如此,由於中國工程師對輝達成熟且廣泛採用的軟體生態系統更為熟悉,以及其在供應鏈可靠性、大規模叢集環境中的優越性能,中國企業目前仍傾向於選擇輝達硬體。

H20的計算性能比輝達旗艦H100低約6.7倍,但記憶體頻寬和容量更大,因此在推理訓練中更受歡迎,成為中國市場需求激增的關鍵因素。多家媒體報導了H20需求上升,作者透過供應鏈檢查確認這一趨勢早在2月初已顯現。這與1月中旬的資料形成對比,當時H20訂單因可能被禁的擔憂顯著下降。 H20需求快速成長可能也與拜登政府末期以來對H20限制的擔憂有關。

根據作者3月初通過下游供應鏈(先進封裝和晶片測試)的計算,輝達2025年預計將出貨約140萬台H20。另據作者計算,到6月,中國可能已獲得約60萬台H20。自2024年第二季H20開始出貨以來,中國已獲得超過100萬台。

推理和計算需求的增長也與中國頂級雲服務提供商的預計年度支出一致。騰訊、百度和阿里巴巴2025年預計總支出319.8億美元,較2024年成長近40%。

然而,本周H20被正式禁止。根據輝達最近向SEC提交的8-K檔案,美國政府通知輝達,銷售H20或任何記憶體頻寬、互聯頻寬匹配的晶片需取得許可證。換言之,輝達無法向中國銷售H20或更強大的GPU,因為不太可能獲得中國市場的許可。

HBM的戰略重要性

H20需求的激增、HBM的關鍵作用以及推理模型和推理訓練的日益重視,凸顯了HBM對中國AI行業的戰略重要性。

中國政府和產業界清楚HBM在計算資源和AI硬體受限環境的重要性。發展自主HBM對中國擺脫美國限制、增強AI開發能力具有戰略緊迫性。

在美中科技競爭加劇的背景下,精確評估中國HBM發展至關重要。作者估計,中國HBM開發僅落後市場領導者約4年,差距比先前預期更小,儘管仍面臨挑戰和不確定性。

CXMT的HBM進展

2024年下半年,報導中國領先的DRAM和儲存器廠商CXMT已開始量產HBM2,落後市場領導者約三代。市場領導者自2024年起向輝達、AMD、Google和AWS等AI晶片廠商供應HBM3E 8hi和12hi(目前最先進的HBM)。作者12月對這四家公司的HBM路線圖分析顯示,CXMT落後約6-8年,且面臨許多挑戰。

然而,最新消息表明,中國儲存器廠商的HBM技術進步快於預期。 CXMT目前正開發HBM3,計畫明年量產,縮小與領先者的差距至約4年。據首爾現代汽車證券,CXMT還計畫2027年量產HBM3E,若成真,差距將縮減至3年。

在2025年3月26日至28日舉辦的SEMICON China 2025上,1,400多家國內外半導體公司及中國高級官員齊聚一堂。媒體聚焦於中國在光刻機等半導體製造裝置(如SiCarrier)的進展,但未覆蓋儲存器進展。參會分析師預計2025年中國HBM將快速推進,HBM3E是國內HBM企業的主要目標規格。這顯示中國儲存器產業正致力於最先進的HBM技術。

若CXMT在2025或2026年推出HBM3E(作者認為2026年更現實),將標誌著中國半導體自給自足的重大里程碑,對全球儲存器產業和政策圈產生震撼影響。 SemiAnalysis 2024年1月預測,CXMT的HBM3E可能在2025年中開始出貨。

即使CXMT在2025年底或2026年推出較落後的HBM3,也會令人驚訝。 CXMT成立僅9年,HBM2去年才量產,且多年來受出口管制影響。從技術角度來看,CXMT在DRAM方面的進展使其越來越有能力生產HBM2E和HBM3的DRAM晶片。目前,CXMT可製造D1y和D1z(17-13nm)節點的DRAM,適用於這兩代HBM。 TechInsights 1月分析確認,CXMT能生產D1z節點(約16nm)的DDR5,密度與2021年全球領導者(美光、三星、SK海力士)相當,但晶片尺寸較大,良率未經驗證。

CXMT的研發團隊可能在開發子15nm DRAM節點(如D1α和D1β,14-13nm),這是HBM3E必需的DRAM節點。儘管沒有極紫外光刻(EUV),開發D1α節點面臨挑戰,但並非不可能。 2021年,美光在不使用EUV的情況下推出D1α DRAM,為CXMT提供潛在路徑。

image-20250418210329606

作者認為,CXMT更現實的目標是2026年上半年開始量產HBM3。 HBM3E的進展因DRAM進展和資訊有限,尚難判斷。

若CXMT開發出HBM3或HBM3E,需仔細評估其性能及與大型語言模型訓練的相容性。經驗表明,同一代HBM性能可能差異顯著。三星的HBM3E 8hi和12hi過去兩年未通過輝達高階GPU供應商資格測試。

為何跳過HBM2E?

CXMT未優先開發HBM2E,可能是因為市場時機問題。國內GPU已廣泛配備HBM2E,CXMT的HBM2E量產時商業機會有限。輝達在禁令前向中國AI企業銷售超100萬台配備HBM3(或稱為「H20E」的HBM3E)的H20晶片,中國GPU廠商需在短期和中期與之競爭。因此,CXMT優先開發HBM3和HBM3E,為國內GPU提供更具競爭力的HBM,符合商業邏輯。

戰略上,CXMT需透過技術跨越策略維持競爭力,滿足國內GPU和ASIC的記憶體需求,確保國內市場地位並尋求全球競爭力。例如,華為Ascend 910C及未來迭代產品可能從910B的HBM2E升級至HBM3或HBM3E,提升記憶體效能與整體競爭力。

多維度挑戰

儘管取得進展,CXMT及其他中國儲存器廠商仍面臨多重挑戰:

  1. 半導體製造裝置限制:儘管CXMT為HBM和DRAM生產儲備了足夠裝置(可能支援至2026或2027年),但現有出口管制仍將限制其開發和擴展先進DRAM和HBM的能力。 2024年12月的管制限制了HBM製造和封裝的關鍵裝置(如矽通孔、蝕刻等)。此外,美國半導體裝置公司駐CXMT的維護人員被要求離開,影響其DRAM和HBM開發。
  2. EUV的缺失:雖然CXMT可能在15nm以下節點不依賴EUV,但開發尖端DRAM和HBM可能不可避免地需要EUV。沒有EUV,CXMT可能面臨類似中芯國際的挑戰,難以提高良率、減小晶片尺寸和擴大生產規模。
  3. 全球市場進入受限:未來幾年,CXMT的HBM產品可能難以進入全球市場,限制其在全球AI硬供應鏈中的角色。由於技術差距及美中緊張關係,外國企業可能因地緣政治風險而避免採用CXMT的HBM。
  4. 實體清單風險:自2020年以來,美國將768家中國實體列入實體清單,包括華為和長江儲存(YMTC)。儘管CXMT尚未列入,但華盛頓自1月以來一直在討論將其加入,未來數月和數年構成重大風險。
  5. 持續創新的不確定性:SK海力士等領先者正快速推進,推出HBM4並規劃HBM4E,以滿足輝達快速發展的產品線需求。 CXMT能否在技術差距和挑戰下持續跟進,仍是未知數。
image-20250418210249566

儘管如此,若CXMT保持當前勢頭,其技術進步可能進一步縮小與HBM市場領導者的差距。若能以低成本穩定生產中低階HBM,可能在全球市場擠壓其他HBM廠商的毛利率並獲得一定市場份額。

總結

HBM對中國AI產業的戰略重要性不言而喻,CXMT在HBM3和HBM3E開發上的快速進展縮小了與全球領導者的差距。儘管面臨裝置限制、EUV缺失、市場進入和地緣政治等多重挑戰,CXMT仍有望在2026年量產HBM3,並在2027年推出HBM3E。若成功,將顯著提升中國半導體自給自足能力,並對全球儲存器市場和政策格局產生深遠影響。 (傅立葉的貓)