#HBM技術
歷史性突破!華為將祭出“技術核彈”,中國AI掙脫美國枷鎖...
8月12日,華為將在2025金融AI推理應用落地與發展論壇上,發佈一項在AI推理領域具有里程碑意義的突破性技術成果。業內透露,這項技術很可能從根本上改變中國AI產業對 HBM(高頻寬記憶體)技術的依賴情況,給國內AI大模型推理性能的提升加把勁,還能補上中國AI推理生態裡關鍵的一塊短板。HBM是種基於3D堆疊技術的先進DRAM解決方案,把多層DRAM晶片垂直整合在一起,資料傳輸效率一下子提上去不少。它有著超高頻寬、低延遲、高容量密度還有高能效比這些優點,在AI時代那可是塊關鍵的 “拼圖”。現在HBM已經成了高端AI晶片的 “標配”,在訓練側的使用幾乎達到100%,而且隨著推理側模型越來越複雜,HBM的普及也在加速。但問題是,HBM的產能一直很緊張,再加上美國的出口限制,咱國內AI產業發展空間被不斷壓縮,國產化率不足5%。在此背景下,華為即將發佈的這項AI推理突破性技術成果,無疑為國內AI產業突破技術封鎖、建構自主可控的AI推理生態帶來了新的希望。其實華為雲之前就發佈過Cloud 384和昇騰AI雲服務,早驗證過這條路子靠譜,實測昇騰平台跑DeepSeek模型,單卡每秒能處理1920個Tokens;跟科大訊飛合作的MoE模型,推理效率直接提升3.2倍。而現在,華為再發力,是要帶中國AI殺出一條血路。若真成功,中國在AI算力自主可控之路上將邁出關鍵一步,全球AI晶片的競爭規則都得跟著變。為華為和中國點贊! (極果網)
對輝達卡脖子的HBM技術迎來突破
HBM技術突破——美光引領新世代近年來,AI、大模型、大規模訓練對記憶體頻寬和能效提出了前所未有的挑戰。HBM(High Bandwidth Memory)憑藉3D堆疊結構成為突破瓶頸的關鍵方向。美光科技及時抓住這一技術紅利,推進HBM3E,逐步向HBM4/4E邁進。美光2025財年Q2財報中指出,HBM3E 8層堆疊已批次用於輝達GB200平台,而12層(12H)HBM3E已量產,“功耗比競品低30%,12H比8H功耗低20%,容量高50%”。不僅如此,美光已提前佈局HBM4,預計2026日歷年量產,性能提升超過60%,且與客戶對接緊密。這表明其規劃從HBM3E直達HBM4E,穩抓技術趨勢。這種跨代跳躍不僅推動晶片堆疊高度(12L→16L),還改善了系統功耗、散熱和頻寬性能——形成沉甸甸的行業護城河。隨著AI訓練需求暴漲,作為“功耗低、容量大、性能強”的HBM領先者,美光將在未來幾年深度受益。HBM卡住輝達“脖子”——GPU是王,記憶體是命脈回顧過去十年,輝達GPU算力提升約9萬倍,但記憶體HBM的這一百分點則亟待跟上。高密度、高性能GPU如果沒有相匹配的高頻寬儲存,就無法發揮應有威力。一個關鍵訊號是,輝達提前預付巨額資金給美光、SK海力士,鎖定其HBM3E/4產能。這種行為是典型的“記憶體供應鏈先行保障策略”——說明輝達深諳“GPU晶片賣不出去不是技術堆疊,而是儲存鏈條卡住了腳”。據瞭解,HBM採購協議下達2024-2025年,顯示這一需求具有長期性和戰略意義。HBM的重要性還體現在出口管制中,儘管輝達針對中國推出H800、H20等“減速版”GPU,仍因HBM的高速不變而被列為控制對象,這說明HBM已成為AI能力控制的核心指標之一。正因為如此,輝達不僅買晶片,也在買供應鏈穩定性,這對美光而言意味著深度繫結與持續訂單。競爭格局與美光的勝算在HBM領域,美光面對SK海力士、三星等競爭對手。然而,從現狀看,美光已憑藉技術與交付節奏取得突破在產品進展上,主要儲存廠商早在2024年即開始設計測試HBM4。SK海力士(SK Hynix)於2025年3月搶先向大客戶交付了全球首批12層堆疊的HBM4樣品,計畫2025年下半年完成量產準備。其12-High HBM4產品每秒資料處理能力超過2TB,是迄今速度最快的AI儲存器之一。海力士預計2026年進一步推出增強版HBM4E,延續性能提升。三星電子則在逐步淘汰舊的HBM2E產品,將重心轉向HBM3E和HBM4開發。報導稱三星採用第四代10nm工藝(1a工藝)製造HBM3E邏輯底層晶片,雖然良率仍在提升,但已簽署向輝達供貨HBM3/3E的合同。三星計畫2025年下半年量產HBM4,其12-High HBM4將整合第六代1c DRAM,實現容量和性能的新高。美光(Micron)方面選擇“後發先至”策略,跳過HBM3直接切入HBM3E,並在2024年一季度提供了12層HBM3E樣片。美光預期2024年Q3開始HBM3E量產;同時積極投入HBM4研發,目標2026年量產HBM4,2027-28年推出HBM4E。據其披露,HBM4相較HBM3E頻寬提升超過60%。由此可見,從HBM3E(過渡提升版)到HBM4,業界在堆疊層數、容量密度和IO頻寬上均實現跨越式提升,滿足未來AI模型對更高速更大容量記憶體的需求。SK海力士雖有搶佔先發,但產能緊張。美光憑藉HBM3E 12H“功耗更優、容量更大”漸獲市場認可。三星2025年6月第三次HBM3E認證未通過,量產仍在排隊,晏外認證需至9月才能繼續推進。此外,還有美光獨家供應輝達GB200、GB300,量產客戶已達三個,2025年將實現“與DRAM同量級份額”。財務資料顯示,HBM收入Q1環比翻倍,Q2超過10億美元,資料中心業務收入佔比首次超過50%。預計2025-2027年,高性能AI訓練與資料中心擴容將驅動HBM年增幅30%-50%。假設美光能拿下20%-25%市場份額(公司目標),HBM收入將在2025年達20-25億美元,2026年突破30億,2027年達45-50億,帶動整體DRAM營業額穩步上揚。估值分析與未來展望美光過去因傳統DRAM波動成為周期股,但HBM傍身使其未來具有結構性成長預期。接下來從財報、Call與機構評估復盤估值邏輯。基本面與財報資料分析2025 Q1/Q2實績:Q1營收87.1億美元,同比增長84%,DRAM收入佔73%,毛利率39.5%,非GAAP EPS1.79美元。Q2營收80.5億美元,同比增長38%,毛利率37.9%,EPS1.56美元。HBM貢獻:Q2 HBM營收超10億美元,資料中心業務同比翻倍,CNBU營收佔比57%。展望:公司預測2025財年HBM收入“數十億美元”,已售完2025產能並籌備2026產能,TAM從300億美元上修至350億美元。估值模型:PE、DCF、相對比較PE估值法:目前美光股價約120美元,市值約1336億美元。2025年Non‑GAAP EPS預計為7美元(Q2 EPS1.56×4=6.24,接近7),預期PE約17倍。對照2018-2020年行業平均20-25倍,市盈率具吸引力。DCF估值模型:假設2025‑2027年收入年增長率分別為+30%、+20%、+15%,EBIT率維持15%、17%、18%,WACC設為10%,終值增長率為3%。估算每股公平價值區間在140‑160美元之間。相對估值對比:SK海力士:PE約8倍,EV/EBITDA約5倍;三星半導體:整體PE約15倍;美光當前PE約17倍,略高於同行,但考慮其HBM高成長彈性與技術護城河,估值合理。投資亮點與風險亮點:HBM技術升級路徑明確(3E→4→4E),美光技術領先;與輝達合作深度繫結,訂單前景高可見性;資料中心DRAM、SSD業務穩步增長;財務結構改善,利潤率與現金流增長顯著。風險:NAND弱周期或拖累整體毛利;美中關係與出口管制變化可能影響中國銷售;競爭對手產能擴張或價格戰;AI訓練增速放緩導致HBM需求回落。結語:跌而不驚,成長就在眼前美光從傳統周期股逐步轉型為“高頻寬儲存契合AI主線”的成長股。技術上引領HBM3E/4發展,繫結蘋果、微軟等終端客戶;供應上鎖定輝達,兌現大客戶訂單;財務上結構性改善,盈利能力恢復。這些趨勢為其帶來合理PE估值提升潛力,若保持技術與產能執行,美光的估值和業績表現值得長期關注。你的投資下一輪“芯力量”,或許就是美光這樣的“高頻寬引擎”。(老王說事)
HBM 深度剖析
最近關於 HBM 的討論越來越多,尤其是在涉及 AI 晶片領域時。HBM 即高頻寬記憶體(High Bandwidth Memory),是一種特殊的 DRAM,通過垂直堆疊並利用硅片內名為 TSV(硅通孔,Through-Silicon Vias)的微小導線與處理器連接。TSV 技術允許直接連接多個 HBM DRAM 晶片,從而提升整體記憶體頻寬。為何 HBM 如此重要?HBM 的核心優勢如下:高速性能:HBM 的頻寬可達每秒數 TB,比常規 DDR 記憶體快 20 倍以上。低功耗:由於緊鄰邏輯晶片,資料傳輸距離短,大幅節省能源。面積效率:單位面積內容量密度最高。image-20250604192803128在生成式 AI 時代,記憶體頻寬至關重要,因為模型訓練往往受限於頻寬而非計算能力。Transformer 模型中的注意力機制需要儲存和計算所有 token 之間的關係,記憶體需求與序列長度成二次方增長。類似地,推理階段記憶體也成為更大瓶頸,因為需要處理更長的上下文窗口和 Transformer 模型中擴大的鍵值快取(KV 快取)——KV 快取的記憶體消耗隨 token 數量線性增長。HBM 技術發展每一代 AI 晶片的升級中,HBM 的迭代(更高頻寬或容量)都是提升性能的關鍵因素。以 NVIDIA GPU 為例,在同架構的 “Tick-Tock” 週期中,第二代產品的主要升級方向即為 HBM 容量:從 H100 到 H200、B200 到 B300,HBM 容量提升 50%;從 Rubin 到 Rubin Ultra 則提升 4 倍。 這一升級通過三種方式實現:增加每個 GPU 模組的 HBM 堆疊數量、提升每個 HBM 模組的 DRAM 晶片數量,或升級 HBM 代際。HBM4 通過將每個堆疊的通道數從 8 個翻倍至 16 個,以及顯著提升每引腳的 I/O 速度,實現了更高頻寬。隨著 GPU 和 ASIC 對 HBM 需求的增長,HBM 市場預計將快速擴張。據 SK 海力士資料,2024 至 2028 年 HBM 行業復合年增長率(CAGR)有望達 50%。對 DRAM 廠商而言,HBM 的週期性弱於傳統 DRAM:儘管未來銷量可能波動,但其合約價格提前 1 年敲定,優於傳統 DRAM 的短期合約甚至現貨定價模式。SK 海力士:HBM 賽道的當前領跑者憑藉卓越的 MR-MUF(大規模回流模塑底部填充,Mass Reflow Molded Underfill)技術,SK 海力士目前在 HBM 市場佔據主導地位。三星和美光則選擇了相對遜色的 TC-NCF(非導電膜熱壓,Thermal Compression with Non-Conductive Film)技術路線,這使得 SK 海力士以超過 60% 的市場份額統治 HBM 市場 —— 其主要為 NVIDIA 從 Hopper 到最新 Blackwell GPU(如 GB200)供應高端 HBM。據摩根士丹利資料,2024 年 NVIDIA 佔全球 HBM 消耗量的 60% 以上,預計 2025 年這一比例將超過 70%。MR-MUF 技術優於 TC-NCF 的核心在於更好的散熱能力和更高良率:其平均良率比 TC-NCF 高 20%。隨著 HBM 堆疊層數增加,散熱變得愈發重要 —— 同一區域堆疊的 DRAM 晶片越多,產熱越大。MR-MUF 的散熱凸點數量是 TC-NCF 的 3 倍,散熱效率顯著提升,可使 HBM 保持低溫。MR-MUF 的另一優勢在於工藝在室溫下以較小壓力完成,而 TC-NCF 需在 300°C 高溫和強壓力下進行。高溫可能導致層間翹曲,強壓力則可能在堆疊過程中損壞晶片。SK 海力士還擁有獨家環氧樹脂模塑化合物,可實現更均勻的間隙填充和封裝,減少空洞、增強散熱並降低翹曲。其樹脂基絕緣材料通過與日本關鍵供應商 Namics Corporation 的長期獨家合約供應 —— 這也是除專利壁壘外,三星和美光無法複製 MR-MUF 技術的關鍵原因。TC-NCF 的薄膜底部填充技術存在更嚴格的對齊公差要求,且隨著堆疊層數增加,流動一致性問題加劇。三星在 HBM 領域的掙扎部分源於其前端技術。由於三星和美光均採用 TC-NCF,後端技術並非其未通過 NVIDIA 認證的主因。自 1a nm 節點起,三星前端工藝便開始面臨挑戰:部分觀點歸咎於文化和管理問題,另一些則認為是激進的縮放路線所致。前端良率在 HBM 中尤為關鍵,因為堆疊的 DRAM 晶片數量將從 8-Hi 持續增長至 16-Hi—— 若良率為 95%,8-Hi 堆疊的最終良率為 66%,16-Hi 則降至 44%。為此,三星目前在 HBM4 中使用 1c nm DRAM 晶片和 4nm 邏輯晶片以追趕同行,但其 1c nm 工藝的結果並不理想,而競爭對手 SK 海力士已憑藉 1c nm 實現了出色良率。值得注意的是,SK 海力士將利用成熟的 1b nm 技術生產 HBM4,以確保高良率。若三星無法及時將 1c nm 良率提升至 90% 以上,其在 DRAM 和 HBM 領域的差距可能進一步拉大。HBM4 競爭的另一關鍵變數:基底晶片從平面 DRAM 工藝向先進 FinFET 邏輯節點的遷移將基底晶片轉向邏輯工藝技術,可降低功耗、提升轉換性能,並為客戶定製功能提供靈活性。借助 FinFET 工藝,基底晶片可成為可定製的小晶片,在提供更高性能和能源效率的同時(尤其是採用更先進節點,儘管成本更高),使記憶體廠商能夠靈活服務超大規模和加速器客戶的特定需求。基於這一趨勢,三星預計將在自家先進節點上(據報導為三星代工廠的 4nm 工藝)內部製造 HBM4 基底晶片,而行業報告顯示 SK 海力士和美光將外包給台積電,可能採用 3nm 工藝定製基底晶片。HBM4 基底晶片主要具備三大功能:控制 DRAM 堆疊:作為整個 HBM 堆疊的控制平面,處理所有讀寫、刷新和修復操作。管理 I/O 介面和資料傳輸:搭載 2048 位物理層 I/O(JEDEC 標準,為 HBM3E 的兩倍)和時鐘網路,負責記憶體堆疊與 GPU 或 ASIC 主機處理器之間的資料傳輸。整合邏輯晶片與定製 HBM4:由於基底晶片採用邏輯工藝(如三星 4nm、台積電 3/12nm),可整合片上電源管理、ECC(糾錯碼)和客戶特定加速器。借助邏輯基底晶片,還能支援 “定製 HBM” 變體,並根據特定工作負載需求支援先進的 2.5D/3D 封裝路線圖。顯然,HBM 基底晶片的質量正成為記憶體廠商的另一關鍵戰場,他們正不斷最佳化這些邏輯層,以滿足客戶對下一代 HBM4 的功耗和性能目標。台積電 N3 家族在過去三年中已展現出強大的能力和穩定性,因此 SK 海力士或美光無需擔心其工藝質量。核心戰略問題在於:儘管 3nm 晶圓成本更高,但其相比 N5 甚至 N12 等較落後節點能否帶來切實的性能優勢?三星面臨不同的考量:其 4nm 工藝表現仍存爭議,早期基於 4nm 的產品已引發行業批評。在 HBM4 量產前,三星必須驗證其內部 4nm 工藝能否提供與競爭對手相當的基底晶片質量。否則,即便三星通過垂直整合保持名義成本優勢,仍可能進一步落後於美光和 SK 海力士 —— 後者將借助台積電成熟的邏輯技術。SK 海力士在 HBM 領域的領先地位,不僅源於其卓越的鍵合技術和 DRAM 製造競爭力,更源於公司對 HBM 技術和人才持續十餘年的投入。自 2013 年起,SK 海力士持續投資 HBM 技術,與 AMD 共同開發首款 HBM。早期持續的投入使其始終站在 HBM 創新前沿 —— 從 2017 年的 HBM2、2019 年的 HBM2E、2021 年的 HBM3,到如今行業領先的 HBM3E 及即將推出的 HBM4。鑑於 HBM 製造工藝的複雜性和專業人才的技術學習曲線,這種先行者優勢和持續投入對 SK 海力士的成功至關重要。更重要的是,這使其能夠持續識別並與符合技術路線圖的最優供應鏈合作夥伴保持協同,避免中斷。與 SK 海力士的堅定投入形成對比的是,三星對 HBM 的參與較為零散。儘管 2010 年代大部分時間裡,三星在 HBM 第一代和 HBM2 上與 SK 海力士並駕齊驅,但 2019 年以 HBM 市場潛力有限為由解散了 HBM 團隊。這一舉措不僅阻礙了技術進步,更嚴重的是切斷了未來 HBM 發展所需的人才儲備。如今看來,這顯然是三星的重大戰略失誤。更致命的是時機 —— 團隊解散僅約三年後,ChatGPT-3 的發佈引發了 AI 熱潮,而這正是企業加速研發 HBM3 和 HBM3E(後來為 NVIDIA 最受歡迎的 H100 提供動力)的關鍵時期。三星從 HBM 的戰略撤退,恰好與 SK 海力士的技術突破同步 ——2019 年,SK 海力士推出了前文所述的 MR-MUF 鍵合技術,這一關鍵技術使其 HBM 產品從美光和三星的競爭中脫穎而出。混合鍵合(Hybrid Bonding):HBM 的顛覆性技術儘管 SK 海力士憑藉 MR-MUF 技術主導 HBM 市場,但其領先地位可能因混合鍵合技術的採用而改變。作為一項新技術,率先掌握混合鍵合的廠商將在學習曲線上佔據優勢。HBM 混合鍵合工藝始於待鍵合晶片的表面製備:形成平面化的銅焊盤和周圍電介質層,隨後進行化學處理和活化以確保高品質粘附。接下來,晶片精確對齊並直接鍵合,形成銅 - 銅連接和電介質 - 電介質機械鍵合。鍵合後,堆疊層經過低溫退火(通常 < 400°C)以強化互連。混合鍵合支援堆疊晶片間直接銅 - 銅(Cu-to-Cu)鍵合,無需微凸點。該方案提供更緊密的間距、更低電阻和更好的熱特性,支援低於 10μm 的間距(微凸點約為 40-55μm),使層間連線量大幅增加。更緊密的凸點間距和 HBM 晶片間無間隙的特性,還能降低 HBM 整體堆疊高度。最初,JEDEC 為 HBM 規定的封裝高度為 720μm,這對採用 MR-MUF 和 TC-NCF 的 8-Hi 和 12-Hi HBM3/3E 均可行。但當轉向 16-Hi HBM4 時,混合鍵合本應成為滿足 720μm 高度要求的必然技術。經遊說,JEDEC 將 HBM4 封裝高度放寬至 775μm,使 MR-MUF 和 TC-NCF 仍可應用。除降低堆疊高度外,混合鍵合還通過更高密度和更短晶片間連接,提升整體功耗和頻寬表現。混合鍵合尚未在 HBM 中普及的主要原因是成本遠高於現有方法:混合鍵合機成本 300 萬美元,而熱壓鍵合機(TCB)僅 100-200 萬美元。此外,由於需要額外的 CMP(化學機械平面化)步驟和更高等級的潔淨室,總體擁有成本更高 ——CMP 用於確保鍵合介面的晶片表面光滑平整。受潔淨室要求影響,研磨機、切割機和晶片放置等其他裝置也需滿足前端規格,成本隨之上升。混合鍵合還模糊了前端和後端工藝的界限。儘管三星和美光試圖通過混合鍵合超越 SK 海力士,但 HBM5(20-Hi)大規模採用混合鍵合的時間線可能在 2028 或 2029 年,這也與 NVIDIA 的路線圖一致 —— 最早在 2028 年底,HBM5 才會與 Rubin Ultra 之後的下一代 GPU 搭配使用。從美光和 SK 海力士投資的兩座新先進封裝工廠的量產時間也可推斷:美光 2025 年在新加坡破土動工 70 億美元的 HBM 先進封裝工廠,預計 2027 年量產;SK 海力士計畫在印第安納州投資 38.7 億美元建設新的先進封裝廠,2028 年開始生產。HBM 裝置供應商HBM 市場的關鍵裝置供應商包括:熱壓鍵合機(TCB):Hanmi、Hanwha、ASMPT、Kulicke & Soffa、SemesC2W 混合鍵合機:Besi、ASMPT、SUSS Microtec計量裝置:Camtek、KLA模塑裝置:ASMPT、Besi、Towa研磨機:DiscoCMP 裝置:應用材料、Ebara臨時鍵合 / 解鍵合裝置:SUSS Microtec、東京電子測試裝置:愛德萬、泰克TSV 裝置:應用材料、泛林半導體、東京電子在供應鏈中,TCB 和混合鍵合機因競爭激烈而備受關注,它們也是堆疊 HBM 晶片的關鍵裝置。TCB 目前是 SK 海力士、三星和美光採用的主流鍵合裝置。HBM 封裝的 TCB 市場目前由韓國廠商主導,如 Hanmi Semiconductor 和 Hanwha Precision,兩者均向 SK 海力士和美光等主要 DRAM 廠商供貨。Hanmi 憑藉卓越的性價比和生產力,在 HBM3 和 HBM3E 領域尤其佔據主導地位,至今仍是 SK 海力士的頂級供應商(儘管雙方存在一些爭議),也是美光和中國廠商的主要 TCB 供應商。ASMPT 和 KLIC(Kulicke & Soffa)雖也活躍於 TCB 市場,但其歷史優勢更多在邏輯封裝領域 —— 邏輯封裝的精度要求高於 HBM 封裝,這也解釋了其裝置成本更高的原因。HBM 的 C2W(晶片到晶圓)混合鍵合機市場仍處於早期階段,但正迅速成為關鍵戰場。行業正從基於微凸點的 TCB 向無凸點銅 - 銅混合鍵合過渡,以適用於 HBM5 及更下一代產品。儘管 TCB 廠商可能嘗試向混合鍵合演進,但需與前端裝置廠商合作:Besi 已與應用材料合作,ASMPT 則與 EV Group 聯手 —— 應用材料在蝕刻、CMP、沉積、清洗、計量和檢測領域貢獻了專業知識。EV Group 是晶圓到晶圓永久鍵合領域無可爭議的市場領導者。韓國廠商如 Hanmi 和 Hanwha 也在探索其 TCB 平台的混合鍵合擴展,但目前缺乏精度和低溫工藝控制能力。目前,Besi 在混合鍵合機競爭中領先,其現有 100nm 精度的混合鍵合機及即將推出的第二代 50nm 精度機型(支援 < 4μm 凸點間距)已佔據優勢。ASMPT 和 KLIC 則試圖通過下一代無焊劑 TCB 工具(ASMPT 的 AOR TCB、KLIC 的 APTURA™ FTC)延緩混合鍵合機的普及,這些工具可實現亞 1μm 的放置精度和 < 10μm 的凸點間距。中國在 HBM 領域的追趕與三大記憶體巨頭相比,中國 HBM 進展仍有限,短期內對其威脅較小,尤其是中國記憶體發展受制於美國主導的半導體製造裝置限制(包括光刻、蝕刻、TSV 等)。但近年來,中國兩大記憶體廠商長鑫儲存(CXMT)和長江儲存(YMTC)已證明,即便面臨監管挑戰,仍能快速推進記憶體技術。成立於 2016 年的長鑫儲存是中國 DRAM 領域的領軍者,過去幾年在傳統 DRAM 領域快速進步,在中低端 DRAM(如 DDR3 和 DDR4)市場挑戰三大記憶體巨頭。此外,該公司今年初已悄然進軍先進的 DDR5 領域,縮小了與 DRAM 領導者的差距。長鑫儲存在 HBM 領域的進展相對緩慢:2022 年底高性能計算需求激增前,公司未將 HBM 技術列為優先事項,導致發展滯後。另一明顯原因是其 DRAM 技術的落後 —— 這是 HBM 前端製造的基礎。然而,長鑫儲存正尋求追趕 HBM 技術:據報導,2024 年下半年其開始量產 HBM2。但鑑於限制前 SK 海力士和三星已提供更先進的 HBM 產品,且本地客戶 unlikely to adopt 長鑫儲存落後的產品,其 HBM 在中國的應用預計最多僅限於國內市場。此外,長鑫儲存的 HBM 產品至今仍處於小批次生產和出貨階段。目前,長鑫儲存正研發 HBM3 並計畫次年量產,這將使其與 HBM 領導者的差距縮小至約四年。此外,公司目標是在 2027 年宣佈 HBM3E 並推動量產 —— 鑑於其 DRAM 和 HBM 技術尚不成熟,這一路線圖頗具野心。今年在上海舉行的 SEMICON China 上,分析師指出預計 2025 年 HBM 將快速演進,HBM3E 是國內 HBM 廠商的主要目標規格。這並不意味著中國即將成功開發 HBM3E,但國內廠商圍繞這一規格積極研發,表明中國 HBM 技術已取得有意義的進展,至少標誌著中國記憶體行業正致力於最前沿的 HBM 技術。從技術角度看,基於 DRAM 領域的進展,長鑫儲存似乎越來越有能力為 HBM2E 和 HBM3 生產 DRAM 晶片。該公司目前能夠在 1y nm 和 1z nm 節點上製造 DRAM,這兩代 HBM 正使用這些節點。另一家領先的技術諮詢公司 TechInsights 在 1 月份的分析中證實,長鑫儲存能夠在 1z nm 節點上製造 DDR5。儘管其晶片的裸片尺寸更大且良率未經驗證,但其 DDR5 的密度與 2021 年全球領先的競爭對手(美光、三星和 SK 海力士)相當。長鑫儲存的研發團隊可能正在開發亞 15 nm 的 DRAM 節點,特別是 1α nm,這是 HBM3E 所需的關鍵 DRAM 節點。儘管長鑫儲存在沒有極紫外(EUV)光刻技術的情況下開發 1α nm 可能面臨重大挑戰,但並非沒有可能。2021 年,美光在未使用 EUV 的情況下推出了 1α nm DRAM,為長鑫儲存提供了潛在的可複製路徑。在後端工藝方面,考慮到長鑫儲存在 2024 年 12 月出口管制前與三星、美光等其他記憶體廠商一樣,能夠獲得 HBM 所需的大部分半導體製造裝置(除 EUV 外),因此其 HBM 產品可能採用 TC-NCF 鍵合技術。即使在出口管制後,韓美半導體(Hanmi Semiconductor)仍是中國多家客戶的 TCB 關鍵供應商,其中很可能包括長鑫儲存、通富微電等中國 HBM 領域的主要參與者。直到最近,據報導韓美半導體可能因美國政府的壓力,停止向中國客戶發運 TC 鍵合機。總體而言,長鑫儲存在 HBM 前端和後端技術的能力將是觀察其未來 HBM 產品(包括 HBM3E)發展的關鍵。特別是其前端技術(即 D1z 和 D1a 節點)的成熟度,可能決定其未來 HBM 產品的成功,因為考慮到該公司從韓國裝置供應商處儲備了鍵合裝置,其 TC-NCF 鍵合技術尚不構成致命問題。鑑於長鑫儲存最近已開始使用 1z nm 節點量產 DDR5,D1z 節點的良率問題可能對其未來 HBM3 的開發影響逐漸減小,儘管該公司仍需時間進一步提升良率和產品質量。然而,隨著該公司積極推進前端技術路線圖,預計其在 D1a 節點將面臨重大挑戰,尤其是在缺乏 EUV 光刻技術的情況下,難以實現有競爭力的良率和規模生產。因此,就 HBM3 和 HBM3E 而言,長鑫儲存目前預計落後領先記憶體廠商 3 到 4 年。2025 年 1 月,美國商務部工業與安全域(BIS)進一步收緊了先進節點 IC 在 DRAM 領域的定義,滿足以下任一條件即屬於限制範圍:儲存單元面積小於 0.0026 µm²;儲存密度大於 0.20 Gb/mm²;每個晶片的硅通孔(TSV)數量超過 3000 個。(* 三星 HBM2 每個晶片的 TSV 數量超過 5000 個,SK 海力士 HBM3 每個晶片的 TSV 數量超過 8000 個)更嚴格的規則可能限制長鑫儲存突破 18nm 節點的能力,儘管 2022 年 10 月的規則允許長鑫儲存在名義上受限的 18nm 節點外,仍可追求至 1z nm 節點。展望未來,除關注中國 HBM 的前端技術外,密切監測中國企業在未來 HBM 技術中對混合鍵合的探索和潛在應用也至關重要。如前所述,混合鍵合可能成為重塑 HBM 行業競爭格局的關鍵轉折點。對中國記憶體行業而言,混合鍵合可能提供一條顯著加速 HBM 發展的路徑,即便無法超越全球領先者,也能有效縮小差距。顯然,中國企業已意識到混合鍵合對 HBM 的重要性。長鑫儲存、通富微電等 HBM 核心企業近年持續投資混合鍵合研究,有報導顯示,自 2022 年中國半導體行業面臨美國限制加劇以來,其在該技術相關的專利申請量顯著增加。下一代 HBM 的領導地位將不僅取決於企業的前端 DRAM 製造能力,還取決於其能否率先掌握混合鍵合技術並將其整合到 HBM 產品中,從而與競爭對手拉開差距。這一趨勢對韓國、美國和中國的記憶體廠商均適用。本篇文章內容轉載自:https://substack.com/home/post/p-164567572原文作者:Ray Wang,X:https://x.com/rwang07 (傅里葉的貓)
輝達 H20 降級版催生新賽道!大摩:中國 HBM 差距正在縮小
2025 年 5 月 26 日,大摩發佈亞洲科技報告《Tech Bytes - 中國 HBM 差距縮小》指出,中國在儲存器領域的進步正在迅速推進,不僅在 DRAM 技術發展上縮小與全球領先者的差距,高頻寬儲存器(HBM)技術也日益先進。其目標是在 2027 年生產 HBM3/3E。近期改良版 H20 圖形 GPU 的進展可能縮短產品上市時間差。差距縮小:大摩認為,中國在 HBM3 技術發展上目前落後全球領先者 3-4 年,這一差距需要通過提升本土 AI 晶片生產能力來彌補。與此同時,中國在 DRAM 技術上顯著進步,且在混合鍵合封裝時代已佔據強勢地位。根據長鑫儲存(CXMT)進入 1z nm 工藝生產 DDR5 的情況,其 DRAM 技術差距已從 5 年縮短至 3 年。遊戲 GPU 可能替代 HBM—— 填補 AI 推理差距的新選擇:根據大摩的管道調研,在新的美國出口限制之前,配備 HBM3 的 H20 GPU 曾是中國市場最受追捧的加速器,主要用於中端計算和推理需求。大摩認為,輝達新推出的降級替代產品可能採用 GDDR7,不含先進封裝技術(CoWoS)和 HBM,這意味著 GDDR7 市場規模有望增加 4 億美元(若假設今年出貨量為 100 萬片,主要受益方為三星)。重要性:應對美國出口管制需要顯著的適應性調整,大摩認為,出口管制的加劇正推動中國加速縮小技術差距,目前中國 HBM 發展僅落後市場領先者 3-4 年。中國儲存器行業正步日韓後塵 —— 日韓均通過儲存器產業成為全球半導體領導者。從技術規格看,中國 DRAM 水平已與 2021 年的全球競爭對手相當,表明 HBM3 並非遙不可及。影響:儘管仍存在早期技術瓶頸,但中國在 HBM 生產上的快速進展可能引發更激烈的競爭、價格波動及全球 DRAM 格局的轉變,這對儲存器企業的長期資本回報率(ROIC)及其估值倍數具有重要影響。中國在出口管制、半導體裝置及全球市場准入方面仍面臨挑戰,但相信其正在 HBM 領域迎頭趕上,且隨著市場轉向低成本 AI 推理,中國有望在 HBM / 高端 DRAM 市場再次提升競爭力。報告主要內容如下(本文為英文報告翻譯而來,翻譯有疏漏之處萬望海涵):以儲存器為核心的中國半導體生態系統更具競爭力中國技術供應生態系統(尤其是儲存器領域)的崛起加劇了競爭,並緩解了對供應鏈中斷的擔憂。中國已在多個領域開發出具有競爭力的本土解決方案,包括射頻晶片、基帶、印刷電路板、感測器、電池、攝影機鏡頭、金屬外殼及終端組裝。反過來,地緣政治緊張促使中國供應商崛起為全球參與者,推動中國科技行業優先採用本土元件,並為技術需求創造本地化解決方案。根據半導體行業協會(SIA)的資料,中國目前佔全球前端半導體製造產能的 20% 左右,後端製造產能的 40% 左右。中國在成熟製程半導體(≥28nm)領域的市場份額增長更為顯著,預計到 2027 年,全球約 37% 的晶圓製造產能將集中在中國。然而,最近中國在先進儲存器製程上的進展已對韓國和美國企業(如 SK 海力士、三星、美光)構成壓力。圖表 1:中國半導體供應鏈已取得長足進步資料來源:摩根士丹利研究輝達計畫於 7 月推出基於 RTX Pro 6000 的降級版 H20 GPU。據路透社報導,該產品將採用 GDDR7 記憶體,記憶體頻寬達 1.7 TB/s,NVLink 速度為 550GB/sec,性能接近 RTX 5090 GPU。預計售價約為 6,500-8,000 美元,2025 年底前出貨量可達 100 萬片。圖形 DRAM(GDDR)佔整體 DRAM 市場的比例不足 5%,三星目前是主要競爭者,其 GDDR7 產品預計在 2025 年下半年才會大規模出貨。假設 2025 年出貨量為 100 萬片,將帶來 768 億 Gb 的 GDDR 需求(約佔今年現有 GDDR 需求的 10%,但僅佔整體 DRAM 市場的 0.2%),按 GDDR7 每 24Gb 12 美元的售價計算,對應營收約 3.84 億美元。關於專為出口中國設計的 H20 GPU,它仍存在但處於暫停狀態,因近期美國限制措施,正在等待個別許可證批准 —— 不過,截至目前尚未聽聞任何訂單取消的消息。在大摩之前的報告中,估計輝達(NVDA)對 H20 的註銷將導致 7200 萬 GB 的高頻寬儲存器(HBM)需求缺口,以及對 HBM 總可定址市場(TAM)造成 8.06 億美元的收入影響。中國 GPU 的替代方案:AI 推理的新路徑:隨著 DeepSeek 通過架構和軟體創新顯著提升計算效率,AI 推理的門檻已大幅降低,甚至遊戲 GPU 卡也足以支援中小企業和個人大規模運行 DeepSeek R1 模型。若假設中國 30-40% 的非超算客戶採用工作站解決方案進行 AI 推理,則 2023-2027 年中國遊戲 GPU 市場復合年增長率(CAGR)有望從原本的 4% 提升至 10%,到 2027 年工作站推理需求將佔整體市場的 15% 以上。中國進軍主流 HBM 市場的宏偉目標隨著 DeepSeek R1 的推出,中國對推理訓練及整體計算的需求加速增長。自 2025 年 4 月 16 日輝達 H20(NVDA's H20)被正式封禁後,其替代方案的總可定址市場(TAM)規模顯著擴大。面對美國限制,中國亟需戰略性開發本土 HBM 技術,以突破封鎖並推動 AI 發展能力。華為昇騰 910B採用 4 顆 HBM2E,最新的 910C GPU 配備 8 顆 HBM2E(在 2024 年 12 月美國對中國 HBM 供應限制生效前,主要從韓國採購)。其他中國 GPU 廠商如壁仞科技 BR100、燧原科技 DTU、天數智芯也使用韓國的 HBM2 和 HBM2E。** 長鑫儲存(CXMT)** 的 HBM2 客戶送樣已在進行中,預計 2025 年中啟動小批次生產。該公司與通富微電合作,為華為 AI 加速器及其他中國客戶開發 HBM。原計畫明年(2026 年)推出 HBM2 的目標已加速:2026 年開發 HBM3,2027 年推出 HBM3E。通過國家主導的資金和研發支援,中國有望縮小 HBM 技術差距。基於 2024 年下半年 HBM2 量產情況,CXMT 目前落後市場領先者約三代技術。若 2026 年實現 HBM3 量產,差距將從 4 年縮短至 3 年。中國 HBM 關鍵企業動態更新:盛微旭(深圳盛微旭科技公司):其原計畫的 DRAM 生產已延期。該公司於 2024 年 12 月被列入美國實體清單,此前已開發出與台灣南亞科技類似的技術。截至目前,我們尚未在市場上看到盛微旭的 DRAM 產品,也未聽聞其向華為供貨的消息。根據我們的管道調研,盛微旭的生產線可能會進行調整,未來的儲存器生產情況尚不明朗。武漢新芯半導體製造有限公司(XMC):正啟動一個專注於開發和製造高頻寬儲存器(HBM)的項目。捷捷半導體(JECT):最近展示了其專為 HBM 設計的 XDFOI 高密度扇出型封裝解決方案。通富微電子:通富並非儲存器或邏輯晶片製造商,它從第三方採購 DRAM 晶片和基礎晶片,然後進行一項複雜工序:將這些元件組裝並測試成 HBM2 堆疊晶片。中國 DRAM 能否支撐先進 HBM?據大摩調查,長鑫儲存(CXMT)的 HBM2E 樣品已於 2025 年上半年交付客戶,計畫於 2026 年上半年量產。其先進封裝合作夥伴包括通富微電子、長電科技和江蘇長電。然而,長鑫儲存想要追趕 HBM3/3E 等高利潤產品,這意味著其可能不會大規模擴大 HBM2E 的生產。據大摩的管道調研,長鑫儲存計畫在 2025 年底向客戶提供 HBM3 樣品,2026 年量產。據採訪的行業人士估計,到 2026 年底,長鑫儲存的 HBM 產能將達到每月約 1 萬片,到 2028 年底將擴充至每月 4 萬片。相比之下,大摩目前預計 2025 年底全球 HBM 產能為每月 34 萬片。對於 HBM3 中的 DRAM 節點,開發 15 奈米以下的 DRAM 節點至關重要。長鑫儲存在沒有極紫外光刻(EUV)技術的情況下開發 D1α 節點可能會面臨重大挑戰。這可能體現在提高良率、晶片尺寸和大規模生產方面的困難。對於 1α 奈米節點,長鑫儲存有可能效仿美光的 D1α DRAM,後者也是在未使用 EUV 技術的情況下開發出來的。長鑫儲存(CXMT)產能與生產計畫更新長鑫儲存最近向市場推出了 16Gb DDR5 晶片,採用其最先進的晶片 ——16 奈米節點的第四代(G4)DRAM,比目前 18 奈米的第三代(G3)DRAM 晶片小約 20%。相比之下,全球前三的 DRAM 製造商目前生產 1α/β 奈米 DDR5 晶片的尺寸為 12 - 14 奈米。以 2021 年開始量產的主流 DDR5 16Gb 晶片為參照,長鑫儲存目前落後約 3 年。G4 晶片類似於 1z 奈米 DDR5 晶片,在目前向中國移動客戶供應 12Gb LPDDR5X 之後,很可能瞄準伺服器 DRAM 市場。根據集邦諮詢(TrendForce)的資料,長鑫儲存計畫在 2025 年底將 DDR5/LPDDR5 產能提升至每月 11 萬片(佔全球 DRAM 產能的 6%),其中 G3 工藝下每月 5000 - 10000 片專供兆易創新(GigaDevice);其餘每月 16 - 16.5 萬片將用於 LPDDR4x 和 HBM 的研發。由於美國的限制措施,長鑫儲存在沒有極紫外光刻(EUV)技術的情況下繼續開發 15 奈米以下的 DRAM,這限制了其相關裝置的採購以及 HBM 技術的大規模發展。我們在國際半導體裝置與材料展覽會上瞭解到,從長遠來看,長鑫儲存的產能可能進一步擴大到每月超過 30 萬片(合肥工廠每月 18 萬片,北京工廠每月 12 萬片)。按晶圓產能計算,長鑫儲存在 2025 年的 DRAM 晶片產量可能相當於全球產量的約 14%。考慮到相對較低的良品率,據大摩估計,其今年實際市場份額可能較小,約為 10%。在高頻寬儲存器(HBM)的製造和封裝過程中,有幾個重要工藝,如矽通孔(TSV)和熱壓鍵合(TCB),但對於中國供應商來說,這些工藝的技術難度不及 DRAM 製造或晶片堆疊工藝,並非最為關鍵。光刻是晶片製造過程中的關鍵步驟,在這一步中,晶片晶圓被放入光刻機中,接受深紫外或極紫外光照射,通過光掩模將圖案印製到晶片的抗蝕劑層上。中國在混合鍵合技術上更具競爭力嗎?中國在混合鍵合專利方面處於領先地位。與中國競爭對手長江儲存(YMTC)相比,三星和 SK 海力士披露的混合鍵合相關專利相對較少。據 TechInsights 指出,長江儲存通過其 “Xtacking” 工藝大規模生產基於混合鍵合的 NAND 快閃記憶體已有約四年時間。該公司採用晶圓對晶圓(W2W)方法,分別製造儲存單元和外圍電路,然後將這些晶圓鍵合為單個高密度多堆疊晶片。根據 ZDNet 從法國專利分析公司 KnowMade 獲取的資料,2017 年至 2024 年 1 月期間,長江儲存披露了 119 項混合鍵合相關專利。相比之下,三星電子儘管在 2015 年就更早開始申請專利,但截至 2023 年底僅有 83 項相關專利。SK 海力士於 2020 年開始申請專利,已披露 11 項。ZDNet 的另一篇報告進一步指出,目前混合鍵合的大多數專利由 Xperi、長江儲存和台積電持有。大摩認為,憑藉技術訣竅以及與本土混合鍵合供應鏈的合作關係,中國有能力縮小在未來先進 HBM 領域的差距。混合鍵合是未來 HBM 的關鍵熱壓鍵合(TC bonding)在連接凸點精度方面,對於超過 16 層的 HBM 產品,越來越面臨良率挑戰。相比之下,混合鍵合無需凸點即可直接連接晶片,能實現更薄的堆疊、更多的層數,降低訊號損耗,並在更小的間距下實現更高的良率。這些優勢對於目前 HBM 領域的領先者 SK 海力士來說尤為關鍵。與此同時,Sedailey 指出,三星計畫在今年年底前生產出 12 層的 HBM4,並正在積極開發混合鍵合解決方案。據說三星還在與旗下裝置子公司 SEMES 合作,以推動該技術的發展。根據集邦諮詢(TrendForce)的觀點,DRAM 行業對 HBM 產品的關注正日益轉向混合鍵合等先進封裝技術。主要的 HBM 製造商正在考慮最早從 2027 年的 HBM4e 產品開始採用混合鍵合技術,且已確定在 HBM5 20hi 堆疊世代應用該技術的計畫。(智通財經APP)
中、日、韓、美發展HBM技術,各有什麼優劣?
HBM(高頻寬記憶體)因其高效能和低延遲特性,成為人工智慧(AI)及高效能運算(HPC)的關鍵技術。以下分析中國、台灣、日本、韓國及美國在HBM發展中的優劣勢:中國大陸優勢- 政策支援與資金投入:中國政府大力支援半導體產業,通過補貼、稅收優惠及政策扶持,推動國內HBM生產能力的提升。- 自主化需求驅動:受美國出口限制影響,中國加速HBM技術的自主研發,企業如華為、長鑫儲存等已在HBM專利和製造上取得進展。劣勢- 技術落後:中國在HBM3及更高階產品上仍落後於韓國和美國,且受制於先進製程裝置的禁運。- 供應鏈挑戰:缺乏完整的高端材料和裝置供應鏈,對外依賴性仍高。台灣優勢:- 完整的半導體生態系統:台灣擁有從IC設計到製造、封裝與測試的完整產業鏈,且在先進製程(如3nm、2nm)上領先全球。- AI伺服器市場領導地位:台灣佔全球AI伺服器出貨量的90%,顯示其在AI硬體生態中的重要性。劣勢:- 地緣政治風險:台灣面臨來自中國的地緣政治壓力,可能影響其半導體供應鏈穩定性。- 電力資源限制:先進製程對電力需求高,但台灣電力供應相對緊張。日本優勢:- 材料與裝置領先:日本在HBM相關材料(如熱介面材料)及裝置(如封裝裝置)上具有核心技術和專利,並持續擴大產能以應對市場需求。- 技術支援角色:日本公司為韓國和其他國家提供關鍵技術支援,使其在全球HBM生態中佔據重要位置。劣勢:- 製造能力不足:雖然在材料與裝置上領先,但日本缺乏大規模HBM製造能力,更多扮演輔助角色。韓國優勢:- 市場領導地位:SK海力士和三星是全球HBM市場的主導者,在HBM3、HBM3e等產品上佔據主要市場份額。- 技術整合能力強:韓國在儲存器技術與先進封裝整合方面具備優勢,可滿足AI對高效能儲存器的需求。劣勢- 競爭壓力增大:中國加速追趕,日本在材料上的支援,以及美國Micron的競爭,使韓國面臨更多挑戰。美國優勢- 技術與市場引領者:美光(Micron)等企業在先進HBM產品上具備競爭力,同時美國企業如NVIDIA廣泛使用HBM於AI GPU中。- 政策保護與研發投入:美國實施出口管制以限制中國獲取高端HBM,同時加強自身AI及半導體研發投入。劣勢- 供應鏈依賴外部合作夥伴:雖然技術領先,但美國部分製造環節仍需依賴亞洲供應鏈支援,如台灣和韓國的代工廠。各國在HBM發展中各有側重。韓國憑藉市場主導地位和技術整合能力保持領先;台灣則依靠完整的半導體生態系統和伺服器市場優勢;日本專注於材料與裝置;美國以政策保護和技術創新為核心;而中國則通過政策驅動努力追趕。然而,地緣政治風險與供應鏈挑戰將持續影響全球HBM格局。 (銳芯聞)