#AI推理應用
半導體行業的2026,三大關鍵詞
在剛剛過去的2025年,從“寒王”市值飆升,儲存漲價潮席捲全球,到年末摩爾線程、沐曦股份先後上市刷新新股盈利紀錄,半導體毋庸置疑是熱度最高的類股之一。在這一年裡,全球頭部半導體企業合計銷售額突破4000億美元,創下行業歷史新高,2026年這一記錄或有望再度刷新。步入2026年,那些有望成為下一個產業爆點?在外部環境充滿變數的當下,中國半導體產業又將如何前行?綜合各路分析,《科創板日報》為您整理了三個2026年半導體產業關鍵詞:儲存、AI與中國國產化。一場關於成本、技術與供應鏈的全域博弈即將開場。儲存:漲價或將貫穿全年回看2025年,儲存暴漲就引發了高度關注。供需鴻溝面前,行業龍頭報價接連暴漲。多家儲存產業鏈廠商都預計,儲存短缺將持續到2026年。“我們的產品供應與客戶需求之間存在巨大缺口,且這種短缺局面將持續一段時間。” 美光科技首席商務官蘇米特・薩達納表示。TrendForce預計,後續儲存產業資本開支將持續上漲,其中DRAM資本開支將從537億美元增長至613億美元,同比增長14%;NAND產業資本開支將從211億美元增長至222億美元,同比增幅為5%,但對2026年產能助力有限。因此,中銀證券預計,儲存價格上漲趨勢或將貫穿2026年全年。中國中國國產儲存廠商亦在積極開發4F2+CBA的技術架構以應對全球龍頭廠商的技術競爭。4F2+CBA的架構變化有望為供應鏈帶來增量變化。儲存漲價潮下,全球終端產品迎來艱巨成本考驗,手機及PC供應商計畫通過漲價、縮減規格配置、暫緩升級等措施以平衡成本。此前已有消息稱,聯想、惠普、戴爾等PC廠商已著手重新評估2026年產品規劃。其中,聯想已經通知客戶即將進行漲價調整,所有伺服器和電腦報價在2026年1月1日到期,新報價大幅上漲;戴爾正考慮對伺服器和PC產品漲價,漲價幅度預計至少在15~20%區間;惠普 CEO也表示2026年下半年可能“尤其艱難”,必要時將上調產品價格。值得一提的是,上交所官網12月30日晚間顯示,中國第一、全球第四的DRAM廠商長鑫科技申報科創板IPO獲上交所受理,擬募資295億元;招股書披露,公司2025年第四季度利潤超預期。東吳證券指出,長鑫重點在研的CBA這一走向3D的技術將有望釋放後續持續擴產動能,通過這一另闢蹊徑的方式縮小與三星和海力士的代際差,保證擴產量級,其產業鏈公司將充分受益。裝置環節在受益長鑫充裕擴產之餘,部分優質公司還將享受滲透率快速提升,迎來戴維斯連按兩下;部分代工和封測公司將承接長鑫的代工需求。AI:算力資本開支續漲 AI終端創新元年到來AI熱潮持續多時仍未停歇,帶動全球算力產業鏈延續高增長。即便歷經了泡沫論疑慮,但在展望2026年時,多方機構依舊給出了較為樂觀的預期。受益於CSP、主權雲等算力需求擴張、以及AI推理應用的蓬勃發展,TrendForce預計2026年全球八大雲廠商合計資本支出將增長40%,達到6000億美元,全球AI伺服器出貨量將增長20.9%。一方面,產業重點由訓練開始漸漸向推理轉移,同時得益於大模型在架構上的創新,國內外大模型在多模態理解、推理及AI應用層面均實現持續進階,帶動ASIC熱度上升。國海證券預計,2026年資料中心ASIC晶片出貨量有望超800萬顆,2027年有望突破1000萬顆,未來或將與同期GPU出貨量相近。ASIC崛起下,已有公司相關訂單量開始攀升。例如芯原股份日前公告,2025年10月1日至12月25日期間,公司新簽訂單金額達24.94億元,較2024年Q4全期大增129.94%,較2025年Q3全期增長56.54%。其中,Q4新簽訂單金額中絕大部分為一站式晶片定製業務訂單。展望2026年,東吳證券預計中國國產算力晶片龍頭有望進入業績兌現期,看好中國國產GPU受益於先進製程擴產帶來的產能釋放。考慮到中國國產算力晶片各家參與者為爭奪市場份額而搶奪產能資源,看好AIASIC服務商在供應鏈中的關鍵角色。除了上游算力之外,AI產業鏈中,下游終端也是2026年備受期待的一個環節。券商認為,2026年是AI終端創新元年,Meta、蘋果、Google、OpenAI均將有新終端新品推出。AI終端形態以眼鏡為代表,同時有AI pin、攝影機耳機等新形態。伴隨模型迭代和新終端的應用場景開發加速,下一代爆款終端或在大廠創新周期中應運而生。端雲混合為AI場景賦能,端側SoC持續受益於AI創新浪潮。中國國產化:本土晶片設計企業崛起 多環節迎來機遇在半導體產業發展中,“中國國產化”一直是關鍵引擎之一。多家券商認為,從晶圓代工到半導體裝置,產業鏈多環節都有望在2026年進一步打開中國國產化機遇。資料顯示,2017-2025年中國晶片設計企業數量和銷售額均以兩位數復合增速增長。中國晶片設計企業數量由2017年的1380家增長至2025年的3901家,年均復合增速為14%,其中銷售額過億的企業數量由2017年的191家增長至2025年的831家,年均復合增速20%。從銷售額來看,2017年為1946億元,2024年增至6460億元,年均復合增速19%,高於全球半導體銷售額同期6%的增速。此外,此前2022年半導體行業周期下行,中芯國際、華虹半導體、聯電等晶圓代工廠的產能利用率均下降,但中芯國際和華虹半導體產能利用率較早實現觸底回升。券商認為,這主要得益於大陸晶片設計企業的崛起和製造本土化趨勢。晶圓代工方面,東吳證券預計,先進邏輯擴產量級有望翻倍,晶圓代工景氣維持。目前國內先進製程尤其是7nm及以下供給嚴重不足,在海外斷供的潛在壓力和中國國產先進邏輯晶片可預見的需求旺盛,2026年開始出於保供意圖的先進擴產將十分豐厚,中芯國際和華力集團有望持續擴產先進製程;除此之外,更多的主體將擴產14nm。半導體裝置方面,中信建投指出,在行業擴產整體放緩大背景下,中國國產化驅動下的滲透率提升依然是裝置類股後續增長的重要來源。其預計未來裝置中國國產化率將實現快速提升,頭部整機裝置企業2025年訂單有望實現20%-30%以上增長,零部件、尤其是卡脖子零部件中國國產化處理程序有望加快,類股整體基本面向好。頭部客戶的中國國產替代訴求仍較強,不在清單的客戶也在加速匯入中國國產,預計後續中國國產化率提升斜率更陡峭,裝置廠對供應鏈的中國國產化推進也非常迅速。 (財聯社)
HBF or HBM?高頻寬快閃記憶體(HBF)更適合AI推理!
這張圖介紹了HBF(高頻寬快閃記憶體)在 AI 推理伺服器中的應用價值:AI工作負載的內存需求可以分為模型參數讀取和KV 快取讀寫兩類:1. 模型參數讀取(Weight Streaming,權重流)訪問模式:大粒度順序讀取。頻寬需求:需支撐GB/s~TB/s 級頻寬,對 “高頻寬” 特性高度依賴。部署優勢:若 HBF 靠近計算核心部署,大容量特性可顯著提升權重讀取效率。2. KV 快取讀寫(KV Cache Read/Write)訪問模式:快取級隨機訪問,對延遲極度敏感。操作特性:生成每個token時都會觸發寫操作;且 KV 快取的大小會隨上下文長度和注意力頭數量線性擴展。HBF 為何不適用訓練場景?訓練場景的記憶體需求與 HBF 的技術侷限存在根本衝突:訪問模式:寫密集型,伴隨持續的梯度更新、最佳化器狀態修改,且存在頻繁細粒度讀寫。介質侷限:HBF 基於快閃記憶體技術,受限於兩個核心短板 ——耐用性:快閃記憶體的擦寫次數有上限,寫密集的訓練會快速耗盡其生命周期;延遲:快閃記憶體的讀寫延遲遠高於 DRAM,無法滿足訓練對低延遲的嚴苛要求。HBF為何適配推理場景?可從三方面理解:特性匹配:HBF 具備大容量、低成本、高密度的優勢,完美適配推理伺服器對 “儲存規模” 和 “成本效率” 的需求。工作負載契合:推理中的 “權重流” 任務是大粒度順序讀取,與 HBF 的頻寬優勢完全匹配。場景區分:訓練是 “寫密集型” 工作負載,會突破 HBF 的耐用性和延遲上限;而推理的讀寫模式更溫和,可充分發揮 HBF 的潛力。HBF取代HBM會發生什麼?假設HBF完全取代了HBM作為GPU的主記憶體。其優勢在於:每GPU多TB記憶體容量使非常大型模型能夠局部安裝在每個加速器上對於頻寬密集型權重流且預取能力強,高效高效但也具有很明顯的侷限性:KV快取作延遲不足隨機訪問性能仍不及 HBM培訓和混合工作量不切實際不支援通用GPU使用場景因此HBF僅適用於具有固定作模式的專用推理加速器,無法作為通用GPU中HBM的替代。HBM + HBF混合GPU記憶體最好!HBM仍然是主要的低延遲記憶體,而HBF則作為高容量讀取最佳化層加入。HBM→KV 快取、熱啟動、中間張量HBF→模型參數、冷啟動通過 HBM 維護低延遲計算流水線,減少對 HBM 的依賴和成本,還相容當前的GPU設計和軟體棧,缺點是包設計複雜度增加,且需要關注功耗與熱量問題。 (銳芯聞)