#AI儲存
海力士HBM4E:1c納米製程的量產訊號與AI儲存新格局
隨著SK海力士正式披露HBM4E核心晶片將全面匯入1c納米製程,AI儲存領域的技術競賽正進入關鍵轉折點。目前該工藝良率已達80%,標誌著其在大規模商用化路徑上取得了實質性突破。本文解讀了海力士這一戰略佈局背後的技術邏輯、2027年量產的時間表,以及從上游EUV裝置到下游AI算力基礎設施的產業鏈傳導效應。研究認為,1c製程與混合鍵合技術的協同,將成為未來定義高性能儲存系統整合效率的新標準。(圖片來源:海力士)行業觀察:1c納米製程的成熟與HBM4E的量產前瞻在人工智慧算力需求持續攀升的背景下,HBM已成為半導體行業關注的焦點。近期,儲存器巨頭SK海力士宣佈,其下一代HBM產品——HBM4E的核心晶片將全面匯入1c納米製程,即第六代10納米級DRAM技術。這一舉措不僅彰顯了海力士在先進製程上的決心,更重要的是,公司透露其1c納米工藝的良率已達到80%,量產能力趨於成熟。根據海力士的規劃,HBM4E樣品預計在2026年下半年向客戶提供,並以2027年實現大規模量產為目標。這標誌著HBM技術路線圖上的一個重要里程碑,預示著AI儲存市場即將迎來新一輪的技術革新與競爭態勢調整。(圖片來源AI生成,僅供參考)技術驅動:性能極限的追求與市場競爭的策略選擇SK海力士在HBM4E上選擇1c納米製程,是多重因素驅動下的結果:首先,對性能極限的持續突破是核心動因隨著GPU等AI加速晶片算力的飛速提升,對儲存頻寬和能效的要求也日益嚴苛。傳統的1b納米工藝在物理層面已逐漸觸及瓶頸。1c納米製程通過更精細的電晶體結構和更先進的光刻技術,能夠在單位面積內整合更多儲存單元,從而顯著提升資料傳輸速率並降低功耗。例如,基於1c工藝的LPDDR6產品,其資料處理速度相比前代提升了33%,能效也提高了20%以上。這種製程優勢對於HBM4E而言,意味著更高的頻寬和更低的運行溫度,這對於滿足未來AI模型對海量資料處理的需求至關重要。其次,市場競爭的策略考量亦是關鍵在HBM領域,三星電子在HBM4階段已率先採用1c納米製程。為保持在HBM市場的領先地位,SK海力士必須在HBM4E這一代產品上迎頭趕上,通過1c納米工藝的成熟量產來鞏固其技術競爭力。此次公佈的80%良率,不僅展示了海力士在解決EUV層數增加所帶來的工藝複雜性方面的進展,也為2027年HBM4E的大規模供應提供了信心。產業鏈影響:從裝置材料到終端應用的全面聯動海力士HBM4E匯入1c納米製程,其影響將貫穿整個半導體產業鏈,形成深遠的傳導效應:趨勢展望:2027年恐成AI儲存的效率元年綜合海力士的技術路線與市場動態,未來幾年HBM市場可能呈現以下趨勢:2026年是技術驗證與生態磨合期隨著GPU等AI加速晶片算力的飛速提升,對儲存頻寬和能效的要求也日益嚴苛。傳統的1b納米工藝在物理層面已逐漸觸及瓶頸。1c納米製程通過更精細的電晶體結構和更先進的光刻技術,能夠在單位面積內整合更多儲存單元,從而顯著提升資料傳輸速率並降低功耗。例如,基於1c工藝的LPDDR6產品,其資料處理速度相比前代提升了33%,能效也提高了20%以上。這種製程優勢對於HBM4E而言,意味著更高的頻寬和更低的運行溫度,這對於滿足未來AI模型對海量資料處理的需求至關重要。2027年為規模量產與技術普及期隨著HBM4E的正式量產,1c納米製程有望成為高性能DRAM的主流工藝。同時,混合鍵合技術在HBM中的應用將逐步成熟,成為區分HBM產品性能和成本競爭力的關鍵技術之一。長期趨勢應該是從堆疊密度到系統級整合效率未來的HBM發展將不再僅僅是單純追求更高的堆疊層數或更寬的位寬,而是更加注重製程工藝(如1c及後續節點)、先進封裝技術(如混合鍵合、3D堆疊)與邏輯晶片(Base Die)之間的協同最佳化。通過提升整體系統整合效率,實現更低延遲、更高能效的AI儲存解決方案,這將是AI時代儲存技術演進的核心方向。海力士HBM4E的1c納米製程計畫,不僅是其自身技術實力的體現,更是AI儲存行業向更高性能、更低功耗邁進的一個縮影。2027年的量產目標,將是AI儲存領域的一個重要分水嶺,屆時,誰能更好地平衡技術創新、良率控制與成本效益,誰就能在激烈的AI競爭中佔據更有利的位置。 (GMIF創新觀察)
AI救活了一家馬桶公司,也點燃了儲存晶片超級周期
AI居然救活了一家馬桶公司?日本高端智能馬桶企業TOTO,因為AI在過去幾個月股價飆升,並不是因為馬桶賣得更好了,而是因為TOTO有一個隱藏業務:高純度陶瓷靜電吸盤,這是晶片製造時固定晶圓用的關鍵耗材,TOTO把精度做到了頭髮絲的1/80,純度業界第一。恰逢儲存晶片需求爆發、上游廠商瘋狂擴產,這一業務就成了絕對的剛需。這使得高盛等投行紛紛上調TOTO股價評級,原因很簡單:靜電吸盤的訂單已經排到了2027年。現在這塊業務佔了TOTO超過四成的營業利潤。當一家馬桶公司,都成為了AI概念股,可見目前的AI儲存賽道有多火爆了,三星(Samsung)、SK海力士(SK Hynix)、美光(Micron)、閃迪(SanDisk),這些儲存行業的重要玩家股價瘋漲的背後,是全球儲存晶片,正在經歷四十年來最嚴重的供需失衡。這篇文章,我們就來梳理一下這輪儲存的“超級周期”,並與三星業內人士和華爾街投資人深度盤點一下:為什麼這一次的周期跟以前不一樣,儲存在AI產業為什麼如此重要,Google等AI巨頭正在如何破除對儲存的依賴,以及這樣的短缺周期還會持續多久、又如何影響你我呢?01. 漲幅超1800%“比黃金還貴”的HBM2026年1月底,韓國儲存雙雄三星電子和SK海力士同時公佈了上一年第四季度財報。數字有多誇張呢?兩家公司合計營業利潤接近40兆韓元,折合大概278億美元,相當於每天淨賺3億美元。在這樣創下歷史的利潤下,SK海力士的年終獎,人均達到64萬元人民幣,刷新公司歷史紀錄。把這一切推上巔峰的核心產品,是HBM(高頻寬記憶體)晶片。一塊指甲蓋大小的HBM,售價400到500美元,這比同等重量的黃金還貴。而全球能做這產品的,就三家:SK海力士佔大約6成,剩下的是三星和美光各2成。但HBM只是冰山一角,真正讓整個行業慌了的,是從高端到低端、從DRAM到NAND,全線告急。從2024年底到2025年12月,DDR5(16GB)的現貨均價,從4.6美元漲到了28美元,漲了500%多;更老的DDR4,從3.2美元飆到62美元以上,累計漲幅高達1800%;資料中心用的64GB伺服器記憶體模組,去年半年之內從255美元漲到了700美元,漲了將近175%。而SK海力士2026年的產能已經全部賣光了,三星2026年一季度直接把NAND快閃記憶體的供應價格上調了100%,直接翻倍。Candice Hu三星儲存產品行銷經理我們現在看到DRAM的spot price(現貨價格)已經超過了2016-2018年cloud(雲)那個時候最高的現貨價格了。我們現在的短缺的情況是2026年已經全部賣完,27年大機率也差不多賣完了。像我們SSD(固態硬碟)給非常核心的GPU provider(GPU廠商)的報價,就是非常誇張,一周內乘以2的價格。與此同時,出現了一個更有標誌性的訊號。閃迪(SanDisk)在2026年初的CES上,告訴華爾街:它正在跟客戶簽一種全新的長期供貨協議——LTA(long term agreement),而且這次客戶要打預付款,毀約不退錢。這在儲存行業幾十年的歷史上從未發生過。Rob Li紐約Amont Partners管理合夥人Long-term agreement(LTA,長期供貨協議)在歷史上不是沒有過,但過去這麼幾十年,LTA是從來沒有任何執行效力的。如果市場進入一個下行周期的時候,客戶說這東西我們就不認了,如果客戶不認的話,你拿他完全沒有辦法。而這一次,畫風變了。強勢的儲存供應方制定了新規則。Rob Li紐約Amont Partners管理合夥人SanDisk告訴華爾街或告訴市場說:我們現在跟客戶簽署的LTA和過去有很大不同。這東西有法律效力,而且客戶要給我們提前預付款,如果你提前預付了款,最後你要走人,如果不按這個價格付,你的預付款是拿不回來的。Rob的判斷是,如果閃迪都能做到這一點,那另外三大巨頭SK海力士、三星和美光,沒理由做不到。在這樣的情況下,整個超級周期很有可能持續到2027年。02. 產業鏈全景拆解儲存行業如何運作?對於儲存行業來說,我們可以用熱和冷來做劃分,當它離計算的關係越近,就越熱;越偏向純粹的儲存屬性,就越冷。所以最“熱”的就是DRAM(動態隨機存取儲存器),是離計算最近的儲存,可以理解為電腦和手機的“運行記憶體”,晶片在工作的時候,資料必須先載入到DRAM裡才能被處理。它的特點是速度極快,但斷電就丟資料,屬於“短期記憶”。其中,HBM(高頻寬記憶體)是DRAM的一種特殊進化形態。它把多層DRAM晶片,通過矽通孔(TSV)技術垂直堆疊在一起,再用先進封裝和GPU貼在同一塊基板上,這樣做的好處是極大增加了頻寬。這就是為什麼所有用於AI訓練的頂級晶片,無論是輝達的GPU還是Google的TPU,都離不開HBM,它是這輪超級周期裡最耀眼、最緊缺的產品。當然DRAM家族內部,其實品類很豐富。包括GDDR(顯示卡用)、Low-Power DDR(手機和筆記本用的LPDDR)等等,不同的應用場景,對應著不同的產品。不是說一顆DRAM晶片能通吃所有裝置,給輝達GPU用的HBM,和你手機裡的LPDDR,雖然都是DRAM,但製造工藝、封裝方式、性能指標完全不同。而在“冷”的這一端,就是NAND。如果DRAM是短期記憶,那NAND Flash就是長期記憶。它斷電不丟資料,是我們日常用的固態硬碟(SSD)、手機儲存、USB 隨身碟的核心。你在手機裡存的照片、電腦裡裝的遊戲,都躺在NAND上。NAND在AI時代的角色也在快速升級。以前它就是單純的“倉庫”,負責把資料長期存好,但現在NAND正在從後台的倉庫,變成前線的彈藥庫。再往“更冷”走,就是傳統的機械硬碟HDD,靠磁碟旋轉來讀寫資料,速度慢但便宜,容量大,現在主要用在資料中心的冷儲存和歸檔場景。隨著AI推理對儲存層級的需求越來越精細,現在越來越像一個分層倉儲系統。最急著用的資料放在HBM,像擺在手邊;常用但沒那麼急的資料放在DRAM,像放在辦公桌抽屜;更冷一些、只是備用的資料放在NAND/SSD,像放在辦公室儲物櫃;而真正長期積累、需要多人共享呼叫的大量資料,則放在後端的大型共享儲存裡,像公司的總檔案館。Rob Li紐約Amont Partners管理合夥人AI起來對熱的東西更有利,當然對於儲存也是需要的。我用AI做了很多圖片,製作了很多視訊,根據各國各地的法規,這東西不能刪,要留著,那對儲存的需求增量肯定起了很大的作用。但它的第一步最直接的體現,一定是跟計算相關的方面,誰跟計算的關係越近,誰在短期的收益越明顯。接下來我們盤點一下整個儲存產業鏈上的玩家們。最上游是材料和矽片,比如日本的SUMCO,它是全球最重要的半導體矽片供應商之一。製造環節裡,關鍵裝置廠商包括ASML這樣的光刻機龍頭,以及Tokyo Electron這類覆蓋塗膠顯影、沉積、刻蝕和清洗等多個環節的裝置公司。與此同時,在製造之前的晶片設計層,Cadence和Synopsys這類EDA、驗證和設計IP公司同樣不可或缺;而像Rambus這樣的介面IP廠商,則在HBM等高速記憶體架構裡扮演關鍵角色,它們看起來不如GPU那樣顯眼,但在這輪AI驅動的超級周期裡,都是超級剛需。中游就是儲存晶片的設計和製造。在DRAM領域,三星、SK海力士、美光,這三家公司加在一起就佔據了全球95%的市場份額。而在NAND領域,除了這三家之外,還有鎧俠(Kioxia)、西部資料、閃迪。然後是在這輪周期裡變得格外關鍵的環節——先進封裝。因為HBM不是單純把DRAM造出來就結束了,它要先把多層DRAM裸片(die)堆疊,再通過2.5D封裝與GPU或其他AI加速器整合在一起。也正因為如此,CoWoS這種半導體封裝技術一度成為AI晶片供應鏈最關鍵的瓶頸之一,直接限制了HBM的實際出貨,而CoWoS產能主要由台積電提供。下游就是各種終端應用了。包括資料中心和雲廠商,微軟、Google、亞馬遜、字節跳動,是現在最大的金主,之後是手機廠(蘋果、三星、小米、OPPO)、PC廠(聯想、戴爾、惠普)、汽車廠(特斯拉、理想、蔚來),以及遊戲主機、工業裝置等等。所以你能看到,雖然整條鏈非常長,但真正的定價權,高度集中在中游那三家:三星、SK海力士、美光。它們決定了做什麼產品、給誰供貨、以什麼價格賣。而在當下這個供給遠小於需求的市場裡,它們擁有的議價權是前所未有的。03. 為何總是暴漲暴跌儲存行業的天然周期宿命儲存行業還有一個非常大的特點,就是周期性。從歷史來看,它總是在“大漲”和“大崩”之間反覆橫跳。這背後有兩層原因,一層是物理學,一層是經濟學。先說物理學。DRAM,就是手機電腦裡的“運行記憶體”,靠儲存電荷來保存資料。幾十年來,工程師一直在把儲存單位做小、做多,來提高密度。巔峰時期,DRAM密度每十年能翻100倍。但如今不行了,SemiAnalysis的報告指出,過去十年DRAM密度總共才翻了大約2倍,而以前是每十年100倍,縮放已經嚴重放緩了。這意味著儲存晶片的成本下降,不再像以前那樣靠技術進步“自動”實現,而是更多取決於產能的增減和供需的博弈。再來說說經濟學。儲存晶片製造是全球資本密度最高的產業之一,建一座先進晶圓廠,動輒幾十億上百億美元,建設周期兩三年。這些錢投進去就是沉沒成本,所以即便需求不好,廠商也傾向於繼續生產,因為不開工反而更虧。更要命的是,儲存行業的模式是“先建後賣”,跟台積電“先接單後擴產”的邏輯完全不同,儲存廠商得自己猜未來需求有多大,提前兩三年布產能。猜對了皆大歡喜,猜錯了就是災難。這種結構性矛盾,造就了儲存行業反覆上演的經典循環:需求爆發→供不應求→價格飆漲→利潤暴增→激進擴產→供過於求→價格崩盤→行業大洗牌。過去三十年,這個循環平均每3到4年上演一次,從未例外。結果就是,全球DRAM供應商從1990年代的20多家,淘汰到今天只剩三家巨頭和中國長鑫這樣的追趕者。每一輪都有人被淘汰出局,比如德國奇夢達破產,日本爾必達退出。這些血淋淋的教訓,讓整個行業對“周期”二字充滿敬畏。在儲存行業過去幾十年的歷史上,曾經出現過四次周期。第一次是1993年,Windows PC黎明期。圖形介面普及讓記憶體需求暴增,供給端產能嚴重不足,價格飆漲。結果全球一口氣新建了約50座新廠,產能過剩後價格暴跌,大批玩家出局。第二次是2010年,智慧型手機加雲端運算時代。iPhone和Android帶來爆發式增長,伺服器DRAM從個位數GB跳到數十GB。但標準化加速了商品化,供應商很難做出差異,結果這輪周期比預期更短。第三次是2017到2018年。雲廠商升級資料中心,單台伺服器塞進更多DRAM,而伺服器記憶體又比消費級更貴更賺錢,三大廠商毛利率衝到歷史高位。但高利潤刺激擴產,需求一過峰值,2018年末行業重新滑入下行。第四次是2020到2021年,疫情驅動的意外繁榮。居家辦公、雲用量暴增,但恐慌性雙重下單製造了虛假需求,退潮後庫存嚴重積壓,接著就是2022到2023年的痛苦大跌。從那時起產能被大幅削減,但正是這段保守期為現在的短缺埋下伏筆。進入2025年,全行業產能再次嚴重不足。所以歷史給我們的核心教訓是什麼?是過去所謂的超級周期,從來沒有持續超過兩年,都是“高利潤→瘋狂擴產→過剩→崩盤”,這是過去四十年的鐵律。經歷了這麼多輪循環,投資者和從業者,都有一種根深蒂固的條件反射:漲得越猛,崩得越快。但這一次,越來越多的證據在暗示,歷史模式可能要被打破了。04. 這次為什麼不同從訓練到推理的需求質變4.1 先從一個最樸素的直覺講起在講複雜的供需模型之前,我們先建立一個最簡單的邏輯。你每天打開ChatGPT或者Gemini,上傳檔案、存對話、讓AI記住你的偏好,你可能沒意識到,每一次互動都在消耗儲存資源。不僅是伺服器端的計算,更是海量的記憶體和快閃記憶體。現在大部分AI使用者是沒有忠誠度的,誰的模型好用、誰便宜就用誰。但想像一下,如果有一天你的AI助手真的“懂你”了,記得你的工作習慣、表達偏好、三個月前討論過的項目細節,你還會輕易換平台嗎?這種“記憶粘性”,是大模型公司建構護城河的核心武器,而支撐這種粘性的硬體基礎設施,就是儲存,海量的、多層級的儲存。還有另一個同樣直覺的邏輯:視訊模型越來越強了,AI生成視訊正在逼近實用化。而視訊資料量是文字的幾十甚至上百倍,這對儲存的需求將是指數級的躍升。Rob Li紐約Amont Partners管理合夥人記憶體就像一塊小黑板,以前我們計算的是1+1=2,所以你不需要一塊巨大的黑板,一塊正常的黑板就夠了。只是來到了AI時代,現在計算的強度會很高,也很複雜,有很多步。如果我是一塊小黑板,你每寫一次、擦掉一次,又寫一次、又再擦掉一次,有100步的計算的話,你需要擦100次,就會耗費你的時間。所以我們現在需要造一塊巨大無比的黑板,我可以一口氣把算數的100個步驟全部寫完,再一口氣擦掉,這樣可以省我的時間。所以,一塊越來越大的黑板,這就是AI時代對儲存的需求。4.2 從訓練到推理:儲存需求發生了質變在生成式AI的早期階段,算力和錢都砸在了模型訓練上,訓練階段儲存系統干的活兒,主要是向上千個GPU高效喂資料,以及定期做模型檢查點,防止訓練中斷功虧一簣。但如今,推理正在迅速成為主戰場,而推理對儲存的需求模式,比訓練複雜得多。它需要把模型從儲存層載入到記憶體層:活躍權重主要駐留在HBM,部分狀態和快取則留在DRAM;當KV Cache(鍵值快取)在高層記憶體中裝不下時,一部分會被解除安裝到SSD/NAND上,需要時再取回;而RAG查詢依賴的外部知識,通常存放在更後端的共享儲存或資料湖中,由檢索系統即時調取。而更大的變數是AI Agent的崛起。摩根士丹利在最新研報中指出,2026年將是AI從實驗走向核心基礎設施的一年,這些智能體更可靠、更有記憶力、幻覺更少,還能持續學習。這份研報中寫到說:“推理正在成為一種記憶體挑戰,而不僅僅是計算挑戰”。但智能體要運轉起來,就需要維護多層記憶:短期工作記憶(當前對話)、長期記憶(跨會話的使用者歷史)、預訓練知識庫、工具呼叫記錄……而每一層都需要不同層級的儲存支撐:從HBM裡的“熱資料”,到DRAM裡的“溫資料”,再到NAND SSD裡的“冷資料”。所以趨勢很明顯:AI的下一波進步,不是來自更強的推理能力,而是來自更好的上下文處理。一個能記住一切的AI助手,比一個更大但什麼都記不住的模型有用得多。對於儲存來說,這意味著什麼呢?4.3 算筆帳:AI到底要吃掉多少儲存?摩根士丹利做了一個非常詳細的分層測算。他們以一個類似ChatGPT規模的模型為基準,假設大約8億周活躍使用者、峰值每秒30萬請求、每次請求2000個輸入token,並且假設只算文字,圖片和視訊不計入。按這個要求詳細拆分結果,這樣的系統大致對應HBM 226PB、DRAM 4.6EB、NAND/SSD約47EB、資料湖約294EB的需求。這組數字意味著,如果全球有三個這種規模的模型,比如ChatGPT+Gemini+Claude,僅僅是純文字推理的需求,就會佔到2026年全球HBM供給的17%、DRAM的35%、NAND的92%。而這還沒有把圖片、視訊等多模態需求算進去。更重要的是,這套測算對上下文長度非常敏感。摩根士丹利的敏感性分析顯示,如果把輸入從每次2000 token,提高到5000 token,在其他條件不變時,每個模型的DRAM需求會再增加約2EB,Rack SSD/NAND再增加約3EB。也就是說,隨著更長上下文和更長思考鏈成為常態,這對儲存的壓力會迅速放大。SemiAnalysis管這叫“記憶體帕金森定律”:HBM容量每提升一次,開發者就會立刻建構更大的模型來把它填滿。以前用來壓縮模型的各種技巧,一有新空間就被放鬆,直到再次撞牆,這就意味著:儲存永遠是下一個瓶頸。這也是為什麼業內有聲音會認為,儲存晶片廠商,可能集體低估了大語言模型token激增所帶來的需求。Rob Li紐約Amont Partners管理合夥人以前的周期可能也就一年半到兩年時間,這次周期有可能會持續一個很長的一個時間,或者說當一個周期性的行業,變成一個結構性增長的行業,它就不再是個周期了。而這個周期的另外一個決定性因素,就是產能上的供應擴張,問題是,為什麼擴產會這麼挑戰呢?05. 越擴產越短缺HBM-DRAM困境與博弈理解這輪超級周期,還有一個核心密碼在於搞懂一個看上去很矛盾的現象:HBM的大規模擴產,不但沒緩解DRAM的短缺,反而讓它更嚴重了。SemiAnalysis的追蹤資料顯示,2023年底,三大儲存廠商分配給HBM的晶圓產能大約12.3萬片/月。到2025年底漲到了33.1萬片/月,兩年擴了將近3倍。預計到2027年底還會進一步到66.8萬片/月,四年翻5倍。擴得這麼猛,為什麼DRAM還是緊缺?關鍵在於,做HBM要消耗大量普通DRAM的產能,而且效率極低。HBM是一種極其消耗晶圓的架構。一片用於HBM3E 12層堆疊的晶圓,位產出(也就是能生產出來的儲存容量)只有普通DRAM晶圓的大約三分之一,到了HBM4,這個比例可能進一步惡化到四分之一。Candice Hu三星儲存產品行銷經理相比較於傳統的DRAM,生產HBM,我們同一片Wafer(晶圓)的產量只能達到普通的DRAM的1/3。這意味著,廠商每多生產1GB的HBM,市場就失去了生產3-4GB普通DRAM的機會。為什麼效率這麼低?因為HBM的製造複雜度遠超普通DRAM,比如TSV(矽通孔)、晶圓減薄、背部加工,這些步驟都會引入額外的良率損耗。在做8層或12層堆疊時,只要有一顆die(裸片)是壞的,整個stack(堆)可能就報廢了。所有這些問題加起來,使得HBM成了一種“反向縮放”的產品,越做它,對產能的消耗越大。這也就帶來了“HBM-DRAM困境”,在業內被稱為“產能排擠效應”。因為HBM的利潤更高,且被AI巨頭預定,廠商會優先把有限的晶圓塞進HBM產線。這導致普通手機和電腦用的傳統DRAM產能,被嚴重壓縮,從而引發了價格的報復性飆漲。來自J.P.Morgan研報中的供需模型也得出了類似結論:DRAM的供給增長,在未來兩年將被壓制在20%以下,跟不上需求增長。於是,又出現了一個令人匪夷所思的現象:雖然普通DRAM工藝比HBM簡單,但由於產能受限、價格飛漲,它的利潤率到2025年四季度,竟然已經追平甚至超過了HBM。因為HBM大多是長期合同鎖了價,而普通DRAM的現貨價格,能迅速反映供需緊張。這就給廠商出了個難題:到底是繼續猛擴HBM,還是把一部分產能,留給同樣暴利的普通DRAM?06. 擴產三座大山潔淨室緊缺、裝置商保守與製程摩擦需求端已經夠瘋狂了,而供給端的約束更加讓人窒息。第一個瓶頸:潔淨室等生產資源不夠。生產晶片需要潔淨室,但在疫情後由於進入周期低谷,儲存廠商集體保守,投資縮水,這使得2025和2026年潔淨室嚴重不足。Candice Hu三星儲存產品行銷經理因為晶片生產對環境的要求實在太高了,反而clean room(潔淨室)夠不夠倒是我們比較擔心的,還有就是電力夠不夠。因為我們可能會晶片做得夠多,可是沒有足夠的power(電力)去讓他們工作。SemiAnalysis的追蹤顯示,2026年全行業幾乎所有新增晶圓產能,就集中在三座工廠:三星的P4、SK海力士的M15X、美光的A3。而且M15X和A3主要是給HBM用的,對普通DRAM貢獻很有限。真正有意義的新產能呢?SK海力士的龍仁(Yongin)工廠,最早2027年2月才能上線;美光的愛達荷(Idaho)工廠瞄準2027年年中。也就是說,未來一年多,供給端基本沒有增量。第二個瓶頸:上游裝置商不肯擴產。Rob Li紐約Amont Partners管理合夥人很多裝置商,比如說日本的很多供應商,有一家很大的叫Tokyo Electron,它自己不願意擴產,很保守。因為過去幾十年,它走過了很多個周期,目前擴產能也需要幾年,等到擴產能出來,說不定那個時候AI周期就爆掉了。所以它寧可不擴,就不求掙500塊錢了,就掙100塊錢,小日子過得也很好。圖片來源:TEL這就是一個典型的“木桶效應”,就算儲存廠商有錢有決心擴產,上游裝置的供貨瓶頸,也會大幅拖慢產能上線的速度。第三個瓶頸:先進節點遷移自身的摩擦。為了在晶圓產能有限的情況下儘量多產出記憶體位,三大廠商都在加速向1b(目前最尖端的量產節點)和1c(即將進入大規模量產的下一代節點)先進節點遷移,因為製程越先進,意味著電路刻蝕得越細,在同樣大小的一片晶圓上,1c節點能切出的儲存顆粒數量比1b更多。但這個產線的遷移過程,就必須把機器停下來,進行長達數周甚至數月的重新偵錯和安裝,本身也會導致幾個季度的良率波動和產能損失。在2026年這個AI需求爆發的節骨眼上,就有點遠水解不了近渴。Candice Hu三星儲存產品行銷經理從開始決定增加產能到建立起來一個Fab(半導體製造廠),然後再到back-end(後端)能夠做出來DRAM晶片或者是NAND晶片,它需要三年的時間。在這個時候又出現了HBM這種難做的晶片,就像我剛提到的HBM跟conventional(傳統的)DRAM相比的話,它是1/3的產能。那我本來要等兩到三年,產能才能增加,現在又只能砍掉1/3的output(輸出),所以它的供需在這個cycle(周期)之下是還比較緊張的。潔淨室等生產資源不夠、裝置商不擴產、先進節點遷移自身的摩擦——這三個瓶頸疊在一起,就是為什麼即使所有人都知道儲存晶片在瘋漲,供給端依然束手無策。07. 產業鏈利潤重分配誰在盛宴,誰在寒冬儲存晶片價格的瘋漲,當然不是沒有代價,它正在重新分配整個電子產業鏈的利潤。先說這條利潤鏈上的大贏家,除了韓國雙雄的天文數字利潤,中國國內的儲存廠商也跟著起飛了,佰維儲存預計2025年利潤同比增長427%到520%,德明利預計增長85%到128%。至於行業利潤率,野村的口徑是2026財年,通用DRAM原廠利潤率,有望回升至上一輪周期的峰值70%。而J.P.Morgan更激進,它的說法是到2027年,營業利潤率可能超過80%,甚至要高於上一輪的峰值。而這條產業鏈上的輸家,就是硬體廠商了。摩根士丹利測算過,儲存晶片價格每漲10%,硬體OEM的毛利率就要下降45到150個基點。手機市場最先遭殃,小米、OPPO出貨預測下調超過20%,vivo下調近15%。TrendForce直接把2026年全球智慧型手機生產總數預測,砍到了同比下降10%。魅族宣佈取消魅族22Air的上市計畫,因為成本扛不住了。Nothing的CEO裴宇在社交媒體上感嘆:小公司不得不尋找其他出路。PC市場同樣慘烈,聯想部分機型上調了500到1500元,戴爾和惠普也已明確預告提價,漲幅主要由儲存成本轉嫁而來。戴爾COO克拉克直言“從沒見過成本上漲得如此之快”,惠普CEO甚至在考慮“減少產品中的記憶體使用量”。汽車行業也沒能倖免,理想汽車供應鏈副總裁公開警告,2026年車規儲存滿足率可能不到50%。蔚來李斌說“今年最大的成本壓力是記憶體”。雷軍在直播中坦言“光車用記憶體一項,成本就要增加幾千塊”。Candice Hu三星儲存產品行銷經理PC和手機這些廠商現在在我們這裡,那怕名字再響,它都沒有那麼大的pricing influence(議價權),它們現在不是那麼吃香,因為對我們來說,它們的margin(利潤)就是比雲廠商的低。比如說某一個國產車企,我們最近聽說它因為記憶體不夠,所以它可能就把後排的車載的entertainment system(娛樂系統)給閹割掉。Rob Li紐約Amont Partners管理合夥人手機和PC今年肯定至少會要跌5個點,有可能會更多,但沒人會在乎這個事情。因為它們三個人(巨頭),尤其是美光,它說我現在不做這個事情了,這個市場變成0都無所謂。而在需求的另一端,雲廠商們(微軟、Google、亞馬遜AWS)表現出驚人的價格不敏感。Candice Hu三星儲存產品行銷經理現在雲廠商它們的marginal cost off(邊際成本)、它們的software(軟體)是0。它們的錢和敘事,都跟股價有關係,所以它們是極其的price insensitive(價格不敏感),就是它們不是很在意到底這個記憶體多少錢。對於雲廠商們來說,即使手機和PC市場歸零,儲存廠商都覺得無所謂,因為AI資料中心的前景太誘人了。所以最後的問題是,這場超級周期到底還能持續多久?這次是不是真的不一樣?08. 2026年接下來會怎樣?如今,整個儲存產業鏈的競爭格局依然穩固。HBM目前大概是“6:2:2”的格局,SK海力士佔大頭,三星和美光各佔自己的地盤。當然也有投資人認為,在當下這個供遠小於求的賣方市場裡,爭論誰份額大其實沒什麼意義。Rob Li紐約Amont Partners管理合夥人因為它們三個巨頭產能都受限,誰的市場份額更多,無非在於誰能把產能擴出來,誰就可以賣動,誰有多的供應,誰就可以吃市場份額。但這個事情和誰的技術更好關係不大,因為目前是一個供給遠遠小於需求的市場。所以在這個時候討論市場份額,比如海力士的市場份額是一半,比其他兩家都大,是沒有任何意義的,因為它們三家都擴不出產能。所以現實就是,儲存三巨頭都已經賣光了,誰能多擠出一點產能,誰就多吃一口肉。不過有意思的是,儲存大廠們卻可能不追求“壟斷”。Candice Hu三星儲存產品行銷經理我覺得沒有一個儲存玩家想壟斷,三星害怕壟斷,我們的客戶也不希望我們壟斷。你一旦有短缺,像現在客戶給到任何一個memory supplier(供應商)100%的market share(市場份額),對於儲存玩家來講都是非常大的壓力。所以打破壟斷,反而是我們儲存玩家比較願意看到的事情。大家通常覺得壟斷等於高溢價,但在儲存這種周期波動極大的行業裡,100%的市場份額意味著100%的需求風險,客戶一砍單就非常的被動,所以儲存廠商反而希望保持三家競爭的平衡態。那麼,這輪周期到底能持續多久呢?Candice Hu三星儲存產品行銷經理2026年就是100%賣完,然後供給和需求中間的差值有到30%,甚至50%。2027年一樣是在短缺,可能到2028年才會有真正的好轉,所以這是一個接下來兩到三年的短缺的情況。同時,需求端完全看不到放緩的跡象。接下來,AI推理和agent的爆發,以及之後的機器人和物理AI需求,也將進一步讓儲存的吞吐量和容量需求出現指數級跳躍。SemiAnalysis認為,2026年總DRAM供給仍將比需求低約7%。在HBM這條線上,供需缺口到2027年還會繼續擴大。至於新增供給,真正有意義的產能更可能要到2027年下半年才陸續出現。如果按野村證券的口徑,真正體現在產量上的增量,甚至要等到2028年。但更值得關注的,是一個更大的問題:這個行業會不會從此告別周期?從華爾街視角,Rob在採訪中給了一個很有深度的思考角度:Rob Li紐約Amont Partners管理合夥人這次周期有可能會持續一個很長的一個時間,或者說它把一個周期性的行業變成一個結構性增長的行業,它就不再是個周期了。如果說現在行業出現一個很大的一個變化,它從一個周期性的行業變成一個非周期性行業,變成一個結構性很穩定增長行業的話,那整個市場可能對這個行業的看法就會有一個質的改變。周期行業我們給你一個10倍市盈率都算很高了,但如果變成結構性增長行業,且持續很多年的話,那它們的市盈率都可以再翻倍了。那在現在這場超級周期裡,我們到底處在什麼位置呢?以下這幅圖的橫軸是以過去五個周期、每輪周期的谷底為零點的時間線,豎軸是市場交易的漲幅。可以看到,每輪周期都會經歷四個階段:悲觀、懷疑、樂觀、狂熱,然後再回到悲觀。當前這輪紅線走勢,我們已經到了“樂觀”的這個區間,並且漲幅遠大於以往的任何一個周期。這就對應了剛剛Rob說的,這種思考方式的轉變,萬一AI真的打破了這種周期呢?這也意味著那怕利潤不增長,光是估值從“周期股”重新定價為“成長股”,就能讓股價翻一倍。就像沒有人會說蘋果賣手機,在過去20年是個周期性行業。如果儲存也能走到這一步,這將是整個半導體投資框架的一次範式轉換。不過,儲存行業的需求也是會有不確定性的,需求側的變數不只來自宏觀層面,技術本身也可能改寫供需關係。比如說,3月底,Google發佈了一個新演算法TurboQuant,號稱是一個高效AI記憶體壓縮演算法。發佈之後是直接轟動了矽谷科技圈,更是引發儲存類股的全線暴跌。但很快,業內有聲音反駁說:這次暴跌是一場烏龍。首先這篇論文發表於一年前,且本身存在一些學術上的爭議。並且這個演算法目前只在Gemma、Mistral等小模型上驗證過,70B以上模型、MoE架構、百萬級token上下文,這些AI記憶體需求真正爆炸的場景,都沒有。還有技術人士出來說,在技術上,TurboQuant壓縮的只是推理時GPU視訊記憶體裡的KV Cache,是AI記憶體需求三大來源之一,但訓練環節完全不受影響。反正,這篇論文和演算法是被各種炮轟。但這就有意思了:這一篇存在爭議的舊論文成果,就能引發資本市場如此劇烈的崩盤,是不是本身就能說明一些問題。是不是這意味著:市場對儲存類股的信心,已經高到了極度脆弱的程度。要知道,在這波暴跌之前,閃迪2026年以來已經暴漲了200%,美光也漲了超過80%。有空頭機構直接指出,閃迪以920億美元的市值、對應2026年僅60億美元的預期淨利潤,估值很難站住腳。美光同樣面臨質疑:儘管創下了歷史最佳業績,但2026財年200億美元的資本開支同比增長68%,這就是在豪賭記憶體需求會持續增長。說到底,TurboQuant論文只是一根導火線,真正的火藥桶是過去兩年積累的極端估值,任何一個“需求可能沒那麼多”的訊號,都足以觸發踩踏。這類演算法層面的進步,恰恰是“超級周期”敘事中,最難被提前定價的風險,Rob也很清醒地給出了終極風險提示。Rob Li紐約Amont Partners管理合夥人對儲存行業的擔憂會一直存在,直到最後發現這東西變成一個穩定上升的“蘋果式”的業務。第一個擔心是AI爆掉,那大家都會死,因為現在主要的增量來自於AI,如果有一天AI不行了,大家發現AI沒有什麼用,那你講的一切的未來都是空話,都會變成0。所以,當前對“超級周期”的樂觀預判,都建立在一個前提上:AI的需求是真實的、可持續的。如果有一天AI出現泡沫破裂,儲存行業很難獨善其身。這個達摩克利斯之劍會一直懸在那裡,直到行業真正證明自己成為了一個“蘋果式”的穩定增長業務。SemiAnalysis將這輪周期定義為“四十年一遇的短缺”。但更有價值的方向或許是:儲存晶片行業正站在一個分岔路口,它要麼像過去四十年一樣,在價格峰值後滑入又一輪低谷;要麼,在AI的結構性需求驅動下,真正打破周期宿命,成為一個持續增長的產業。至少在2026年,答案似乎正在傾向於後者。三大儲存廠商的產能全部售罄,上游裝置商的訂單排到了2027年,客戶開始交預付款簽有法律約束力的長期合同,甚至連一家做馬桶的日本公司,都因此改變了命運。但歷史從不缺少對“這次不一樣”的嘲諷。唯一確定的是:無論這次能不能打破周期,它已經不可逆轉地重塑了全球科技產業的權力版圖。在這場對儲存晶片的飢餓遊戲中,誰掌握了供給,誰就掌握了AI時代的話語權。 (硅谷101)
從HBM到SSD:被嚴重低估的AI儲存長周期邏輯
最近市場的不確定性很高,確實也很難做。目前市場上共識性比較強的就是光和儲存,應該說光的共識性是遠大於儲存的,儲存現在已經有很多的爭議了,上周儲存的回呼也比較大,即便市場都在解釋Google的那個TurboQuant論文,還是沒能擋住閃迪、三星、美光和鎧俠的大幅回呼, 甚至花旗還給出了下調美光的分析報告。這些都是AI Memory長周期的一部分,我們只需要知道當前Memory依舊稀缺,AI需求依舊旺盛即可。這篇文章,我們來看下,為什麼這波儲存周期被低估了。一個重度使用者每天要“吃掉”多少儲存先從最基本的問題開始:當一個程式設計師每天用 Claude Code 或者 Cursor 瘋狂寫程式碼時,背後的資料中心到底需要準備多少儲存空間?行業裡有個不成文的定義,日均消耗 1000 萬 tokens 的使用者,被稱為 Power User——重度使用者。這個數字聽起來很抽象,但換算成儲存需求就具體多了。整個計算鏈條是這樣的:1000 萬 tokens 對應大約 40MB 的純文字資料,這只是起點。這些文字需要被轉換成向量嵌入索引,用於 RAG 檢索,這一步會膨脹到 30GB 左右。再加上會話狀態、agent 執行日誌,以及出於安全考慮的三副本複製機制,最終一個重度使用者每天會產生 50 到 100GB 的 SSD 儲存需求。普通使用者呢?日均 100 萬 tokens,對應的儲存需求大約是 12GB,恰好是重度使用者的十分之一。這個比例關係在訪談中被反覆驗證,基本是個行業共識。有意思的地方在於並行場景。很多人的第一反應是:10 個重度使用者就是 500GB 到 1TB,100 個使用者就是 5TB 到 10TB。但實際情況要複雜一些。AI 系統通過“共享倉庫索引”機制,可以讓多個使用者共享基礎資料,只為每個使用者單獨儲存會話狀態。所以並行使用者的儲存需求增長不是線性的,而是被最佳化過的。但這個最佳化空間也是有限的。當 token 總需求持續上升,當越來越多的應用從單一 agent 變成多 agent 協作,儲存壓力就會快速累積。一個簡單的查詢,在 Claude Code 這樣的工具裡,可能會同時呼叫 4 到 5 個 agent,一個負責寫程式碼,一個負責審查,一個負責測試,一個負責最佳化。每個 agent 都有自己的狀態儲存需求,這就是為什麼程式設計 agent 的儲存消耗遠超普通對話應用。多模態時代的儲存爆炸如果說文字程式設計已經讓儲存需求翻了好幾番,那多模態應用帶來的衝擊就是另一個量級了。從文字到音訊,儲存需求增長 10 倍;從音訊到視訊,再增長 100 倍。一分鐘的視訊內容,儲存體積是同樣時長文字的 10000 倍。這不是危言聳聽。想想 Claude 的截圖分析功能,想想各種 AI 視訊生成工具,想想那些正在路測的自動駕駛系統。這些應用產生的資料,不僅體積龐大,而且全都是熱資料,必須隨時可以被快速讀取。這些資料能不能放到便宜的機械硬碟(HDD)裡?答案是不能。至少在推理場景下不能。HDD 只適合冷歸檔,比如你一年前在 Claude Code 裡問過的某個問題,如果長期不再訪問,系統可能會把它挪到 HDD。但當你需要呼叫這段歷史記錄時,就會明顯感覺到載入延遲。所有需要即時響應的資料,都必須放在 SSD 上。這是 AI 推理和傳統資料儲存的本質區別。儲存的四層金字塔如果把 AI 系統的儲存比作人的記憶系統,那麼它有四層結構,每一層都有自己的角色。最頂層是 HBM,高頻寬記憶體,直接焊在 GPU 上。這是最貴、最快、容量最小的那一層,專門用來儲存模型權重。一顆 H100 GPU 有 90GB 的 HBM,8 顆加起來也就 800GB 左右。這就是 AI 系統的“工作記憶”,處理眼前任務的核心空間。第二層是 DRAM,也就是伺服器記憶體。它的容量通常是 HBM 的 4 到 5 倍,主要用來儲存 KV cache——那些在對話過程中需要頻繁呼叫,但又不至於佔用 GPU 核心空間的資料。這是“短期記憶”,你今天跟 AI 說過的話,大機率就存在這裡。第三層是 SSD,容量從 1TB 到 15TB 不等,取決於伺服器配置。這是“長期記憶”,用來儲存 RAG 檢索需要的知識庫、使用者的歷史會話、agent 的執行狀態。雖然速度比 DRAM 慢,但容量大、成本相對可控,是推理場景下的主力儲存。第四層是 HDD,只在訓練資料歸檔和冷備份場景下出現。在推理環節,它基本是隱形的。一個兆參數的模型,如果用 INT4 精度運行,需要 500GB 的 HBM、700 到 800GB 的 DRAM,以及 5TB 的 SSD。這套配置可以跑到 1000 tokens 每秒的推理速度。至於這 1000 tokens/s 怎麼分配,可以是 1000 個使用者每人 1 token/s,也可以是 10 個使用者每人 100 tokens/s,完全取決於應用場景。這裡順便提一下 DeepSeek 的 engram 方法和 Google 的 TurboQuant 技術。它們的核心思路是把一些靜態的事實性知識從 DRAM 挪到 SSD,或者把 KV cache 壓縮 4 到 6 倍,從而釋放更多的 HBM 和 DRAM 空間。但都是Jevons 悖論,已經有很多人解釋過了,這裡不再贅述。200 到 300EB 的需求從那裡來現在我們把視角拉到整個行業。根據JPM的資料,2026 到 2027 年,全球超大規模雲服務商(Hyperscaler)的 SSD 需求預計會達到 200 到 300 EB。這是個什麼概念?如果按照前面算的重度使用者每天 100GB 來估算,200EB 可以支援 200 萬個重度使用者持續工作 1000 天。當然實際需求的構成要複雜得多。200 到 300EB 可以拆成下面幾個部分:訓練檢查點佔了 50% 到 60%。大模型訓練動輒幾個月,中間需要不斷保存 checkpoint,防止訓練中斷後從頭再來。這些 checkpoint 檔案體積驚人,而且必須用 SSD 儲存,因為恢復訓練時需要快速載入。RAG 資料湖佔 10% 到 15%。越來越多的企業開始把自己的知識庫接入 AI 系統,這些資料需要被向量化、索引化,然後儲存在高速儲存裡,隨時準備被檢索呼叫。剩下的部分,一部分是資料複製和安全備份(通常是三副本機制),一部分是多模態推理狀態——這是增長最快的那塊。更值得關注的是 AI 在整個 Memory 市場中的佔比變化。2023 年,AI 相關需求只佔 DRAM 總市場的 9%,到 2026 年這個數字會飆升到 37%,2028 年預計達到 53%。NAND 快閃記憶體的趨勢類似,從 2023 年的 2% 增長到 2026 年的 32%,2028 年預計 41%。換句話說,AI 正在從一個邊緣應用場景,變成 Memory 行業的主導力量。按照JPM的資料:2024 到 2028 年,AI DRAM 的價值 TAM(Total Addressable Market)年複合增長率是 105%,而非 AI DRAM 只有 51%。這是兩倍的增速差距。市場可能低估了幾個供給側的約束因素。比如 fab廠的物理空間限制,擴產不是想擴就能擴的;比如 HBM 的損耗率,每一代工藝升級都會帶來良率挑戰;比如 agent 應用的爆發,可能會帶來超預期的儲存需求;比如物理 AI(機器人、自動駕駛)的模型訓練和部署,需要的儲存量遠超純軟體 AI。從更長的時間維度看,AI 對 Memory 行業的改變不只是需求量的增長,更是商業模式的轉型。過去 Memory 是典型的 commodity(大宗商品),價格隨供需周期劇烈波動,廠商沒有定價權。但現在 HBM、SOCAMM、eSSD 這些產品越來越定製化,需要和客戶深度繫結,聯合設計,這就從 commodity 變成了 customized solution(定製化解決方案)。這種轉變如果能夠持續,Memory 廠商的利潤率中樞會被抬升,周期波動的幅度會被熨平,估值體系也會隨之重構。這才是這輪 AI 浪潮對 Memory 行業最深層的影響。最後放一個今天“HBM之父”的觀點,當然可能由於屁股決定腦袋,他的觀點比較激進,僅供大家參考。 (傅里葉的貓)
AI儲存革命,效能提升十倍專用SSD,輝達已參與研發
【全球儲存觀察 | 科技熱點關注】這個消息在去年冬天就已經出來了!輝達攜手儲存巨頭,瞄準的不僅是地面資料中心,更是未來的太空計算需求。具體情況簡單是這樣的,輝達與韓國SK海力士以及台灣的群聯電子合作,共同開發一種被稱為“AI SSD”的全新固態硬碟。據稱AI SSD性能將達到當前AI伺服器所用SSD的十倍以上,有望突破現有AI推理運算中的關鍵瓶頸。這一項目的內部代號為“Storage Next”(下一代儲存)。然而,其目標不僅是提升地面資料中心的效率,也為未來的太空資料中心和月球備份節點等高可靠性應用提前佈局。如此前瞻,令人驚豔不?!影響AI SSD研發的關鍵,不是別的,而是產業聯盟輝達、SK海力士和群聯電子聯手開發AI專用固態硬碟的消息一經傳開,引發業內朋友廣泛關注與討論。大家關注的重點就是AI SSD並非簡單的性能升級,而是針對AI推理任務進行的架構性革新。這一合作集合了圖形處理器巨頭、儲存晶片領軍者和控製器設計專家,三方分工明確!輝達提供AI工作負載需求與系統架構設計,SK海力士負責NAND快閃記憶體核心技術與製造,群聯電子則貢獻其企業級SSD控製器技術。“Storage Next”技術指標方面,性能目標是達到1億IOPS(每秒輸入輸出操作次數),這比當前的企業級固態硬碟性能提高了約十倍。從原型到商用的路線圖,開發處理程序怎樣呢?據說SK海力士已經出來了AI SSD的原型產品,但是我還沒有看到SK海力士向業界展示這項技術的初步成果,如果有知道更多內幕進展的朋友,可以空了分享一下。不過,在原型展示後,預計將有約一年的測試和最佳化期,重點驗證其在真實AI推理場景中的表現和可靠性。然後走向量產商用的方向上,各方目標是在2027年前後實現AI SSD的規模化量產和商業部署,屆時將開始實際應用於AI伺服器和資料中心。後續隨著產品成熟,輝達預計將逐步在其AI伺服器平台中整合這一新型儲存解決方案,形成完整的AI計算-儲存生態。填補“記憶體牆”與“儲存牆”之間的空白,找到架構突破口這款AI SSD最核心的創新在於其系統定位,它被設計為位於傳統記憶體與儲存之間的“類記憶體層”,在AI推理架構中承擔關鍵的資料緩衝角色。隨著AI模型參數規模的急劇膨脹,推理過程中需要即時調取海量資料,傳統的“記憶體-儲存”分層架構已顯疲態。一方面,高頻寬記憶體供給有限且價格昂貴。另一方面,傳統SSD雖然容量巨大,但延遲與IOPS表現不足以支援即時AI推理需求。AI SSD的出現正是為瞭解決這一兩難境地。它在系統中承擔了高效的資料預取和暫存功能,能夠大幅減少GPU等待資料的時間,從而提升整體推理效率。對於台灣的半導體產業而言,這次合作具有特殊意義。群聯電子加入AI SSD開發,是台灣記憶體業首度參與輝達新記憶體規格制訂,被視為產業的新里程碑。在此之前,台灣在DDR5、高頻寬記憶體等AI用高端儲存領域參與度有限,此次能夠進入核心開發圈,標誌著技術實力的認可和產業地位的提升。群聯之所以能獲得這個機會,可能主要得益於其在企業級與高性能儲存市場的長期深耕,其PCIe Gen5等級產品已能滿足高頻寬、低延遲的AI推理需求。值得注意的是,群聯的儲存方案已達到太空應用水準,曾隨SpaceX任務進入太空,其可靠性和耐用性已獲實際驗證。顯然,這也解釋了為何輝達會考慮其在太空資料中心應用方面的潛力。企業級SSD需求爆發的背後,驅動產業生態加速進化全球儲存觀察分析認為,AI伺服器對儲存的要求,正在重塑整個企業級SSD市場。雲服務商及大型AI企業對儲存裝置的需求持續上升,已使NAND快閃記憶體供應鏈承受較大負擔。據產業相關分析指出,AI伺服器中NAND硬碟的價值比重大約只佔2%,但這一比例隨著AI專用儲存的出現可能會發生顯著變化。從地域市場看,中國在AI基礎設施方面的投入尤為顯著。以2025年某一季度為例,阿里巴巴資本支出達到人民幣318億元,環比增長80%,並宣佈未來3年在雲和AI基礎設施上的投入將超過過去10年的總和。市場預測顯示,2026年中國企業級SSD市場規模有望達到人民幣669億元,2022-2026年復合年增長率約25%。毋庸置疑,這一增長很大程度上是由AI驅動的基礎設施建設所帶動。NAND市場面臨新壓力,供應鏈進化也將加速若AI SSD未來大規模部署,NAND市場可能出現類似當前DRAM的供應緊張局面。雲服務商與大型AI企業對儲存裝置的需求持續上升,已使NAND快閃記憶體供應鏈承受較大負擔。目前,支援AI推理的基礎設施投入正迅速增長,正在對半導體產業鏈結構產生深遠影響。在DRAM合約價格持續上漲的背景下,NAND市場的供需變化趨勢將成為接下來產業關注的重點。從競爭格局看,Solidigm和三星電子在中國企業級SSD市場的佔有率合計超過65%,而中國本土廠商的市場份額低於30%。這種市場格局,有望在AI SSD這一新興賽道上可能會發生改變。從地面到太空的計算藍圖,資料中心的競爭逐漸升空輝達推動AI SSD的發展,不僅是解決地面資料中心面臨的DRAM短缺問題,也著眼於長期的太空探索需求。太空資料中心和月球備份節點等高可靠應用需要效能更高、容量更大、耐用性更強的儲存解決方案,而AI SSD正好符合這些要求。這種前瞻性佈局反映了AI計算基礎設施發展的新趨勢,儲存不再僅僅是資料的靜態倉庫,而是成為計算流水線中動態、智能的參與者。全球儲存觀察分析認為,AI SSD所要求的高耐用、高可靠特性,與未來太空資料中心需求高度重疊,有需求必然就會有供給,有研發並進。群聯已經驗證的太空級可靠性經驗,可能成為其在這一波AI儲存升級中的重要優勢,但是不排除其他儲存控製器晶片廠商下一步將積極參與。儲存與計算的深度融合,潮流奔湧勢不可擋隨著AI計算範式的發展,儲存的角色正在發生根本性轉變。復旦大學的一個研究團隊前段時間開發的“破曉”皮秒快閃記憶體器件,其擦寫速度達到了亞1納秒(400皮秒),與電腦晶片的工作速度相當。這種底層技術的突破,與AI SSD的系統級創新形成了呼應,都指向一個共同的方向。是什麼呢?彌合儲存與計算之間的性能鴻溝,實現更緊密的協同。“破曉”儲存器件的研究者指出,他們同時也在探索儲存器本身具備AI矩陣運算能力的可能性,這暗示了未來儲存裝置可能會承載部分計算功能,進一步打破傳統的計算-儲存的分層分工。不叫AI SSD,叫太空SSD,可好?隨著這項技術從藍圖走向現實,AI計算的瓶頸正從單純的算力不足,轉向資料供給與處理能力的協同挑戰。傳統固態硬碟容量雖大但速度有限,高端記憶體快速卻昂貴稀缺,AI SSD瞄準的正是這兩者間的真空地帶。未來,當宇航員在月球基地呼叫地球上的AI模型,或者自動駕駛車輛即時處理海量環境資料時,他們可能不會意識到,支撐這些智能瞬間的,正是今天這場由輝達、SK海力士和群聯電子共同開啟的AI SSD儲存創新。由此,我又特別想給AI SSD取一個新名字,叫:太空SSD,可好?那麼,在AI SSD道路上,後來者還會有誰?期待中…… (全球儲存觀察)
美光豪擲 305 億新元:在新加坡建“雙層”晶圓廠,只為填補 AI 的儲存“無底洞”
2026 年 1 月 27 日,新加坡兀蘭(Woodlands)。 在推土機的轟鳴聲中,儲存巨頭 美光科技(Micron Technology) 正式啟動了其在新加坡最大的一筆單體投資。 面對 AI 帶來的“前所未有”的儲存需求,美光宣佈斥資 305 億新元(約 240 億美元) 擴建晶圓廠。這座新工廠不僅承載著美光對 NAND Flash 市場的野心,更試圖通過獨特的“雙層”設計,在有限的土地上最大限度地搾取產能,以緩解可能持續數年的供應危機。1. 核心動作:305 億新元與“雙層”工廠美光此次投資的規模和技術細節都顯示出其對未來市場的極度看好。巨額投資:總投資額高達 305 億新元。這是美光自 1998 年進入新加坡以來,累計投資額突破 600 億美元的重要里程碑。雙層設計:為瞭解決新加坡土地稀缺的問題,新工廠將是美光在新加坡的首座 “雙層(Double-Storey)” 晶圓製造廠。目的:最大化土地利用率,同時提供額外的 700,000 平方英呎(約 6.5 萬平方米)潔淨室空間。產能提升:這將使美光在新加坡的潔淨室空間增加 50%,為生產下一代最先進的 NAND Flash 提供物理保障。投產時間:工廠預計將於 2028 年下半年 投入營運,並創造約 1,600 個高技能就業崗位。[圖片:美光新加坡新工廠動土儀式]圖註:新加坡副總理顏金勇(Gan Kim Yong)與美光 CEO Sanjay Mehrotra 共同出席新廠動土儀式。這座工廠將成為美光全球 NAND 生產的核心樞紐。2. 投資驅動:AI 的“無限貪婪”與短缺危機美光為何敢於在 2026 年初下如此重注?因為 AI 對儲存的需求已經到了“不可理喻”的地步。前所未有的短缺美光 CEO Sanjay Mehrotra 在儀式上直言:“AI 驅動的儲存需求是前所未有的。”他指出,目前的儲存短缺預計將持續到 2026 年以後。 美光全球營運執行副總裁 Manish Bhatia 補充道,目前美光只能滿足客戶 50% 到 66% 的需求。這種巨大的供需缺口迫使客戶不得不從傳統的“一年一簽”轉變為簽署 “多年期供貨協議”,只為鎖定未來的晶片供應。戰略地位的躍升Mehrotra 強調:“隨著 AI 的擴展,記憶體和儲存不再只是系統中的元件,它們已成為絕對能釋放 AI 潛力的 戰略資產。” 新工廠將專注於生產用於資料中心的 NAND Flash。這些晶片將被組裝成高性能 SSD,為訓練生成式 AI 模型提供海量且高速的資料吞吐能力。新加坡目前是美光 NAND Flash 的主要生產基地,貢獻了公司約 20% 的營收。3. 輔助資訊:地緣政治下的“避風港”除了商業邏輯,新加坡的 地緣政治穩定性 也是美光加碼投資的關鍵。 新加坡副總理 顏金勇 表示,在地緣政治緊張和供應鏈中斷頻發的當下,新加坡定位為 “值得信賴的樞紐”。美光選擇在這裡錨定其關鍵的 NAND 製造,正是看中了這種在全球動盪中依然保持“中立與穩定”的特質。目前,新加坡在全球半導體供應鏈中扮演著關鍵角色,生產了全球 10% 的晶片和 20% 的半導體裝置。「橙芯」視點1. “雙層工廠”:摩爾定律的另一種延續當電晶體微縮變得越來越難時,半導體製造開始在宏觀層面尋找空間。美光的“雙層晶圓廠”設計,本質上是在寸土寸金的新加坡通過 物理堆疊 來換取產能。這與 HBM 在微觀上堆疊 DRAM 的邏輯如出一轍——向天空要空間,已成為半導體行業解決物理限制的通用法則。2. 只有一半需求被滿足的恐怖美光高管透露“只能滿足一半需求”,這是一個令人毛骨悚然的訊號。這意味著,對於下游的伺服器廠商和雲服務商來說,即使有錢也買不到貨。這種極端的賣方市場將賦予儲存原廠極強的定價權,2026 年的儲存價格暴漲(如三星 NAND 翻倍)才剛剛開始,遠未結束。3. “戰略資產”的新定義美光 CEO 將儲存定義為“戰略資產”而非“元件”,這標誌著儲存晶片在 AI 時代的地位重估。就像石油之於工業革命,高性能儲存(HBM/eSSD)就是 AI 時代的石油。誰掌握了產能,誰就掌握了 AI 發展的命門。互動探討美光的新工廠要到 2028 年才能投產,而目前的 AI 需求缺口高達 50%。在未來兩年的“至暗時刻”,您認為雲服務商會因為買不到 SSD 而放緩 AI 模型的訓練速度,還是會不惜一切代價搶購現有庫存,從而將儲存價格推向歷史新高? (橙芯視界)
TrendForce:AI引發“根本性變革”,儲存行業收入暴漲將延續至2027年
TrendForce集邦諮詢指出,AI創新使得儲存器成為AI基礎設施的關鍵元件。TrendForce預計,儲存器市場規模將從2026年的5516億美元飆升至2027年的8427億美元,同比增長53%,其中DRAM需求增速遠超NAND快閃記憶體。rendForce集邦諮詢認為儲存器市場正在經歷由人工智慧創新引發的根本性轉變。1月22日,TrendForce集邦諮詢最新研究表明,隨著資料訪問量持續增長,AI系統對高頻寬、大容量、低延遲DRAM的依賴顯著加深,而NAND快閃記憶體在快速資料傳輸中的作用也日益凸顯,使儲存器成為AI基礎設施的關鍵元件。受產能受限及配額需求上升推動,儲存器價格持續攀升,行業收入屢創新高。DRAM歷史上單季度價格漲幅峰值約為35%,但去年第四季度因DDR5需求強勁,DRAM價格跳漲53%至58%。TrendForce預計今年第一季度漲幅將超過60%,部分品類價格接近翻倍,看漲勢頭預計將持續至未來三個季度。此外TrendForce預計,儲存器市場規模將從2026年的5516億美元飆升至2027年的8427億美元,同比增長53%。DRAM需求增速遠超NAND快閃記憶體2025年初,DRAM市場受地緣政治緊張和宏觀經濟不確定性影響,終端市場情緒低迷,消費應用復甦尤其受阻。但隨著市場在下半年趨於明朗,北美雲服務提供商大幅提高資本支出,AI伺服器的快速部署和儲存器採購的大幅增加引發新一輪價格上漲。在資料訪問需求激增的推動下,DRAM需求增速遠超其他品類。TrendForce預測2025年DRAM市場收入將達到1657億美元,同比增長73%,顯著超過同期NAND快閃記憶體的697億美元收入。這一差距促使供應商在生產策略中更加側重擴大DRAM產能。TrendForce預計2026年DRAM市場收入將達到4043億美元,同比激增144%。NAND快閃記憶體價格受AI Agent驅動上行NAND快閃記憶體市場的強勁增長動力不可小覷。輝達在2026年國際消費電子展上表示,AI正從根本上重塑整個計算堆疊。隨著生成式AI向具備長期推理能力的智能體系統發展,AI智能體需要頻繁訪問大規模向量資料庫以支援檢索增強生成。這些任務涉及大型資料集和高度隨機的訪問模式,大幅提升了對高IOPS企業級固態硬碟的需求。這一變化預計將進一步推高NAND快閃記憶體價格。TrendForce預測第一季度價格將環比上漲55%至60%,並在全年保持上行趨勢。2026年NAND快閃記憶體市場收入預計將同比跳增112%,達到1473億美元。供應緊張持續至2027年在整個儲存器市場,供應緊張狀況沒有緩解跡象,定價權牢牢掌握在供應商手中。TrendForce強調,AI熱潮正在硬體堆疊、系統架構和軟體層面全面推進,使儲存器成為AI計算中不可替代的關鍵元件。在AI伺服器、高性能計算和企業儲存的持續需求支撐下,DRAM和NAND Flash的合約價格預計將持續上漲至2027年。因此,儲存器行業的收入增長預計將持續擴大至2027年,鞏固其作為AI時代核心受益者的地位。 (invest wallstreet)