#SSD
從HBM到SSD:被嚴重低估的AI儲存長周期邏輯
最近市場的不確定性很高,確實也很難做。目前市場上共識性比較強的就是光和儲存,應該說光的共識性是遠大於儲存的,儲存現在已經有很多的爭議了,上周儲存的回呼也比較大,即便市場都在解釋Google的那個TurboQuant論文,還是沒能擋住閃迪、三星、美光和鎧俠的大幅回呼, 甚至花旗還給出了下調美光的分析報告。這些都是AI Memory長周期的一部分,我們只需要知道當前Memory依舊稀缺,AI需求依舊旺盛即可。這篇文章,我們來看下,為什麼這波儲存周期被低估了。一個重度使用者每天要“吃掉”多少儲存先從最基本的問題開始:當一個程式設計師每天用 Claude Code 或者 Cursor 瘋狂寫程式碼時,背後的資料中心到底需要準備多少儲存空間?行業裡有個不成文的定義,日均消耗 1000 萬 tokens 的使用者,被稱為 Power User——重度使用者。這個數字聽起來很抽象,但換算成儲存需求就具體多了。整個計算鏈條是這樣的:1000 萬 tokens 對應大約 40MB 的純文字資料,這只是起點。這些文字需要被轉換成向量嵌入索引,用於 RAG 檢索,這一步會膨脹到 30GB 左右。再加上會話狀態、agent 執行日誌,以及出於安全考慮的三副本複製機制,最終一個重度使用者每天會產生 50 到 100GB 的 SSD 儲存需求。普通使用者呢?日均 100 萬 tokens,對應的儲存需求大約是 12GB,恰好是重度使用者的十分之一。這個比例關係在訪談中被反覆驗證,基本是個行業共識。有意思的地方在於並行場景。很多人的第一反應是:10 個重度使用者就是 500GB 到 1TB,100 個使用者就是 5TB 到 10TB。但實際情況要複雜一些。AI 系統通過“共享倉庫索引”機制,可以讓多個使用者共享基礎資料,只為每個使用者單獨儲存會話狀態。所以並行使用者的儲存需求增長不是線性的,而是被最佳化過的。但這個最佳化空間也是有限的。當 token 總需求持續上升,當越來越多的應用從單一 agent 變成多 agent 協作,儲存壓力就會快速累積。一個簡單的查詢,在 Claude Code 這樣的工具裡,可能會同時呼叫 4 到 5 個 agent,一個負責寫程式碼,一個負責審查,一個負責測試,一個負責最佳化。每個 agent 都有自己的狀態儲存需求,這就是為什麼程式設計 agent 的儲存消耗遠超普通對話應用。多模態時代的儲存爆炸如果說文字程式設計已經讓儲存需求翻了好幾番,那多模態應用帶來的衝擊就是另一個量級了。從文字到音訊,儲存需求增長 10 倍;從音訊到視訊,再增長 100 倍。一分鐘的視訊內容,儲存體積是同樣時長文字的 10000 倍。這不是危言聳聽。想想 Claude 的截圖分析功能,想想各種 AI 視訊生成工具,想想那些正在路測的自動駕駛系統。這些應用產生的資料,不僅體積龐大,而且全都是熱資料,必須隨時可以被快速讀取。這些資料能不能放到便宜的機械硬碟(HDD)裡?答案是不能。至少在推理場景下不能。HDD 只適合冷歸檔,比如你一年前在 Claude Code 裡問過的某個問題,如果長期不再訪問,系統可能會把它挪到 HDD。但當你需要呼叫這段歷史記錄時,就會明顯感覺到載入延遲。所有需要即時響應的資料,都必須放在 SSD 上。這是 AI 推理和傳統資料儲存的本質區別。儲存的四層金字塔如果把 AI 系統的儲存比作人的記憶系統,那麼它有四層結構,每一層都有自己的角色。最頂層是 HBM,高頻寬記憶體,直接焊在 GPU 上。這是最貴、最快、容量最小的那一層,專門用來儲存模型權重。一顆 H100 GPU 有 90GB 的 HBM,8 顆加起來也就 800GB 左右。這就是 AI 系統的“工作記憶”,處理眼前任務的核心空間。第二層是 DRAM,也就是伺服器記憶體。它的容量通常是 HBM 的 4 到 5 倍,主要用來儲存 KV cache——那些在對話過程中需要頻繁呼叫,但又不至於佔用 GPU 核心空間的資料。這是“短期記憶”,你今天跟 AI 說過的話,大機率就存在這裡。第三層是 SSD,容量從 1TB 到 15TB 不等,取決於伺服器配置。這是“長期記憶”,用來儲存 RAG 檢索需要的知識庫、使用者的歷史會話、agent 的執行狀態。雖然速度比 DRAM 慢,但容量大、成本相對可控,是推理場景下的主力儲存。第四層是 HDD,只在訓練資料歸檔和冷備份場景下出現。在推理環節,它基本是隱形的。一個兆參數的模型,如果用 INT4 精度運行,需要 500GB 的 HBM、700 到 800GB 的 DRAM,以及 5TB 的 SSD。這套配置可以跑到 1000 tokens 每秒的推理速度。至於這 1000 tokens/s 怎麼分配,可以是 1000 個使用者每人 1 token/s,也可以是 10 個使用者每人 100 tokens/s,完全取決於應用場景。這裡順便提一下 DeepSeek 的 engram 方法和 Google 的 TurboQuant 技術。它們的核心思路是把一些靜態的事實性知識從 DRAM 挪到 SSD,或者把 KV cache 壓縮 4 到 6 倍,從而釋放更多的 HBM 和 DRAM 空間。但都是Jevons 悖論,已經有很多人解釋過了,這裡不再贅述。200 到 300EB 的需求從那裡來現在我們把視角拉到整個行業。根據JPM的資料,2026 到 2027 年,全球超大規模雲服務商(Hyperscaler)的 SSD 需求預計會達到 200 到 300 EB。這是個什麼概念?如果按照前面算的重度使用者每天 100GB 來估算,200EB 可以支援 200 萬個重度使用者持續工作 1000 天。當然實際需求的構成要複雜得多。200 到 300EB 可以拆成下面幾個部分:訓練檢查點佔了 50% 到 60%。大模型訓練動輒幾個月,中間需要不斷保存 checkpoint,防止訓練中斷後從頭再來。這些 checkpoint 檔案體積驚人,而且必須用 SSD 儲存,因為恢復訓練時需要快速載入。RAG 資料湖佔 10% 到 15%。越來越多的企業開始把自己的知識庫接入 AI 系統,這些資料需要被向量化、索引化,然後儲存在高速儲存裡,隨時準備被檢索呼叫。剩下的部分,一部分是資料複製和安全備份(通常是三副本機制),一部分是多模態推理狀態——這是增長最快的那塊。更值得關注的是 AI 在整個 Memory 市場中的佔比變化。2023 年,AI 相關需求只佔 DRAM 總市場的 9%,到 2026 年這個數字會飆升到 37%,2028 年預計達到 53%。NAND 快閃記憶體的趨勢類似,從 2023 年的 2% 增長到 2026 年的 32%,2028 年預計 41%。換句話說,AI 正在從一個邊緣應用場景,變成 Memory 行業的主導力量。按照JPM的資料:2024 到 2028 年,AI DRAM 的價值 TAM(Total Addressable Market)年複合增長率是 105%,而非 AI DRAM 只有 51%。這是兩倍的增速差距。市場可能低估了幾個供給側的約束因素。比如 fab廠的物理空間限制,擴產不是想擴就能擴的;比如 HBM 的損耗率,每一代工藝升級都會帶來良率挑戰;比如 agent 應用的爆發,可能會帶來超預期的儲存需求;比如物理 AI(機器人、自動駕駛)的模型訓練和部署,需要的儲存量遠超純軟體 AI。從更長的時間維度看,AI 對 Memory 行業的改變不只是需求量的增長,更是商業模式的轉型。過去 Memory 是典型的 commodity(大宗商品),價格隨供需周期劇烈波動,廠商沒有定價權。但現在 HBM、SOCAMM、eSSD 這些產品越來越定製化,需要和客戶深度繫結,聯合設計,這就從 commodity 變成了 customized solution(定製化解決方案)。這種轉變如果能夠持續,Memory 廠商的利潤率中樞會被抬升,周期波動的幅度會被熨平,估值體系也會隨之重構。這才是這輪 AI 浪潮對 Memory 行業最深層的影響。最後放一個今天“HBM之父”的觀點,當然可能由於屁股決定腦袋,他的觀點比較激進,僅供大家參考。 (傅里葉的貓)
瘋狂的儲存晶片,史無前例
三星18日召開年度股東大會,共同執行長兼記憶體晶片事業負責人全永鉉表示,AI資料中心投資成長,正帶動記憶體業進入「史無前例的超級循環」。三星表示,代理AI的實用價值正帶動使用者數快速成長,推升客戶需求,導致不只是高頻寬記憶體(HBM),連固態硬碟(SSD)及用於伺服器的其他晶片的訂單,都出現爆發式成長,並示警記憶體漲價可能影響電腦與手機出貨量。全永鉉認為,隨著AI需求日增,以及其造成的記憶體供應持續短缺,預期商業環境將維持對三星有利。三星看好AI熱潮將帶動今年記憶體需求持續強勁,正與大客戶協商,將記憶體供應合約從目前「季約」或「年約」,轉向三至五年期的「多年合約」,以提高晶片事業的可預測性和穩定性,幫助穩定供應並緩解對關鍵零件短缺的擔憂。全永鉉不忘提醒風險仍然存在,強調包括全球總體經濟環境的不確定性,例如關稅問題及以對整機業務(電視、手機和家電產品)造成成本負擔。美光科技打破紀錄全球第三大儲存半導體公司美國美光科技公佈了2026財年第二季度(2025年12月至2026年2月)創紀錄的季度營收。營收較上年同期增長近三倍,超出市場預期。美光科技於當地時間18日公佈,2026財年第二季度營收達238.6億美元(約合35.9093兆韓元),較上年同期(80.5億美元)增長2.96倍,較上一季度(136.4億美元)增長1.75倍。該資料遠超市場研究機構倫敦證券交易所集團(LSEG)此前預測的200.7億美元。在此期間,美光科技按照通用會計準則(GAAP)計算的營業收入為161.35億美元(約合24.2832兆韓元),較上年同期(17.73億美元)增長810%。相應地,營業利潤率(P)在一年內提升了45.6個百分點,從22.0%升至67.6%。調整後每股收益(EPS)為12.2美元,同比增長682%,遠超華爾街預期的9.31美元。按業務部門劃分,收入總計:雲端儲存77.49億美元、核心資料中心56.87億美元、移動和客戶端77.11億美元、汽車和嵌入式27.08億美元。美光科技預計下一季度營收為335億美元(誤差範圍為±7.5億美元;約合50.4175兆韓元)。該公司預計調整後每股收益為19.15美元,高於市場預期的12.05美元。在財報發佈前夕,美光宣佈已開始量產並出貨第六代高頻寬記憶體(HBM4)。此舉恰逢輝達年度開發者大會(GTC 2026)開幕,也徹底駁斥了近期關於“Vera Rubin晶片將不被採用”的傳言。此前,一些半導體行業人士曾表示,三星電子和SK海力士的HBM4將被用於輝達今年即將發佈的Vera Rubin人工智慧(AI)晶片。而美光則表示,其HBM4是“專為輝達Vera Rubin晶片設計的”。美光首席執行長桑傑·梅赫羅特拉表示:“憑藉強勁的需求、行業供應緊張以及我們卓越的執行力,我們在2026財年第二季度所有領域均創下歷史新高,包括營收、毛利率、每股收益和自由現金流。”他補充道:“我們預計第三季度將再次打破多項紀錄。”他還表示:“在人工智慧時代,儲存器已成為客戶的戰略資產,我們正在投資全球製造工廠,以滿足客戶日益增長的需求。”最後,他補充道:“鑑於對公司業務持續增長的信心,董事會決定將季度股息提高30%。”記憶體晶片短缺或將持續到2030年SK海力士CEO崔泰元警告稱,全球儲存晶片短缺可能持續數年,結構性供應限制很可能延續到下一個十年。他在聖何塞舉行的輝達GTC 2026大會間隙表示,晶圓產能有限仍然是半導體行業的關鍵瓶頸。Chey表示:“短缺源於晶圓產能不足,而獲得額外的晶圓供應至少需要四到五年時間。我們預計到2030年,整個行業的供應缺口將持續超過20%。”他補充說,SK海力士正在實施調整生產計畫和拓展供應商合作關係等舉措來穩定價格。首席執行長郭魯正預計將就這些應對記憶體晶片短缺引發的價格波動的新措施提供更多細節。儘管面臨越來越大的壓力,需要將生產規模擴大到海外,但崔強調,集團將優先發展國內生產,以更好地應對持續的記憶體晶片短缺問題。他表示:“無論在韓國以外的地方建廠,所需時間都一樣。韓國已經擁有完善的基礎設施,可以更快地做出反應。”他還強調了在國外建設製造工廠所面臨的挑戰,包括需要可靠的電力和水供應,以及獲得熟練的工程人才。關於高頻寬記憶體市場的競爭,Chey指出,人工智慧驅動的需求增長正在重塑供應格局。“人工智慧需要圖形處理器(GPU),而GPU需要HBM。我們將竭盡全力,”他說道,同時他也警告說,過度關注HBM可能會加劇智慧型手機和個人電腦中使用的傳統DRAM記憶體晶片的短缺。最瘋狂時代來了「有多少產能,輝達全包了!」輝達執行長黃仁勳在摩根士丹利大會上的霸氣喊話,揭開了記憶體產業史上最瘋狂的序幕。這場由HBM(高頻寬記憶體)點燃的戰火,正讓全球科技業陷入一場空前的搶貨風暴。HBM產能黑洞:結構性缺貨席捲全球隨著AI 模型從雲端訓練走向地端推論,記憶體不再只是附屬零件,而是決定算力勝負的「戰略物資」。雪上加霜的是,全球HBM 龍頭三星電子面臨史上最大規模罷工危機,消息一出,已讓三級跳的記憶體價格沖上雲霄。筆電大廠微星總經理黃金請直言:「這是創立以來最嚴峻的一年。」過去董座親自出馬就能要到貨的時代已不復見,現在即便是大廠負責人親自上門,也常換來一句「真的沒貨」。這場缺貨亂象,反映了AI 需求遠超預期,正深刻檢視台廠的應變真本事。20年一遇的巨變:從景氣循環走向「戴維斯連按兩下」回顧過去20年,記憶體產值從2005 年的480 億美元,到2025 年衝破2,100 億美元。過去被視為低毛利的景氣循環股,如今在AI 助攻下迎來「戴維斯連按兩下」:EPS 隨價格噴發,本益比也因戰略地位提升而獲得修復。為了卡位AI,三星、SK 海力士與美光三大巨頭在2026 年同步展開擴廠競賽,單家年投資額均突破200 億美元。然而,HBM 生產過程複雜且排擠傳統DDR4 產能,加上3D NAND 技術門檻拉高,新產能到位至少需兩年,短期內供需失衡已成定局。台廠攻城掠地:趁巨人轉身卡位新藍海當三大巨人轉身投入高單價的HBM 戰場,留下的傳統產品空檔,正是台廠大展身手的時刻。威剛:董事長陳立白憑藉精準的市場嗅覺,提前佈局350 億元高水位庫存,老神在在地預言:「下半年NAND 將由小缺貨轉為大缺貨。」群聯:執行長潘健成積極撕掉模組廠標籤,推出aiDAPTIV+ 等系統方案,將NAND 儲存進化為突破算力瓶頸的關鍵。南亞科與華邦電:兩大廠一改保守,豪擲千億擴產。南亞科推客制化UWIO 技術追求高價值;華邦電則以CUBE 技術鎖定邊緣AI 的低功耗商機。焦佑鈞董事長更看好這波熱度將一路旺到2028 年。理性競爭年代:是長紅還是泡沫?南亞科總經理李培瑛觀察,過去那種致人於死的產能殺戮戰已成歷史,產業正進入「理性競爭」新階段。然而,在一片樂觀聲中,市場仍有冷靜的聲音。法人分析師則警示,傳統型記憶體終究具循環性,一旦大廠產能回流,價格修正往往快又急。更關鍵的是,AI 基礎建設的高投入能否轉化為實質營收?若終端應用獲利跟不上算力投資,當前飛上雲端的股價與擴產潮,恐將面臨嚴峻的商業本質檢驗。記憶體最狂時代已然來臨,台廠能否趁勢重新定義全球戰略位置,不僅取決於產能,更取決於這場AI 賽局中,誰能真正端出獲利成績單。 (EDA365電子論壇)
重磅!美光最新突破!
在退出消費級記憶體和固態硬碟(SSD)市場之後,美光把重點轉向了企業級市場,尤其是在人工智慧(AI)領域加大了投入。當地時間3月3日,美光宣佈推出業界首款單條256GB SOCAMM2記憶體模組,已向客戶啟動出樣及出貨。該產品搭載全球首款單晶片32Gb LPDDR5X DRAM顆粒,實現儲存技術新突破。SOCAMM2 是一種專為資料中心、高性能計算和人工智慧設計的低功耗記憶體模組。它基於 LPDDR5/5X 的標準,結合了 CAMM 的模組化設計,未來還有望支援 LPDDR6。這個技術最大的優點就是省電、節省空間,而且維護起來也方便。它正好填補了 HBM(高頻寬記憶體)和傳統 DDR 之間的性能和成本空缺。相較前代最高容量192GB SOCAMM2,該產品容量提升約三分之一。在8通道單路伺服器中,可支援2TB系統記憶體配置,適配12通道雙路伺服器時更可拓展至6TB系統容量,助力AI伺服器輕鬆處理超長上下文窗口與複雜推理任務。美光還表示,在處理長文字的大型語言模型推理任務時,他們讓第一個字生成的時間快了2.3倍。而在單獨使用CPU的應用中,能效提升了最多3倍。目前美光正與輝達緊密合作開發下一代記憶體解決方案,輝達下一代AI超級計算平台Vera Rubin將成為首批採用該記憶體標準的產品之一。該記憶體模組計畫在GTC 2026大會上正式展出。 (半導體技術天地)