#儲存晶片
中國儲存,第一次真正坐上全球牌桌
一、中國國產儲存,真的進入實戰了嗎?過去很多年,“國產替代”更多是一個敘事概念。但這一次不一樣。AI 拉動資料中心需求,高端儲存供給緊張,全球廠商開始重新評估供應鏈安全。在這種背景下,國產儲存第一次進入一個關鍵狀態——它們不再只是政策敘事中的角色,而是被全球客戶當成“真實備選項”。問題來了。這是階段性窗口,還是結構性變化?二、先說清楚:NAND 和 DRAM 根本不是一個難度等級1️⃣ 長江存儲:NAND 的真實位置在 NAND 領域,長江存儲 已經具備成熟產品線與規模量產能力。Xtacking 架構讓其在成本與性能之間取得了平衡。但要冷靜。高端伺服器級 NAND、全球頭部客戶的長期穩定驗證、供應鏈連續性,這些才是真正的門檻。技術“能做出來”,和“全球客戶敢押注”,是兩回事。它現在的位置更接近——有資格參與競爭,但還不是規則制定者。2️⃣ 長鑫存儲:DRAM 的難度更高長鑫存儲 所在的 DRAM 賽道,比 NAND 更殘酷。全球長期格局由Samsung Electronics、SK Hynix、Micron Technology 三家主導。DRAM 拼的不是某一代技術突破,而是持續製程迭代、良率、資本強度與生態繫結。長鑫的現實意義,不在於短期挑戰三星。而在於——它改變了全球 DRAM 定價的“唯一性結構”。當全球買家多了一個選項,價格博弈就開始鬆動。這是結構變數。三、真正的訊號:誰開始認真看待它們?這輪變化的關鍵不在技術報告。而在於——國際 OEM 是否開始做第二供應商認證。一旦開始認證,就意味著兩件事:它們被視為可交付產品它們進入真實競爭序列供應鏈的邏輯很簡單:沒有人會把“象徵性公司”納入驗證流程。驗證,是時間成本。也是戰略訊號。但別過度解讀。認證 ≠ 大規模替代。這只是入場券。四、真正的考驗:連續交付能力技術突破可以是一次性的。市場信任必須是連續的。未來 12 個月,真正決定國產儲存位置的不是某一代產品發佈,而是:良率是否穩定擴產是否可持續裝置限制下的工藝升級能力現金流與資本強度儲存是資本密集型行業。沒有持續投入,就沒有技術節奏。沒有技術節奏,就沒有議價權。五、三種可能路徑(未來 12 個月)路徑一:穩步擴大份額進入更多中端產品成為價格緩衝變數全球客戶增加結構配置這是最現實路徑。路徑二:政策變數加劇如果裝置進一步受限,技術追趕節奏可能放緩。行業進入更強“內循環模式”。路徑三:AI 高端市場繼續拉開距離HBM 與高端 DRAM 生態形成封閉優勢。國產儲存在高端 AI 伺服器市場參與度有限。結構分層加深。六、真正的結論國產儲存已經從“情緒變數”,變成“結構變數”。它們確實坐上了牌桌。但距離制定規則,還有距離。這不是否定。這是階段判斷。 (卡拉瓦喬的網路日誌)
Google一篇論文,帶崩全球儲存晶片股!中國學者實名“打假”:用了我們的方法,卻不承認
3月26日,Google研究院發表了一篇論文,全球儲存晶片市場應聲大跌——美國和韓國巨頭一夜之間蒸發超900億美元市值。引發這場“血案”的,是一個叫 TurboQuant 的新演算法。Google宣稱,它能在幾乎不損失精度的前提下,把AI大模型的記憶體佔用壓縮到原來的1/6。論文發表僅一天後,一位中國學者在社交媒體公開“開火”:“Google的論文存在嚴重學術問題,明知有錯卻不改,還刻意迴避與我們方法的相似性。”這位學者叫高健揚,目前是蘇黎世聯邦理工學院的博士後。他在新加坡南洋理工大學讀博期間,曾發表過一個叫 RaBitQ 的向量量化演算法。01. “Google主動找我們幫忙偵錯程式碼”高健揚說,早在2025年1月,Google論文的第二作者就主動聯絡過他,請他幫忙偵錯自己基於RaBitQ程式碼翻譯的Python版本,還詳細描述了復現步驟和報錯資訊。“這說明他們對我們方法的技術細節非常瞭解。”高健揚說。但2025年4月Google論文正式發佈後,高健揚發現,論文中對RaBitQ的描述嚴重失實:把RaBitQ的核心技術說成別的東西,反而忽略了自己最關鍵的設計,在沒有證據的情況下,說RaBitQ的理論保證“不如他們的”實驗對比故意設定了不公平的條件02. 溝通一年對方只是“最小限度讓步”發現問題後,高健揚團隊從2025年5月開始與Google論文作者郵件溝通。對方第二作者表示已把意見轉告給全體作者。但當高健揚要求修正論文中的事實錯誤後,對方就不再回覆了。2025年11月,高健揚發現這篇論文被AI頂會ICLR 2026接收,裡面的錯誤內容一字未改。他聯絡了會議主席,沒得到回應。今年3月,Google通過官方管道大規模推廣這篇論文,高健揚再次給全體作者發郵件。這次對方回覆了——但只同意修正理論描述和實驗條件,明確拒絕討論方法論的相似性,而且承諾只在會議結束後才改。03. “核心像一道菜的完整食譜”高健揚用一個比喻來解釋兩者的相似性:一位廚師率先公開發佈了一道菜的完整食譜。另一位廚師後來做了一道菜,用了幾乎一樣的關鍵步驟,卻在介紹中把前者說成“做法不同、效果較差”的另一道菜,對兩者的聯絡隻字不提。讀者在不知情的情況下,根本無法做出公正判斷。但Google作者在最終版本中,不但沒有補充討論,反而把原本正文中對RaBitQ的不完整描述移到了附錄。04. “小型團隊很難與Google抗衡”為什麼不繼續通過學術管道解決,而是選擇公開?他們先後聯絡了論文作者、會議主席、倫理委員會,也提交了正式投訴,並在公開評審平台發佈了評論。“但我們是一個小型高校團隊,對方是Google研究院。在資源、影響力和話語權上,完全不對等。”Google論文在社交媒體上的相關瀏覽短時間內達到數千萬次——這是任何高校實驗室都不可能做到的。05. 如果不更正,會有什麼後果?龍程認為,如果不修正,至少帶來三個問題:扭曲學術史:後來的研究者會誤判技術源頭,在錯誤的基礎上繼續研究。打擊原創:一個經過嚴格理論推導的高品質方法,被重新包裝後以千萬級曝光推向公眾,原創者卻得不到應有的認可。誤導產業:向量量化是工業界高度關注的方向,不精準的方法歸屬會讓從業者選錯技術路線。06. 接下來怎麼辦?高健揚和龍程表示,他們會在學術平台發佈詳細的技術報告,系統梳理兩者的真實關係。同時繼續通過正式管道向Google研究申訴理事會反映。“我們的目標從來不是製造對立,而是讓學術記錄精準地反映各方法之間的真實關係。”這場爭議裡,有一個細節值得所有人留意:Google論文的問題,歸根結底不是演算法好壞,而是如何精準描述自己的工作、如何恰當地引用前人的貢獻——這恰恰是學術寫作中最基礎、也最容易出錯的環節。 (科研轉運站)
【中東戰局】韓國儲存晶片業面臨重大風險:以色列溴供應處於伊朗襲擊半徑內
美伊以衝突導致卡達天然氣設施受損,其天然氣副產品氦氣供應出現了短缺訊號,導致市場擔憂這一關鍵材料將限制全球半導體的生產。然而,除了氦氣之外,市場忽略了另一個致命風險。溴是專業化學品供應商生產半導體級溴化氫氣體的原材料,韓國公司在所有動態隨機存取儲存器(DRAM)和NAND快閃記憶體晶片生產中,離不開這一關鍵氣體。目前,韓國記憶體巨頭三星和SK海力士合計佔到全球DRAM市場約70%的份額,是全球市場的關鍵供應方,但其97.5%的溴進口來自以色列。全球其他的溴供應商也無多餘產能可以替代以色列的空白,這讓以色列的供應至關重要。由於DRAM和NAND是所有現代計算裝置的基礎,溴供應中斷的影響將波及整個消費電子和工業電子產業鏈,甚至是國防行業。危險程度以色列跨國公司ICL集團是溴的核心生產商,其利用含溴量極高的死海完成生產,並做到了全球最低的成本。以色列與約旦合計佔到全球溴供應量的三分之二。但由於生產加工的便利性,ICL將溴提取和溴化氫氣體轉化綜合設施設定在死海附近的索多姆,距離伊朗過去三周襲擊的內蓋夫沙漠不到35公里,處於伊朗的導彈打擊範圍之內。另一方面,雖然以色列不走荷姆茲海峽運輸溴,而是從海法和阿什杜德等地中海港口經波斯灣出口,但這條路線同樣存在胡塞武裝控制紅海的風險。雖然目前伊朗並未對以色列的溴工業進行打擊,紅海航道也仍在正常進出,但以色列運輸行業已經看到成本上漲。船舶停靠以色列港口的戰爭風險保險費已從船舶價值的0.2%上漲至0.7%至1.0%,這意味著一艘中型貨船每次航行將增加高達50萬美元的成本。即使船舶的航線並非途經紅海而是地中海,只要船舶停靠以色列港口,這些保險費用就會立即生效。這將大大增加以色列出口貨物的成本,從而引發下游一系列產品漲價的連鎖反應。這對本已大幅漲價的記憶體行業來說無疑是雪上加霜。可怕後果成本的問題相比起來還只是小問題,由於溴化氫在先進技術中的不可替代性,一旦該材料陷入短缺,記憶體生產商將被迫調整產線目標,極大可能優先生產利潤率更高的人工智慧高頻寬記憶體,這將再次擠壓傳統記憶體的供應。而傳統記憶體是手機、個人電腦、筆記型電腦和資料儲存的核心配件。目前記憶體已經佔到中端智慧型手機材料成本的15%到20%,繼續漲價將對終端消費者產生巨大的打擊。與此同時,最壞情況下人工智慧資料中心也會受到影響。SK海力士是輝達Blackwell和Rubin兩代晶片的記憶體供應商,而輝達又是微軟、亞馬遜、Google和Meta等公司資料中的晶片供應商。韓國記憶體能否按時交貨將是美國人工智慧資料中心能否順利建設投產的關鍵變數,而其又取決於以色列ICL工廠會否被伊朗打擊這一不確定因素,這讓整個人工智慧行業的投資前景變得十分脆弱。這條供應鏈上的參與者或許可以通過遠期合約、增加庫存以及尋找其他地方的溴來提前預防,但上述措施均只能支撐幾個月的時間,完全消弭風險需要以色列在其他地區尋找新的溴生產基地,或者將其轉移出以色列,而這往往需要幾年的時間。更可怕的是,市場尚未充分意識到這種風險。 (財聯社)
創A股新紀錄!淨利增長6714%
市場反彈之際,全球儲存晶片股成為先鋒。隔夜,美股儲存巨頭閃迪暴漲近12%,股價創下了歷史新高;今天,韓國SK海力士暴漲逾7%,首次站上110萬韓元關口。這股熱潮也順利傳導A股,儲存晶片類股出現多股漲停,有個股盤中創歷史新高。其中,半導體裝置ETF易方達(159558)今日上漲3.27%,近5日漲幅11.9%。01. 業績驗證持續火熱的儲存晶片漲價潮,在業績期得到了驗證。根據相關上市企業披露的資料,儲存分銷龍頭香農芯創預計2026年Q1歸母淨利潤11.4億至14.8億元,同比增長6714%至8747%,一個季度的盈利就達到2025年全年的兩倍還多,創下A股一季報預增紀錄新高;德明利預計Q1歸母淨利潤31.5億至36.5億元,由上年同期虧損6908.77萬元轉為巨額盈利,營收同比增長483%至523%;海外方面,三星電子Q1營業利潤同比大增755%至約57.2兆韓元,銷售額同比增68.1%,雙雙創歷史新高。SK海力士在投資者會議上表示,記憶體市場已轉向賣方市場,公司庫存僅約4周,難以滿足全部客戶需求。而且,這場漲價潮並沒有消退的跡象。據TrendForce集邦諮詢資料,進入Q2,儲存價格仍在上行,預計DRAM環比漲58%至63%,NAND Flash環比漲70%至75%。三星電子Q1將DRAM合約價上調100%後,Q2再度上漲30%,兩季度合計漲幅高達130%。同時,另外一條關於儲存晶片行業的重要新聞也刷屏了。閃迪已開始與材料、元件和裝置合作夥伴接洽,以建構HBF(高頻寬快閃記憶體)原型生產線的生態系統,計畫於2026年下半年推出原型產品,目標在2027年實現商業化量產,試點生產線預計下半年建成並在年底前後投入營運。作為AI算力的核心儲存(HBM),閃迪HBF的產線建設也是AI需求持續高位的證據。更重要的是,這場起於儲存領域的漲價潮,正在蔓延至全產業鏈。從上游儲存晶片、模擬晶片、功率器件,到中游晶圓代工、封測,再到下游雲端運算、資料中心和消費電子產品,數十家廠商密集發佈漲價通知,部分品類漲幅超過100%。儲存封測端也出現產能滿載跡象,力成、華東、南茂等儲存封測廠訂單湧進,產能利用率直逼滿載,近期陸續調升封測價格,漲幅上看三成。雲端運算方面,阿里雲、百度智能雲將於4月18日起同步上調AI算力及儲存產品價格,最高漲幅達34%。02. 傳導路徑儲存晶片持續漲價,對整個半導體類股的傳導路徑非常清晰:漲價潮→企業盈利改善→擴產意願增強→資本開支增加→裝置、原材料、零部件、配套等訂單增加其中,對於裝置類股的傳導邏輯,主要集中在資本開支增加和裝置訂單加速這個環節。外資報告也指出,中國儲存廠商正積極推動產能擴張,以DRAM為例,上海有新建HBM產線,合肥三期擴建工程也同期推進,武漢三期晶圓廠也計畫在2026年擴建,2026年儲存擴產總量預計超過12萬片。有研究機構更直白地指出,本輪行業上行的核心驅動力來自DRAM與HBM投資超預期及中國市場的持續擴產,AI基礎設施的裝置需求正在從高端邏輯晶片向儲存、先進封裝等環節持續傳導。就以閃迪HBF原型產線建設為例,HBM生產涉及TSV矽通孔和堆疊封裝,需要混合鍵合裝置、電鍍裝置、晶圓減薄裝置等先進封裝裝置的支撐,這些裝置成為延續晶片性能提升的關鍵。而SEMICON China 2026中,集中發佈的混合鍵合、TSV、Chiplet、HBM相關裝置與材料,成為支撐AI算力晶片先進封裝需求,幫助國內先進封裝產業與國際接軌的重要事件。目前,儲存正從傳統周期品演化為AI基礎設施中的核心戰略資源,HBM新產線的建設,正帶動相關半導體裝置的訂單增長。另外,不能忽略的一個重要邏輯,在於國產化。統計資料(口徑或有差異)顯示,中國大陸使用本土半導體製造裝置的佔比,已從2024年的25%提升至2025年的35%,這種趨勢正深刻影響國產半導體裝置企業的訂單增長。以DRAM裝置為,其在地化比率提升,將成為2026年中國本土裝置商的重要訂單動能來源,先進邏輯製程裝置市佔率有望於2027至2028年進一步提升。日系外資報告則全面上修中國半導體裝置市場需求,將2025至2027年中國SPE市場規模上修5%至14%,預估達540億至600億美元,主因是儲存與先進邏輯製程擴產需求強勁。二級市場上,半導體裝置ETF易方達(159558)近60日資金淨流入28.63億元,最新規模49.92億元,年初至今日均成交額2.8億元,場內交投活躍、流動性高。半導體裝置ETF易方達(159558)跟蹤中證半導體材料裝置主題指數,裝置權重佔比高達64.3%,材料佔比約22.5%,兩者合計86.8%,覆蓋光刻機、蝕刻機、薄膜沉積等關鍵裝置及矽片、光刻膠等核心材料,剔除低毛利環節,相比全產業鏈,彈性大。從過往表現看,半導體裝置ETF易方達(159558)標的指數近一年漲幅72.83%,跑贏滬深300指數及多數行業指數。半導體裝置ETF易方達聯接基金(A/C:021893/021894)為場外佈局半導體的投資者提供了便捷工具。03. 底層驅動2026年開年以來,半導體裝置類股持續走強,成為資本市場最受關注的賽道之一。這背後,是全球半導體裝置銷售額連續三年創新高,更是AI算力需求爆發、國產替代加速,以及半導體裝置在產業鏈中的獨特屬性驅動。先說需求。當前全球半導體裝置市場的景氣上行,根本驅動力只有一個—AI。現階段,AI算力需求正從模型訓練向推理應用遷移,推理場景對低延遲、高頻寬的要求更高,直接推高了高性能計算晶片和HBM儲存的需求。2026年HBM市場規模預計同比增長58%至546億美元,三星、SK海力士、美光三大原廠已將約70%新增產能傾斜至HBM,帶動刻蝕、薄膜沉積等前道裝置需求同步擴張。台積電2026年資本支出大幅上調至520億至560億美元,明確釋放了全球先進製程擴產的強烈訊號。AI產業的增長空間廣闊、周期長,是裝置需求最重要也最長期的壓艙石。再說,回到國內,疊加多了一層國產化需求。統計資料顯示,2025年國內半導體裝置企業整體訂單金額同比增長80%,部分頭部廠商的訂單排期已經延伸至2027年。其中,北方華創裝置訂單超150億元,排期至2027年;中微公司刻蝕裝置訂單超45億元,5nm裝置排期至2027年一季度;拓荊科技薄膜沉積裝置訂單超50億元,排期至2027年二季度。政策層面的支援力度也在持續。大基金三期正加速流向半導體裝置、材料等上游核心環節,註冊資本高達3440億元,規模遠超一期和二期總和。工信部發佈《半導體裝置產業發展指引》,對國產裝置進入晶圓廠產線的企業給予最高15%的採購補貼。如果說全球AI需求是β,那麼國產替代就是A股半導體裝置類股強α。最後說到,半導體裝置有著“賣鏟人”的獨特屬性。無論下游的晶片設計格局如何變化,無論那家晶圓廠的製程技術領先,要製造晶片,就必須採購刻蝕機、薄膜沉積裝置、清洗裝置、測試裝置,這是繞不開的剛需。更重要的是,隨著晶片製程微縮逼近物理極限,先進封裝成了延續晶片性能提升的關鍵。HBM需要TSV矽通孔和堆疊封裝,AI晶片需要2.5D/3D封裝,這進一步擴大了“賣鏟人”的市場空間。04. 結語儲存晶片業績爆發、全產業鏈漲價、HBM需求激增等訊號,驗證了半導體市場的景氣度,AI需求則為半導體市場注入了長期增長的邏輯。國產化率突破35%且仍在提升,頭部裝置廠商訂單排期延伸至2027年,則推動了半導體裝置行業的發展。投資者應持續跟蹤SEMI裝置銷售額、國產化率季度變化、晶圓廠資本開支公告以及頭部裝置企業訂單交付節奏等關鍵變數,並在當中尋找到合適的機會。 (格隆)
AI救活了一家馬桶公司,也點燃了儲存晶片超級周期
AI居然救活了一家馬桶公司?日本高端智能馬桶企業TOTO,因為AI在過去幾個月股價飆升,並不是因為馬桶賣得更好了,而是因為TOTO有一個隱藏業務:高純度陶瓷靜電吸盤,這是晶片製造時固定晶圓用的關鍵耗材,TOTO把精度做到了頭髮絲的1/80,純度業界第一。恰逢儲存晶片需求爆發、上游廠商瘋狂擴產,這一業務就成了絕對的剛需。這使得高盛等投行紛紛上調TOTO股價評級,原因很簡單:靜電吸盤的訂單已經排到了2027年。現在這塊業務佔了TOTO超過四成的營業利潤。當一家馬桶公司,都成為了AI概念股,可見目前的AI儲存賽道有多火爆了,三星(Samsung)、SK海力士(SK Hynix)、美光(Micron)、閃迪(SanDisk),這些儲存行業的重要玩家股價瘋漲的背後,是全球儲存晶片,正在經歷四十年來最嚴重的供需失衡。這篇文章,我們就來梳理一下這輪儲存的“超級周期”,並與三星業內人士和華爾街投資人深度盤點一下:為什麼這一次的周期跟以前不一樣,儲存在AI產業為什麼如此重要,Google等AI巨頭正在如何破除對儲存的依賴,以及這樣的短缺周期還會持續多久、又如何影響你我呢?01. 漲幅超1800%“比黃金還貴”的HBM2026年1月底,韓國儲存雙雄三星電子和SK海力士同時公佈了上一年第四季度財報。數字有多誇張呢?兩家公司合計營業利潤接近40兆韓元,折合大概278億美元,相當於每天淨賺3億美元。在這樣創下歷史的利潤下,SK海力士的年終獎,人均達到64萬元人民幣,刷新公司歷史紀錄。把這一切推上巔峰的核心產品,是HBM(高頻寬記憶體)晶片。一塊指甲蓋大小的HBM,售價400到500美元,這比同等重量的黃金還貴。而全球能做這產品的,就三家:SK海力士佔大約6成,剩下的是三星和美光各2成。但HBM只是冰山一角,真正讓整個行業慌了的,是從高端到低端、從DRAM到NAND,全線告急。從2024年底到2025年12月,DDR5(16GB)的現貨均價,從4.6美元漲到了28美元,漲了500%多;更老的DDR4,從3.2美元飆到62美元以上,累計漲幅高達1800%;資料中心用的64GB伺服器記憶體模組,去年半年之內從255美元漲到了700美元,漲了將近175%。而SK海力士2026年的產能已經全部賣光了,三星2026年一季度直接把NAND快閃記憶體的供應價格上調了100%,直接翻倍。Candice Hu三星儲存產品行銷經理我們現在看到DRAM的spot price(現貨價格)已經超過了2016-2018年cloud(雲)那個時候最高的現貨價格了。我們現在的短缺的情況是2026年已經全部賣完,27年大機率也差不多賣完了。像我們SSD(固態硬碟)給非常核心的GPU provider(GPU廠商)的報價,就是非常誇張,一周內乘以2的價格。與此同時,出現了一個更有標誌性的訊號。閃迪(SanDisk)在2026年初的CES上,告訴華爾街:它正在跟客戶簽一種全新的長期供貨協議——LTA(long term agreement),而且這次客戶要打預付款,毀約不退錢。這在儲存行業幾十年的歷史上從未發生過。Rob Li紐約Amont Partners管理合夥人Long-term agreement(LTA,長期供貨協議)在歷史上不是沒有過,但過去這麼幾十年,LTA是從來沒有任何執行效力的。如果市場進入一個下行周期的時候,客戶說這東西我們就不認了,如果客戶不認的話,你拿他完全沒有辦法。而這一次,畫風變了。強勢的儲存供應方制定了新規則。Rob Li紐約Amont Partners管理合夥人SanDisk告訴華爾街或告訴市場說:我們現在跟客戶簽署的LTA和過去有很大不同。這東西有法律效力,而且客戶要給我們提前預付款,如果你提前預付了款,最後你要走人,如果不按這個價格付,你的預付款是拿不回來的。Rob的判斷是,如果閃迪都能做到這一點,那另外三大巨頭SK海力士、三星和美光,沒理由做不到。在這樣的情況下,整個超級周期很有可能持續到2027年。02. 產業鏈全景拆解儲存行業如何運作?對於儲存行業來說,我們可以用熱和冷來做劃分,當它離計算的關係越近,就越熱;越偏向純粹的儲存屬性,就越冷。所以最“熱”的就是DRAM(動態隨機存取儲存器),是離計算最近的儲存,可以理解為電腦和手機的“運行記憶體”,晶片在工作的時候,資料必須先載入到DRAM裡才能被處理。它的特點是速度極快,但斷電就丟資料,屬於“短期記憶”。其中,HBM(高頻寬記憶體)是DRAM的一種特殊進化形態。它把多層DRAM晶片,通過矽通孔(TSV)技術垂直堆疊在一起,再用先進封裝和GPU貼在同一塊基板上,這樣做的好處是極大增加了頻寬。這就是為什麼所有用於AI訓練的頂級晶片,無論是輝達的GPU還是Google的TPU,都離不開HBM,它是這輪超級周期裡最耀眼、最緊缺的產品。當然DRAM家族內部,其實品類很豐富。包括GDDR(顯示卡用)、Low-Power DDR(手機和筆記本用的LPDDR)等等,不同的應用場景,對應著不同的產品。不是說一顆DRAM晶片能通吃所有裝置,給輝達GPU用的HBM,和你手機裡的LPDDR,雖然都是DRAM,但製造工藝、封裝方式、性能指標完全不同。而在“冷”的這一端,就是NAND。如果DRAM是短期記憶,那NAND Flash就是長期記憶。它斷電不丟資料,是我們日常用的固態硬碟(SSD)、手機儲存、USB 隨身碟的核心。你在手機裡存的照片、電腦裡裝的遊戲,都躺在NAND上。NAND在AI時代的角色也在快速升級。以前它就是單純的“倉庫”,負責把資料長期存好,但現在NAND正在從後台的倉庫,變成前線的彈藥庫。再往“更冷”走,就是傳統的機械硬碟HDD,靠磁碟旋轉來讀寫資料,速度慢但便宜,容量大,現在主要用在資料中心的冷儲存和歸檔場景。隨著AI推理對儲存層級的需求越來越精細,現在越來越像一個分層倉儲系統。最急著用的資料放在HBM,像擺在手邊;常用但沒那麼急的資料放在DRAM,像放在辦公桌抽屜;更冷一些、只是備用的資料放在NAND/SSD,像放在辦公室儲物櫃;而真正長期積累、需要多人共享呼叫的大量資料,則放在後端的大型共享儲存裡,像公司的總檔案館。Rob Li紐約Amont Partners管理合夥人AI起來對熱的東西更有利,當然對於儲存也是需要的。我用AI做了很多圖片,製作了很多視訊,根據各國各地的法規,這東西不能刪,要留著,那對儲存的需求增量肯定起了很大的作用。但它的第一步最直接的體現,一定是跟計算相關的方面,誰跟計算的關係越近,誰在短期的收益越明顯。接下來我們盤點一下整個儲存產業鏈上的玩家們。最上游是材料和矽片,比如日本的SUMCO,它是全球最重要的半導體矽片供應商之一。製造環節裡,關鍵裝置廠商包括ASML這樣的光刻機龍頭,以及Tokyo Electron這類覆蓋塗膠顯影、沉積、刻蝕和清洗等多個環節的裝置公司。與此同時,在製造之前的晶片設計層,Cadence和Synopsys這類EDA、驗證和設計IP公司同樣不可或缺;而像Rambus這樣的介面IP廠商,則在HBM等高速記憶體架構裡扮演關鍵角色,它們看起來不如GPU那樣顯眼,但在這輪AI驅動的超級周期裡,都是超級剛需。中游就是儲存晶片的設計和製造。在DRAM領域,三星、SK海力士、美光,這三家公司加在一起就佔據了全球95%的市場份額。而在NAND領域,除了這三家之外,還有鎧俠(Kioxia)、西部資料、閃迪。然後是在這輪周期裡變得格外關鍵的環節——先進封裝。因為HBM不是單純把DRAM造出來就結束了,它要先把多層DRAM裸片(die)堆疊,再通過2.5D封裝與GPU或其他AI加速器整合在一起。也正因為如此,CoWoS這種半導體封裝技術一度成為AI晶片供應鏈最關鍵的瓶頸之一,直接限制了HBM的實際出貨,而CoWoS產能主要由台積電提供。下游就是各種終端應用了。包括資料中心和雲廠商,微軟、Google、亞馬遜、字節跳動,是現在最大的金主,之後是手機廠(蘋果、三星、小米、OPPO)、PC廠(聯想、戴爾、惠普)、汽車廠(特斯拉、理想、蔚來),以及遊戲主機、工業裝置等等。所以你能看到,雖然整條鏈非常長,但真正的定價權,高度集中在中游那三家:三星、SK海力士、美光。它們決定了做什麼產品、給誰供貨、以什麼價格賣。而在當下這個供給遠小於需求的市場裡,它們擁有的議價權是前所未有的。03. 為何總是暴漲暴跌儲存行業的天然周期宿命儲存行業還有一個非常大的特點,就是周期性。從歷史來看,它總是在“大漲”和“大崩”之間反覆橫跳。這背後有兩層原因,一層是物理學,一層是經濟學。先說物理學。DRAM,就是手機電腦裡的“運行記憶體”,靠儲存電荷來保存資料。幾十年來,工程師一直在把儲存單位做小、做多,來提高密度。巔峰時期,DRAM密度每十年能翻100倍。但如今不行了,SemiAnalysis的報告指出,過去十年DRAM密度總共才翻了大約2倍,而以前是每十年100倍,縮放已經嚴重放緩了。這意味著儲存晶片的成本下降,不再像以前那樣靠技術進步“自動”實現,而是更多取決於產能的增減和供需的博弈。再來說說經濟學。儲存晶片製造是全球資本密度最高的產業之一,建一座先進晶圓廠,動輒幾十億上百億美元,建設周期兩三年。這些錢投進去就是沉沒成本,所以即便需求不好,廠商也傾向於繼續生產,因為不開工反而更虧。更要命的是,儲存行業的模式是“先建後賣”,跟台積電“先接單後擴產”的邏輯完全不同,儲存廠商得自己猜未來需求有多大,提前兩三年布產能。猜對了皆大歡喜,猜錯了就是災難。這種結構性矛盾,造就了儲存行業反覆上演的經典循環:需求爆發→供不應求→價格飆漲→利潤暴增→激進擴產→供過於求→價格崩盤→行業大洗牌。過去三十年,這個循環平均每3到4年上演一次,從未例外。結果就是,全球DRAM供應商從1990年代的20多家,淘汰到今天只剩三家巨頭和中國長鑫這樣的追趕者。每一輪都有人被淘汰出局,比如德國奇夢達破產,日本爾必達退出。這些血淋淋的教訓,讓整個行業對“周期”二字充滿敬畏。在儲存行業過去幾十年的歷史上,曾經出現過四次周期。第一次是1993年,Windows PC黎明期。圖形介面普及讓記憶體需求暴增,供給端產能嚴重不足,價格飆漲。結果全球一口氣新建了約50座新廠,產能過剩後價格暴跌,大批玩家出局。第二次是2010年,智慧型手機加雲端運算時代。iPhone和Android帶來爆發式增長,伺服器DRAM從個位數GB跳到數十GB。但標準化加速了商品化,供應商很難做出差異,結果這輪周期比預期更短。第三次是2017到2018年。雲廠商升級資料中心,單台伺服器塞進更多DRAM,而伺服器記憶體又比消費級更貴更賺錢,三大廠商毛利率衝到歷史高位。但高利潤刺激擴產,需求一過峰值,2018年末行業重新滑入下行。第四次是2020到2021年,疫情驅動的意外繁榮。居家辦公、雲用量暴增,但恐慌性雙重下單製造了虛假需求,退潮後庫存嚴重積壓,接著就是2022到2023年的痛苦大跌。從那時起產能被大幅削減,但正是這段保守期為現在的短缺埋下伏筆。進入2025年,全行業產能再次嚴重不足。所以歷史給我們的核心教訓是什麼?是過去所謂的超級周期,從來沒有持續超過兩年,都是“高利潤→瘋狂擴產→過剩→崩盤”,這是過去四十年的鐵律。經歷了這麼多輪循環,投資者和從業者,都有一種根深蒂固的條件反射:漲得越猛,崩得越快。但這一次,越來越多的證據在暗示,歷史模式可能要被打破了。04. 這次為什麼不同從訓練到推理的需求質變4.1 先從一個最樸素的直覺講起在講複雜的供需模型之前,我們先建立一個最簡單的邏輯。你每天打開ChatGPT或者Gemini,上傳檔案、存對話、讓AI記住你的偏好,你可能沒意識到,每一次互動都在消耗儲存資源。不僅是伺服器端的計算,更是海量的記憶體和快閃記憶體。現在大部分AI使用者是沒有忠誠度的,誰的模型好用、誰便宜就用誰。但想像一下,如果有一天你的AI助手真的“懂你”了,記得你的工作習慣、表達偏好、三個月前討論過的項目細節,你還會輕易換平台嗎?這種“記憶粘性”,是大模型公司建構護城河的核心武器,而支撐這種粘性的硬體基礎設施,就是儲存,海量的、多層級的儲存。還有另一個同樣直覺的邏輯:視訊模型越來越強了,AI生成視訊正在逼近實用化。而視訊資料量是文字的幾十甚至上百倍,這對儲存的需求將是指數級的躍升。Rob Li紐約Amont Partners管理合夥人記憶體就像一塊小黑板,以前我們計算的是1+1=2,所以你不需要一塊巨大的黑板,一塊正常的黑板就夠了。只是來到了AI時代,現在計算的強度會很高,也很複雜,有很多步。如果我是一塊小黑板,你每寫一次、擦掉一次,又寫一次、又再擦掉一次,有100步的計算的話,你需要擦100次,就會耗費你的時間。所以我們現在需要造一塊巨大無比的黑板,我可以一口氣把算數的100個步驟全部寫完,再一口氣擦掉,這樣可以省我的時間。所以,一塊越來越大的黑板,這就是AI時代對儲存的需求。4.2 從訓練到推理:儲存需求發生了質變在生成式AI的早期階段,算力和錢都砸在了模型訓練上,訓練階段儲存系統干的活兒,主要是向上千個GPU高效喂資料,以及定期做模型檢查點,防止訓練中斷功虧一簣。但如今,推理正在迅速成為主戰場,而推理對儲存的需求模式,比訓練複雜得多。它需要把模型從儲存層載入到記憶體層:活躍權重主要駐留在HBM,部分狀態和快取則留在DRAM;當KV Cache(鍵值快取)在高層記憶體中裝不下時,一部分會被解除安裝到SSD/NAND上,需要時再取回;而RAG查詢依賴的外部知識,通常存放在更後端的共享儲存或資料湖中,由檢索系統即時調取。而更大的變數是AI Agent的崛起。摩根士丹利在最新研報中指出,2026年將是AI從實驗走向核心基礎設施的一年,這些智能體更可靠、更有記憶力、幻覺更少,還能持續學習。這份研報中寫到說:“推理正在成為一種記憶體挑戰,而不僅僅是計算挑戰”。但智能體要運轉起來,就需要維護多層記憶:短期工作記憶(當前對話)、長期記憶(跨會話的使用者歷史)、預訓練知識庫、工具呼叫記錄……而每一層都需要不同層級的儲存支撐:從HBM裡的“熱資料”,到DRAM裡的“溫資料”,再到NAND SSD裡的“冷資料”。所以趨勢很明顯:AI的下一波進步,不是來自更強的推理能力,而是來自更好的上下文處理。一個能記住一切的AI助手,比一個更大但什麼都記不住的模型有用得多。對於儲存來說,這意味著什麼呢?4.3 算筆帳:AI到底要吃掉多少儲存?摩根士丹利做了一個非常詳細的分層測算。他們以一個類似ChatGPT規模的模型為基準,假設大約8億周活躍使用者、峰值每秒30萬請求、每次請求2000個輸入token,並且假設只算文字,圖片和視訊不計入。按這個要求詳細拆分結果,這樣的系統大致對應HBM 226PB、DRAM 4.6EB、NAND/SSD約47EB、資料湖約294EB的需求。這組數字意味著,如果全球有三個這種規模的模型,比如ChatGPT+Gemini+Claude,僅僅是純文字推理的需求,就會佔到2026年全球HBM供給的17%、DRAM的35%、NAND的92%。而這還沒有把圖片、視訊等多模態需求算進去。更重要的是,這套測算對上下文長度非常敏感。摩根士丹利的敏感性分析顯示,如果把輸入從每次2000 token,提高到5000 token,在其他條件不變時,每個模型的DRAM需求會再增加約2EB,Rack SSD/NAND再增加約3EB。也就是說,隨著更長上下文和更長思考鏈成為常態,這對儲存的壓力會迅速放大。SemiAnalysis管這叫“記憶體帕金森定律”:HBM容量每提升一次,開發者就會立刻建構更大的模型來把它填滿。以前用來壓縮模型的各種技巧,一有新空間就被放鬆,直到再次撞牆,這就意味著:儲存永遠是下一個瓶頸。這也是為什麼業內有聲音會認為,儲存晶片廠商,可能集體低估了大語言模型token激增所帶來的需求。Rob Li紐約Amont Partners管理合夥人以前的周期可能也就一年半到兩年時間,這次周期有可能會持續一個很長的一個時間,或者說當一個周期性的行業,變成一個結構性增長的行業,它就不再是個周期了。而這個周期的另外一個決定性因素,就是產能上的供應擴張,問題是,為什麼擴產會這麼挑戰呢?05. 越擴產越短缺HBM-DRAM困境與博弈理解這輪超級周期,還有一個核心密碼在於搞懂一個看上去很矛盾的現象:HBM的大規模擴產,不但沒緩解DRAM的短缺,反而讓它更嚴重了。SemiAnalysis的追蹤資料顯示,2023年底,三大儲存廠商分配給HBM的晶圓產能大約12.3萬片/月。到2025年底漲到了33.1萬片/月,兩年擴了將近3倍。預計到2027年底還會進一步到66.8萬片/月,四年翻5倍。擴得這麼猛,為什麼DRAM還是緊缺?關鍵在於,做HBM要消耗大量普通DRAM的產能,而且效率極低。HBM是一種極其消耗晶圓的架構。一片用於HBM3E 12層堆疊的晶圓,位產出(也就是能生產出來的儲存容量)只有普通DRAM晶圓的大約三分之一,到了HBM4,這個比例可能進一步惡化到四分之一。Candice Hu三星儲存產品行銷經理相比較於傳統的DRAM,生產HBM,我們同一片Wafer(晶圓)的產量只能達到普通的DRAM的1/3。這意味著,廠商每多生產1GB的HBM,市場就失去了生產3-4GB普通DRAM的機會。為什麼效率這麼低?因為HBM的製造複雜度遠超普通DRAM,比如TSV(矽通孔)、晶圓減薄、背部加工,這些步驟都會引入額外的良率損耗。在做8層或12層堆疊時,只要有一顆die(裸片)是壞的,整個stack(堆)可能就報廢了。所有這些問題加起來,使得HBM成了一種“反向縮放”的產品,越做它,對產能的消耗越大。這也就帶來了“HBM-DRAM困境”,在業內被稱為“產能排擠效應”。因為HBM的利潤更高,且被AI巨頭預定,廠商會優先把有限的晶圓塞進HBM產線。這導致普通手機和電腦用的傳統DRAM產能,被嚴重壓縮,從而引發了價格的報復性飆漲。來自J.P.Morgan研報中的供需模型也得出了類似結論:DRAM的供給增長,在未來兩年將被壓制在20%以下,跟不上需求增長。於是,又出現了一個令人匪夷所思的現象:雖然普通DRAM工藝比HBM簡單,但由於產能受限、價格飛漲,它的利潤率到2025年四季度,竟然已經追平甚至超過了HBM。因為HBM大多是長期合同鎖了價,而普通DRAM的現貨價格,能迅速反映供需緊張。這就給廠商出了個難題:到底是繼續猛擴HBM,還是把一部分產能,留給同樣暴利的普通DRAM?06. 擴產三座大山潔淨室緊缺、裝置商保守與製程摩擦需求端已經夠瘋狂了,而供給端的約束更加讓人窒息。第一個瓶頸:潔淨室等生產資源不夠。生產晶片需要潔淨室,但在疫情後由於進入周期低谷,儲存廠商集體保守,投資縮水,這使得2025和2026年潔淨室嚴重不足。Candice Hu三星儲存產品行銷經理因為晶片生產對環境的要求實在太高了,反而clean room(潔淨室)夠不夠倒是我們比較擔心的,還有就是電力夠不夠。因為我們可能會晶片做得夠多,可是沒有足夠的power(電力)去讓他們工作。SemiAnalysis的追蹤顯示,2026年全行業幾乎所有新增晶圓產能,就集中在三座工廠:三星的P4、SK海力士的M15X、美光的A3。而且M15X和A3主要是給HBM用的,對普通DRAM貢獻很有限。真正有意義的新產能呢?SK海力士的龍仁(Yongin)工廠,最早2027年2月才能上線;美光的愛達荷(Idaho)工廠瞄準2027年年中。也就是說,未來一年多,供給端基本沒有增量。第二個瓶頸:上游裝置商不肯擴產。Rob Li紐約Amont Partners管理合夥人很多裝置商,比如說日本的很多供應商,有一家很大的叫Tokyo Electron,它自己不願意擴產,很保守。因為過去幾十年,它走過了很多個周期,目前擴產能也需要幾年,等到擴產能出來,說不定那個時候AI周期就爆掉了。所以它寧可不擴,就不求掙500塊錢了,就掙100塊錢,小日子過得也很好。圖片來源:TEL這就是一個典型的“木桶效應”,就算儲存廠商有錢有決心擴產,上游裝置的供貨瓶頸,也會大幅拖慢產能上線的速度。第三個瓶頸:先進節點遷移自身的摩擦。為了在晶圓產能有限的情況下儘量多產出記憶體位,三大廠商都在加速向1b(目前最尖端的量產節點)和1c(即將進入大規模量產的下一代節點)先進節點遷移,因為製程越先進,意味著電路刻蝕得越細,在同樣大小的一片晶圓上,1c節點能切出的儲存顆粒數量比1b更多。但這個產線的遷移過程,就必須把機器停下來,進行長達數周甚至數月的重新偵錯和安裝,本身也會導致幾個季度的良率波動和產能損失。在2026年這個AI需求爆發的節骨眼上,就有點遠水解不了近渴。Candice Hu三星儲存產品行銷經理從開始決定增加產能到建立起來一個Fab(半導體製造廠),然後再到back-end(後端)能夠做出來DRAM晶片或者是NAND晶片,它需要三年的時間。在這個時候又出現了HBM這種難做的晶片,就像我剛提到的HBM跟conventional(傳統的)DRAM相比的話,它是1/3的產能。那我本來要等兩到三年,產能才能增加,現在又只能砍掉1/3的output(輸出),所以它的供需在這個cycle(周期)之下是還比較緊張的。潔淨室等生產資源不夠、裝置商不擴產、先進節點遷移自身的摩擦——這三個瓶頸疊在一起,就是為什麼即使所有人都知道儲存晶片在瘋漲,供給端依然束手無策。07. 產業鏈利潤重分配誰在盛宴,誰在寒冬儲存晶片價格的瘋漲,當然不是沒有代價,它正在重新分配整個電子產業鏈的利潤。先說這條利潤鏈上的大贏家,除了韓國雙雄的天文數字利潤,中國國內的儲存廠商也跟著起飛了,佰維儲存預計2025年利潤同比增長427%到520%,德明利預計增長85%到128%。至於行業利潤率,野村的口徑是2026財年,通用DRAM原廠利潤率,有望回升至上一輪周期的峰值70%。而J.P.Morgan更激進,它的說法是到2027年,營業利潤率可能超過80%,甚至要高於上一輪的峰值。而這條產業鏈上的輸家,就是硬體廠商了。摩根士丹利測算過,儲存晶片價格每漲10%,硬體OEM的毛利率就要下降45到150個基點。手機市場最先遭殃,小米、OPPO出貨預測下調超過20%,vivo下調近15%。TrendForce直接把2026年全球智慧型手機生產總數預測,砍到了同比下降10%。魅族宣佈取消魅族22Air的上市計畫,因為成本扛不住了。Nothing的CEO裴宇在社交媒體上感嘆:小公司不得不尋找其他出路。PC市場同樣慘烈,聯想部分機型上調了500到1500元,戴爾和惠普也已明確預告提價,漲幅主要由儲存成本轉嫁而來。戴爾COO克拉克直言“從沒見過成本上漲得如此之快”,惠普CEO甚至在考慮“減少產品中的記憶體使用量”。汽車行業也沒能倖免,理想汽車供應鏈副總裁公開警告,2026年車規儲存滿足率可能不到50%。蔚來李斌說“今年最大的成本壓力是記憶體”。雷軍在直播中坦言“光車用記憶體一項,成本就要增加幾千塊”。Candice Hu三星儲存產品行銷經理PC和手機這些廠商現在在我們這裡,那怕名字再響,它都沒有那麼大的pricing influence(議價權),它們現在不是那麼吃香,因為對我們來說,它們的margin(利潤)就是比雲廠商的低。比如說某一個國產車企,我們最近聽說它因為記憶體不夠,所以它可能就把後排的車載的entertainment system(娛樂系統)給閹割掉。Rob Li紐約Amont Partners管理合夥人手機和PC今年肯定至少會要跌5個點,有可能會更多,但沒人會在乎這個事情。因為它們三個人(巨頭),尤其是美光,它說我現在不做這個事情了,這個市場變成0都無所謂。而在需求的另一端,雲廠商們(微軟、Google、亞馬遜AWS)表現出驚人的價格不敏感。Candice Hu三星儲存產品行銷經理現在雲廠商它們的marginal cost off(邊際成本)、它們的software(軟體)是0。它們的錢和敘事,都跟股價有關係,所以它們是極其的price insensitive(價格不敏感),就是它們不是很在意到底這個記憶體多少錢。對於雲廠商們來說,即使手機和PC市場歸零,儲存廠商都覺得無所謂,因為AI資料中心的前景太誘人了。所以最後的問題是,這場超級周期到底還能持續多久?這次是不是真的不一樣?08. 2026年接下來會怎樣?如今,整個儲存產業鏈的競爭格局依然穩固。HBM目前大概是“6:2:2”的格局,SK海力士佔大頭,三星和美光各佔自己的地盤。當然也有投資人認為,在當下這個供遠小於求的賣方市場裡,爭論誰份額大其實沒什麼意義。Rob Li紐約Amont Partners管理合夥人因為它們三個巨頭產能都受限,誰的市場份額更多,無非在於誰能把產能擴出來,誰就可以賣動,誰有多的供應,誰就可以吃市場份額。但這個事情和誰的技術更好關係不大,因為目前是一個供給遠遠小於需求的市場。所以在這個時候討論市場份額,比如海力士的市場份額是一半,比其他兩家都大,是沒有任何意義的,因為它們三家都擴不出產能。所以現實就是,儲存三巨頭都已經賣光了,誰能多擠出一點產能,誰就多吃一口肉。不過有意思的是,儲存大廠們卻可能不追求“壟斷”。Candice Hu三星儲存產品行銷經理我覺得沒有一個儲存玩家想壟斷,三星害怕壟斷,我們的客戶也不希望我們壟斷。你一旦有短缺,像現在客戶給到任何一個memory supplier(供應商)100%的market share(市場份額),對於儲存玩家來講都是非常大的壓力。所以打破壟斷,反而是我們儲存玩家比較願意看到的事情。大家通常覺得壟斷等於高溢價,但在儲存這種周期波動極大的行業裡,100%的市場份額意味著100%的需求風險,客戶一砍單就非常的被動,所以儲存廠商反而希望保持三家競爭的平衡態。那麼,這輪周期到底能持續多久呢?Candice Hu三星儲存產品行銷經理2026年就是100%賣完,然後供給和需求中間的差值有到30%,甚至50%。2027年一樣是在短缺,可能到2028年才會有真正的好轉,所以這是一個接下來兩到三年的短缺的情況。同時,需求端完全看不到放緩的跡象。接下來,AI推理和agent的爆發,以及之後的機器人和物理AI需求,也將進一步讓儲存的吞吐量和容量需求出現指數級跳躍。SemiAnalysis認為,2026年總DRAM供給仍將比需求低約7%。在HBM這條線上,供需缺口到2027年還會繼續擴大。至於新增供給,真正有意義的產能更可能要到2027年下半年才陸續出現。如果按野村證券的口徑,真正體現在產量上的增量,甚至要等到2028年。但更值得關注的,是一個更大的問題:這個行業會不會從此告別周期?從華爾街視角,Rob在採訪中給了一個很有深度的思考角度:Rob Li紐約Amont Partners管理合夥人這次周期有可能會持續一個很長的一個時間,或者說它把一個周期性的行業變成一個結構性增長的行業,它就不再是個周期了。如果說現在行業出現一個很大的一個變化,它從一個周期性的行業變成一個非周期性行業,變成一個結構性很穩定增長行業的話,那整個市場可能對這個行業的看法就會有一個質的改變。周期行業我們給你一個10倍市盈率都算很高了,但如果變成結構性增長行業,且持續很多年的話,那它們的市盈率都可以再翻倍了。那在現在這場超級周期裡,我們到底處在什麼位置呢?以下這幅圖的橫軸是以過去五個周期、每輪周期的谷底為零點的時間線,豎軸是市場交易的漲幅。可以看到,每輪周期都會經歷四個階段:悲觀、懷疑、樂觀、狂熱,然後再回到悲觀。當前這輪紅線走勢,我們已經到了“樂觀”的這個區間,並且漲幅遠大於以往的任何一個周期。這就對應了剛剛Rob說的,這種思考方式的轉變,萬一AI真的打破了這種周期呢?這也意味著那怕利潤不增長,光是估值從“周期股”重新定價為“成長股”,就能讓股價翻一倍。就像沒有人會說蘋果賣手機,在過去20年是個周期性行業。如果儲存也能走到這一步,這將是整個半導體投資框架的一次範式轉換。不過,儲存行業的需求也是會有不確定性的,需求側的變數不只來自宏觀層面,技術本身也可能改寫供需關係。比如說,3月底,Google發佈了一個新演算法TurboQuant,號稱是一個高效AI記憶體壓縮演算法。發佈之後是直接轟動了矽谷科技圈,更是引發儲存類股的全線暴跌。但很快,業內有聲音反駁說:這次暴跌是一場烏龍。首先這篇論文發表於一年前,且本身存在一些學術上的爭議。並且這個演算法目前只在Gemma、Mistral等小模型上驗證過,70B以上模型、MoE架構、百萬級token上下文,這些AI記憶體需求真正爆炸的場景,都沒有。還有技術人士出來說,在技術上,TurboQuant壓縮的只是推理時GPU視訊記憶體裡的KV Cache,是AI記憶體需求三大來源之一,但訓練環節完全不受影響。反正,這篇論文和演算法是被各種炮轟。但這就有意思了:這一篇存在爭議的舊論文成果,就能引發資本市場如此劇烈的崩盤,是不是本身就能說明一些問題。是不是這意味著:市場對儲存類股的信心,已經高到了極度脆弱的程度。要知道,在這波暴跌之前,閃迪2026年以來已經暴漲了200%,美光也漲了超過80%。有空頭機構直接指出,閃迪以920億美元的市值、對應2026年僅60億美元的預期淨利潤,估值很難站住腳。美光同樣面臨質疑:儘管創下了歷史最佳業績,但2026財年200億美元的資本開支同比增長68%,這就是在豪賭記憶體需求會持續增長。說到底,TurboQuant論文只是一根導火線,真正的火藥桶是過去兩年積累的極端估值,任何一個“需求可能沒那麼多”的訊號,都足以觸發踩踏。這類演算法層面的進步,恰恰是“超級周期”敘事中,最難被提前定價的風險,Rob也很清醒地給出了終極風險提示。Rob Li紐約Amont Partners管理合夥人對儲存行業的擔憂會一直存在,直到最後發現這東西變成一個穩定上升的“蘋果式”的業務。第一個擔心是AI爆掉,那大家都會死,因為現在主要的增量來自於AI,如果有一天AI不行了,大家發現AI沒有什麼用,那你講的一切的未來都是空話,都會變成0。所以,當前對“超級周期”的樂觀預判,都建立在一個前提上:AI的需求是真實的、可持續的。如果有一天AI出現泡沫破裂,儲存行業很難獨善其身。這個達摩克利斯之劍會一直懸在那裡,直到行業真正證明自己成為了一個“蘋果式”的穩定增長業務。SemiAnalysis將這輪周期定義為“四十年一遇的短缺”。但更有價值的方向或許是:儲存晶片行業正站在一個分岔路口,它要麼像過去四十年一樣,在價格峰值後滑入又一輪低谷;要麼,在AI的結構性需求驅動下,真正打破周期宿命,成為一個持續增長的產業。至少在2026年,答案似乎正在傾向於後者。三大儲存廠商的產能全部售罄,上游裝置商的訂單排到了2027年,客戶開始交預付款簽有法律約束力的長期合同,甚至連一家做馬桶的日本公司,都因此改變了命運。但歷史從不缺少對“這次不一樣”的嘲諷。唯一確定的是:無論這次能不能打破周期,它已經不可逆轉地重塑了全球科技產業的權力版圖。在這場對儲存晶片的飢餓遊戲中,誰掌握了供給,誰就掌握了AI時代的話語權。 (硅谷101)
儲存晶片擺脫周期? 一個被AI誤導的產業幻覺
2025Q2,全球記憶體市場迎來了一輪罕見的劇烈上漲,DDR5 價格在短短一年時間裡,從每 GB 約 3–4 美元飆升至 15美元以上,部分高端規格產品的價格更是突破了這一區間。DDR4在需求不斷下跌的情況下,因為供給瞬間暴跌,導致價格飆漲的更為誇張從每 GB 約 1-2 美元飆升至 15美元,在2025年底到2026年初,甚至出現DDR4每GB價格比DDR5還高的倒掛現象。為何壓根沒需求,需求每年下降的DDR4價格比DDR5長得還高?核心原因是三大同時間宣佈停止生產DDR4,將產線轉進DDR5,全球DDR4供給瞬間減少6成以上,導致DDR4價格暴漲,因為需求可能每年下降10%,但供給暴降60%,瞬間造成了供需緊張。而DDR4的價格更高,毛利更高,會讓三大回心轉意減緩DDR4的停產嗎?當然不會,因為DDR4沒有需求,需求在下降,甚至DDR5需求也很一般,每年只有微幅上漲,從消費級電子就能看出DDR5的需求不會太好。那三星,海力士,美光三大原廠為何要放棄DDR4全面轉進DDR5呢?DDR5需求同樣一般。核心就在HBM,這一波儲存的需求拉動完全在AI沒有其他,而AI需要的是大量的HBM,生產HBM必須先做DDR5顆粒再層層堆疊,目前的HBM4是12層,未來會有16層,也就是佔用DDR5顆粒會越來越多。最終導致DDR5漲價的原因也是供給被大量HBM擠佔,供給減少造成供需不平衡。這就是三大為何毅然決然放棄價格更高,毛利更高的DDR4全面轉進DDR5的核心原因,HBM緊缺需要更多DDR5顆粒,用DDR4的舊產線升級最快,不用在新建廠房,所以必須把DDR4騰出來升級DDR5,為的只有一件事 - HBM。只有HBM的需求是不斷增加的,DDR4跟DDR5需求是減少跟持平,但價格大漲。大家搞明白這兩年的儲存漲價邏輯才能對未來做出正確判斷,如果你不懂產業邏輯,憑藉網路上看的有頭沒尾的文章,這會讓你的認知片面化,切入點單一化非常容易做出錯誤判斷,尤其是在瞬息萬變的儲存市場。去年開始筆者在知識星球就開始跟同學灌輸儲存市場的很多底層邏輯,就是擔心從未經歷過儲存周期的同學們,在儲存高漲的時候出現不切實際跟脫離產業的幻想。我想這正是加入筆者知識星球的最大好處,對整個產業有高維度的宏觀認知,這是做投資的基石。所以真心建議加入筆者知識星球,掃文章末尾二維碼即可加入,知識付費。儲存產業是否會復刻先進邏輯製程的發展路徑,進入長期漲價的結構性時代?這個問題看似符合產業發展的 “技術直覺”,畢竟無論是 CPU、GPU 這類邏輯晶片,還是 DRAM 這類儲存晶片,本質上都是在wafer上堆疊電晶體,依靠摩爾定律,也就是製程工藝的持續進步提升單位面積的電晶體密度。既然先進邏輯製程能夠在每一代技術迭代中實現產品價格的持續提升,同為半導體產業核心品類的儲存,為何不能走上同樣的道路?但如果拋開表面的技術相似性,從數學邏輯與產業本質的底層維度分析,『儲存長期漲價』或者『儲存周期特性結束』 的結論其實站不住腳。更進一步說,這一輪看似具備結構性特徵的儲存價格上漲,恰恰在更高維度再次驗證了儲存產業的核心屬性,它不僅是典型的周期行業,而且受產業底層規律約束,幾乎不可能擺脫周期的桎梏。一、表象相似:都是電晶體,卻有完全不同的命運很多人被「電晶體縮放」的表面規律所誤導,認為邏輯晶片能靠製程進步提價,儲存也能走同一條路。畢竟兩者的技術核心都是通過縮小電晶體尺寸,在同樣大小的 wafer 上塞進更多基本單元,從而實現成本最佳化。先看一組公認的產業資料,無論是邏輯還是儲存,製程進步的確帶來了單位成本的下降:邏輯晶片:製程越先進,晶圓越貴,但單位電晶體成本越低台積電 3nm 晶圓價格是 14nm 的 3 倍多,但每平方毫米能塞的電晶體數是 14nm 的 8 倍多,攤到每個電晶體的成本反而降了近 70%。簡單說,邏輯晶片是「買貴的晶圓,造更便宜的電晶體」。儲存晶片:同樣靠製程降成本,卻卡在物理極限DRAM 的核心單元是 1T1C(1 個電晶體 + 1 個電容),製程進步同樣能縮小單元尺寸,提升 bit/mm² 密度,但電容的物理特性讓它的微縮速度遠慢於邏輯電晶體。從 DDR3 到 DDR5,DRAM 的 bit 密度提升了 5-6 倍,每 bit 成本降了近 70%,看起來和邏輯晶片的成本最佳化節奏差不多。但關鍵差異在於,邏輯晶片的電晶體能持續微縮,而 DRAM 的 1T1C 單元自 2004 年後就卡在 6F² 的設計上,再也沒實現突破,這也是 DRAM 密度提升放緩的核心原因。目前DRAM行業準備進入4F²的3D DRAM時代,但真正推出產品還得是1d以後的節點,預計2028年~2029年才能真正進入4F²的3D DRAM時代。看到這裡有人會問:既然兩者都能靠製程降單位成本,為什麼邏輯能長期提價,儲存卻只能在周期裡掙扎?答案藏在「你賣的到底是什麼」這個本質問題裡。二、核心分歧:一個賣性能,一個賣容量,分母完全不同這是儲存和邏輯最根本的差異,也是解釋兩者價格走勢的關鍵。我們用兩個核心公式,把這個差異講透。邏輯晶片的定價邏輯 —— 賣的是性能,不是電晶體邏輯晶片(CPU、GPU、AI)的核心定價公式:Price logic ≈ f (Performance)。邏輯晶片的價格由「能解決多大的問題」決定,不是由「有多少個電晶體」決定,電晶體只是實現性能的手段。而性能和電晶體數量的關係是超線性增長:Performance ∝ Transistorα , α > 1 。電晶體數量的增長,會帶來性能的爆炸式增長(α > 1),簡單說就是「電晶體翻 10 倍,性能可能翻 20 倍、30 倍」。最典型的例子就是 AI 晶片:同樣是台積電 3nm 工藝,一塊 GPU 的電晶體數是傳統 CPU 的數十倍,其能運行的大模型參數量、推理速度是 CPU 的上百倍,因此它的售價能達到 CPU 的幾十倍,使用者依然願意買,因為單位性能的成本實際上是下降的。對資料中心來說,一塊貴的 AI 晶片能替代幾十塊普通晶片,節省的機房空間、電費、維護成本遠超晶片本身的價格,這就是「性能溢價」的核心邏輯。即使 wafer 價格越來越貴,只要性能提升的速度超過價格上漲的速度,使用者就願意為更高的價格買單。儲存晶片的定價邏輯 —— 賣的是容量,一個 bit 就是一個 bitDRAM 的核心定價公式:Pricememory ≈ f (Capacity),而單位容量的價值是恆定的。儲存晶片的價格由「能存多少資料」決定,1GB 就是 1GB,無論是用 DDR3 還是 DDR5 存,能存的資料量一樣,對使用者的價值也一樣。製程進步只能讓廠商用更低的成本生產 1GB 儲存,但無法讓 1GB 儲存的價值變高 —— 使用者不會因為你用了更先進的 1βnm 工藝,就願意為 1GB DDR5 付比 1GB DDR3 高的價格。這裡有一個關鍵的對比,能讓我們一眼看清差異:* 邏輯晶片:價格上升,但性能提升更快 → 使用者的「單位性能成本」下降 → 願意接受漲價;* 儲存晶片:價格上升,但容量不變 → 使用者的「單位容量成本」直接上升 → 會減少採購、選擇替代方案,市場天然壓制價格。簡單說,邏輯晶片是「越貴越值」,儲存晶片是「貴了就不買」,這是兩者價格走勢的本質區別。三、系統層約束:儲存不能貴,是一條物理 + 經濟定律如果你到了會思考產業且具備一定水平,你可能又會產生新的疑問 - 邏輯晶片漲價也會增加系統成本,為什麼只約束儲存?這個問題看似合理,但其實忽略了系統成本的計算邏輯,我們依然用公式解讀。系統總成本的構成與差異整個電腦系統的成本可以簡化為:System Cost=Compute+Memory但邏輯(Compute)和儲存(Memory)的成本計算方式完全不同。邏輯的系統成本:看的是「價格 / 性能」對邏輯晶片來說,真正影響系統成本的不是晶片本身的價格,而是單位性能的價格:Performance/Price只要這個比值在下降,即使晶片價格上漲,整個系統的運算成本也是下降的。比如一塊 10 萬元的 AI 晶片,性能是 10 塊 1 萬元普通晶片的 20 倍,那麼用這塊 AI 晶片的系統,單位運算成本只有原來的一半,企業當然願意選擇。儲存的系統成本:看的是「價格 × 容量」對儲存晶片來說,系統成本的計算方式是價格乘以容量:System Costmemory = Price × Capacity而在 AI 時代,儲存的容量需求是和算力同步增長的,甚至增長更快:Memory Demand ∝ Compute × K,K > 1也就是說,一個 GPU 的算力提升 10 倍,搭配的儲存容量可能需要提升 15 倍(K=1.5)。如果此時每 GB 儲存的價格再上漲 10 倍,那麼儲存的系統成本就會提升 150 倍,這是任何企業都無法承受的。這不是市場的選擇,而是物理和經濟的雙重約束,AI 算力的提升需要海量儲存的支撐,如果儲存價格長期上漲,整個 AI 產業的擴展就會戛然而止。因此,儲存價格必須在長期內維持穩定甚至下降,這是支撐科技進步的必要條件。四、資料實證:儲存的「1 美元地心引力」,邏輯的「性能溢價無上限」前面的公式解讀了理論邏輯,接下來我們用十幾年的產業資料,驗證儲存和邏輯的價格規律。重點看兩個核心指標:單位面積 wafer 的價值(Value/mm²) 和扣除周期波動的均衡價格。半導體的統一價值衡量標尺無論是邏輯還是儲存,都可以用這個公式衡量單位面積矽片的價值,這也是判斷一個半導體行業能否持續提價的核心指標 :Value  /mm2 = Density × Valueunit* Density:單位面積的基本單元數(邏輯是電晶體,儲存是 bit)* Value_{unit}:每個基本單元的實際效用價值。想要讓晶片持續提價(提升 Value/mm²),只有兩條路:要麼密度翻倍,要麼每個單元的價值變高。邏輯晶片兩條路都走通了,而儲存晶片兩條路都撞了牆。邏輯晶片 —— 密度和單位價值雙增長,Value/mm² 暴漲從 14nm 到 2nm,邏輯晶片的電晶體密度提升了 11 倍,而每個電晶體能實現的性能提升了 15 倍,兩者相乘,單位面積wafer的價值提升了 165 倍。這就是為什麼台積電 2nm 晶圓能賣到 3 萬美元一片,客戶依然排隊送錢 —— 因為這塊 wafer 能創造的價值,是 14nm wafer 的上百倍。儲存晶片 —— 密度慢增長,單位價值恆定,Value/mm² 微漲從 DDR3 到 DDR5,DRAM 的 bit 密度提升了 5 倍,但每個 bit 的價值始終不變,因此單位面積 wafer 的價值只提升了 6.2 倍,遠低於邏輯晶片的 165 倍。扣除地震、缺芯、AI 爆發等短期周期因素,三十多來DRAM 的每 GB 均衡價格始終圍繞1-3 美元波動,這就是儲存行業鼎鼎大名的「1 美元地心引力」,無論製程多先進,價格最終都會回歸到成本支撐的均衡區間。1美元地心引力這個概念是老半導體人耳熟能詳的DRAM規則,從歷史上看確實也是如此。不過2016年以後傳統資料中心因為巨量資料開始繁榮,儲存的價格有稍稍的墊高,加上這波AI熱潮,新進的且沒經歷過周期的投資者,幾乎沒有人知道所謂1美元地心引力。但是即使目前價格高企的 DDR5,其單位面積wafer的價值也只有邏輯晶片的幾百分之一,這也是儲存永遠成不了「高價品」的核心原因。DRAM 的 1T1C 儲存單元的密度直接決定了 bit/mm²,其變化規律和 bit 密度完全同步,從 DDR3 到 DDR5,每 mm² 能塞進的 1T1C 單元數從約 0.12 億個提升到 0.8 億個,提升了 6.7 倍,但由於單元尺寸卡在 6F²,這個提升速度遠慢於邏輯電晶體的 10 倍以上提升。簡單說,邏輯晶片是在「做乘法」,儲存晶片只是在「做加法」,這是兩者價值差異的核心資料支撐。五、為什麼儲存一定會有周期?供需的「超級反應」定律理解了價值和定價模型,我們就能輕易解釋儲存的周期性 —— 這不是市場情緒導致的,而是供需結構決定的必然結果。儲存的周期性動態公式Demand↑→ Supply↑↑ → Oversupply → PriceCollapse儲存需求的特點是體量巨大、高度同步,當 AI、手機、PC 需求同時上升時,整個市場會一起拉動儲存需求。而儲存供給端的特點是標準化程度高,技術路徑清晰,三星、海力士、美光三大廠商的擴產節奏幾乎一致。這就形成了一個典型的循環:需求剛剛上漲,三大廠就會同時大規模擴產,最終導致供給遠超需求,價格直接崩盤。歷史資料反覆驗證了這一點DDR3 時代:2011 年需求上漲→廠商擴產→2013 年供過於求→價格暴跌 50%。DDR4 時代:2017 年需求上漲→廠商擴產→2019 年供過於求→價格暴跌 60%。DDR5 時代:2025 年 AI 需求上漲→廠商開始擴產→預計 2027 年供給平衡維持高位→高價儲存導致消費級電子需求低迷→新技術導致AI對儲存容量增長減緩→2028年價格逐漸回落。而邏輯晶片幾乎沒有這種周期,核心原因是邏輯晶片的技術壁壘高、產品差異化大,台積電的 3nm 工藝獨步全球,NVIDIA 的 GPU 架構無人能敵,沒有企業能輕易擴產跟上需求,因此供需能長期維持相對平衡,價格也能保持穩定上漲。邏輯晶片如果競爭力不足,會體現在稼動率,而不是價格,製程節點價格永遠向上,不可能向下,但經爭力不足將導致稼動率崩盤,客戶只會選擇具備最高競爭力的Foundry。六、HBM 能改變儲存的周期宿命嗎?答案是:不能面對儲存的周期性質疑,很多人會拿 HBM舉例,HBM 賣的是頻寬和延遲,不是容量,定價邏輯和邏輯晶片一樣,能擺脫周期。HBM 的確具備了邏輯晶片的某些特徵,但其依然逃不過周期定律,核心原因有三,我們用資料和邏輯說明:產能槓桿效應:放大周期,而非消滅周期生產 1GB HBM 所需的晶圓面積是傳統 DRAM 的 2倍左右,加上良率耗損可能在3倍。AI 需求旺盛時,HBM 會抽乾通用 DRAM 的產能,導致全線漲價,而一旦 AI 需求增速放緩,HBM 釋放的產能會以 2-3 倍的壓力衝擊普通 DRAM 市場,導致價格暴跌,HBM 只是讓儲存的周期波動更劇烈,而不是消滅周期。又或者行業有其他替代方案,比如HBF會部分取代HBM,或者如Google的儲存壓縮演算法,如此一來龐大的HBM帶來產能,將沖垮DDR5,這正是三大原廠對擴產保守的一個核心原因。其實如果未來真的儲存百分百大爆發,向邏輯一般,不會因為某種新技術而被淘汰,那三大原廠必然是往死裡擴產,還擔心啥供給,他們保守以對必然有其核心邏輯。成本驅動而非價值驅動:高價是暫時的目前 HBM 的高價,主要來自於封裝良率低(良率不足 70%)和 TSV(矽通孔)工藝成本高,而不是其單位價值高。一旦工藝成熟、良率提升到 80% 以上,HBM 的成本會大幅下降,價格競爭依然會回歸 ,HBM 的高價是技術不成熟的結果,不是結構性的性能溢價。目前我們可以看到三大原廠對擴產的保守,目的就是長維度的維持高價格,但本質還是人為的利用供給手段來調控價格,即便未來儲存長時間維持高價,但依然沒有本質的改變。同質化競爭:沒有企業能壟斷技術三星、海力士、美光在 HBM 技術上的差距極小,沒有企業能像 NVIDIA 在 GPU 領域那樣形成技術壟斷。只要是同質化競爭,最終的競爭手段必然是「產能擴張 + 價格戰」,這是大宗商品的必然規律 ,HBM 依然是儲存,不是邏輯晶片。簡單說,HBM 只是「高級的儲存」,並沒有改變儲存,『賣容量(頻寬本質也是容量的一種體現)、單位價值恆定』的核心屬性,因此依然逃不過周期宿命。七、結語:儲存的周期,是物理和經濟的雙重必然2025-2026 年的這輪儲存超級周期,的確是 AI 驅動下的歷史性行情,但這並不意味著儲存行業的規律變了。儲存和邏輯晶片的根本差異,從來不在於電晶體和製程,而在於價值函數和單位面積價值潛力:* 邏輯晶片賣的是性能,性能隨電晶體超線性增長,因此能靠性能溢價實現長期提價,定價權掌握在企業手中。* 儲存晶片賣的是容量,容量的單位價值恆定,因此價格只能圍繞成本波動,定價權掌握在供需曲線手中。再加上 DRAM 的 1T1C 單元卡在 6F² 的物理極限,密度提升速度放緩,單位面積價值潛力幾乎見頂,儲存的周期性就成了物理和經濟的雙重必然。對於投資者和產業從業者來說,最危險的念頭就是「這一次不一樣」。當所有人都認為儲存擺脫了周期、會長期漲價時,往往就是下一個周期頂點降臨的時刻。AI 只是給儲存行業打了一劑強心針,讓它在短期內光鮮亮麗,但並沒有改變 DRAM 作為「科技大宗商品」的底層基因。儲存不相信奇蹟,只相信供需。這條底層規律,過去成立,現在成立,未來依然會成立。而這,正是儲存這個行業最難以改變、也最值得市場敬畏的底層規律,技術進步可以提升效率、降低成本,可以催生出高端的性能型細分品類,但始終無法改變其作為基礎元件的容量定價核心,也無法擺脫供需同步性帶來的周期桎梏。對於市場而言,認清儲存產業的周期本質,摒棄 “結構性漲價” 的幻覺,才能做出更理性的產業判斷與投資決策。加入知識星球,你將會得到比所有人更前瞻的行業動態與趨勢,沒有推票,只有最正統的產業邏輯去看投資市場,知識付費,掃文章末尾二維碼即可加入。(梓豪談芯)
亞太股市集體重挫,A股儲存晶片全線殺跌,港股科網股大跳水,智譜跌15%,新能源汽車股飆漲
截至4月2日收盤,A股四大指數集體回呼,滬指跌0.74%,深證成指跌1.60%,創業板指跌2.31%,科創綜指跌2.56%。滬深京三市成交額不足1.9兆,較昨日縮量逾1500億。圖源/21財經客戶端行業類股多數收跌,石油石化、醫藥商業、能源金屬類股漲幅居前,貴金屬、元件、通訊服務、小金屬、半導體、廣告行銷、玻璃玻纖類股跌幅居前。個股方面,上漲股票數量超過1000隻,逾30隻股票漲停。總體來看,兩市個股呈普跌態勢,全市場下跌個股超4300隻。A股油氣股逆市走強,博匯股份20cm漲停,中油工程漲超10%,藍焰控股、貝肯能源漲停,招商南油、通源石油等漲幅超6%。消息面上,據央視新聞,川普一句話嚇壞市場,川普表示戰爭將持續到四月下旬,威脅要打擊伊朗的發電廠,國際油價大幅攀升,截至15:08,布倫特原油日內漲幅達7.0%,報108.32美元/桶;WTI原油日內漲幅達6.5%,報106.66美元/桶。下跌方面,貴金屬類股集體調整,曉程科技、湖南黃金跌幅居前;算力租賃概念集體調整,優刻得、首都線上、利通電子大跌;儲存晶片類股多股全線殺跌,南亞新材跌超10%,精測電子、東芯股份、精智達多股跌超6%。大宗商品方面,國際金銀價格持續跳水,現貨黃金日內大跌4%,現報4564.73美元/盎司。現貨白銀回落至70美元/盎司下方,日內跌6.72%。港股科網股大跳水,智譜跌15%新能源汽車股逆勢飆漲港股低開低走,恆指、恆科指雙雙跌超1%,恆指一度跌破25000點,科網股大跳水,恆生科技指數跌幅1.86%,AI應用股大幅調整,智譜跌近15%,權重科技股全線下跌,其中華虹半導體跌超4%,小米跌近4%,阿里巴巴、美團跌超3%。港股市場部分新能源汽車股逆勢飆漲,其中,奇瑞汽車漲超7%,吉利汽車漲近6%,長城汽車漲近5%,零跑汽車漲超2%。 (21世紀經濟報導)
讓儲存晶片暴跌的Google論文,被指學術不端
近日,Google公佈的全新AI內存壓縮技術“TurboQuant”,引發了業界的極大關注。該技術宣稱能在不犧牲模型精準度的前提下,將生成式AI推理階段最吃資源的“鍵值快取”(KV Cache)空間需求減少到原來的1/6,並讓計算速度暴增8倍。這一突破性的技術,也引發了整個市場對於記憶體需求將斷崖式下跌的擔憂,美光、Sandisk、西部資料等儲存相關美股紛紛大跌。然而,就在3月27日,蘇黎世聯邦理工學院博士後、RaBitQ系列論文第一作者高健揚公開發佈澄清信,指控TurboQuant論文存在“系統性迴避方法相似性”、“錯誤描述RaBitQ的理論結果”、“刻意創造不公平的對比實驗環境”等三處嚴重問題,且這些問題在論文投稿前已通過郵件明確告知TurboQuant團隊,對方知情卻未修正。RaBitQ是高健揚2024年發表的高維向量量化方法,其核心創新之一是在量化前對輸入向量施加隨機旋轉(Johnson-Lindenstrauss變換),並從理論上證明其達到了理論電腦頂級會議論文(Alon-Klartag, FOCS 2017)給出的漸近最優誤差界。以下為高健揚發佈的原文:大家好,我叫高健揚,目前在蘇黎世聯邦理工學院做博士後,我是 RaBitQ 系列工作的第一作者。Google Research 於2026年1月被 ICLR 2026 會議接收的論文 ”TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate“ 中,有關已有的 RaBitQ 向量量化演算法的描述,理論結果對比,實驗對比均存在嚴重問題(詳細情況後文會展開描述)。這些問題在論文投稿至 ICLR 2026 前已被我們通過郵件明確指出,TurboQuant 團隊也明確表示已知情,但選擇了不予修正。論文隨後被 ICLR 2026 會議接收,然後通過 Google 官方管道大規模推廣,在社交媒體瀏覽量已達到數千萬次。我們此時公開說明,是因為錯誤的學術敘事一旦廣泛傳播,糾正的成本會越來越高。背景:RaBitQ 是什麼RaBitQ 系列論文(如下所列)於2024年發表,提出了一種高維向量量化方法,並從理論上證明其達到了理論電腦頂級會議論文(Alon-Klartag, FOCS 2017)給出的漸近最優誤差界。RaBitQ(arXiv:2405.12497,2024年5月,隨後發表於頂級會議SIGMOD 2024) 擴展版(arXiv:2409.09913,2024年9月,隨後發表於頂級會議SIGMOD 2025)RaBitQ 的核心想法之一是在量化前對輸入向量施加隨機旋轉(random rotation / Johnson-Lindenstrauss 變換),利用旋轉後坐標分佈的性質做向量量化,在理論上實現最優誤差界。TurboQuant 論文問題一:系統性地迴避 TurboQuant 方法與已有 RaBitQ 方法的相似性RaBitQ 與 TurboQuant 在方法層面有直接的結構聯絡,兩者都在量化前對輸入向量施加隨機旋轉(Johnson-Lindenstrauss 變換)。這是兩篇論文方法設計中最核心、最接近的部分。TurboQuant 的作者在 ICLR OpenReview 審稿平台上對審稿人的回覆中,親自這樣描述自己的方法:“We achieve this by first normalizing the vectors by their l2 norm and then applying a random rotation (隨機旋轉)to ensure the entries of the vectors will have a beta distribution post rotation.”然而在這段回覆、TurboQuant 論文中的方法介紹乃至整篇論文中,從未正面說明這一結構與 RaBitQ 完全一致。這一迴避發生在以下背景之下:2025年1月(TurboQuant 論文在 arXiv 發佈的數月前),TurboQuant 論文的第二作者 Majid Daliri 主動聯絡我們,請求幫助偵錯他自己基於 RaBitQ C++ 程式碼實現的 Python 版本。他詳細描述了自己復現的步驟、程式碼片段和具體報錯,這一點可以說明 TurboQuant 團隊對 RaBitQ 的技術細節有充分的瞭解。之後在2025年4月他們在 arXiv 發佈的論文版本,以及2025年9月他們在 ICLR 2026 會議投稿的論文版本中,他們將 RaBitQ 描述為 grid-based PQ,並且在描述中忽略了 RaBitQ 中核心的 random rotation 的步驟。ICLR 的一位審稿人也在審稿意見中獨立指出:”RaBitQ and variants are similar to TurboQuant in that they all use random projection”,並明確要求更充分的討論和比較。儘管如此,在 ICLR 會議最終版本論文中,TurboQuant 的作者不僅沒有加入對 RaBitQ 討論,甚至反而還將原本正文中對 RaBitQ 不完整描述移到了附錄中。為此,我們於2026年3月通過郵件聯絡了 TurboQuant 所有作者,提出了以上問題及糾正請求後,TurboQuant 作者在回覆中以“The use of random rotation and Johnson-Lindenstrauss transformations has become a standard technique in the field, and it is not feasible for us to cite every method that employs them.”為由拒絕了這一請求。我們認為這一回應是在轉移矛盾:作為在相同問題設定下率先將隨機旋轉(Johnson-Lindenstrauss 變換)與向量量化結合、並建立最優理論保證的具體先行工作,RaBitQ 應當在文中被精準描述,其與 TurboQuant 方法的聯絡應當充分討論。TurboQuant 論文問題二:錯誤描述 RaBitQ 的理論結果TurboQuant論文在不提供任何論據的情況下,將 RaBitQ 的理論保證定性為”次優”。TurboQuant 論文寫道:“While the paper’s theoretical guarantees are suboptimal, likely due to loose analysis — as practical performance surpasses theoretical bounds”這句話直接將 RaBitQ 的理論保證定性為”次優(suboptimal)”,將原因歸結為”較粗糙的分析(loose analysis)”。但論文沒有提供任何推導、對比或證據來支撐這一判斷。事實是:我們在拓展版 RaBitQ 論文(arXiv:2409.09913)的 Theorem 3.2 中,已經嚴格證明 RaBitQ 的誤差界達到了理論電腦頂級會議論文(Alon-Klartag, FOCS 2017)給出的漸近最優誤差界。因為這一結果,我們被邀請至理論電腦科學頂級會議 FOCS 的 Workshop 進行報告。 為此,我們於2025年5月通過郵件與 TurboQuant 的第二作者 Majid Daliri 進行了多輪詳細的郵件技術討論,逐條澄清了 TurboQuant 團隊對我們理論結果的錯誤解讀。Majid Daliri 在郵件中明確表示已將這些討論告知全體共同作者。然而後面 TurboQuant 論文在提交至 ICLR 2026、經過審稿、被接收,最終大規模宣發的全過程中,這個對 RaBitQ 理論保證的錯誤定性始終未被修正。一個沒有證據支撐的斷言,在被原作者具體指出錯誤、且 TurboQuant 作者方已明確知情的情況下,仍被保留在正式發表的 TurboQuant 論文中,我們認為這已超出普通失誤的範疇。TurboQuant 論文問題三:刻意創造不公平的實驗環境TurboQuant 論文使用劣化的實現、關閉多線程使用單核CPU測試 RaBitQ 的效果,卻使用 A100 GPU 測試 TurboQuant 的效果。TurboQuant 報告的 RaBitQ 量化速度比我們開源實現的實際速度慢了數個數量級。 2025年5月的郵件中,Majid Daliri 本人解釋了這一差距的來源:“we were using a single-core CPU instance, and multiprocessing was indeed disabled […] we weren’t fully utilizing parallelism, which explains why it was significantly slower”我們的官方 RaBitQ 程式碼在論文發佈至 arXiv 時(2024年5月與2024年9月)就已經公開,並且默認採用多線程平行。並且,Majid Daliri 在2025年1月的郵件中還說明,他成功跑通 RaBitQ 的程式碼用以測試,但他用於實驗的仍是自己翻譯的 Python 版本。這意味著,TurboQuant 論文中對 RaBitQ 速度的報告,疊加了兩層系統性的不公平條件:使用自己翻譯的 Python 程式碼,而非我們開放原始碼的 C++ 實現使用單核CPU,關閉多線程平行測試 RaBitQ 演算法,但卻使用 NVIDIA A100 GPU 測試 TurboQuant 演算法以上兩點均未在論文中充分披露。讀者看到的是 RaBitQ 比 TurboQuant 慢數個數量級這一結論,卻無從知道這一結論建立在刻意創造的不公平的實驗條件之上。事件完整時間線2024年5月:RaBitQ 論文在 arXiv 發佈,同時原始碼公開(後面發表在頂級會議 SIGMOD 2024)2024年9月:拓展版 RaBitQ 論文在 arXiv 發佈,同時原始碼公開(後面發表在頂級會議 SIGMOD 2025)2025年1月:TurboQuant 論文第二作者 Majid Daliri 聯絡我們,請求協助偵錯 Python 版 RaBitQ 實現2025年4月:TurboQuant 論文在 arXiv 發佈2025年5月:我們跟 Majid Daliri 通過郵件詢問了實驗條件的差異並清楚解釋了 RaBitQ 的理論保證最優性, Majid Daliri 表示他已告知全體作者,但在我們要求修正 TurboQuant 論文中的事實性錯誤之後,Majid Daliri 停止回覆2025年11月:我們發現 TurboQuant 論文被提交至 ICLR 2026 會議,且論文中的事實性錯誤並未修正,為此我們聯絡了 ICLR 2026 PC Chairs,未獲回應2026年1月:TurboQuant 論文被 ICLR 2026 接收 2026年3月:TurboQuant 團隊通過 Google 官方管道持續推廣,社交媒體相關瀏覽量已達數千萬次2026年3月:我們正式向 TurboQuant 全體作者傳送郵件,闡述以上三個事實性問題並要求做出修正及澄清。截至目前為止,我們僅收到 TurboQuant 論文第一作者 Amir Zandieh 的籠統答覆,承諾會修正問題二和問題三,但拒絕修正問題一(即討論 TurboQuant 與 RaBitQ 在技術上的相似性)。並且,他們僅願意在 ICLR 2026 正式會議結束之後才做相應修正我們已經做了什麼在 ICLR OpenReview 發佈公開評論: https://openreview.net/forum?id=tO3ASKZlok向 ICLR General Chairs, PC Chairs, Code and Ethnics Chairs 再次提交正式投訴,附完整證據包我們接下來會做什麼在 arXiv 發佈詳細的關於 TurboQuant 和 RaBitQ 的技術報告考慮向相關機構進一步反映最後我們提出這些問題,目標是讓公共學術記錄精準地反映各方法之間的真實關係。一篇論文被 Google 以數千萬曝光量推向公眾,在這種體量下,論文中錯誤的敘事不需要主動傳播,只需要不被糾正,就會自動成為共識,這也是我們選擇公開記錄的原因。在此我們也懇請大家讓更多人知道 TurboQuant 論文背後存在的問題,我們相信真理越辯越明。 (芯智訊)