“有人因閃崩恐慌離場,有人卻看到了倒車接人的機會。”
過去一年儲存行業迎來歷史性的上漲大周期。
根據TrendForce今年2月發佈的報告,2026年第一季度傳統DRAM合約價比2025年第四季度漲了90%到95%;2026年第一季度NAND Flash合約價比前一個季度漲了55%到60%。
然而3月下旬開始,市場突然變臉,DRAM現貨市場出現了恐慌性拋售,DDR4、DDR5記憶體條現貨價格一下子跌了不少,有資料顯示主流32GB DDR5套裝價格從3月中旬的2999元左右降至2200元附近,單月跌幅接近27%。
現貨市場的下跌,也讓無數從業者和投資者困惑,市場真實的供需到底緊不緊張?
既然 AI 算力需求這麼大,為什麼傳統記憶體還會遭遇現貨閃崩?儲存股的上漲邏輯還在嗎?(有關儲存市場更多討論,可加入作者微信 Evelynn7778 互通有無。)
為此,雷峰網邀請了兩位身處儲存產業鏈一線的嘉賓,從管道、客戶、系統廠商的多重視角,共同拆解這輪儲存周期背後的真相和未來走向。
- 郭照斌:中科曙光北京公司副總裁、正高級技術專家,擁有15年儲存系統架構與研發經驗。主導研發的分佈式儲存ParaStor及集中式全快閃記憶體儲FlashNexus多次斬獲全球性能榜單第一,在AI推理、金融高頻交易等關鍵場景擁有極深的落地經驗。
- 王文浩:長虹佳華高級副總裁,在ICT領域擁有超二十年深厚積澱,負責公司資料解決方案業務的戰略規劃與營運管理,從2013年起帶領團隊佈局資料儲存與管理業務,積極推動以冷儲存為特色、覆蓋熱溫冷多級資料場景的解決方案體系。
01 過去一年儲存報價失控:不再是以年為單位,每一天都在變
在王文浩看來,這輪儲存漲價潮並不是一夜之間爆發的。
作為國記憶體儲領域頭部分銷商的長虹佳華,橫跨十數個品牌、連接逾萬家核心管道生態夥伴與客戶,這種全面的觸角讓其對供需關係變化的感知更為敏銳。
他回憶說,早在2025年Q1到Q2,漲價的苗頭就已經出現。當時三大原廠剛剛完成減產,市場的直接感受還不明顯。但到了Q3,尤其是七八月份,需求端開始出現明顯變化。
部分原廠接到了大單,開始提前備貨,第一輪產能緊張就開始出現了。一些型號的交付開始變得困難。進入Q4,行情迅速升溫,原廠交貨周期被拉長到兩三個月,市場進入快速漲價階段。
到11月、12月,瘋狂的一幕出現了:一些熱門產品開始按天報價,管道端也出現惜售和囤貨。春節前後,很多產品價格較最初已經翻了好幾倍。
這背後的核心驅動力,首先來自AI算力需求爆發。以HBM為代表的高性能記憶體需求激增,擠佔了原本用於DDR的晶圓產能,造成結構性供需錯配。與此同時,原廠主動減產甚至停產DDR4,加速產品切換,也讓存量市場進一步緊張。
當然,市場炒作因素也有份。
當產品從“正常波動”變成“買不到”,當報價周期從按年變成按天,管道端的惜售、囤貨和預期交易就會放大波動。價格上漲本身,又會進一步強化缺貨預期。
這也是為什麼同樣在一輪上漲周期裡,市場會同時看到兩個看似矛盾的現象:一邊是原廠合約價大幅上漲,另一邊是華強北現貨價格突然閃崩。
換句話說,儲存行業正在變熱,但並不是每一個環節、每一種產品,都以同樣的方式變熱。
02 HBM 產能排到2027年,中國國產替代接受度在提升
一切瘋狂的源頭,都指向了AI算力中心的核心——HBM。
王文浩透露,從市場觀察供給側,三星、海力士、美光三大原廠的HBM產能訂單已經排到今年年底,甚至到2027年。
原因並不複雜:AI需求增長太快,但原廠產能爬坡需要時間,HBM生產線投資大,決策周期長,不可能在短時間內快速擴張。更重要的是,儲存行業本身具有強周期屬性,原廠也不會無限制地擴產。
因此,在一段時間內,HBM緊缺仍然會是一個持續存在的問題。
受影響最大的,是做智算中心項目、追趕大模型進度的雲服務商、網際網路大廠,以及一些大型行業項目。很多客戶提前半年或一年做好預算,由於HBM價格暴漲,面臨著“投標沒人敢投”的尷尬局面,不得不延期項目或修改配置方案。
不過,危機裡也蘊藏著中國國產替代的機會。隨著國際品牌價格持續走高且優先供應歐美客戶,中國客戶越來越務實,對中國國產HBM的接受度正在逐漸增加。
視線拉回原廠內部,HBM的技術路線也出現了巨大分歧。三星在HBM4上激進押注4nm邏輯製程做基底晶片,而SK海力士則走更成熟的路線 ,外界對三星良率的擔心也很多。(有關三星、海力士等原廠HBM路線選擇,可加入作者微信 Evelynn7778 討論。)
有人用一個極其生動的帆船比賽理論解釋了這一現象:領航者(SK海力士)求穩,而追趕者(三星)就需要在HBM4上押注更激進的路線,一旦突破,就有機會重新爭奪份額。
反過來,作為領航者的海力士,也必須關注追趕者動態,在保持穩定的同時切向新賽道。良率是相對的,只要性能提升能給GPU帶來更高的應用價值,就能彌補良率的不足。
至於有人擔心“輝達Groq架構的LPU會不會顛覆HBM”,郭照斌覺得不太可能。他類比了光儲存到HDD、再到NVMe SSD的演進史,強調新東西要取代成熟的生態,不是一朝一夕的事。
“HBM已經形成了真金白銀的爆炸式投入,生態匹配非常快。大家已經在資料中心建了這麼多東西,不可能馬上再花錢替代 。”
03 DDR4閃崩與磁帶復興,看似矛盾實則合理
大模型不僅吃掉了HBM的產能,更引發了強烈的算力溢出效應。
王文浩指出,HBM和DDR5在生產工藝上存在晶圓爭搶,HBM的暴增直接擠佔了DDR5的產能;同時,原廠戰略投資向高性能記憶體傾斜後,SSD產能增長也會受到影響,價格同樣出現上行壓力。
因此,儲存市場呈現出一種整體上漲的趨勢。
HBM、DDR5和SSD之間,是一條性能遞減、容量遞增的鏈條。HBM解決的是高頻寬、高性能問題;DDR5在性能和容量之間折中;SSD則更偏向大容量儲存。SSD並不能直接接住HBM的性能流量。
也就是說,客戶不是簡單地在這些產品之間做替代,而是在預算和性能要求之間重新組合方案。
有意思的是,在性能狂飆的另一邊,古老的磁帶儲存反而迎來了意想不到的復興。
王文浩分享了一個有趣的現象:AI模型訓練需要海量冷資料沉澱,在裝置漲價的大環境下,怎麼低成本、安全地儲存這些“冷資料”成了難題。
磁帶因為安全性高、省電、成本極低,從今年年初開始先在歐美市場爆發,中國大廠迅速跟進,需求快速增加,目前相關廠商的產能也已經被佔滿 。
但這並不意味著“冷儲存”是一門簡單的生意。王文浩指出,AI時代的冷熱資料流轉頻繁,客戶需要為不同資料選擇合適的儲存介質,更需要讓資料在“熱、溫、冷”多級儲存之間平滑流動、按需調取。
這正是長虹佳華的賽道。目前,長虹佳華已經建構了以冷儲存為特色、覆蓋熱溫冷多級資料場景的完整解決方案體系,從底層介質選型到上層資料智能管理軟體,幫助客戶在應對海量AI資料時,將綜合儲存成本壓至最低,同時保障資料調取的效率。
但同時,DDR4現貨價格的閃崩也提醒市場:不是所有上漲都具有同樣的確定性。
之前華強北DDR4現貨價格明顯下跌,比如16GB DDR4從900元左右跌到700元左右。表面上看,這跟“儲存緊缺”的大邏輯矛盾,但王文浩認為,這本質上就是存量產品的價格波動。
外資原廠已經停產DDR4,市場上就是“有多少賣多少”。當DDR5緊缺時,一部分需求溢出到DDR4,再疊加炒作因素,價格很快被推高。但當DDR4漲到性價比下降,需求又可能回到DDR5或其他替代方案,價格自然就回落了。
王文浩強調,長虹佳華作為專業服務商,不會跟著行情去“賭”。穩定健康是其核心策略:一方面要守住交付確定性,另一方面也要幫助管道夥伴理解市場底層邏輯,把真實需求放在第一位,不要把不確定性風險放大。
對系統廠商而言,AI帶來的儲存需求更直接地體現在高性能儲存系統上。
郭照斌結合中科曙光的業務證實了這一點:AI最直觀帶動的是SSD這類儲存系統,需求量和應用量最匹配。曙光做儲存,最早就是配合高性能超算中心,第一關注點就是高性能。AI出現後,他們團隊在2023年底便開始關注相關趨勢,並結合高性能計算場景做適配。
隨著AI繼續深入,儲存系統要面對的不只是簡單的資料讀寫,而是HBM、記憶體、KV Cache、外接儲存等多層級協同。
郭照斌提到,曙光已經圍繞KV Cache解除安裝、向量資料庫支援等“近計算”能力做了很多性能開發和應用適配,GDS(GPU直接訪問儲存)、KV Cache解除安裝這些能力也已經逐步產品化並進入商業應用。
這意味著,AI時代的儲存產品,正在從“放資料的地方”變成“參與計算流程的一部分”。(AI時代儲存產品的地位還發生那些變化?歡迎加入作者微信 Evelynn7778 一起交流。)
04 從賣容量到賣效率,儲存的定價邏輯正在轉變
當圓桌進入尾聲,兩位大咖揭示了本輪AI浪潮對儲存行業最深遠的影響:商業模式的底層邏輯正在被徹底重構。
過去,儲存廠商的鐵律是按容量定價,靠規模降本。但在 AI 時代,這個邏輯可能會有些轉變。
郭照斌提到,輝達前不久開大會時,專門為儲存系統定義了一套新標準,把專業儲存廠商聚到一起,討論GPU和儲存之間的新協議。
原因很直接:HBM再大也有容量限制。隨著模型參數越來越大、視訊模型等新應用不斷出現,資料量已經不是HBM或記憶體能夠完全承載的。未來AI生態必須把儲存緊緊捆綁進來,這意味著,未來儲存的價值衡量方式,可能不再只是容量,而是整個AI應用的效果。
用了某家的儲存系統,模型響應時間是不是更短?推理效率是不是更高?GPU利用率是不是更充分?Token呼叫的效率和效益是不是更好?這些指標,都會慢慢進入客戶的採購決策。
當客戶開始從“買多少容量”轉向“提升多少效率”,儲存廠商的議價權也會跟著變。
在這個新法則下,管道商的生存之道也在悄然改變。王文浩坦言,以前客戶找管道商主要是比價格,但在結構性缺貨的當下,核心訴求變成了“保交付、穩供應” 。同時,面對高昂的裝置成本,客戶迫切需要成本最佳化的整體解決方案 。
王文浩表示,這對長虹佳華來說是一種價值提升。一方面,長虹佳華在產品資源上相對豐富;另一方面,價格上漲後,客戶對成本最佳化解決方案的關注度越來越高,這對管道商的解決方案能力提出了更高要求。
所以,長虹佳華並沒有簡單把自己定位成分銷商,而是持續投入技術人員,要求團隊更懂客戶業務,幫客戶設計合理的資料儲存方案。經過幾年積累,在儲存全生命周期管理、資料管理技術服務和解決方案能力上,已經得到了客戶認可。
至於要不要向上游自研產品延伸,王文浩認為,這是延伸產業鏈價值的一條路徑,但不是唯一方案。
在他看來,長虹佳華本質上是科技服務商,是生態連接者和增值服務商。面對結構性缺貨,市場真正需要的是橫跨多品牌的全域視野、調配供需的操盤能力,以及理解客戶業務的解決方案交付能力。
從熱資料的高效供給,到溫冷資料的長效管理,長虹佳華依靠在儲存領域多年摸爬滾打的市場營運經驗,與全端資料儲存技術方案的能力沉澱,正在這輪周期中確立更高的生態價值。
AI讓整個儲存行業踏進了一個歷史性的大周期,但與此同時,市場也必須承認:AI需求再強,也不會讓所有儲存產品無差別上漲。這意味著,從原廠到模組,從管道到系統廠商,每一個產業鏈角色都要重新思考自己的定位,誰能最快把“儲存裝置”轉化為“算力效率”,誰就能抓住這波機遇,吃到這輪周期裡最厚的一塊蛋糕。
以下是此次圓桌討論的精彩分享,雷峰網進行了不改原意的編輯整理:
聊體感:春節期間供需最緊張,甚至按天報價
雷峰網·胡敏:長虹佳華處在原廠與下遊客戶之間,對水溫變化最敏感。這場儲存漲價潮,你們的體感是從什麼時候開始從“正常波動”變成“缺貨焦慮”的?
王文浩:2025年第一個季度到第二個季度之間因為三大原廠之前做了減產,所以當時基本上相關體感不是很明顯。但是大概到七八月份的時候,需求端發生一些變化,有部分原廠接到了很大的需求,所以提前開始備貨,第一輪的強產能開始,這就導致了部分型號交貨開始變得困難。
到了第四個季度,這個情況就比較加劇了。一方面,原廠的交貨周期變長了,大概兩三個月,對應下來的話,整個市場也進入了比較快速地大幅漲價的階段。到了十一二月底的時候,有些比較熱門的產品甚至開始按天報價。管道端也出現了惜售囤貨,這種現象到了春節前應該說達到頂峰,很多產品跟最開始的價格相比翻了幾倍。到目前看的話,基本上到了一個相對的平穩期。
這個漲價背後的驅動力在我們看來可能還是多重因素吧。首先最核心的還是AI算力需求的爆發。不僅是中國,歐美算力的爆發是非常迅猛的,以HBM為代表的高性能記憶體需求一下就激增了,擠佔了原本用於DDR的晶圓產能,造成了結構性的供需錯配。
其次,由於技術迭代,原廠產能投資也在調整。比如三大記憶體廠商都主動減產,甚至停產了DDR4,加速了整個產品的切換,也導致了DDR4存量市場供應的緊張,價格也就隨之波動。
另外,也存在市場炒作的因素,疊加到一起,一定程度上也放大了價格的波動。
聊HBM:HBM4路線分歧背後,像帆船競賽一樣的博弈
雷峰網·胡敏:三大原廠說自己產能被全數預訂一空。但從管道端看,HBM到底是什麼樣的緊缺狀態?什麼樣的客戶最著急?有沒有客戶因為拿不到HBM而改變方案或者推遲項目?
王文浩:其實從市場整體來看,我們瞭解到的需求跟供給的問題其實也是一樣的——三大原廠的產能訂單已經排到今年年底甚至到2027年了。整個大背景就是剛才講的AI需求增長太快。
但原廠產能增長,實際上需要爬坡期。因為投資本身比較大,生產線也需要時間,加上對於原廠來說整體決策可能需要一個長時間的市場判斷,所以在這個周期裡面跟不上迅速增長的需求量。
而且從原廠的經營策略來看,它也會在合理範圍之內控制產能的擴張速度,所以可能在一段時間之內需求端緊缺的問題還會存在,受影響比較大的是計算中心項目客戶、正在追趕大模型進度的雲服務商、網際網路大廠、一些行業的大型項目。
這些客戶可能有些預算都已經是提前半年、一年計畫好的,結果這麼大的價格波動,導致預算差異比較大。那我們其實看到這個市場經常出現沒有人能投標的情況,這樣的話就會導致項目的延期。甚至使用者那邊會改改方案、整整配置,都會導致剛才講的春節過後很多項目都沒有按照原來的進度進行的情況。
雷峰網·胡敏:那在海外HBM拿不到貨的情況下,有些客戶會考慮中國國產HBM。我們也看到中國國產封測廠已經展示960GB/s的HBM3e樣品,像長鑫儲存也在推進量產準備。從管道接觸下來,客戶對中國國產HBM是什麼態度?是有就行還是必須等國際品牌?
王文浩:我覺得可能不同需求的客戶態度不一樣,但是大家整體上還是比較務實的。我們其實也觀察到了一部分的客戶一開始還是比較堅持國際品牌,但是隨著行情變化,現在開始接受中國國產。
其實我們有一些合作的廠商陸陸續續都在推進自己的產品,而且從整個供應角度來看,我覺得他們也在加大這方面的生產力度。
我覺得兩方面原因,一方面確實有成本壓力,國際品牌的價格持續走高,在歐美的銷售價格要比在中國的銷售價格高,所以從原廠角度來講,更願意把產能分配給歐美使用者。
但同時中國的品牌現在也有具備競爭力的選擇了。我們自己一些產品的性能表現也越來越能夠滿足客戶的需求,包括其實像曙光那邊的一些產品應該也採用了中國國產。我覺得客戶的接受度是在慢慢增加的。
雷峰網·胡敏:我們瞭解到HBM4現在存在路線的分歧,像三星押注4nm邏輯製程做基底晶片,SK海力士相對來說更穩健,聯合台積電走多線平行的策略。大家會很疑惑的是三星為何如此激進?目前的良率問題能否快速解決,實現在HBM4上的翻盤?
其實更多是商品策略。國際上有一個非常有名的帆船競賽案例,當出現順風或逆風情況,作為跟隨者,你想超越,就必須做出和領航者不一樣的東西。反過來作為領航者,不被別人超越,其實你還要關注一下對手的動態,保持與其相同的航向選擇。不管選擇是對是錯,憑藉之前的優勢,始終還能是領先的。
三星和海力士目前就是這個狀況。海力士HBM3的市場份額很高,而三星其實很低。那後者想超越,就要緊追下一代,如果突破了,肯定能搶到更多的市場份額。
那反過來,海力士在保持穩定的同時,肯定也要關注最新的市場狀態。並且本身技術的發展迭代確實是比較快,海力士也必須得切到更新的賽道上。從雙方這麼多年的成熟的經歷來看,他們本身的追趕策略,包括最終良率的提升,都還是有比較大的可能性。
雷峰網·胡敏:所以您還是比較看好三星的商業策略,有可能實現在HBM4上的翻盤?
對。我覺得這是一個在國際上表現比較好的企業必然會採用的策略。
雷峰網·胡敏:那良率問題現在能否得到快速解決?
良率其實都是相對的。當性能在整個代際上升了一代、GPU實現跨代更高的使用效率,那其實良率低一點,價格也可以賣出更高的應用價值。這可以彌補一部分良率的不足。並且本身先進的技術都是從良率低慢慢往前演進的。大家更關注是否真能帶來比較好的效果。
雷峰網·胡敏:我最近看到業內還有一個疑問是,輝達如果推出Groq設計的LPU晶片,會不會削弱HBM的需求,甚至顛覆HBM?您怎麼判斷這種“替代”風險?
其實這種替代的風險在整個科技或者IT行業時刻會發生。包括從儲存本身的介質來說,其實從之前藍光這種很慢的光儲存到硬碟、HDD盤、SAS盤,再到最新的NVMe盤,都是代際能力更好的發展表現。
回過頭去看每一個新的代際出現之後,它並不能在短時間內就把一個已經有成熟生態的產品很快速取代掉,這其實很難。NVMe、SAS已經發展有十幾年了,但其實現在依然是HDD、SAS、NVMe並存的市場狀態。
聊其他儲存產品:冷資料沉澱成為剛需,磁帶產品復興
雷峰網·胡敏:HBM目前雖然供不應求,但它的需求也在帶動其他儲存產品的變化。就像剛才浩總提到的,三大廠商把產能轉向 HBM之後,像我們平時用的DDR4、DDR5以及企業級SSD,它們的供需關係也在發生一些比較微妙的變化。所以,想請浩總給我們解讀一下:除HBM之外,像DDR4、DDR5、SSD這些產品,目前的供給情況究竟如何?
王文浩:我先分享一下這些產品供給側的關係。現在AI大模型訓練和推理算力需求比較大,我們平時習慣叫高頻寬視訊記憶體的HBM能滿足這種需求。而HBM之所以會緊缺,除了前面提到的結構性供需錯配,由於HBM和DDR5在生產工藝中都要使用同一類晶圓,兩者之間是存在晶圓爭搶的關係。所以對於HBM持續、大量的需求反饋,從供給側來看的話會擠佔DDR5的產能。DDR產能一被擠佔,那市場價格就上漲,供應就緊張。
再說SSD。SSD和記憶體之間的關係,實際上是生產商固定資產投資的方向在支撐。我們認為隨著更多廠商的戰略投資轉向記憶體,SSD的產能增長會變得緩慢,那麼價格也會增長。所以整個市場就呈現整體都要漲的姿態。
那提到需求溢出,實際情況是從HBM到DDR5再到SSD,屬於性能遞減、容量遞增的三級快取,不是串聯的通道溢出,也不是一個剛性的傳導。
需求溢出的核心是生產端結構性短缺,不是簡單地說HBM不夠了就買DDR5、SSD。SSD接不住性能的流量。不同客戶根據預算與性能的要求,可能直接選擇“HBM+DDR5+SSD”的組合方案。這個不是一個被動的傳導。
因為都漲價了,需求的溢出是在每一層傳導,所以我們也觀察到一個有趣的現象——原來已經不太被關注的磁帶產品業務迎來復興。
因為AI模型訓練的要求,海量的冷資料沉澱成為剛需。現在裝置漲價,那海量資料怎麼存?怎麼用?怎麼降低成本?可能答案就是給不同的資料安排合適的儲存介質,那磁帶由於安全性以及在節能減排上的優勢,比較適合現在大量的AI產生的冷資料儲存。我們瞭解到很多主流的公有雲的深度歸檔層都採用了磁帶技術。
佳華也關注到這一方向,那我們也為客戶提供相對應的解決方案,來幫助公有雲和資料量比較大的行業客戶,包括幫助超巨量資料中心來應對資料暴增以及成本大幅提升的挑戰。
雷峰網·胡敏:佳華是什麼時候觀察到這一現象的呢?
王文浩:其實做對應的產品的時間也比較久了,可能有20多年。但是真正發現這個需求開始增長,因為傳導有延遲,所以差不多就在今年年初。
最開始發現傳導的現象還是海外的市場,緊接著中國的一些剛才講的大型網際網路公司,包括雲廠商開始有跟進。而且我們也觀察到最近客戶詢問相關產品的資訊也越來越多了。此外這一需求也以非常快的速度在增長,因為我們觀察到對應廠商的產能已經被佔滿了。
雷峰網·胡敏:但前段時間有一個奇怪的現像是,市場需求緊缺的同時,在華強北DDR4管道價格閃崩,16GB DDR4從900元跌到700元左右。您怎麼解讀這個矛盾的訊號?
王文浩:確實是崩了一下,當時網路炒得也比較厲害。其實屬於存量價格的波動。因為外資原廠已經停產了,所以市場上有多少賣多少。但是從目前來看,其實DDR4不是特別剛需,但性價比還是有的,所以DDR4會有一部分需求在。
此外,因為DDR5的緊缺使得需求溢出,再加上炒作,DDR4價格就會跟著漲。那等到漲到性價比開始下降的時候,需求可能又會回到DDR5 ,市場表現上看就是整個DDR4的價格又跌了,所以這個現象也並非矛盾,本質上還是存量產品的價格波動。
雷峰網·胡敏:您剛才提到客戶有磁帶產品的需求,佳華接下來會有怎樣的策略去應對?因為像DDR4需求和價格的波動,挺考驗廠商前期判斷和策略。
王文浩:佳華更側重解決方案類的項目。那從項目整體把控來看,我們會根據實際的需求來做對應的策略。因為佳華作為專業的服務商,不會跟著行情去賭,穩定健康是我們核心策略的要求。一方面,要守住交付的確定性,另一方面跟我們合作的管道夥伴、生態夥伴實現共贏。
我們其實也希望大家還是能夠理解整個市場現象的底層的邏輯——要把真正的需求放在第一位,不能把不確定性的風險放大,所以整體的業務要保持在可控的範圍之內。所以我們一直講做生意還是要長期主義,別像炒股一樣,這個風險就太大了。
雷峰網·胡敏:從曙光做企業級儲存的直觀感受上,AI推理對SSD、HHD等儲存的需求拉動到底到了什麼程度?
郭照斌:不只是AI推理,整個 AI 最直觀的帶動,像王總剛才也說了,還是對SSD類儲存系統的需求拉動。其實它的需求量和應用量是最匹配的,也是最強的。所以NVMe、SAS,類似分佈式全閃、集中式全閃這一系列適配整個AI推理和AI訓練的產品,量確實出現比較大的增幅。
而曙光做儲存,那其實我們整個儲存第一關注的點還是在高性能上。2023年左右我們其實就已經開始關注到相關的AI對於儲存高性能相關技術的趨勢影響、需求。
高性能計算本身和儲存場景的要求,其實它們是很像的,所以我們提升性能表現的整個過程很絲滑。在整個AI的使用場景上,我們公司產品在市場上表現還是不錯的。前一段時間賽迪的報告裡,曙光儲存系統在AI細分領域的市場佔有率也是第一。
雷峰網·胡敏:對於像你們這類做系統性儲存設計的廠商來說,這種需求會帶來那些新的挑戰?會專門針對訓練或者推理場景做一些技術上的最佳化或調整?
郭照斌:是的,就像我剛才說的,其實儲存是比較穩定和傳統的產品了。伴隨著電腦的出現,整個儲存系統對使用者的使用方式有幾十年的要求,儲存的訪問標準都是很標準、很一致的形式。即使到AI出現,天下也沒有什麼太多的新鮮事。
儲存要求最關鍵的就是兩大項——性能和穩定性。我們正好是做高性能計算的,高性能計算對儲存的第一個要求也是快,一定是性能高,才能匹配幾萬節點的平行計算和使用量。所以我們切到對AI的適配和應用上,其實還是有一定的優勢的。
儲存剛開始出現的時候,只要求整個系統按標準的使用方式。你家的儲存比別人家的儲存快幾倍,客戶肯定用你的。在“快”上有技術積累後,當AI 對儲存提出更深度的要求,介於HBM和真正的外接儲存之間其實還有記憶體、KV cache、往帶外儲存的dump、中間的CXL等等很多層級,對推理的整體性能和結果產生了比較大的影響。
所以針對KV的解除安裝、對向量資料庫的支援等近計算的能力,我們也要做比較多的性能上的開發和應用上的適配。我們已經逐步產品化,具備了GPU直接訪問儲存的能力、KV的解除安裝能力等,已經在商業化中得到應用。
聊未來:客戶需求從“比價”到“保交付”“穩供應”
雷峰網·胡敏:過去廠商賣儲存是按容量(元/GB)定價,利潤來自降成本、上規模,但未來如果儲存真的能讓客戶的GPU利用率從60%提到80%,那定價邏輯會不會變成按“節省的算力成本”來定價?未來儲存商業模式會不會從“賣容量”到“賣效率”的根本性轉變?這種變化如何重塑儲存廠商在AI產業鏈中的位置和價值分配?
郭照斌:這個問題的角度很新穎。當AI往縱深方向發展的時候,包括前一段時間輝達開大會也專門對於儲存系統定義了一套相應的標準,集合專業的儲存廠商做了一個相當於GPU和儲存之間的新的標準協議。
並且現在新的模型參數的提升、視訊模型出來之後,整個資料量的儲存量級根本不是HBM、包括記憶體裝得下的。未來一個必然發展的趨勢就是整個AI生態要把資料儲存緊緊捆綁起來,儲存的效率決定了你整個AI推理的能力和強度。那其實也是分兩個維度,一是速度快,二是資料質量。
儲存在AI的應用裡面一定是不可或缺的一環。現在可能大家關注的是GPU的控制率,之後可能看的是整個 AI 應用最終Token使用效果等。而我用了你家的儲存,聰明程度和響應時間就是不一樣的,這個時候儲存在整個AI生態的議價權會更足一些。
雷峰網·胡敏:從長虹佳華所處的位置來看,這一輪儲存周期給管道商帶來的最大機遇和最大挑戰分別是什麼?面對這些變化,長虹佳華做了那些應對?像香農芯創這樣的同行,已經開始從分銷向上游自研產品延伸了。長虹佳華怎麼看這個路徑?有沒有類似的佈局考慮?
王文浩:一方面以前客戶找管道,主要是比價,或者看誰的交付能力更強。但是現在因為結構性缺貨,客戶的核心需求變成了保交付和穩供應。誰能解決買不到的問題,誰就能真正鎖定客戶長期的信賴。
所以對我們來說的話是一種價值的提升。一方面,佳華還是有比較豐富的產品資源;另一方面由於價格上漲,客戶其實對於成本最佳化的解決方案也越來越關注,這其實對我們解決方案能力要求就比較高了。
從幾年前開始做解決方案時,我們就投入了大量技術方面的人員,希望能夠更理解客戶業務,幫助客戶更合理設計資料儲存方案。經過這幾年的積累,佳華在這方面還是具備了比較領先的能力。那像剛才講到的儲存全生命周期的管理、資料管理的技術服務跟解決方案能力,應該說都已經在客戶端有所顯現,客戶端的反饋也還是比較認可的。
我們還給客戶提供更精細化的資料儲存解決方案,像剛才提到的應用在大型電腦網際網路企業、大型生產製造型企業的針對冷儲存的解決方案,其實都幫助客戶降本。同時,在整個AI大環境下,我們也通過一些智能管理的軟體來實現對客戶資料的全生命周期管理。
當前也確實有企業開始向上游自研延伸。這確實是延伸產業鏈價值的一種路徑選擇,但這也不是唯一的方法。佳華這麼多年還是基於科技服務商的商業本質,做生態的連接者和增值服務商。
比如今天咱們一直在聊的結構性缺貨,面對這種複雜局面,市場真正需要的可能是橫跨多品牌的全域視野,以及調配供需的操盤能力,包括剛才我們講到的解決方案的交付能力。那麼佳華在這之中能提供調度和交付服務,實際上也是一條價值乘法的路徑。 (雷峰網)
