隨著AI大模型參數規模從億級邁向兆級,訓練資料從純文字走向多模態融合,傳統儲存架構已不堪重負,AI訓練過程中出現的“儲存牆”和“功耗牆”問題尤為突出。
傳統電腦系統採用的馮諾依曼架構,將資料儲存和計算單元相互分離,這種設計在AI對算力需求呈爆發式增長的當下暴露出明顯弊端。
隨著計算單元(CPU、GPU等)性能快速提升,記憶體的訪問速度和頻寬未能同步增長。當進行大量資料處理時,由於計算單元與儲存單元之間頻寬有限,處理器需要等待從記憶體中獲取資料,這會限制交換速度,減緩處理速度,即產生“儲存牆”問題。
資料搬運的能耗比浮點計算高1~2個數量級,DRAM訪問功耗是晶片內快取功耗的50~100倍。資料訪問和儲存已成為算力使用的最大能耗,當處理資料大幅增加時,頻繁的資料搬運會消耗大量能量,即產生“功耗牆”問題。
輝達CEO黃仁勳曾坦言“GPU 70%時間在等待資料”,表示計算資源大部分時間處於閒置狀態,等待資料從儲存裝置載入至記憶體。
“一套高端AI伺服器需要配備640GB的HBM、4TB的DDR5記憶體和128TB的SSD儲存。當前HBM市場由SK海力士和三星壟斷,價格高企且產能緊張。”——這是當下AI伺服器面臨的儲存瓶頸,也是一眾科技企業想要突破的方向。
2025年8月底,華為發佈的專為人工智慧(AI)工作負載設計的固態硬碟(SSD)新品——Huawei OceanDisk EX/SP/LC系列,分別瞄準AI訓練、推理及海量資料儲存等核心場景。
華為方面表示,這三款SSD並非簡單的儲存介質,它們內建了計算能力,能夠解除安裝部分原本由CPU或GPU執行的資料處理任務,如資料過濾、格式轉換、近資料計算等。這正是行業熱議的“計算儲存”(Computational Storage)技術的具體實現。通過將計算推向資料端,可以大幅減少資料在CPU、記憶體和儲存之間不必要的搬運,從而降低延遲、節約頻寬,並釋放核心計算資源 。
華為在資料儲存AI SSD新品發佈會上正式推出三款針對AI儲存的新產品
值得一提的是華為聯合11家機構成立“AI SSD創新聯盟”,整合聯芸科技的主控晶片、深科技的堆疊封裝等產業鏈資源,實現從NAND快閃記憶體到主控晶片的全鏈條貫通。
就在華為發佈AI SSD一周後,昕原半導體註冊資本由4653.7萬增至5029.7萬元人民幣,字節跳動通過旗下PICOHEART入股6.33%,阿里巴巴關聯方螞蟻集團也悄然佈局。這場資本暗戰直指下一代儲存技術——ReRAM。
ReRAM是一種基於電阻轉換機制的非易失性儲存器,其核心結構如同一個電子“三明治”——在兩層金屬電極之間夾著一層薄薄的阻變介質材料(通常為金屬氧化物),形成金屬-介質層-金屬(MIM)三層結構。資料的儲存依賴於一個精妙的物理現象——通過施加電壓脈衝,阻變層的離子或氧空位會形成或斷裂導電細絲,從而在高阻態(代表“0”)和低阻態(代表“1”)之間可逆切換。即使斷電,這種電阻狀態仍能保持,實現了資料的非易失性儲存。
ReRAM能有效解決“儲存牆”問題
在新型儲存技術中,ReRAM(電阻式隨機存取儲存器)因其高速度、低功耗和優異耐久性備受關注。昕原半導體成立於2019年,是中國大陸唯一一家實現先進製程ReRAM量產的公司,也是國際上新型儲存器產品商業化最快的企業之一,這也是為何字節和阿里爭相投資其的原因。
AI SSD與ReRAM的共生演進
總體而言,AI SSD解決的是當下AI算力瓶頸,而ReRAM瞄準的是未來存算融合架構。華為的XtremeLink技術通過資料I/O全硬化與數控分離架構,將傳統SSD單通道升級為高速雙通道;昕原則通過ReRAM的電阻特性實現模擬計算,為神經形態計算鋪路。
螞蟻集團和字節跳動對昕原半導體的投資只是網際網路科技大廠“追芯”熱潮的縮影。近年來,包括阿里、騰訊在內的網際網路科技公司紛紛對不同細分品類的晶片企業完成入股。
螞蟻集團自2023年明確將“AI First”作為核心戰略之一後,持續提升AI含量,並開始持續蒐集晶片公司“籌碼”。據統計,螞蟻已經領投過墨芯科技、無錫沐創,併入股清微智能、雲合智網、燁知芯等企業。除“投芯”外,主動下場“造芯”也逐漸成為巨頭們的“新場景”。阿里在2018年9月整合了此前收購的中天微系統和達摩院自研晶片業務,成立了平頭哥半導體有限公司。
主要網際網路大廠晶片佈局策略對比
網際網路大廠的“追芯”熱潮,表面是算力爭奪,實則是重構產業鏈話語權:通過投資卡位技術節點,自研晶片最佳化業務護城河,最終以“晶片+雲+生態”繫結使用者。隨著國產替代率的持續提升,這場戰役將重塑全球晶片格局——從“矽谷定義標準”轉向“場景定義晶片”。 (壹零社)