據海外媒體報導,輝達和亞馬遜正在推進儲存架構的研發,該架構允許 GPU 直接控制 SSD 等儲存裝置。輝達計畫在其 Vera Rubin平台上率先推出 GPU 發起的直接儲存訪問 (GIDS) 技術,這一轉變會加速高頻寬快閃記憶體 (HBF) 的普及。
當前AI大模型參數持續暴漲,HBM高頻寬記憶體暴露出兩大致命短板:
一是物理堆疊上限決定其容量擴容難度極大、成本居高不下,無法承載兆級超大規模模型;
二是GPU與HBM之間的資料傳輸功耗,已佔據AI伺服器整機系統總功耗近50%,算力能效比嚴重失衡。與此同時,傳統馮諾依曼架構存在天生的資料搬運瓶頸,資料需經過CPU中轉→DRAM快取→再傳輸至GPU,而CPU線程調度存在結構性上限,GPU卻具備數萬級平行算力,二者的算力與資料調度效率嚴重錯配,成為AI推理、訓練提速的核心枷鎖。