美股儲存晶片股為何今日重挫?
周三美股盤中,儲存晶片類股遭遇顯著回呼。西部資料(WDC)和美光科技(MU)均跌超4%,希捷科技(STX)跌幅超5%。
引發這一輪集體走弱的直接原因,是Google剛剛發佈了一項名為TurboQuant的新型AI記憶體壓縮技術,引發了市場對儲存硬體中長期需求前景的擔憂。
要理解為什麼一個“軟體演算法”的進步會嚇壞“賣硬體”的公司,我們得先搞清楚大模型執行階段最佔資源的地方——鍵值快取(KV Cache)。
當你在和AI對話,或者讓它處理長文章時,為了記住前面的內容(上下文),AI必須在記憶體裡即時暫存大量資料。這就像一個人為了記住長篇大論,腦子裡得塞滿臨時的筆記。這些“臨時筆記”不僅極其佔用昂貴的儲存空間,還拖慢了AI的反應速度,限制了它能同時服務多少人。
Google推出的TurboQuant技術,正是為了精準攻克這一硬體痛點。根據公開測試資料,該技術能夠在完全不損失大模型精準性、且無需重新訓練的前提下,將鍵值快取直接壓縮至原先的六分之一。
同時,在輝達H100加速器上,處理性能最高提升了8倍。這意味著,原本需要大量高昂記憶體硬體才能支撐的長上下文推理運算,現在通過底層資料結構的“瘦身”,用極少的記憶體空間就能高效完成。
面對這種“以軟代硬”的技術跨越,資本市場的第一反應往往是高度防禦性的。既然單張顯示卡的記憶體吞吐效率被成倍放大,市場自然會推演:各大雲服務商和企業客戶未來對儲存晶片的物理採購總量,是否會因此出現斷崖式下滑?
疊加儲存類股今年以來已經累積了較為可觀的漲幅,整體估值處於相對高位。在當前容錯率極低的市場環境下,任何可能削減底層硬體採購量的邊際技術進展,都足以促使機構資金選擇提前獲利了結。
儘管投行如摩根士丹利隨後指出,這種效率提升主要集中在推理階段的快取壓縮,並不影響模型權重所需的高頻寬記憶體(HBM)。且從長遠經濟學角度看,這可能觸發“傑文斯悖論”:AI運行成本的大幅降低將使規模化部署門檻驟降,進而啟動更多應用場景,最終反而推升硬體總需求。
但對於當下的盤面而言,遠期的產業推演往往讓位於短期的“削減需求”恐慌,高估值疊加新技術衝擊,共同構成了今天儲存股集體下挫的核心邏輯。 (美股投資網)