Google AI記憶體技術工程化失敗?TurboQuant“橫空出世”,科技圈呼“Google版DeepSeek”、“真實版Pied Piper”!華爾街“呵呵,抄底記憶體股”!

GoogleAI記憶體壓縮技術TurboQuant橫空出世,宣稱將大模型快取記憶體縮減6倍、性能提升8倍,瞬間引爆市場恐慌——美光科技、閃迪等儲存巨頭盤中重挫逾5%。然而華爾街投行卻高呼"抄底":摩根士丹利援引傑文斯悖論指出,效率革命非但不會壓縮硬體需求,反將啟動更龐大的AI部署規模,儲存需求長期基本面"中性偏正面"。

Google發佈的一項新型AI記憶體壓縮技術,不僅在科技界引發了對底層算力效率革命的狂歡,也讓美股儲存晶片類股經歷了一場劇烈的估值重估,但華爾街機構卻從這場恐慌中看到了買入良機。

周三,受該技術可能大幅削減AI硬體需求預期的衝擊,美股儲存晶片類股盤中遭遇重挫。截至收盤,儲存晶片與硬體供應鏈指數下跌2.08%,閃迪、美光科技等頭部企業均顯著收跌,凸顯出市場對需求前景的防禦性反應。

然而,在科技圈將這一突破性技術捧為“真實版Pied Piper”和“Google版DeepSeek”的同時,華爾街投行的表態卻截然不同。多位分析師指出,該技術的實際影響被市場過度計價,並直言投資者應藉機買入回呼的記憶體概念股。

儘管實驗室資料展示了驚人的壓縮效率,但從宏觀經濟學與算力部署的真實演進來看,這項旨在打破AI記憶體瓶頸的技術,最終可能不僅不會摧毀儲存需求,反而會成為推動行業進一步擴張的催化劑。

儲存類股應聲下挫

Google發佈名為TurboQuant的記憶體壓縮演算法後,市場對儲存硬體長期需求的擔憂迅速蔓延,導致相關資產遭到拋售。

周三盤中,儲存晶片類股集體下探。閃迪一度大跌6.5%,美光科技跌4%,西部資料和希捷科技分別跌超4%和5%。隨著市場情緒在尾盤有所消化,相關個股跌幅縮小。截至收盤,閃迪和美光科技均跌超3.4%,希捷科技收跌2.6%,西部資料跌幅縮小至1.6%。當日,儲存晶片與硬體供應鏈指數報收於113.03點,盤中一度觸及109點的日內低點。

引發市場恐慌的直接原因,是Google宣稱TurboQuant可在不損失準確性的前提下,將大型語言模型執行階段的快取記憶體佔用至少減少6倍。在高度依賴硬體規模擴張的AI軍備競賽邏輯下,任何可能削減實體記憶體採購量的技術進步,都足以讓本已處於高估值的晶片類股面臨拋壓。

“真實版Pied Piper”與“Google版DeepSeek”

在科技業界,TurboQuant的發佈被視為解決大語言模型高昂運行成本的重要里程碑。該技術專為解決AI系統中的鍵值快取(KV Cache)瓶頸而設計,核心是將原本佔用大量空間的快取壓縮至3位元。

據媒體報導,Google採用兩步壓縮法:先通過PolarQuant技術將資料向量轉換為極坐標以消除額外的歸一化開銷,再利用量化演算法QJL消除殘差誤差。

在採用Gemma和Mistral等開源模型的測試中,該演算法不僅實現了6倍的記憶體縮減,在輝達H100 GPU上的性能較未量化的32位方案更是提升了最高8倍。

這一驚豔的資料在網際網路上引發熱議,人們將其戲稱為“真實版Pied Piper”——即HBO經典美劇《矽谷》中那家憑藉無失真壓縮演算法顛覆行業規則的虛構初創公司。Cloudflare首席執行長Matthew Prince等人則將其稱為Google的“DeepSeek時刻”,認為其有望像DeepSeek一樣,通過極高的效率收益大幅拉低AI的運行成本。

華爾街無懼衝擊,高呼“抄底”

面對科技圈的狂熱與二級市場的拋售,華爾街投行表現出顯著的冷靜,並認為市場反應過度。

Lynx Equity Strategies分析師KC Rajkumar對該技術的“顛覆性”提出質疑。他在給客戶的報告中指出,媒體對該技術的報導存在誇大成分。

他表示,當前的推理模型早已廣泛採用4位元量化資料,Google所謂的8倍性能提升是建立在與老舊的32位模型對比之上的。他強調,這些先進的壓縮技術僅僅是為了緩解算力瓶頸,並不會破壞未來三到五年內因供應受限而依然堅挺的記憶體與快閃記憶體需求。為此,他維持對美光科技700美元的目標價及買入評級,並明確表示建議“在因Google消息引發的回呼中買入”。

Wells Fargo分析師Andrew Rocha同樣指出,儘管TurboQuant直擊AI系統的記憶體成本曲線,但歷史經驗表明,壓縮演算法的存在從未從根本上改變硬體採購的整體規模,目前AI記憶體的需求基本面依然強勁。

傑文斯悖論再現,長期需求或受提振

除了指出市場反應過度外,機構還從更長遠的經濟學視角重新評估了TurboQuant的影響。

摩根士丹利在分析中指出,TurboQuant僅作用於推理階段的鍵值快取,完全不影響模型訓練任務,也不影響模型權重所佔用的高頻寬記憶體(HBM)。該技術的核心意義在於提升單GPU的吞吐量,使相同硬體能支援更長的上下文或更大的批處理規模。

摩根士丹利進一步援引了“傑文斯悖論”(Jevons Paradox)來闡釋這一現象:技術效率的提升往往會降低使用成本,從而激發出更龐大的總需求。通過大幅降低單次查詢的服務成本,TurboQuant能夠讓原本只能在雲端昂貴叢集上運行的模型遷移至本地,有效降低AI規模化部署的門檻。

這意味著,效率提升將啟動更多原本受制於成本而無法落地的AI應用場景。投行總結稱,該技術重塑了AI部署的成本曲線,對算力與記憶體硬體的長期影響不僅不是利空,反而呈現出“中性偏正面”的積極訊號。 (invest wallstreet)