奧爾特曼點名“AI記憶”,儲存環節迎來新敘事

奧爾特曼表示,“雖然說這是2026年(要考慮)的事,但它是我個人最期待的部分之一。”

“這是整個系統裡我個人最期待的部分之一。”在日前的Big Technology訪談中,OpenAI CEO山姆•奧爾特曼(Sam Altman)如此形容記憶功能。在他看來,AI的下一個重大飛躍並非是更敏銳的推理能力,而是更為根本的記憶。

ChatGPT問世三年多以來,聊天介面並沒有出現大變動,但底層功能進步不少,其中就包括記憶功能。

在訪談中,當被問及“記憶功能究竟發展到什麼程度”時,奧爾特曼表示,“其實我認為我們現在完全無法想像它最終能發展到什麼程度。人類本身是有侷限的:即使你擁有世界上最好的私人助理,他們也不可能記住你說過的每一句話,不可能讀過你的每一封郵件,不可能看過你寫的每一份檔案,不可能每天觀察你的所有工作並記住每一個細節,也不可能以那樣的深度參與到你的生活中——沒有任何人類擁有完美無限的記憶,但AI肯定可以做到這些。”

記憶功能是OpenAI內部經常討論的一個問題。目前ChatGPT雖然迭代到了5.2,但記憶功能“依然非常粗糙、非常早期”,仍處於“GPT-2時代”。

一旦AI真的能記住你整個人生的每一個細節,並在此基礎上加以個性化——不僅能記住事實,還能察覺、捕捉並利用那些連使用者自己都沒意識到未曾刻意表達過的小偏好,AI將變得極其強大。

“我覺得這是一個非常令人興奮的方向。雖然說這是2026年(要考慮)的事,但它是整個系統中我個人最期待的部分之一。”奧爾特曼直言。

▌KV Cache重要性凸顯

此前,OpenAI已於2024年2月啟動記憶功能小範圍測試,並於2025年4月升級為可參考全部歷史對話的長期記憶系統,能跨對話保留使用者偏好、工作內容與常用格式,在互動中持續呼叫,顯著強化個性化服務與使用者黏性。

可以看到,在奧爾特曼的描述遠景中,擁有了成熟記憶能力的ChatGPT堪稱“開了掛的超級個人AI Agent”。

根據《Heterogeneous Memory Opportunity with Agentic AI and Memory Centric Computing》(Jinin So),建構一個強大的“Agentic AI”,因為自注意力機制需要對序列中的每個元素(token)與序列中所有其他元素之間的關係進行建模,因此對記憶體和儲存系統提出了前所未有的、多層次的需求和挑戰。AI記憶系統可以被劃分為工作記憶(處理當前任務)和長期記憶(知識、技能、經驗)。

程序性記憶(模型本身):隨著大語言模型參數量的增長,其自身大小已達到TB等級;
語義記憶(外部知識庫):儲存外部知識的向量資料庫,其容量需求可達數十TB;
工作記憶(執行階段快取):在高並行推理時,僅KV快取(KV Cache)一項就能消耗上百TB的記憶體。

整個系統融合了大模型(如Gemini)、外部資料庫(如Milvus)和快取記憶體機制,並通過檢索、學習等方式進行互動,這對資料流動的頻寬和延遲提出了極高要求。

其中,“能記住使用者說過的所有話、讀完所有郵件和文件、深度全量參與使用者生活”的AI,需要的正是“工作記憶”。廣發證券指出,AI的“工作記憶”在技術上體現為大模型的“上下文窗口”,它是AI進行複雜、多步推理和決策的工作台與基礎。它的核心功能是整合所有相關資訊以支援連貫思考。通過將系統指令、歷史對話、使用者問題、外部知識(來自語義記憶)和模型的中間思路全部“盡收眼底”,大模型才能進行全面、有深度的推理,而不是孤立地看問題。

國金證券稱,目前隨著大模型應用的普及和上下文窗口的不斷擴展,KV Cache技術的重要性將進一步凸顯。無論是ChatGPT的流暢對話體驗,還是Claude的長文件處理能力,都需要KV Cache的技術支撐。未來KV Cache將在智能化、硬體加速、邊緣部署等方向持續演進,為更廣泛的AI應用提供強有力的技術支撐。智能化與硬體化趨勢明確,KV Cache有望在未來數年持續提升大模型推理效率並改善算力成本結構。

落實到具體方向上,東方證券認為,儲存供不應求持續,同時海外儲存巨頭在通用儲存方面的擴產進度可能有限,建議關注國內半導體裝置企業中微公司、京儀裝備、微導奈米、拓荊科技、北方華創等;佈局端側AI儲存方案的兆易創新、北京君正等;受益儲存技術迭代的瀾起科技、聯芸科技等;國產企業級SSD及儲存方案廠商江波龍、德明利、佰維儲存等。 (科創板日報)