#LLM
Andrej Karpathy:完整LLM wiki 建構提示詞! 基於Obsidian+AI Agent的個人知識庫完整建構指南
這是一篇很有意思的文章。Andrej Karpathy兩天前剛提出了備受關注的以Obsidian+AI建構個人知識庫的模式,這個路徑是非常明確的,Obsidian筆記軟體在本地管理了以md為格式的知識文件,提供了知識庫建構所需要的各種目錄索引組織功能, Andrej提出的設計模式讓AI Agent來接管Obsidian,讓人們從整理原始素材的繁瑣工作中解脫出來,讓大家真正擁有一個自主整理資料乃至分析提煉的AI助手。所以Anredj其實是提出了一種區別於傳統對話機器人的全新個人知識庫建構範式。而今天,Andrej更是直接給出了詳細方法,這文章實就是直接給AI Agent看的完整建構指南。為了讀者看完就能直接上手操作,本文在關鍵步驟加入了 💡【手把手實操註釋】。讀者可以把它當作一份“實戰搭建指南”。建構個人 LLM Wiki(大語言模型維基)的設計模式作者:Andrej Karpathy這是一個“概念檔案(Idea File)”,它的設計初衷是讓你直接複製貼上給你的 LLM Agent(例如 OpenAI Codex、Claude Code、OpenCode / Cursor / Pi 等)。本文的目的是傳達高層次的理念,而你的 AI 助手將會和你一起協作,建構出具體的實現細節。💡 【實操註釋:第一步該怎麼做?】Karpathy 的意思是,你不需要自己從零寫程式碼。你可以直接把這篇中文版,喂給具備“讀取本地檔案”能力的 AI 工具。告訴 AI:“閱讀這篇文章,理解 LLM Wiki 的理念,以後你就是我的 Wiki 維護員了。”核心理念 (The core idea)大多數人使用 LLM 處理文件的體驗類似於 RAG(檢索增強生成):你上傳一堆檔案,當你提問時,LLM 檢索出相關的文字塊,然後生成答案。這種方法能用,但問題是:LLM 每次回答新問題時,都在“從零開始”重新發現知識。沒有任何知識沉澱。 如果你問一個需要綜合五份文件的複雜問題,LLM 每次都得重新去尋找並拼湊相關碎片。NotebookLM、ChatGPT 的檔案上傳功能,以及大多數 RAG 系統都是這樣工作的。這裡的理唸完全不同。LLM 不再是在你提問時才去原始文件裡檢索,而是持續建構並維護一個持久的 Wiki(維基庫)——這是一個由相互連結的 Markdown 檔案組成的結構化集合,它介於你和原始資料之間。當你加入一份新資料時,LLM 不是簡單地建立索引留待後用。它會主動閱讀它,提取關鍵資訊,並將其整合到現有的 Wiki 中——更新實體頁面,修改主題摘要,標註新資料與舊觀點的衝突之處,強化或挑戰正在演變的綜合結論。知識被“編譯(compiled)”一次後就會保持更新,而不是每次提問都重新推導。這是最關鍵的區別:Wiki 是一個持久的、具備複利效應的產物。 交叉引用已經存在了,矛盾之處已經被標記了,總結結論已經反映了你讀過的所有內容。你加入的資料越多、問的問題越多,這個 Wiki 就越豐富。你永遠(或極少)需要自己動手寫 Wiki——LLM 會負責編寫和維護這一切。你的職責是尋找資料、探索發現、以及提出好問題。 LLM 則負責所有的“苦力活”——總結、交叉引用、歸檔、記帳,正是這些枯燥的工作讓一個知識庫隨著時間推移變得真正有用。在實際操作中,我會在螢幕一邊打開 LLM Agent,另一邊打開 Obsidian(一款本地筆記軟體)。LLM 根據我們的對話修改檔案,我則即時瀏覽結果——點選連結跳轉、查看知識圖譜(graph view)、閱讀更新後的頁面。Obsidian 是開發工具(IDE),LLM 是程式設計師,而你的 Wiki 就是程式碼庫。適用場景 (Examples)這套模式適用於多種情境:個人管理:追蹤你的目標、健康、心理、自我提升——將日記、文章、播客筆記歸檔,隨著時間推移建構一個結構化的“自我畫像”。深度研究:花費數周或數月深入研究一個主題——閱讀論文、文章、報告,並逐步建構一個包含演進論點的全面 Wiki。閱讀書籍:邊讀邊將每一章歸檔,為人物、主題、情節線索建立頁面,記錄它們之間的關聯。讀完後,你就會擁有一個內容豐富的伴讀 Wiki。(想想類似《指環王》粉絲建立的維基百科,成千上萬個連結頁面,現在你可以用 LLM 自己建一個)。商業/團隊:一個由 LLM 維護的內部 Wiki,資料來源可以是 Slack 聊天記錄、會議記錄、項目文件、客戶通話。競品分析、盡職調查、旅行規劃、課程筆記、愛好鑽研——任何需要隨著時間推移積累知識,且希望知識井然有序而不是散落一地的場景。系統架構 (Architecture)整個系統分為三個層級:原始資料層 (Raw sources):你收集的原始文件庫。文章、論文、圖片、資料檔案。這些是不可變(immutable)的——LLM 只能讀取它們,絕不能修改它們。這是你的事實真相源(Source of truth)。Wiki 層 (The wiki):由 LLM 生成的 Markdown 檔案目錄。包括摘要、實體頁面、概念頁面、對比表格、概覽和綜合分析。LLM 完全擁有這一層。它負責建立頁面、更新內容、維護交叉引用並保持一致性。你負責讀,LLM 負責寫。約束架構層 (The schema):一個配置檔案(例如 Claude Code 的 CLAUDE.md 或 Codex 的 AGENTS.md),用於告訴 LLM 這個 Wiki 的結構是什麼、命名約定是什麼,以及在提取資料、回答問題或維護 Wiki 時要遵循什麼工作流。你和 LLM 會隨著時間的推移不斷最佳化這個檔案。💡 【實操註釋:普通使用者如何在電腦上建立這個架構?】你只需要在電腦桌面上新建一個資料夾,比如叫 My_AI_Wiki,然後在裡面建三個子資料夾/檔案:📁 Raw_Sources (你把下載的 PDF、網頁文字扔這裡,別讓AI改)📁 Wiki_Pages (讓 AI 在這裡面自由建立和修改 .md 筆記)📄 Agents.md (這是給AI看的規則說明書)操作方式:用你的AI Agent軟體打開這個 My_AI_Wiki 資料夾,你就可以直接在聊天框裡讓 AI 讀取Angets.md, 它就開始幹活了。日常操作 (Operations)攝入資料 (Ingest):你把一份新資料扔進原始資料庫,然後叫 LLM 處理它。例如:LLM 讀取資料,跟你討論核心觀點,然後在 Wiki 中寫一頁摘要,更新目錄索引,更新各個相關的實體和概念頁面,最後在日誌裡寫下一筆。一份資料可能會觸及 10-15 個 Wiki 頁面。我個人傾向於每次只攝入一份資料並保持參與感——我會閱讀摘要、檢查更新、引導 LLM 強調那些內容。你也可以建立自己的工作流並寫在 schema 規則裡。💡 【實操註釋:讓AI Ingest的有效提示詞(Prompt)舉例】"請閱讀 Raw_Sources 資料夾中剛放入的《2024新能源報告.pdf》。讀完後:1. 在 Wiki_Pages 建立該報告的摘要頁面;2. 如果報告提到了電池技術,去更新已有的 固態電池.md 頁面;3. 更新總目錄 index.md。"查詢 (Query):你向 Wiki 提問。LLM 會搜尋相關頁面,閱讀它們,並附上引用來源生成答案。答案可以是 Markdown 頁面、對比表、幻燈片或圖表。最重要的見解是:高品質的答案應該作為新頁面存回 Wiki 中。 你要求做的橫向對比、分析、發現的關聯——這些都是有價值的,不應該消失在聊天記錄裡。讓你的探索像原始資料一樣在知識庫中產生複利。程式碼審查/健康檢查 (Lint):定期讓 LLM 對 Wiki 進行健康檢查。尋找:頁面之間的矛盾、被新資料推翻的舊觀點、沒有外部連結的“孤兒頁面”、提到了但沒有專屬頁面的重要概念、缺失的交叉引用等。這能讓 Wiki 在膨脹時保持健康。索引與日誌 (Indexing and logging)有兩個特殊檔案能幫助 LLM(以及你)在 Wiki 不斷增長時進行導航:index.md (內容目錄):它是 Wiki 中所有內容的目錄。每個頁面都有一個連結、一句話摘要,也許還有日期或來源數量等中繼資料。按類別組織。LLM 在每次攝入新資料時都會更新它。LLM 回答問題時,會先看 index 找到相關頁面。在中等規模下(~100 份資料,數百個頁面),這種方法出奇地好用,無需搭建複雜的向量檢索(RAG)基礎設施。log.md (操作日誌):它是按時間順序記錄的。這是一個“只能追加(append-only)”的記錄,記錄了何時發生了什麼(攝入、查詢、檢查)。小技巧:如果每條記錄都以一致的前綴開頭,日誌就能用簡單的工具進行解析。這能讓 LLM 瞭解最近做了什麼。💡 【實操註釋:為什麼這兩個檔案極其重要?】因為目前 AI 的“上下文窗口”是有限的。如果不建索引,AI 無法瞬間看清幾百個檔案的全貌。index.md 就像是一張全域地圖,每次 AI 接到任務,你讓它先看地圖,再決定去修改那個具體的本地檔案。可選:命令列工具 (Optional: CLI tools)隨著 Wiki 變大,你可能需要幫助 LLM 更高效操作的工具。最明顯的就是搜尋引擎。在小規模時 index.md 就夠了,但做大後你需要真正的搜尋。qmd 是個不錯的選擇(一個本地 markdown 搜尋引擎)。你也可以自己讓 LLM 幫你寫一個簡單的搜尋指令碼。(註:對於普通小白使用者,直接使用 Obsidian 自帶的搜尋,或者 Cursor 的 Codebase 檢索功能即可,無需折騰複雜的命令列工具。)技巧與竅門 (Tips and tricks)Obsidian Web Clipper:一個瀏覽器外掛,能把網頁文章轉換成 Markdown。非常適合快速把資料抓進你的 Raw_Sources。把圖片下載到本地:在 Obsidian 中設定快速鍵將引用的圖片下載到本地。這樣 LLM 可以直接查看本地圖片,而不是依賴隨時會失效的網址連結。Obsidian 知識圖譜 (Graph view):這是查看 Wiki 形狀的最佳方式——什麼連接著什麼,那些是核心樞紐,那些是孤島。Marp 幻燈片:一種基於 Markdown 的 PPT 格式。Dataview 外掛:如果你讓 LLM 在頁面開頭加上 YAML 中繼資料(如標籤、日期),Dataview 外掛能幫你生成動態表格。Git 版本控制:Wiki 只是一個包含 Markdown 檔案的資料夾(git repo)。你可以免費獲得歷史版本和防呆備份。就算 AI 把檔案改亂了,你也可以一鍵回撤。為什麼這種模式有效 (Why this works)維護一個知識庫最繁瑣的部分不是閱讀或思考,而是“記帳(bookkeeping)”。更新交叉引用、保持摘要最新、留意新舊資料的衝突、在幾十個頁面間保持一致性。人類之所以會放棄維護 Wiki,是因為維護的負擔增長得比它帶來的價值快得多。但是,LLM 不會覺得無聊,不會忘記更新連結,並且一次操作就能修改 15 個檔案。因為維護成本接近於零,所以 Wiki 能夠一直保持良好的狀態。人類的工作是精選資料、指導分析、提出好問題,並思考這一切的意義。LLM 的工作是搞定剩下的一切。 (Web3天空之城)
V4 發佈前的 DeepSeek:特質、組織和梁文鋒的獨特目標
有人離開,更多人留下。DeepSeek 正處在一個變化的關口,從 2025 年下半年至今,明確已離開、找到新去處的 DeepSeek 成員有:去年底被騰訊姚順雨挖走的王炳宣,他是 DeepSeek LLM(DeepSeek 第一代大語言模型)的核心作者,此後參與歷代模型訓練。約在春節前後離開的魏浩然,他是 DeepSeek-OCR 系列的核心作者,可能會入職某大廠。近期正式離職的郭達雅,他是 DeepSeek-R1 的核心作者,可能會入職某大廠。以及 2025 年早些時候離職進入退休狀態的阮翀,他在今年 1 月官宣加入自動駕駛創業公司元戎啟行;阮翀是從幻方時期就加入的老成員,是 Janus-Pro 等 DeepSeek 多模態成果的核心貢獻者。DeepSeek 此前並未融資,沒有明確的公司估值。當其它 AI 公司市值或估值高漲,梁文鋒正在想辦法回答團隊成員的疑問:公司到底值多少錢?這關係著員工簽的期權協議到底價值幾何。從 2025 年秋天起,梁文鋒也開始更多提產品化和商業化。DeepSeek 已有小數十人的產品團隊,但尚未涉足 AI 程式設計、通用 Agent 等熱門應用方向,在 C 端仍只有典型的 Chatbot 產品。梁文鋒的新課題還有管理規模。DeepSeek 的人數已超過幻方,是他管過的最大的組織。籠罩以上多重變化的是,DeepSeek V4 仍未正式發佈。其實在 26 年 1 月左右,V4 的一個小參數版本已給到了一些開源框架社區開始做適配。按此前相對樂觀的預期,大參數版的 V4 原本可能在 2 月中旬春節前後發佈和開源。據瞭解,DeepSeek V4 有可能會在 4 月發佈。有人離開,更多人選擇留下。DeepSeek 在調整,但也有諸多不變的特質。它是全球僅有的 “不卷” 的核心 AI Lab。當 Google、OpenAI、xAI、字節跳動等中美公司的核心 AI 開發人員每周工作 70~80 小時時,平日裡 DeepSeek 的多數員工會在下午 6 點~7 點左右離開公司,他們早上也不打卡。梁文鋒認為,一個人一天能高品質輸出的時間很難超過 6~8 小時。DeepSeek 沒有明確的績效考核和 DDL(截止時間)。這個精簡而人才密度極高的組織依然延續 “自然分工”,研究員可自由組隊或獨自鑽研一些新想法。“除了主線之外,DeepSeek 也有人在做一些可能一年都不會有成效的長期研究。”“DeepSeek 是一個真心想做研究的人,在國內,甚至全球能找到的最好的地方。” 有接近 DeepSeek 的人士說。當然,DeepSeek 還有一個特點:神秘。尤其 2025 年之後,除了公開發佈技術報告外,從創始人梁文鋒到團隊成員集體 “沉默”,在 AI 從業者活躍的社交媒體或社區裡很難聽到他們的聲音。這篇報導裡,我們呈現了從各種管道瞭解到的 DeepSeek 的特點、工作重心、組織運轉方式,和這個不到 200 人的組織正在發生的變化。這一切的源頭,都是梁文鋒為 DeepSeek 設立的獨特目標。梁文鋒其人:做少數事,做到極致梁文鋒的 AI 目標遠早於 DeepSeek 成立的 2023 年。2016 年,AGI 的提出者、DeepMind 創始人哈薩比斯曾組建量化交易團隊,試圖給當時想從 Google 獨立的 DeepMind 創收,結果沒賺到錢。同一年,浙大本碩畢業的梁文鋒做量化投資已經 8 年。他在 2015 年創立幻方,2016 年開始用 GPU 跑深度學習實盤交易,在 2017 年底實現 “幾乎所有交易策略 AI 化”,在 2019 年開始建立幻方的第一個算力叢集,有 1100 張 GPU 的 “螢火 1 號”。也是 2019 年,幻方 AI(幻方人工智慧基礎研究有限公司)正式註冊成立。現在在小米負責 AI 的羅福莉和近期加入元戎的阮翀都是在這之後加入幻方,後在 2023 年轉入 DeepSeek。作為一個不到 30 歲就財富自由的人,梁文鋒的生活簡單而神秘。在周圍人的印象中,他會好多天穿同一件衣服。他在杭州曾長期住酒店,在多數 DeepSeek 研發人員所在的北京則租房住。他身材精瘦、有運動習慣,被人所知的愛好是徒步等戶外運動。黃仁勳會邀請輝達員工去家裡做客,喝小酒、聊家常,開心地展示跑車。而梁文鋒不參與季度團建活動,很少和成員聚餐,年底大團建也只在講話時露面,不會參與全程。2022 年,幻方一位員工 “一隻平凡的小豬” 個人向慈善機構捐助 1.38 億元。後來很多人猜這只小豬就是梁文鋒。幻方工作人員的回覆是:“員工捐款均是匿名,公司內部也不知道小豬的真實身份。”在工作範疇裡,梁文鋒只做少數事。他不做多數初創公司 CEO 做的一些事,如融資。2023 年,梁文鋒小範圍見過一些投資人。但據我們瞭解,他提出了一個不常規的要求:類似 OpenAI 與微軟的投資協議,梁文鋒希望投資方接受一個回報上限。這一輪見下來,沒有機構投資 DeepSeek。之後兩年,中國大模型融資洶湧,頻現數億美元大單輪,梁文鋒卻不再見投資人了,甚至不建立新的聯絡。即使不在融資窗口,大部分創始人也不會拒絕認識一下一線機構合夥人,而梁文鋒拒絕了多數此類請求。梁文鋒幾乎把所有時間投入到他認為應該聚焦的少數事上,做得細緻、做到極致。DeepSeek 此前成功的關鍵之一是 “力出一孔”,明確以語言模型為更高優先順序,沒有做多模態生成等熱門方向。在選定的主線上,梁文鋒會 “hands on” 地深入細節。他從不同背景的團隊成員身上學習演算法、架構、Infra、資料的知識,會自己參與模型和產品的細節討論。見過梁文鋒的不少人提到,他沒有 CEO 或所謂天才的 “氣場”,更像一個研究員,他和人談論最多的是具體技術問題。綠洲資本創始合夥人張津劍曾在《那些活出來的人中》分享了一個小故事,他問自己投資的 MiniMax 創始人閆俊傑:“有比你更專注的人嗎?” 閆俊傑說有一次約一位沒見過的朋友吃飯,到早了,看到一位穿 T 恤的小哥,以為是助理。對方開始沒有自我介紹,問了閆俊傑很多技術問題。過了半小時,閆俊傑說:“梁總什麼時候來?” 對方說:“我就是梁文鋒”。DeepSeek 組織:扁平、交叉分工、不加班與梁文鋒的風格相應,DeepSeek 的組織極其扁平、各環節交叉分工、謹慎擴張規模、不加班。創立幻方時,梁文鋒有合夥人,而 DeepSeek 沒有二把手,尤其在研究團隊,只有梁文鋒和其他研究員兩個層級。梁文鋒做重大決定,承擔最多結果。這部分研究團隊現在約有 100 多人,它像一個大型實驗室。主要在 2000 年前後出生的 DeepSeek 研究員們習慣稱 1985 年出生的梁文鋒為 “梁老闆”。這個老闆更接近導師:組織研發、協調資源,也做具體研究,在共同成果上署名為通訊作者。梁文鋒本人參與最多的是基模架構團隊,會與團隊深入討論後確定每一代基模的架構定版。這個團隊有小幾十人,他們是預訓練的主力。與基模架構密切相關的是 Infra 和資料團隊,各有小幾十人。Infra 團隊在一些公司裡更像完成演算法需求的 “內部乙方”, 而 DeepSeek 的 Infra 團隊會在模型訓練前的定版階段就參與討論、給出建議。這幾個模組間的緊密合作使 DeepSeek 的團隊界限沒那麼涇渭分明,形成了 “交叉分工”。這其實是最符合模型訓練特點的協作形式,因為在模型實驗和定版階段,就要考慮資料選擇和 Infra 實現。梁文鋒是串起這些不同模組的探測器和粘合劑,他會出席每一個團隊各自的會議,瞭解全域進度和卡點。DeepSeek 大部分團隊的周會也向其它團隊的人開放,可跨組參會。深入細節的一號位風格和自發形成的緊密協作都很難在大組織裡實現。所以 DeepSeek 會很謹慎地擴大核心研發團隊的規模。在全球 AI 圈都非常特異的一點是,DeepSeek 不加班。他們不打卡、沒有明確的績效考核,平日多數成員會在 6 點~7 點左右離開公司。DeepSeek 給員工免費提供一些下班後福利,如球類課程、運動場地報銷等。梁文鋒認為:一個人每天能高品質工作的時間很難超過 6~8 小時。加班疲勞下的昏庸判斷反而會浪費寶貴的算力資源,得不償失。在人員構成上,DeepSeek 此前幾乎不社招,以應屆生和實習生留任為主。2025 年初,《晚點》曾梳理當時參與過 DeepSeek 三代模型(LLM、V2、V3&R1)的 172 名研究者(包括實習生),並找到了其中 84 人的履歷:超 7 成的人是本科生和碩士生,超 7 成的人小於 30 歲。在 V3 和 R1 之前,DeepSeek 是以大廠約 1/10 的人數,約 1/2 的人均工作時間,以極高的專注和聚焦,躋身全球大模型第一梯隊。但隨著觸達頂尖 AI 能力需要探索的方向越來越多,繼續保持這種組織規模、溝通方式和協作氛圍已越來越難。過去 15 個月,DeepSeek 繼續做自己,而外部世界急劇變化2025 年初 V3 和 R1 爆火後,DeepSeek  並沒有乘勝追擊放大招,而是沿著他們專注的方向繼續研發,已經公開的成果大致有三類:一是效率最佳化:極致壓榨 GPU 算力,提高單位算力能產出的智能。這包括 DeepSeek 在 2025 年初的開源周釋放的一整套訓練與推理 Infra,涵蓋推理 kernel、通訊庫、矩陣乘法庫和資料處理框架。(註:kernel 是在 GPU 上執行最底層計算的程式碼,用來實現矩陣乘法等核心運算。)還有對 “注意力機制” 的持續改進:如 25 年初的 NSA(原生稀疏注意力)和後續的 DSA(動態稀疏注意力)。加上更早時 V2 中的 MLA(多頭潛在注意力),它們的共同目標,是在不大幅增加算力的前提下處理更長的上下文。從 25 年 9 月底更新的 DeepSeek-V3.2 中還可以看到,DeepSeek 甚至把底層的算子庫從主流的 CUDA 和 Triton 語言換成了 TileLang。CUDA 是輝達提供的最底層語言,Triton 由 OpenAI 開源,TileLang 則是北京大學楊智團隊發起的開放原始碼專案。二是模型架構改進,如 26 年初發佈的 mHC(流行約束超連接),旨在提升大規模訓練中的穩定性;和在模型之外建構長期記憶的 Engram。外界普遍認為,mHC 會被用到 V4 的訓練中。三是一些 “非主流” 探索,如把文字轉成圖片,再輸入給模型的 DeepSeek-OCR,這個思路是讓模型按更接近人類 “看文字” 的方式理解段落與層級,提升對複雜文件的理解力。在 DeepSeek 內部,還有更多進行中的此類嘗試,包括持續學習、自主學習等。梁文鋒還在 2025 年招募了一些神經科學和腦科學背景的顧問,想探索更接近人腦的學習機制。而同期,外部 AI 環境在 2025 年至今急劇變化,最受關注的競爭主線有兩條:一是以 coding 能力為基礎的 Agentic 模型和應用。這是 Anthropic 和 OpenAI 目前競爭最激烈的主戰場,形成了 Opus 4.6 vs GPT-5.4 兩個最新模型,和 Claude Code vs Codex 兩個產品的對陣。年初至今爆火的 OpenClaw 小龍蝦也是 Agentic 應用的最新形態。二是多模態生成,這個領域因 “魔法效果” 屢次出圈:2025 年春天的 OpenAI GPT-4o ,秋天的 Google NanoBanana,再到 2026 年春節前的字節 Seedance 2.0。而視訊生成也與一個更前沿的方向有關,即 “世界模型”。DeepSeek 首先沒怎麼投入多模態生成,因為梁文鋒認為多模態生成不是智能的主線。在 Agent 方向上,DeepSeek-V3.2 強化了 Agent 能力,但 DeepSeek 的整體迭代頻次低於 R1 之後一度深感焦慮其它小虎。2025 年初至今,智譜、MiniMax、Kimi 分別已更新了 5 版、4 版和 3 版模型,針對 Agent 或 coding 強化。據 OpenRouter 資料,過去 30 天(2 月 24 日-3 月 26 日),通過 OpenRouter 呼叫的 OpenClaw 應用的模型 token 消耗前 10 中,6 個模型來自中國,DeepSeek-V3.2 排在第 12。(註:OpenRouter 更反映個人和中小開發者的使用情況,只能作為整體 Token 消耗的參考。)DeepSeek 的目標不是最主流的,有人離開、有人留下DeepSeek 的 “特立獨行”,和梁文鋒認同的 AGI 目標有關,除了追求大模型的智能上限外,他認為還有兩個很重要的工作:一是基於國產生態來做大模型。DeepSeek 會投入對國產 GPU 的適配,以解決高性能 GPU 供給受限的現實。比如他們在去年 8 月更新 V3.1 後提及,DeepSeek 採用的 UE8M0 FP8——這是一種資料壓縮格式——“是針對下一代國產晶片設計”。前文提到的用國產開放原始碼的 TileLang 替代 Triton 也是這類工作,能在基礎層更有主動權。在與 AI 從業者交流時,梁文鋒也曾提過這樣的假設:“能不能用現存的一部分算力,就實現現在所有的智能?”二是 “原創式創新”,做一些大廠或其它創業公司不會去試,不願去試的方向。比如 2024 年下半年,DeepSeek 就開始了 Janus 系列,嘗試統一多模態的理解和生成。DeepSeek 也做過 Prover 系列,探索形式化證明。還有 25 年的 OCR,以及內部在繼續做的持續學習和仿生人腦的探索。作為創始人,梁文鋒最在意的,不僅是模型效果本身,也包括追求效果的路上那些更本質、原創的發現。但這與外界現在對 DeepSeek 的部分期待並不匹配:一些人希望 DeepSeek 每次出手都像 R1 那樣石破天驚,這有些強人所難,也不符合技術規律。梁文鋒可以不在意外部期待,但他必須面對和處理內部期待。對更多年輕的研究員來說,做更多前沿研究,也需要承擔更多不確定性。更保險的路,是持續參與業界最強模型,在那些被關注的技術報告上署名,以及能有豐富的 GPU 資源支撐實驗和探索。除了榮譽和影響力,外界對 DeepSeek 成員的吸引力還有高額的財富承諾。DeepSeek 的絕對薪資不低,但外面給的更高。一些獵頭告訴我們,競爭對手開出了 “難以拒絕的數字”,“翻 2 到 3 倍問題不大”,“其他公司開出 8 位數(算股票或期權)總包”。新變化還有,MiniMax 和智譜上市、股價高漲,階躍、Kimi 的 IPO 也提上日程。這也讓一些 DeepSeek 成員對手中那份沒有明確標價的期權產生更多疑問。面對巨額邀約,更多人選擇留下。他們認可梁文鋒追求 AGI 的方式,願意做並非競爭驅動的探索;也習慣了 DeepSeek 相對寬鬆、從容的研究氛圍。近期外界的一些傳聞並不精準,DeepSeek 團隊雖有變化,但並沒有成組流失。“留下的人多少還是有些理想的。” 有接近 DeepSeek 的人士說,梁文鋒覺得在提升模型效率和性能的主線外,需要做一些當下回報不明確的方向,因為 “國外那些算力更多的公司,如 Google、OpenAI,內部肯定在試各種方向”。至今,DeepSeek 相對小的團隊和成立以來的透明、扁平的氛圍,讓成員之間依然可以自然分工:有時開始一個新方向,就是因為有三五個人都覺得一個 idea 不錯,然後就一起做了。這與梁文鋒 2024 年接受《暗湧》採訪時的描述相呼應:“我們一般不前置分工”,“每個人有自己獨特的成長經歷,都是自帶想法的,不需要 push 他……不過當一個 idea 顯示出潛力,我們也會自上而下地去調配資源。”“DeepSeek 是一個真心想做研究的人,在國內,甚至是全球能找到的最好的地方。” 有接近 DeepSeek 的人士說。改變世界,也被世界改變對 AGI 目標的獨特認知和拆解,是 DeepSeek 的可貴之處,也是它如今面臨內部張力的原因。因為梁文鋒看重的生態建設和原創探索,與業界普遍把 “保持最強” 視為第一優先順序,是重合但並非完全一致的目標。而且大模型發展到今天,“強” 和 “原創性” 的標準越來越模糊而主觀。Benchmark 分數已不能完全衡量模型水平。尤其進入 Agentic 模型競爭後,產品觸手及其帶來的長尾使用案例與多樣化資料變得更重要了,這恰恰是專注於模型研發的 DeepSeek 此前沒有太多投入的地方。即將發佈的 V4,大機率仍是開源最強模型,但很難是碾壓級的強。因為現在不同場景的不同開發者和使用者對 “強” 的標準和體感已越來越多元。什麼是原創的、有價值的新探索,則向來眾說紛紜,取決於不同研究者的經驗、判斷和直覺,所謂 “技術品味”。驗證品味的方式是實驗,而實驗的數量和規模又受限於 GPU 資源。相對於同行,DeepSeek 並沒有那麼多算力。最後,不管是大模型的生態基礎,還是在追求模型效果的過程中,探索其它團隊不一定會試的方向,這些梁文鋒看重的工作的回報都極不明確。前沿研究本該承擔這種不確定性,但它與算力資源有限的事實,與外界對 DeepSeek 能持續驚豔甚至 “碾壓” 的期待不完全匹配。梁文鋒意識到了要改變,近期他開始想辦法給公司估值,給團隊成員更多確定的預期。DeepSeek 也將更多投入產品。我們梳理了 DeepSeek 一位 HR 在社交媒體上從 2024 年 12 月至今發佈的所有招聘啟示,在今年 3 月中旬的最新招聘中,DeepSeek 第一次提及其它具體產品的名稱,要招募 Agent 方向 “模型策略產品經理”:持續跟蹤行業前沿,熟悉並深度使用過 Claude Code、OpenClaw、Manus 等知名 agent……接下來,肯定會看到 DeepSeek 在 Agent 產品上的更多動作。2025 年初,DeepSeek 以慷慨的開源精神和以小博大的奇蹟,震撼了中國和世界,也改變了世界:讓一批同行投入更多精力到模型技術本身,啟發了 Kimi K2 和 K2-thinking 等後續模型,也直接催生了一些新團隊,如陳天橋出資支援的 MiroMind。奇蹟之所以是奇蹟,就是因為它不常發生,是小機率事件。在中國這個崇尚競爭和結果說話的環境裡,敢於追求獨特目標的 DeepSeek 的存在本身,是一個令人驚喜的小機率事件。接觸梁文鋒的人評價:“他是一個特別抗噪音的人。”2025 年 R1 爆火後,梁文鋒顯示了對追捧的淡然。而現在,他面臨另一種情形的考驗:在外部競爭加劇時,分辨噪音與訊號,堅持該堅持的,改變要改變的。“低頭做事的人也許不一定能在浮躁的市場洪流裡笑到最後,但是只有更多 DeepSeek 這樣的公司出現,中國科技才有從 ‘復刻’ 到領跑的可能。” 一位從業者說。這是屬於梁文鋒和 DeepSeek 的工作。而曾被這家公司震動過的更多人,能做的很簡單:卸下爽文敘事,用更多平常心去看待一家公司和技術創新。 (晚點LatePost)
Google公開全新極限壓縮演算法:LLM提速8倍、記憶體佔用狂降6倍,精度零損失
Google帶來了一套有深厚理論基礎的全新量化演算法。這套演算法的出現,直接瞄準了當前AI領域的兩大痛點:大模型極其吃記憶體的鍵值快取(KV Cache),以及高維向量搜尋的算力瓶頸。直接把大模型推理中最燒錢的那塊記憶體砍掉六分之五,同時推理速度提升最高8倍,精度還沒有任何下降。說人話就是如果這個演算法真的有效,記憶體價格將有望大幅降低,也不要那麼多的GPU來訓練大模型了,當然根據傑文斯悖論,記憶體和GPU可能又會迎來一波更大的需求。這組演算法叫 TurboQuant,將在 ICLR 2026 正式發表。(實際上論文的預印本2025年就發了)記憶體瓶頸卡在那裡要理解 TurboQuant 解決的問題,先得搞清楚大模型推理時最貴的東西是什麼。大模型處理資訊的方式,本質上是把一切轉化成向量——一串數字。維度越高,向量能承載的資訊越複雜,也越精確。但高維向量極其耗記憶體。推理過程中有一個叫 KV Cache(鍵值快取)的機制,相當於模型的臨時記事本,把之前算過的結果存起來,避免重複計算。模型上下文越長,這個記事本佔的空間越大,記憶體很快就被撐滿了。解決思路自然是壓縮向量。但傳統的向量量化方法有一個隱藏成本:壓縮時需要存一批次化常數,這些常數本身又要佔掉1到2個位元,部分抵消了壓縮的效果。TurboQuant 就是衝著這個隱藏成本來的。TurboQuant 分兩步走第一步是 PolarQuant——處理主體壓縮。傳統量化用的是直角坐標系,相當於告訴你往東走3步、往北走4步。PolarQuant 改用極坐標,變成沿某個角度走5步。這樣一來,向量被拆成兩個量:半徑(代表資料的強度)和角度(代表資料的方向/含義)。極坐標有一個好處:角度的分佈規律是已知的、高度集中的,像一個固定的圓形網格,而不是邊界隨時在變的方形網格。不需要再額外算一遍資料歸一化,量化常數這個記憶體開銷就被徹底消掉了。第二步是 QJL——用1個位元處理殘餘誤差。第一步壓縮之後,還會留下一點點誤差。QJL 用 Johnson-Lindenstrauss 變換處理這個殘差:把每個數壓縮成一個符號位,+1 或 -1,記憶體開銷為零。關鍵是 QJL 用了一個特殊的估計量,把高精度的 query 和低精度的壓縮資料組合起來,使得最終計算注意力分數時誤差不會累積偏移。兩步合在一起,TurboQuant 用大部分位元做高品質的主體壓縮,再用1個位元做誤差修正,整體實現了零額外開銷。實驗資料Google在多個標準長上下文基準上做了測評,包括 LongBench、Needle In A Haystack、ZeroSCROLLS、RULER 和 L-Eval,使用 Gemma 和 Mistral 兩個開源模型。主要結論:TurboQuant 把 KV Cache 壓縮到 3 位元,不需要任何訓練或微調,模型精度沒有任何下降。在長上下文針尖大海撈針任務中,壓縮比達到至少6倍,結果依然滿分。在速度上,4位元的 TurboQuant 在 H100 GPU 上計算注意力 logits 的速度是原始32位元未量化版本的8倍。在向量檢索任務上,TurboQuant 在 GloVe 資料集上的1@k召回率超過了 PQ 和 RabbiQ 等當前最優方法,而後者還用了更大的碼本和針對資料集的專項調優。意義在那裡這套極限壓縮技術的出現,不僅直接解決了Gemini等大模型的鍵值快取瓶頸,更將深刻改變現代搜尋的格局。如今的搜尋引擎正在從關鍵詞匹配進化為理解意圖和含義,這離不開在數十億級向量庫中尋找最相似內容的向量搜尋技術。借助TurboQuant,以最小的記憶體、幾乎為零的預處理時間建構和查詢超大型向量索引成為可能,且精度達到當前最高水平。隨著AI技術全面融入各類產品,這類基礎級的向量量化突破將爆發出前所未有的威力。Google研究人員強調,這三個演算法不只是工程最佳化,背後有完整的理論證明,性能接近理論下界,因此在大規模系統中具有可信賴的魯棒性。TurboQuant、QJL 和 PolarQuant 的論文將分別在 ICLR 2026 和 AISTATS 2026 正式亮相。 (AI寒武紀)
AI的下一步:智能體
人的智能有三個方面:資訊的收集、資訊的處理產生認知、基於認知的行動。大語言模型目前主要的應用形態是ChatGPT這樣的聊天機器人(Chatbot),能力集中在前兩個方面。但更加有用的機器智能不只停留在“理解”和“說話”,如果能像一個或一群優秀的人才那樣幫我們“做事”,顯然能創造更大的價值。這就需要AI智能體(Agent)。智能體是能做事的AI。LLM是近幾年AI領域最重要的發展。已經在語言理解與生成、對話互動以及知識整合等方面展示出超凡能力,但它是“缸中大腦”——擅長思考、分析與回答問題,卻並不能真正地做事情。而在真實世界,大多數認知活動並不止於“給出答案”,而是要有完整的“認知-行動”閉環:我們要求AI得能夠自主的拆解複雜需求,規劃流程,呼叫工具和資源,實現從感知到決策再到執行的完整循環;進一步我們還希望AI的行動能夠超出電腦和網際網路領域,在物理世界中為我們做事情,則需要AI能夠感知物理世界的訊號,進行匹配具身的思考,通過裝置/機器人把決策轉化為執行,對現實環境產生直接影響。打個比方,LLM像是“未出山前的諸葛亮”,善於分析,以“隆中對”和劉備對談,出謀劃策,但限於“紙上談兵”;智能體則是“出山後的諸葛亮”,掌握全域情報,運籌帷幄,組織資源、調兵遣將,親自率軍北伐。智能體以LLM為代表的前沿模型作為大腦,通過軟體工程令其可以在高階目標驅動下完成複雜任務。可以說未來大部分的複雜AI應用都會以Agent為載體。事實上,我們在科幻作品中所看到的AI形象,比如《鋼鐵人》中的賈維斯或《2001:太空漫遊》中的HAL 9000,正是創作者對以Agent為載體的未來AI的直觀想像。只是和物理世界交換的AI本身就極為重要和複雜,現在習慣上把這部分單獨放在具身智能/機器人領域討論。智能體能力的構成為了在各行各業的應用中發揮出顯著價值,理想中的智能體需要具備幾個關鍵條件。首先,智能體應具備強大的目標理解和規劃能力來體現智能的自主性。理想狀態下,人類只需給出抽象目標,智能體便能理解目標、拆解任務、規劃行動,並在儘量少的人工干預下完成執行閉環。就像影《星際穿越》中的機器TARS,在緊急情況下能夠根據"拯救宇航員"這一目標,自主判斷局勢、制定和調整行動策略,甚至做出犧牲自己資料的決定來完成使命。這要求機器智能有深度“理解/思考”能力(推理、規劃、決策),能夠敏銳的決策,能夠基於執行結果與環境反饋動態調整任務規劃,而不是僵化的執行既定路徑。其次,我們希望智能體能“動手”做事:執行和互動能力。這就意味著它能夠使用工具、執行操作,並能與外部環境發生直接互動。在數字世界中,智能體可以模擬人類操作,通過鍵盤輸入、點選螢幕的方式來完成任務;也可以通過其他程序或系統介面來呼叫工具;還可以發揮模型特長,通過編寫和執行程式碼來達成目的。在物理世界中,智能體則需要與各類控制系統和裝置相連接,通過下達指令來操控物理對象,將智能決策轉化為現實行動。第三,我們希望智能體具備出色的記憶與學習能力。記憶和狀態管理能力是完成長程、複雜任務的前提。在面向消費者的場景中,例如個性化的日程管理或長期服務支援,智能體需要跨會話地記住使用者偏好、歷史互動與長期狀態,才能減少重複溝通、提升服務質量;在企業級應用中,如跨周期項目管理、複雜業務流程推進等,則需要智能體記住任務進度、中間結果與關鍵決策依據,確保任務在長周期、多階段執行中保持連貫性,不中途偏離既定目標。學習能力的意義是我們希望智能體能持續提升,像人類員工一樣可以從職場小白通過經驗積累和吸收新知進化成專家。最後,智能體還需要有很強的可靠性、可控性,才能規模化的帶來價值。這既體現在智能體能否穩定、魯棒的完成任務,也體現在其行為是否始終與人類的真實意圖與價值觀保持一致。在《2001:太空漫遊》中,AI為完成任務選擇犧牲人類乘員,正是目標函數與人類價值未能有效對齊的極端後果。隨著智能體智能水平與自主性的提升,這類對齊失敗帶來的風險可能會被進一步放大。如何建構智能體有了理想的標竿,我們怎麼建構智能體?基本邏輯很簡單:以可獲取的最“聰明”、理想的模型為核心(大腦),通過軟體工程來搭建一個系統,彌補模型的不足,儘量逼近理想智能體的形態。大模型是目前智能體大腦的最優選擇,因為大模型的兆參數壓縮了人類積累的海量知識,擁有強大的模式識別和生成能力,是處理包括語言在內的多種非結構化資料的萬能介面,擁有不錯的泛化能力構成處理各類任務的基礎。而以OpenAI o1/DeepSeek R1為代表的新一代推理模型為智能體的發展進一步助推:加強的推理能力帶來更強的任務分解和規劃,更好的自檢和糾錯,也令智能體對工具的使用可以更加精準。大模型有一些結構性弱點,直接限制了智能體在真實業務中的應用價值,因此智能體工程的一大核心工作,就是在模型外圍,用工程手段補齊短板、設定邊界、約束行為。首先,大模型本身沒那麼可靠:存在無法根除的幻覺問題、知識時效性問題,任務拆解和規劃經常不合理,也缺乏面向特定任務的系統性校驗機制。這樣一來,以其為“大腦”的智能體使用價值會大打折扣:智能體把模型從“對話”推向“行動”,錯誤不再只是答錯問題,而是可能引發實際操作風險;而真實業務任務往往是跨系統、長鏈路的,一次小錯誤會在鏈路中層層放大,令長鏈路任務的失敗率居高不下(例如單步成功率為95%時,一個20步鏈路的整體成功率只有約36%)。為此,智能體工程通常通過以下幾類手段給大模型加“外骨骼”以改善可靠性:引入檢索與知識庫(RAG)以降低幻覺和知識陳舊的影響;預先設計和約束工作流,而不是完全自由的“自治智能體”,以此限定可接受的執行路徑;通過多次回答、自一致性檢查或模型間交叉驗證,識別並過濾高風險輸出;在關鍵鏈路節點上設定人工審批,讓人類對高風險動作“最後拍板”。其次,大模型的記憶能力有缺陷:大模型在訓練時“記住”了大量知識,但訓練完成後並不會在使用中持續學習、“記住“新知識;每次推理時,它只能依賴有限長度的上下文窗口來“記住”當前任務的資訊(不同模型有不同上限,超過窗口的內容就會被遺忘),而無法像人一樣自然地維持穩定、長期的個體記憶。但在真實業務中,我們需要機器智能有強大的記憶能力,比如一個AI老師,需要持續記住學生的學習歷史、薄弱環節和偏好,才能在後續的講解與練習中真正做到“因人施教”。針對這些記憶缺陷,智能體工程通常採取以下手段進行增強:建構外部記憶庫將使用者偏好、業務知識、歷史互動等儲存在資料庫中,智能體在需要時通過檢索機制按需提取相關資訊,應對長期記憶缺陷;對過長的上下文進行摘要和壓縮,保留核心資訊,釋放Token空間,來應對資訊過載導致的短期記憶遺忘。除了補短板,因為智能體要行動、要和環境互動,需要有感知和執行。首先,大模型本身無法主動感知,只能對輸入被動響應。智能體需要用外部感知元件來主動獲取環境資訊。對於數字世界的任務,通過智能體工程可以建立基於時間的觸發器,定期檢查日誌、郵件、股價變動等;或基於事件的訂閱、監聽,接收API推送的事件通知,或當資料庫發生變更時自動喚醒記錄資料。在物理世界中,智能體還可以通過感測器、攝影機、麥克風等裝置採集視覺、聽覺、觸覺等訊號。其次,大模型沒有天然的執行能力,需要輔以智能體工程來將意圖轉化為實際操作。工具呼叫是當前最主流的方式,大模型根據任務需求,生成結構化的函數呼叫指令,由智能體框架解析後執行相應操作,比如呼叫天氣API、資料庫查詢、傳送郵件等;另一種方式是模擬人類操作,通過視覺識別和模擬操作來“看螢幕、點按鈕、填表單”來完成任務,近期大火的豆包手機就是這樣完成智能體操作;對於更複雜的任務,智能體還可以配置程式碼直譯器(Code Interpreter / Sandbox),讓模型程式設計運行,這可以極大的擴展智能體的行動邊界。當下智能體的能力邊界剛剛過去的2025年被不少AI從業者和科技媒體稱作“智能體元年”。這個觀察是較為準確的,得益於以下幾個條件的成熟,過去一年左右的智能體發展進入快車道:首先是大模型的持續進步,主要體現在推理模型的出現提供了更強的任務理解、規劃能力,以及多模態模型的發展為智能體能夠處理和生成更複雜的資訊提供了基礎。其次是基礎設施和生態的成熟,包括LangChain、AutoGPT等開源框架經過兩年的迭代,已經形成了一套標準化的開發範式,極大地縮短了開發周期;Dify、Coze(扣子)等低程式碼/無程式碼平台的普及,讓不懂程式碼的業務人員也能通過拖拉拽快速生成一個專用智能體;值得一提的是2025年Anthropic發佈的MCP(模型上下文協議)和skills(技能系統)給智能體生態提供了重要的標準和啟發:MCP作為一個開源協議標準,令大模型與外部資料來源或工具之間的互動更統一、便捷,Skills則是把人類設計的完成某類任務所需的能力/工作流打包起來,讓Agent在這類任務上可以更穩定的工作,雖然技術含量不高,但在當下有很強的實用性。再次,學術界和產業界都有大量的人才、資源投入到智能體領域,以ACL(國際計算語言學協會年會)2025為例,有超過230篇論文和智能體相關,為歷年最高,涵蓋規劃、工具使用、多智能體協作與評估等多個方向。在能力的提升、生態的健全、資源的投入影響下,各行各業正在嘗試把智能體真正的用起來。根據麥肯錫2025年全球調研顯示,約62%的受訪組織已在部分業務中嘗試智能體(23%為至少一個場景的規模化部署,39%為試驗性應用);但從業務職能的具體採用資料來看,產業對智能體的應用還處於早期階段:根據該調查,對於智能體應用最多的職能依次是IT、知識管理、行銷和服務,以應用最多的IT為例,僅有2%和8%的受訪企業IT部門全面規模化(Fully Scaled)和規模化(Scaling)的應用智能體,以及6%和7%的企業IT部門試點(Piloting)和試驗(Experimenting)的應用。造成這種規模化應用水平較低的原因有兩方面,一是前面討論的智能體能力問題,雖然在快速進步,但離全面的實用性還有距離;二是各行各業的企業應用者要把智能體用好還需要一些自身條件的配合。第一方面,除了短任務鏈條的資料分析、生成、檢索等方面的應用,智能體現在規模化應用場景大體可以概括為兩類,一是在程式設計領域,程式設計是智能體最理想的"練兵場",環境隔離、容錯率高,目標明確、目前規劃能力能應對,程序可執行,還有即時的執行反饋。這令其成為智能體第一個大規模、商業化的突破口。二是在各行各業的各種業務(銷售、客服、人力等)的專用智能體可以集合成一個大類,有一個共同點:目前主要是工作流自動化類型,其實這也是應對智能體深度理解(規劃、決策)能力不足的權宜之計,通過把智能體的任務的開放性降低、給出參考工作流程、定義可用的有限工具集等來提高智能體在這些任務上的工作質量。智能體進一步的規模化應用需要其能力進化,為企業能夠帶來切實的價值。第二方面,企業要用好智能體需要組織和資源上的匹配。根據Anthropic 2026年的最新調研,46%的受訪者表示與現有系統的整合是智能體部署的主要障礙,43%和42%的受訪者分別指向實施成本和資料的可及性/質量,40%和39%的受訪者表示安全/合規和員工的學習成本/抵制是重要障礙(中小企業尤其擔心學習成本,51%的受訪者指向這一點)。對於企業的顧慮,成本、安全等問題和技術進步的關係較大,但資料問題、整合問題、學習或人才問題都是需要企業通過組織變革、進一步數位化和全員的學習來提升。總結與展望未來,智能體將會是我們在各行各業、各種場景應用人工智慧的主要載體。可以預見,隨著模型能力和智能體工程的進步,企業資料治理和組織適配的提升,智能體會逐步成為每家企業極有競爭力的數字員工,和我們人類員工競爭與協作。從路徑上看,前面提到現在智能體規模化應用集中在程式設計和工作流自動化方面,隨著機器智能深度理解水平的提升,可以預期智能體的應用會不斷拓展邊界,能承擔更抽象、複雜的任務,更多的自主規劃和決策,來把人類的意圖轉化為結果。當然,突破不等於拋棄工作流。在企業高風險場景裡,工作流/權限/審計會變成“護欄”,用來限制智能體的行動空間,以確保應用的安全。在相當長的時間內,人類的審批、審計在智能體工作的閉環中可能都是不可缺少的。智能體發展的另一個關鍵方向,是成為人類的“個人助手”或“智能代理”。與其他類型的智能體相比,這一方向的門檻更高,因為它需要更強的個性化能力、長期記憶、跨場景泛化能力以及更嚴格的安全邊界。個人助手型智能體有潛力重塑人類與世界的互動方式——無論是購物、社交,還是資訊獲取——並可能對很多產業的商業邏輯產生顛覆性影響。過去一年中,“豆包手機”的推出,以及2026年年初爆火的“OpenClaw”,讓我們看到了助手型智能體的一些早期探索,令人振奮。前者代表了裝置級智能體的嘗試:它將智能體能力深度嵌入作業系統,通過模擬人類操作以調取各類App,為使用者完成任務。後者則是一種始終線上的解決方案,能夠主動觀察與執行任務,並通過本地部署獲取豐富的個性化資料和軟體控制權,初步體現了個人助手型Agent的一些核心特徵。根據IDC的預計,活躍智能體的數量將從2025年的約2860萬,攀升至2030年的22.16億。這意味著五年後,能夠幫助企業或個體執行任務的數字勞動力數量將是現在的近80倍,年複合增長率139%;任務執行的數量將從2025年的440億次暴漲至2030年的415兆次,年複合增長率高達524%;Token的消耗將從2025年的5000億激增至2030年的1.5兆億,年複合增長34倍。IDC的預測未必精準,但趨勢非常明顯,每一家企業都要為此做好準備。 (FT中文網)