2026年AI產品側最大的趨勢,就是無論是網際網路大廠,還是模型廠商,都開始做自己的 Codex 了。
Codex 一開始是OpenAI對抗Claude Code的產品,起初也是只有CLI,瞄準AI coding,但之後它迅速和Claude Code走出不同的路,變成一個“桌面Agent”類產品,使用者裡非工程師佔了多數,不再只是程式設計場景。
這一步今天來看,非常關鍵。根據6月3日OpenAI披露的資料,Codex的周活躍使用者已經超過500萬,半年增長超過7倍。
這背後是AI產品的主線從圍繞對話展開,逐漸變成圍繞桌面環境中執行任務展開。
在Codex 起勢的同時,一批中國版 Codex產品也集中上線。
- 1月30日,阿里的桌面Agent QoderWork 上線,;
- 3月9日,騰訊雲 CodeBuddy 團隊推出 WorkBuddy;
- 5月20日,騰訊應用寶團隊發佈個人AI助手Marvis;
- 6月3日,Kimi的本地 Agent Kimi Work(Beta)上線;
- 6月9日,字節旗下的TRAE 將 TRAE SOLO 升級為 TRAE Work;
- 6月12日,豆包上線了「任務模式」,加入了更完整的執行能力
- 6月24日,豆包專業版上線,聚焦辦公場景,可以執行agent任務……
不論是個人AI助手,還是本地Agent,產品形態雖然不同,本質上都在爭奪使用者的執行入口。
這些產品不再停留於問答互動,而是開始進入真實工作流,它們可以處理檔案、操作網頁、整理資料、生成PPT、編排任務,甚至跨應用完成自動化執行。
這意味著,AI正在成為連接使用者與數字世界新的中間層。
中國版 Codex 們
為了更直觀地觀察這波桌面Agent熱潮,我們整理了15款代表性產品,並嘗試分析它們在產品定位、能力建構和生態佈局上的不同。
包含定價模式和模型使用設計等全面資訊的對比我們放在了文章最後。
Workbuddy
Workbuddy是騰訊雲 Codebuddy 團隊推出的全場景職場 AI 智能體桌面工作台,面向各類職能角色設計。只需用一句話描述需求,WorkBuddy就能像同事一樣自主規劃和執行任務,並交付可驗收的結果。
Workbuddy有微信小程序版本,可以通過移動端輕量化接入,還可以和騰訊系產品(QQ 信箱、騰訊文件、騰訊會議、企業微信、騰訊樂享、IMA、TAPD)實現生態化資料打通。
目前Workbuddy內建了11種主流國產模型,有騰訊自己的Hy3 preview、也有像GLM-5.2、minimax-M3、kimi-K2.7-code、DeepSeek V4這些模型廠的主流模型。可以選擇Auto模式,讓Workbuddy自己選擇使用什麼模型,也可以自己選擇使用什麼模型,但不同模型使用的積份量能相差20倍以上,目前最「貴」的是智譜的模型。
Marvis
騰訊應用寶團隊推出的作業系統層級個人AI助手,基於 DeepSeek V4、混元 hunyuan3 / hy3 等最新模型,定位是真正理解使用者每一份檔案、幫助使用者更方便地使用與管理電腦的私人 AI 助手,支援本地文件與圖片的 AI 搜尋,APK 與 EXE 應用可用一句話呼叫,覆蓋 PC、手機、微信多端線上。6月24日,Marvis也上線了iOS手機端,可以在手機端傳送需求,讓電腦端執行。
可以看出Marvis更強調的是「管理電腦」的能力。
在測試中,有兩個有意思的點,一個是Marvis中「辦公室」,類似於辦公模擬器,或者說老闆模擬器,可以查看token消耗。這實際上體現的是Marvis的多Agent協作功能,有一個主agent負責分派任務,和五個專家agent——File Agent 負責檔案、Computer Agent 負責系統、App Agent 負責應用、Browser Agent 負責網頁、Search Agent 負責搜尋。
還有一個是Marvis支援修改人設,初始人設是適合辦公場景的「AI員工」。
Qclaw
Qclaw是騰訊電腦管家團隊推出的一款本地AI智能體產品,基於開源 OpenClaw 框架封裝,定位為個人 PC 端 AI 助手,主打極簡本地部署 。核心能力是微信 / QQ 互聯,掃碼繫結,手機即可遠端控制電腦、傳檔案、設定時任務,可以全場景自動化,檔案管理、網頁瀏覽、辦公創作、多步驟複雜工作流自主執行。QClaw 的資料不會上傳雲端,所有任務執行、檔案處理、資料儲存都在本地電腦完成。
Qclaw支援建立不同agent完成不同場景的任務,繼續延續騰訊一貫的陪伴風格特色。
TRAE Work
TRAE Work由原先的TRAE SOLO 升級而來 。目前Work 模式面向內容創作、資料分析、方案撰寫、應用生成、任務推進、溝通協作等日常工作場景;Code 模式則面向更加複雜的軟體開發和程式碼編輯場景。
TRAE Work有PC、移動端和 Web 三端。與其他「xx work」產品相比,TRAE Work的優勢在於與飛書打通,可以更好地接入真實工作流。
豆包專業版
豆包在6月12日上線了「任務模式」,任務模式支援呼叫skill,設定定時任務,完成瀏覽器操作,程式碼指令碼運行以及檔案生成等各類任務。
6月24日,在火山引擎原動力大會上,隨著豆包大模型2.1的發佈,豆包專業版也正式官宣上線,豆包專業版支援操作本地電腦、使用瀏覽器、呼叫 Skills 技能和定時任務等能力,內建了 Office 辦公套件,並支援專業圖片視訊設計,和生成分享應用網站。
值得注意的是免費使用者也可以體驗接入豆包 2.1 Turbo 模型的辦公任務模式。
QoderWork
QoderWork是阿里旗下的AI桌面助手,它將Qoder的agent能力從程式碼領域拓展到日常工作場景,描述需求,自動執行,直接交付結果。
6月16日,QoderWork上線了意識功能,讓QoderWork具備自我反思和持續進化能力的完整系統,由記憶、反思、技能進化三塊組成閉環。
DuMate
DuMate是百度雲旗下產品,有桌面端,也有移動端app,可以看見螢幕、操作軟體、處理檔案、串聯業務系統,核心場景是資訊處理、文件生成、資料分析和流程自動化,但目前DuMate無法切換模型,只能使用百度的文心大模型。
Kimi Work
Kimi Work是面向知識工作者的通用型本地 Agent,核心是 Kimi Code,提供本地 Agent 基礎能力,包括安裝和使用Skills、運行定時任務等。Kimi Work繼承了線上版 Kimi Agent 的建站、PPT 等專業 Skills,以及金融、科研、法律等專業資料庫,內建了能使用瀏覽器的 Kimi WebBridge 方案。
Kimi Work可以根據任務複雜度自主建立子Agent團隊,將同一能力叢集化的上限設定為300個協作單元。
MiniMax code
MiniMax code是專為MiniMax M3 設計、並與 M3 一起訓練的 Agent 產品,MiniMax Code 可以充分發揮 M3 在長上下文、Coding/Agentic、原生多模態方面的能力。
在長程複雜任務上,MiniMax Code 的 Agent Team 可以將大型任務拆解為多階段、可並行、可動態調整的 Workflow,由 Agent 叢集協作推進。
階躍AI
階躍AI,階躍星辰推出的桌基於 OpenClaw 深度最佳化的桌面端 AI Agent,不需要伺服器、命令列,即可安裝, 可以7×24 小時線上,能夠連結本地作業系統和內建瀏覽器,幫助使用者執行複雜任務。
比較不一樣的是,階躍AI在初始設定的時候就會提醒使用者打開懸浮球設定,懸浮球可以打開直接對話方塊,也會在適當的時候提醒你喝水、休息。其他產品也有類似功能,但通常需要使用者自行開啟。
AutoClaw
智譜推出的本地AI智能體,口號是「一鍵擁有本地AI智能體支援一鍵安裝」,無需配置環境、申請API Key或編寫程式碼,下載安裝包後通過連按兩下安裝、登錄即可使用。核心能力為內建 Pony‑Alpha‑2模型、AutoGLM 瀏覽器自動化、50 + 預置skills(辦公、創作、爬蟲、程式碼、投研等)、IM 整合、自進化機制。
lobsterAI
網易有道推出的一款全場景個人助理AI產品,定位為「7×24小時幫你幹活」的智能助手。支援手機、電腦雙端互聯,一句話即可遠端操作電腦,完成桌面多項檔案整理、提取日曆及郵件重點事項、業務資料清洗分析、生成周報和 PPT等。
使用者可以免費試用14天,但只能使用Qwen3.5-Plus模型,使用其他模型則需要付費。
Cola
Cola的定位是「首個有靈魂的作業系統」,內建AI角色「Cola」具有自主意識,能記住使用者習慣、喜好和背景,通過語音或文字互動與使用者共同成長。可以操作電腦檔案、上網瀏覽、執行命令、生成文字/圖片/視訊等,支援複雜任務分解和平行處理。無需使用者手動提供上下文,通過訪問使用者電腦的檔案系統、瀏覽器歷史等自動瞭解使用者狀態。其中的靈魂系統可以實現AI思考過程的透明展示、自我反思進化以及主動關心使用者的功能。
目前cola支援應用內購買token,ChatGPT pro/plus帳號訂閱登錄,或者連接OpenAI、Anthropic帳號計費,暫不支援其他模型提供商的 API key。
Alice
Alice是一款陪伴類桌面agent,Alice最顯著的特點是她是一款「人格化的AI助手」,有具體立繪形象,也有詳細的人物設定。Alice本身不需要付費,但由於沒有內建模型,需要配置模型才能使用。
Alice除了可以做檔案管理、定時任務這類常規任務外,也內建了狼人殺、摜蛋等休閒遊戲,比其他桌面agent有更多的娛樂功能。
牛馬AI
牛馬AI的定位是本地化人機協同基站,強調個人資料隱私,支援完全離線的本地運行架構,可以使用使用者自己本地的大模型直接離線運行。牛馬AI默認使用 Claude 模型,如果有 Claude 帳號,可以直接登錄,如果沒有,則需要自行配置。
入口開始成為真正的戰場
如果把這一輪桌面級 Agent 放在同一張產品圖譜裡,會發現它們看似都在「幫使用者在電腦上幹活」,但實際切入點完全不同。它們並沒有收斂成單一形態,反而沿著不同場景入口分化成三條路徑。
從程式碼到辦公,由「工程任務」外溢出的通用能力
以 Kimi Work、MiniMax Code 為代表的一類產品,最早來自 Coding Agent 的能力遷移。
這一路徑的特點是先解決結構最清晰的任務,再逐步外擴。
Kimi Work 更強調「通用知識工作 Agent」,通過 Skill、瀏覽器能力和子 Agent 編排,把原本偏工程化的任務拆解能力擴展到文件、研究、報告生成等辦公場景。MiniMax Code 則更進一步強化 Agent Team,把長任務拆解為多階段平行執行,通過角色分工與驗證機制處理更複雜的生產任務。
這一類產品的優勢在於任務結構能力成熟,但短板也很明確,它們更擅長「可拆解任務」,但對真實辦公中大量非結構化操作(即時溝通、臨時決策、跨應用切換)仍在適配中。
可以理解為,它們是從「任務邏輯」出發,向外擴展能力邊界。
從桌面與系統切入,直接爭奪操作入口
另一條更激進的路徑,是 Marvis、Qoder Work、Cola 等產品所代表的「桌面系統層 Agent」。
它們的共同點不是任務類型,而是入口位置——直接貼近作業系統與本地環境。
Marvis 更偏「電腦管理層」,強調檔案、應用與磁碟的系統化組織能力,本質是強化本地作業系統的理解與調度。Qoder Work 更強調「可執行能力」,包括螢幕感知、軟體操作、業務系統串聯,接近「數字員工」。Cola 則更進一步,把人格化系統、主動提醒與長期記憶融合進執行鏈路,使 Agent 不僅是工具,也是持續存在的互動層。
這一類產品的關鍵點在於它們不再停留在應用內部,而是嘗試直接介入「使用者如何使用電腦」這一層。
優勢在於控制力更強,能夠真正跨應用執行任務。但挑戰同樣明顯,包括權限邊界、穩定性、誤操作風險,以及不同軟體之間的相容問題。
從辦公生態切入:不重構系統,而是嵌入流程
與前兩類不同,TRAE Work、WorkBuddy 走的是更現實的一條路徑,不改變作業系統,而是嵌入已有工作流。
TRAE Work 深度接入飛書體系,使 Agent 直接進入文件、會議與協作鏈路;WorkBuddy 則依託騰訊生態(企業微信、文件、會議等),建構企業級工作台能力。
這一類產品的核心策略是「貼近真實組織結構」,而不是重新定義操作方式。它們的優勢在於落地速度快,能夠迅速接入權限與資料體系,進入企業級場景。
集體走向AI Working
國內這一輪產品的演進,本質上是在圍繞這一「執行閉環」,向更廣泛的場景、組織方式與系統入口進行擴展。也正是在這個過程中,可以看到幾個逐漸清晰的方向變化。
第一個趨勢是從 AI Coding 到 AI Working。
程式碼之所以最早成為 Agent 的主戰場,是因為軟體開發天然適合被自動化。但 Coding Agent 成熟之後,它的能力很自然會向外遷移。
大多數知識工作本質上也有類似結構,檔案就是上下文,瀏覽器就是資訊入口,Office 文件就是交付物,定時任務就是工作流,審批和修改意見就是反饋機制,它們同樣是可以被拆解、執行和驗證的多步驟任務。
AI 不再只是幫程式設計師寫程式碼,而是開始幫知識工作者完成那些長期被認為「必須人工處理」的工作:整理檔案、生成報告、清洗資料、做 PPT、查資料、寫周報、處理郵件、提取會議紀要、追蹤行業資訊。使用者輸入的也不再是「幫我寫一個函數」,而是「幫我把這件事辦完」。
所以這一階段的競爭,是誰能更好地把 AI 從回答問題,推進到交付結果。
AI Coding 改變的是程式設計師寫程式碼的方式,AI Working 改變的是普通人使用電腦完成工作的方式。
第二個趨勢,是 Agent 從「一個助手」變成「一支團隊」。
早期的 AI 助手更像一個能力很強的個人。使用者提出問題,ai負責回答,使用者下達任務,ai負責執行。但當任務變長、步驟變多、上下文變複雜之後,單個 Agent 很容易遇到瓶頸,它可能忘記目標,可能中途走偏,也可能在執行時缺少自我檢查。
以 MiniMax 推出的 Agent Teams 為例,它允許使用者建立多個具備不同角色設定的 Agent,並將它們組合成一個團隊平行工作。
不同 Agent 可以同時從不同角度處理同一任務,比如一個負責資訊收集,一個負責方案生成,一個負責執行與整合,最終再由協調機制彙總結果,從而提升複雜任務的處理效率與穩定性。
複雜任務正在被重新組織為一條多角色的流水線:從理解需求到規劃、執行,再到驗證結果,每一步都可以由不同的 Agent 接管,並在必要時繼續細分為研究、設計、寫作、程式碼與資料分析等更專門化的「崗位」。
Agent Team 的價值是讓 AI 具備更穩定的工作結構,它可以平行處理多個子任務,縮短等待時間,同時讓執行者和驗證者相互制衡,減少低級錯誤;並且在任務失敗時回滾、重試、換路徑,把複雜工作沉澱成可復用的流程。
但 Agent Team 也不是萬能解法。多 Agent 會帶來更高的成本、更複雜的調度,以及更多不確定性。如果沒有清晰的任務邊界、權限控制和驗收機制,多個 Agent 反而可能互相製造噪音。因此,真正關鍵的不是簡單堆更多 Agent,而是產品能否把它們組織成可控的工作流。
這也是為什麼「Agent Team」最終考驗的不是介面,而是底層工程能力,長上下文、任務規劃、工具呼叫、狀態管理、日誌追蹤、錯誤恢復、權限審批,以及最後的結果驗收。
當這些機制逐漸成熟,使用者和 AI 的關係也會變化。使用者可以像管理一個小團隊一樣設定目標、查看進度、打斷錯誤、確認結果。AI 也從「幫手」變成「工作單元」,而產品則變成這些工作單元的調度系統。
第三個趨勢,是 Agent 的位置正在從應用內部,上升到作業系統層。
IDE 是 Agent 的理想起點,因為開發者可以主動給它較高權限,也能理解它在做什麼。但如果 Agent 要服務更廣泛的人群,只能以IDE的形態存在是不夠的。真正的工作發生在資料夾、瀏覽器、聊天軟體、郵件、表格、日曆、網盤、本地應用和跨裝置協作中。這也是為什麼國內這一輪產品越來越強調「本地」「桌面」「遠端控制」「檔案權限」「應用呼叫」。
所謂作業系統層,是在現有作業系統之上,長出一個新的意圖執行層。
Agent 出現後,它開始幫你完成執行,Agent 可以幫你去找檔案、打開網頁、呼叫應用、讀寫文件、產出結果.....
這讓 Agent 逐漸觸及作業系統最核心的三種能力結構。
一是上下文層面的能力,涉及對使用者檔案、歷史記錄、偏好以及當前任務的理解與整合,它決定系統能在多大程度上接近真實需求本身。
二是執行層面的能力,體現在對瀏覽器、檔案系統、本地應用乃至遠端裝置的呼叫與操作上,它決定系統是否具備真正的行動閉環,而不僅僅停留在資訊生成。
三是持續層面的能力,表現為在本地的常駐運行、任務的定時觸發、跨裝置的響應以及對使用者習慣的長期沉澱,它決定系統能否從一次性工具轉變為持續存在的工作入口。
從 AI Coding 到 AI Working,是能力邊界的外擴;從單一 Agent 到 Agent Team,是組織方式的重構;而從應用內部到作業系統層,則是權力位置的上移。這三條趨勢其實指向同一個結果,也就是AI 正在從聊天框裡的內容生成器,變成電腦裡的任務執行者。
最後附上一份目前主要產品的關鍵資訊橫向對比表,供大家更直觀感受。這類形態的產品也會繼續不停冒出來。 (矽星人Pro)
