Anthropic 再出手,收購 AI 電腦操控公司 Vercept

剛剛,Anthropic 官宣收購 Vercept,要給 Claude 的 Computer Use 能力加把火。

Vercept 是一家西雅圖的 AI 初創公司,去年 9 月成立,團隊只有 10 個人左右,但來頭不小:五位聯合創始人全部出自 AI2(Allen Institute for AI)。

CEO Kiana Ehsani 之前在 AI2 帶機器人和具身智能團隊。Luca Weihs 是 AI2 的研究經理,專攻 AI Agent 和強化學習。Oren Etzioni 更不用說了,AI2 的創始 CEO。Matt Deitke 參與過 Molmo、Objaverse 等知名項目。

但陣容裡最重磅的是 Ross Girshick,電腦視覺領域的傳奇人物。他發明了 R-CNN 目標檢測演算法,在 Meta FAIR 待了 8 年,參與了 Mask R-CNN 和 Segment Anything(SAM) 等里程碑式的工作,Google Scholar 引用超過 50 萬次

這麼一支全明星團隊,去年 6 月剛拿了 1600 萬美元 種子輪,投資人陣容也很豪華:

前 Google CEO Eric Schmidt、Google DeepMind 首席科學家 Jeff Dean、Cruise 創始人 Kyle Vogt、Dropbox 聯合創始人 Arash Ferdowsi,領投方 Fifty Years 此前投過 Hugging Face。

產品叫 Vy

Vercept 的產品叫 Vy,一個桌面端的 AI Agent。

它的思路很直接:像人一樣「看」螢幕,然後操控滑鼠和鍵盤完成任務。 不需要 API,不需要整合,任何軟體都能用。

你可以錄一段自己操作電腦的過程,Vy 看懂之後就能自動重複執行。也可以直接用自然語言下指令,讓它幫你處理 Excel、從網頁抓資料丟到 Slack,或者自動填表單。

技術上,Vy 走的是 vision-first 路線:高頻螢幕擷圖,理解螢幕上的真實內容(文字、圖片、佈局),然後決定下一步操作。跟傳統 RPA 靠 DOM 結構或固定坐標點選完全不同。

這套能力,恰好就是 Anthropic 的 Computer Use 最需要的。

不過,Vy 作為獨立產品的日子不多了。

Vercept 在官網公告中明確表示:Vy 將於 3 月 25 日關停,付費使用者的訂閱會自動取消,剩餘時間內可以免費使用。

Vercept 團隊在告別信中說,從最初接觸 Anthropic 開始,就感受到雙方在「AI 既要好用,也要安全」這件事上的高度一致。他們甚至稱 Anthropic 是「世界上最重要的 AI 研究機構」。

用他們的原話來說:

我們在 Vercept 開始的工作將繼續下去,只是現在有了更大的資源、更強的團隊和更遠的願景。

Computer Use

Anthropic 在公告中秀了一波資料:Claude Sonnet 4.6 在 OSWorld(評測 AI 操控電腦能力的基準)上的得分,從 2024 年底的不到 15% 飆到了 72.5%,已經接近人類水平。

收購 Vercept,自然是要把這個數字進一步往上推。

Vercept 團隊在視覺感知和互動操控上的積累,正好能補上 Anthropic 自研的短板。

這已經是 Anthropic 近期的第二筆收購了。

上一次是去年底收購了 JavaScript 執行階段 Bun,用來給 Claude Code 和 Agent SDK 做底層基建。

Claude Code 半年跑出了 10 億美元 ARR,Bun 在其中扮演的角色不容小覷。

另一邊,OpenAI 也沒閒著

巧的是,就在 10 天前,OpenAI 也做了一筆收購:OpenClaw.

OpenClaw 的創始人 Peter Steinberger 是一位奧地利開發者,去年 11 月搞了個 AI Agent 項目,最初叫 Clawdbot

名字裡帶個「Clawd」,明眼人一看就知道跟 Claude 有關係。

果不其然,Anthropic 直接發了律師函,要求改名。

Steinberger 先改成了 Moltbot(龍蝦蛻殼的 molt),但覺得不夠順口,三天後又改成了 OpenClaw

這個名字前面加個「Open」,後面保留「Claw」(龍蝦鉗),既甩開了 Claude 的商標糾紛,又暗戳戳地致敬了 OpenAI 的命名風格。

改名之後,OpenClaw 反而更火了,成了 AI 開發者圈子裡現象級的項目,主打「能跨應用、跨系統自主完成任務的 AI Agent」。

2 月 15 日,Sam Altman 官宣:Peter Steinberger 加入 OpenAI,負責下一代個人 Agent。

Altman 的原話是:

他是個天才,對未來智能 Agent 之間的協作有很多令人興奮的想法。

很多人關心:OpenClaw 被收了,開源還保得住嗎?

Steinberger 自己寫了篇部落格解釋:OpenClaw 將轉入一個獨立基金會營運,繼續開源。OpenAI 會作為贊助方提供資金支援,他本人也會繼續維護。

他說自己「骨子裡是個 builder」,之前創業 13 年,但發現做開放原始碼專案帶來的成就感遠比做公司大。加入 OpenAI 是因為要做出「連我媽都能用的 Agent」,這需要頂級模型和研究資源。

不過話說回來,OpenAI 既是贊助方又是 Steinberger 的僱主,OpenClaw 能保持多大的獨立性,還得觀察。

都在搶人

把這兩件事放在一起看,趨勢則是:

AI 巨頭現在最缺的,其實是 Agent 的落地能力。

Anthropic 收 Vercept,補的是 Computer Use 的感知和互動。收 Bun,補的是程式碼執行的基礎設施。

兩筆收購指向同一個目標:讓 Claude 能真正替人幹活。

OpenAI 收 OpenClaw,瞄準的則是個人 Agent 市場。ChatGPT 的聊天框已經不夠用了,使用者需要的是一個能操作日曆、訂機票、管檔案的全能助手。

而 OpenClaw,恰好驗證了這條路走得通。

OpenClaw 這筆收購,也「標誌著 ChatGPT 時代開始走向終結」,AI 產品的主戰場正在從「對話」轉向「行動」。

而 Anthropic 和 OpenAI 的打法,則有著明顯區別:

Anthropic 在買團隊、補技術堆疊,OpenAI 在買社區、搶生態。

或許 Agent 之戰,才剛開始。 (AGI Hunt)