#Claude Code
Anthropic “王牌”Claude Code原始碼洩露 國產AI程式設計工具迎來機遇
2026年3月31日,一場因打包失誤引發的“意外開源”,讓Anthropic引以為傲的AI程式設計工具Claude Code的51.2萬行核心程式碼在全球開發者社群中瞬間擴散。這不是一次駭客攻擊,而是人為發佈錯誤——偵錯用的.map檔案被一同打包進npm包,暴露了完整架構與功能邏輯。短短數小時內,GitHub上湧現大量鏡像倉庫;次日,Anthropic為阻止擴散發出下架請求,卻因操作失誤誤刪約8100個倉庫,引發使用者強烈不滿。這場戲劇性的洩露事件,恰逢Anthropic籌備IPO的關鍵期,不僅重創其“安全標竿”形象,更意外地為全球AI開發工具的技術平權撕開了一道口子。▍戲劇性洩露:從低級失誤到 “自殺式” 下架這場原始碼洩露的開端,是一個幾乎所有開發者都熟悉的低級錯誤。2026年3月31日14 時,Anthropic 在 npm 倉庫發佈@anthropic-ai/claude-code v2.1.88版本,卻意外將包含完整原始碼的 59.8MB 偵錯用 cli.js.map 檔案打包其中。Web3 安全公司 FuzzLand 實習研究員Chaofan Shou(@Fried_rice在16時30分左右率先發現並披露了這一漏洞,檔案中的sourcesContent欄位直接包含了未經混淆的完整 TypeScript 原始碼,可直接還原 Claude Code 的全部核心邏輯。消息在開發者社區如野火般蔓延,數小時內GitHub上出現大量鏡像倉庫,星標數量迅速破千。更具諷刺意味的是,這已是Anthropic在13個月內第二次因同類source map問題導致原始碼洩露,暴露了其CI/CD流程存在嚴重漏洞,且未從歷史錯誤中吸取教訓。事件的戲劇性在4 月1日(愚人節)達到高潮。Anthropic為阻止程式碼擴散向 GitHub發出下架請求,卻因範圍判斷失誤,誤刪了約8100倉庫,其中包括自身開放原始碼專案的正常分支,引發全球開發者強烈不滿。Claude Code負責人鮑裡斯・切爾尼隨後緊急承認誤操作,撤回大部分下架請求,僅保留對1個倉庫及96個分支的處理,GitHub也已恢復多數受影響倉庫的存取權。一位不願具名的網際網路大廠技術專家對此評論道:“嚴謹地說,原始碼被洩漏的這種情況,沒有許可證來授權如何使用、修改、再分發的,不應該說是‘開源’,大概相當於說錢丟在路邊不算是‘功德’。” 這句評論精準點出了此次事件的本質 —— 一場由人為失誤導致的 “被動開源”,而非 Anthropic 主動開放技術的善舉。▍技術平權:從閉源壟斷到生態爆發儘管此次洩露源於失誤,卻意外成為AI領域的技術民主化催化劑。快思慢想研究院院長田豐告訴《科創板日報》記者:“2026 年 Claude Code 原始碼洩露事件,即是AI領域里程碑式危機,又是行業變革催化劑。51.2 萬行核心程式碼的意外公開,直接導致技術壁壘崩塌與開源生態爆發。”這場 “意外開源” 的直接成果,是韓國開發者Sigrid Jin的clean-room項目 ——Claw-Code。該項目採用 “淨室重寫” 原則,完全不接觸、不參考原始原始碼,僅根據對產品功能的外部觀察,從零重新實現一遍,2小時內獲5萬星標,目前已超10萬星標、9萬fork,更催生了多語言重寫版本。田豐指出,這標誌著閉源壟斷模式受重創,技術普惠加速,行業競爭核心從‘程式碼保密’轉向模型質量、生態整合與安全治理。對全球 AI 開發者而言,洩露程式碼提供了 “工程教科書” 級參考。在田豐看來,多 Agent 協作、超長上下文管理及六級權限沙箱等設計,已助力某國產團隊程式碼生成精準率提升 40%。這些技術細節此前被 Anthropic 視為核心商業機密,如今卻成為全球開發者的 “免費午餐”,大幅降低了 AI Agent 工程化門檻,加速了開發者生態競爭,助力中小團隊快速追趕。此次洩露還意外推動了AI開發工具領域的技術平權。田豐分析道:“Anthropic‘安全標竿’形象因兩次重大洩露徹底瓦解,警示全行業:安全漏洞將引發系統性信任危機。” 這一事件讓全球企業客戶開始重新審視對單一閉源工具的依賴風險,為技術自主可控的國產工具創造了市場窗口。▍國產AI程式設計工具:借鑑而非複製,創新而非跟隨對國產大模型與 AI 程式設計工具而言,此次洩露堪稱 “史詩級” 的技術補課與彎道超車機會。田豐認為:“機遇與挑戰並存,關鍵在於如何把握。”在技術層面,洩露程式碼為國產團隊提供了直接學習全球頂尖AI程式設計工具架構的機會。此前,國內AI程式設計工具在自主Agent、安全沙箱等領域與海外頭部產品存在差距,而Claude Code原始碼提供了可直接參考的工程方案,包括動態提示詞系統(分層快取省成本)、YOLO安全分類器(防誤刪)、Auto Dream記憶機制(後台整理不佔 token)及44個功能開關等核心元件。國內團隊無需再重複試錯,可直接基於現有架構最佳化迭代,快速推出具備競爭力的產品,實現 “彎道超車”。在市場層面,Anthropic的信任危機為國產工具打開了窗口。復旦大學復旦大學計算與智能創新學院一位人士指出:“企業客戶對資料主權、本地化部署的需求激增,國產工具可借勢強化安全可控與國產晶片適配性,在合規與信任上建立差異化優勢。”他指出,2025年底Claude曾對中資斷供,大量國內產品依賴Claude核心被迫緊急換模型、損失使用者。現在,國產團隊有能力完全自研程式設計agent架構,後端可自由切換國產模型(DeepSeek、Qwen、Seed、文心等),實現AI開發工具自主可控,不再被海外 “卡脖子”。田豐則特別強調,此次Claude Code原始碼提洩露,對於國內大模型企業的核心在於 “借鑑而非複製,創新而非跟隨”。他提出三點建議:一是差異化功能突破,如融合中文環境最佳化、國產IDE整合、本土程式碼規範檢查;二是安全能力升維,打造更嚴苛的發佈管控與透明審計機制,將安全作為核心賣點;三是生態突圍,聯合雲廠商建構託管服務,發展本土外掛生態。同時,他也警示必須警惕法律風險,避免直接使用洩露程式碼,而應通過clean-room重寫實現技術遷移。AI大模型業內普遍認為,這場 “意外開源” 雖源於失誤,卻加速了AI開發工具的技術平權。“未來競爭焦點將轉向資料積累、工作流整合深度及品牌信任,國產工具唯有從‘模仿’轉向‘價值創新’,才能把握技術民主化浪潮,建構自主生態系統。國產玩家需以安全為盾、創新為劍,在行業重構中搶佔制高點。” (財聯社)
突發!Claude Code開源,全網瘋傳
實習生扒出51萬行原始碼,GitHub已瘋傳。Claude Code“開源”了?智東西3月31日報導,剛剛,Anthropic的Claude Code在打包發佈時誤將source map檔案(.map)捆綁進了npm包,導致約1900個TypeScript檔案以及超過51.2萬行程式碼遭洩露。這件事的發現者是區塊鏈基礎設施公司Solayer的實習生Chaofan Shou,他第一個在X上發帖並直接給出了R2儲存桶的src.zip下載連結。用簡單的話解釋就是,Source map本來是給開發者偵錯用的“還原地圖”,它能把壓縮後的JS程式碼對應回原始TypeScript原始碼。結果Anthropic打包npm包時,不小心把.map檔案也塞了進去,而且地圖裡直接寫著他們Cloudflare R2儲存桶的公開地址。於是任何人只要下載這個npm包,打開.map檔案,就能順著地址下載到完整的、未混淆的TypeScript原始碼檔案,而這些TypeScript檔案就是Claude Code軟體的完整原始碼。目前,Anthropic已經迅速更新了npm包,移除了source map,但社區已經有人把原始碼鏡像到了GitHub中,並且獲得了超2萬顆星:https://github.com/instructkr/claude-code還有網友已經梳理出了Claude Code的運作邏輯,並行布了完整的“說明書”:https://www.mintlify.com/VineeTagarwaL-code/claude-code/guides/authentication那這約1900個TypeScript原始碼檔案,到底是什麼呢?簡單來說,這些檔案就是Claude Code客戶端工具的實現細節,包括它怎麼架構、用那些工具、支援那些命令、怎麼和IDE互動、怎麼管理記憶,以及一些還沒上線的功能,但不包含Claude大模型本身的權重、訓練資料、伺服器端程式碼或使用者敏感資訊。具體內容主要包括以下部分:1、核心架構和引擎QueryEngine(查詢引擎):這是整個工具的大腦,負責接收使用者指令、拆解任務、呼叫Claude模型、處理流式輸出、做快取、協調多步操作等。多Agent協作系統(swarms):讓多個AI Agent一起分工合作完成複雜任務。Memory記憶系統:將之前的對話、檔案內容、上下文持久化保存下來,方便長期使用。IDE Bridge:工具如何和VS Code、JetBrains等編輯器雙向通訊(包括使用 JWT 認證機制)。2、內建工具:這些工具讓Claude Code能真正“動手”幫你操作電腦、寫程式碼、搜尋資訊,而不是只聊天。3、命令系統:4、技術堆疊5、關鍵檔案QueryEngine.ts(約46K行):LLM API 呼叫的核心引擎,包括處理流式響應、工具呼叫循環、思考模式、重試邏輯和token計數等。Tool.ts(約29K行):定義所有工具的基本類型和介面,即輸入模式、權限模型和進度狀態類型。commands.ts(約25K行):管理所有斜槓命令的註冊和執行,使用條件匯入為每個環境載入不同的命令集。main.tsx:基於Commander.js的CLI解析器和React/Ink渲染器初始化。啟動時,它會優先處理MDM設定、鑰匙串預取和GrowthBook初始化,以加快啟動速度。6、值得關注的設計模式平行預取:通過在開始繁重的模組評估之前平行預取MDM設定、鑰匙串讀取和API預連接來最佳化啟動時間。懶載入:大型模組(OpenTelemetry、gRPC、分析和一些功能門控子系統)通過動態方式延遲執行,import()直到實際需要時才執行。智能體群:子Agent通過生成AgentTool,並coordinator/處理多代理編排。TeamCreateTool支援團隊級平行工作。技能系統:可重用工作流程中定義的元件skills/通過該元件執行SkillTool,使用者可以加入自訂技能。外掛架構:內建外掛和第三方外掛均通過plugins/子系統載入。7、主要未發佈特性標誌及功能:KAIROS:自主守護模式。支援後台持續運行、後台會話、自我記憶整合,讓Claude Code成為一個24×7線上的助手,能在無人值守時自主工作和總結。PROACTIVE:主動模式。Claude Code能主動監控項目、提出建議、提前處理任務,增強AI的自主性和前瞻性。VOICE_MODE:語音互動模式。支援通過語音輸入指令,目前部分命令可能已有限支援,但完整整合仍未發佈。DAEMON:背景執行/守護模式。將工具轉為常駐後台處理程序,支援長期任務執行,而無需一直保持終端窗口打開。BRIDGE_MODE:與IDE的深度橋接模式增強版本,可能包括更先進的雙向通訊或認證邏輯。BUDDY系統:一個趣味虛擬寵物系統,包含約18種不同物種,有鴨子、鵝、貓、龍、章魚、貓頭鷹、企鵝、烏龜、蝸牛、幽靈、軸足動物、卡皮拉、仙人掌、機器人、兔子、蘑菇等。有稀有度、閃光變體、即時狀態等玩法,是個隱藏的彩蛋式功能。但要注意,這並不是Anthropic主動開源,Anthropic依然對原始碼擁有版權。開發者們可以看程式碼、學架構,但不可以拿去修改後重新發佈成自己的工具或做成產品。否則,Anthropic有權通過DMCA(版權刪除通知)讓GitHub刪除相關項目,或者追究法律責任。 (智東西)
Codex不打算讓Claude Code好過
2月6日,OpenAI總裁Greg Brockman在X上公開發了一條面向全公司工程團隊的帖子,設了一個deadline:到3月31日,任何技術任務,工程師的第一工具應該是agent,而不是編輯器或終端。這是OpenAI對自己下的動員令。如果只看這句話,你可能會覺得又是一條矽谷式的願景聲明。但接下來六周發生的事情表明,Brockman不是在喊口號。OpenAI的Coding Agent平台Codex,正在經歷一輪罕見的產品衝刺,密度之高,節奏之快,甚至讓一些長期關注AI編碼工具的開發者開始重新審視自己的工具鏈。與此同時,Codex在程式設計師群體中的熱度和口碑也在肉眼可見地上升。一切動作都指向“狙擊”Anthropic 如日中天的Claude Code。六周的瘋狂迭代拉一下時間線就能感受到這個節奏。2月2日,Codex桌面App發佈(macOS),OpenAI同時宣佈向ChatGPT免費和Go使用者開放Codex,所有付費使用者的速率限制翻倍。2月5日,GPT-5.3-Codex發佈,OpenAI稱它為"第一個幫助創造了自身的模型"。同一天,Anthropic發佈Claude Opus 4.6。2月12日,Codex-Spark發佈,與AI推理硬體公司Cerebras合作,推理速度超過每秒1000 tokens。OpenAI的說法是,“當模型能力越來越強,互動速度就成了明確的瓶頸。”2月14日,OpenClaw創始人Peter Steinberger宣佈加入OpenAI。據Pragmatic Engineer報導,Steinberger用Codex編寫了OpenClaw的全部程式碼,偏好長時間運行的agentic loop。Sam Altman在X上稱他為“天才”,說他將“推動下一代personal agents”。3月4日,Codex桌面App登陸Windows。3月5日,GPT-5.4發佈,是OpenAI第一個同時具備reasoning、coding和原生computer use能力的通用模型,在Codex和API中支援100萬token上下文。3月6日,Codex Security進入research preview。這是OpenAI推出的應用安全代理,前身為內測階段的Aardvark,能夠分析程式碼倉庫、建構項目級威脅模型、在沙盒中驗證漏洞並提出修復建議。過去30天的beta測試中,它掃描了超過120萬次commits,發現792個critical等級漏洞和超過10000個高危問題,覆蓋OpenSSH、GnuTLS、Chromium等重量級開放原始碼專案。誤報率降低超過50%,噪音降低84%。使用資料也在同步攀升。Sam Altman在X上確認,Codex的周活使用者自年初以來增長超過三倍;Codex團隊負責人Thibault Sottiaux(Tibo)告訴Pragmatic Engineer的Gergely Orosz,1月以來它的使用量增長了5倍,周活開發者超過100萬。Tibo還在播客中提到,Super Bowl周日播出的Codex廣告讓系統幾乎立即承受了巨大負載。六周,七次重大產品動作,這成了OpenAI在產品上最激進的衝刺之一。要理解這個節奏,一方面要看供給側的變化。GPT-5系列模型的agent能力在過去幾個月出現了質的飛躍,從上下文窗口、工具呼叫到長時間自主執行,模型本身的能力到了一個可以支撐Coding Agent這個產品形態的臨界點。另一方面,需求側的訊號同樣強烈。據SemiAnalysis報導,Anthropic的Claude Code已經做出25億美元的年化收入,佔其企業收入的一半以上。Claude Code用真金白銀證明了Coding Agent可以成為AI公司的核心收入引擎。對於估值據報已達數千億美元的OpenAI來說,放棄這個賽道不是一個現實的選項。根據SemiAnalysis的預測AnthropicARR增速一度超過OpenAI時間點上的貼身肉搏也值得注意。GPT-5.3-Codex和Claude Opus 4.6在2月5日同一天發佈。Codex Security和Claude Code Security幾乎同期推出。這種節奏本身就是訊號,兩家公司正在把Coding Agent平台視為正面戰場。開發者開始從Claude Code的單一模式變成混合模式在很長一段時間,Anthropic旗下的Claude Code看起來似乎已經沒有了對手,使用者對它的依賴變得越來越重。而OpenAI顯然不想讓Anthropic 這麼舒服。在Codex的一通激進衝刺後,開發者社區的反應也開始發生一些變化。過去一個月,Reddit和Hacker News上關於Codex和Claude Code的討論,出現頻率最高的詞不是更好或替代,而是stacking。也就是說,越來越多的開發者不是在兩者之間選擇,而是同時使用。Calvin French-Owen是一個典型案例。他是Segment聯合創始人,曾在OpenAI參與Codex web產品的發佈,同時也是Claude Code的深度使用者。他在今年2月寫的一篇部落格裡說,自己選擇工具的核心標準是“我有多少時間,以及我想讓它多自主地跑”。他的日常工作流是用Claude Code做規劃、編排終端和管理git操作,然後切到Codex做實際編碼。他說Opus在跨上下文窗口的工作中效率更高,會同時啟動多個子代理平行探索程式碼庫;而Codex在長時間自主編碼任務上更穩定。Reddit上也出現了更具體的分工模式。有開發者詳細描述了一個五段式workflow,先讓Claude Code出計畫,再讓Codex review計畫,然後由Claude實施,最後交給Codex做code review和QA迭代。還有人直接把Claude Code和Codex串成了一個CLI bridge,因為手動在兩者之間複製貼上太累了。一篇社區分析總結了500多條Reddit評論後的結論,Claude Code在一組小樣本盲測中勝率達到67%,質量更高;但Codex 20美元的套餐能編碼一整天不斷,而Claude Code同價位十幾個prompt就用完了。“Claude Code質量更高但用不完,Codex稍弱但全天能用”,這是2026年3月開發者社區最真實的共識。在Cursor官方的benchmark中,GPT系列整體領先其他模型。開發者社區還流傳著一個比喻來描述兩者的氣質差異,Claude像美國人,適合做充滿創造力的探索和頭腦風暴,Codex像德國人,代表極致的效率和專注執行。“它就像一條咬住骨頭不放的狗,非常固執,會一直嘗試直到解決問題。”當然也有反面聲音。Hacker News上有開發者說Codex對自己來說“每一項都比Claude Code差”,尤其是code review會製造看似合理但實際不存在的問題,他最後只把Codex用來覆核Claude的產出。但大方向已經很明確了,社區討論正在從那個更好就用那個,變成兩個都用,各佔一個工位。比的不再是benchmark,是誰是更實用的產品只看模型benchmark,你不太容易理解Codex為什麼起勢。在SWE-Bench這類編碼評測上,Claude Opus 4.6仍然領先。真正讓Codex拉開差異的地方在別處,OpenAI正在圍繞它建構一整套工程系統。Orosz今年2月發表了一篇對Codex團隊的深度報導。其中最引人注目的事實是,Codex超過90%的程式碼是由Codex自己編寫的。Anthropic方面也有類似的說法,Claude Code的建立者Boris Cherny告訴Orosz,Claude Code的資料大致相當。當然,這裡的90%需要打個折扣理解,在一個成熟項目中,樣板程式碼、測試用例、常規重構佔了大量行數,核心架構決策仍然由人來做。但兩家AI實驗室都在用自己的coding 工具來編寫自己的coding 工具,這種自舉本身就說明了這些工具已經深度嵌入了日常工程流程。Codex 的基本工作原理Codex團隊在工程組織層面走得更遠。Orosz的報導描述了一種新的工作方式,Codex團隊的典型工程師同時運行4到8個平行agent,分別處理feature開發、code review、安全審計、程式碼庫理解、bug修復等任務。工程師的角色正在從寫程式碼的人變成管理agent的人。技術選型上,Codex CLI選擇了Rust(Claude Code使用的是TypeScript)。團隊負責人Tibo給出的理由不僅是性能和正確性,還有工程文化,選擇Rust是為了給團隊設定一個高工程標準,同時減少對npm依賴生態的依賴。他們甚至招募了Rust終端UI庫Ratatui的維護者全職加入團隊。更值得關注的是分層程式碼審查機制。Codex團隊訓練了一個定製的code review模型,據Tibo說約9/10的評論能指出有效問題。審查分兩層,非關鍵程式碼在AI review後可以直接merge,核心agent程式碼和開源元件仍然要求強制人工審查。這套機制的意義在於,審查本身開始分層了。還有兩個細節能說明Codex正在從工具走向系統。Codex可以運行自己的完整測試套件來測試自身;團隊還設定了夜間巡檢,讓Codex自動掃描程式碼庫並生成待審修復建議,工程師每天早上進公司時就有一批修復等著review。一家名為Wonderful的AI開發公司的首席架構師在今年3月寫了一篇文章,描述了他們四個月前禁止手動coding後的經驗。他對兩個工具的定位是,Codex是坐在房間後面戴耳機的工程師,默默讀完你整個程式碼庫15分鐘才寫第一行程式碼,Claude則更有產品感,更擅長判斷什麼感覺對。他們把Codex用於低延遲系統工作、即時語音管線、性能敏感程式碼,Claude則用於UI和前端。從coding工具到Agent平台拉遠來看,Codex六周衝刺的方向指向一個更大的野心。Peter Steinberger的加入是一個人事訊號。他日常同時平行5到10個agent,加入OpenAI後的方向是下一代personal agents,不是coding工具。OpenAI正在用Codex作為agent戰略的入口。Codex Security則是另一個方向的延伸。當Codex從幫你寫程式碼走向幫你審計安全,它的定位就已經變了。GPT-5.4進一步加速了這個轉變。作為OpenAI第一個具備原生computer use能力的通用模型,它在Codex中不僅能寫程式碼,還能操作電腦、跨應用執行工作流。配合正在成型的外掛/skills生態系統和企業級權限管理,Codex的輪廓越來越像一個AI原生的開發平台。Codex團隊在Every的播客中透露了他們眼中的下一個瓶頸,就是程式碼審查。模型生成程式碼的速度已經遠超人類review的速度,驗證產出的正確性成了最緊迫的問題。他們已經在嘗試讓模型通過重現使用者操作路徑來“證明”修復有效,而不是讓人類逐行讀程式碼。這些野心和Claude Code已經越來越清楚的發展方向有很多重合,在從Claude Code那裡迅速搶走了一些使用者和使用場景之後,Codex的勢頭正在起來。回到Greg Brockman 2月6日的那條帖子。他設的deadline是3月31日,目前距離deadline還有兩周多,而從過去六周的節奏來看,Codex的衝刺還遠沒有結束。OpenAI把曾經在模型上呈現出的狠勁兒和卷王的氣質,都放到了Codex上,接下來它和Claude code之間短兵相接的故事,會更精彩了。 (硅星人Pro)
Agentic AI時代,“老大”OpenAI成了“老登”?
ChatGPT的發佈讓OpenAI一戰封神,所有人都覺得這家AI公司會一直贏下去。然而在AI程式設計這條賽道上,佔據先機的卻並非OpenAI。2025年2月份,競爭對手Anthropic低調發佈了Claude Code。這款能夠直接操作電腦、自主完成程式設計任務的AI智能體,在短短幾個月內為Anthropic帶來了超過25億美元的年化收入。與之相比,OpenAI的同類產品Codex,同期年化收入約為10億美元。雙方的差距不止一倍。更令OpenAI尷尬的是,Anthropic的核心創始團隊,正是幾年前從OpenAI離開的那批人。OpenAI位於舊金山Mission Bay的新總部大樓是一棟現代化的玻璃幕牆建築。接待處擺放著介紹公司發展歷程的宣傳資料,樓梯間的牆壁上掛滿了一系列里程碑事件的紀念海報:GPT系列、DALL·E、ChatGPT——每一幅都記錄著這家公司過去幾年的高光時刻。但其中沒有AI程式設計。01. 從Codex到Copilot,OpenAI錯失的先發優勢OpenAI其實很早就開始了AI程式設計方向的探索。2021年,奧特曼和OpenAI聯合創始人格雷格·布羅克曼(Greg Brockman)還在舊金山Mission區的老辦公室,向《連線》雜誌記者展示了一個叫Codex的項目。它是GPT-3的一個分支版本,在GitHub的數十億行開放原始碼上訓練而成。使用者輸入一句自然語言描述,它就能生成一段相應的程式碼。“它可以代表你在電腦世界裡執行操作,”布羅克曼當時說,“你擁有一個可以執行命令的系統。”但這個早期的技術積累,最終沒有轉化為產品層面的持續投入。Codex被微軟看中了。這家軟體公司當時正在開發一個叫GitHub Copilot的產品,這是一款能嵌入程式設計師編輯器、提供程式碼補全功能的工具。一位早期加入OpenAI的員工回憶,當時的Codex“除了自動補全之外做不了太多事情”,但微軟已經將其視為未來產品的重要方向。2022年6月,GitHub Copilot正式發佈,幾個月內就吸引了數十萬使用者。正常情況下,OpenAI應該會加大對這一方向的投入。但接下來發生的事情,讓後來負責Codex產品的團隊感到遺憾。最初的Codex團隊被解散了。一部分成員轉去做DALL·E 2圖像生成項目,一部分去參與GPT-4的訓練。當時公司的首要目標是實現AGI,AI程式設計沒有被視為需要獨立投入的領域。一位前團隊成員說,之後的幾年裡,OpenAI沒有專門的團隊在開發AI程式設計產品。“當時的感覺是,這個領域已經被GitHub Copilot覆蓋了,”畢竟微軟會繼續使用OpenAI的模型來迭代這個產品,不需要OpenAI自己操心。幾個月後,ChatGPT上線,兩個月內使用者數突破1億。OpenAI完全被這次成功轉移了注意力。接下來的2023年和2024年,OpenAI把主要資源投入到多模態模型的研發上,致力於讓AI理解圖像、視訊、音訊,像人一樣操作游標和鍵盤。當時Midjourney等產品正在興起,行業普遍認為大語言模型需要具備處理多模態資訊的能力,才能邁向更高層次的智能。這個方向的選擇本身沒有問題。只是在這段時間裡,AI程式設計這條賽道正在悄然生長,而OpenAI的注意力並不在這裡。02. 競爭對手Anthropic突圍Coding賽道Anthropic選擇了另一條發展路徑。這家公司也做多模態模型和聊天機器人,但有一個方向始終沒有放鬆:程式設計能力。布羅克曼後來在一個播客節目裡談到,Anthropic“從早期就非常專注在程式設計上”。他們不僅用演算法競賽題目訓練模型,還往訓練資料裡加入了真實項目中那些結構混亂的程式碼,就像普通開發者日常面對的那種。“這是我們沒有及時意識到重要性的地方,”他說。2024年6月,Anthropic發佈Claude Sonnet 3.5。很多開發者試用後發現,這個模型的程式設計能力確實突出。一家叫Cursor的初創公司最先受益於此。幾個二十多歲的年輕人做了一款產品:在程式碼編輯器裡用自然語言提需求,AI直接幫忙修改程式碼。他們接入Sonnet 3.5後,使用者量開始快速增長。據熟悉Cursor的人士透露,幾個月內,Anthropic就開始內部測試自己的獨立版本了,也就是後來的Claude Code。Cursor火起來之後,OpenAI曾試圖收購這家公司,但遭到拒絕。對方認為程式設計賽道潛力巨大,希望保持獨立。收購未能達成,OpenAI內部也開始有團隊嘗試AI程式設計方向。2024年底,幾個小型團隊陸續啟動。一個是安德烈·米申科(Andrey Mishchenko)和蒂博·索蒂奧(Thibault Sottiaux)帶領的團隊,這兩人分別是Codex的研究負責人和前GoogleDeepMind研究員。他們最初的動機比較務實:用AI程式設計來加速AI研究,讓AI自動管理訓練任務、監控GPU叢集,研究員就能騰出時間做更有創造性的工作。另一個是亞歷山大·恩比里科斯(Alexander Embiricos)帶領的團隊,他之前負責多模態智能體的研發。他做了一個叫Jam的演示項目,在公司內部引起了不少關注。Jam和2021年的Codex有本質區別。Codex是輸出程式碼讓人來執行,Jam則可以直接進入命令列,自己運行程式碼。恩比里科斯看著電腦螢幕上那個跟蹤Jam操作的自建頁面一遍遍自動更新,感到有些不可思議。“我以前一直以為多模態互動可能是實現AGI的路徑,也許我們以後就是整天和AI共享螢幕,”他說,“但後來逐漸意識到,讓模型以程式設計方式直接訪問電腦,可能是更有效的方向。”這幾個團隊磨合了幾個月後合併在一起。等OpenAI在2025年初完成o3(比o1更針對程式設計任務最佳化的模型)的訓練,他們終於有了建構產品的技術基礎。但這時,Claude Code已經準備公開發佈了。03. 收購受阻與內部衝刺,OpenAI的雙線應對2025年2月,Claude Code以“有限研究預覽”的形式首次亮相。5月,全面開放使用。這個產品和之前流行的“氛圍編碼”模式不同。氛圍編碼是人主導、AI輔助的程式設計模式,由人做決策,AI執行具體操作。而Claude Code可以直接在命令列工作,訪問使用者的所有檔案和應用程式,開發者可以把部分工作真正交給AI來完成。OpenAI也開始加快節奏。索蒂奧在3月組建了一個“衝刺團隊”,把內部幾個小組整合在一起,計畫在幾周內推出競品。與此同時,奧特曼開始尋找收購目標,他們看上了一家叫Windsurf的AI程式設計初創公司,報價30億美元。如果收購完成,產品、團隊、企業客戶都能快速補齊。但這筆交易被微軟擱置了數月。據《華爾街日報》報導,微軟希望獲得Windsurf的智慧財產權。這家雲巨頭從2021年起就用OpenAI的模型支撐著GitHub Copilot,每次財報電話會都會提及這個產品。但Cursor、Windsurf、Claude Code陸續出現後,GitHub Copilot的產品形態顯得有些過氣。此時OpenAI再推一個新的編碼產品,微軟的態度自然變得複雜。Windsurf的交易正趕上OpenAI和微軟重新談判合作協議。OpenAI希望從微軟那裡爭取更多自主權,不希望產品和算力資源被過度控制。這筆收購成了雙方博弈過程中的犧牲品。到7月,交易正式告吹。後來Google招攬了Windsurf的創始人,剩餘團隊則被另一家編碼初創公司Cognition收入麾下。“我本來挺希望做成這筆交易的,”奧特曼說,“但不是每一筆交易都能控制。”不過他提到,Codex團隊的表現讓他有些意外。談判那幾個月,索蒂奧和恩比里科斯一直在迭代產品,沒有停下來。到8月,OpenAI開始加速推進自己的產品。04. 從5%到40%:Codex猛追市場份額布羅克曼有一個自己設計的測試方法,叫“反向圖靈測試”。他多年前親自編寫了這套程序,規則是這樣的:兩台電腦前各坐一個人,每人螢幕上有兩個聊天窗口,一個連接著對面的人,一個連接著AI。目標是判斷那個窗口是AI,同時還得讓對方以為你才是AI。去年大部分時間,OpenAI最好的模型要完成這個遊戲的程式碼編寫,需要好幾個小時,中間還得有人一步步引導。到12月,Codex用GPT-5.2做引擎,一個結構清晰的提示詞輸入後,就能直接生成一個可運行的遊戲。感受到變化的不僅僅是布羅克曼。開發者社區裡開始頻繁討論AI程式設計智能體的能力提升,話題從矽谷擴散到更廣的範圍。一些沒有程式設計背景的人,也開始嘗試用這些工具做些簡單的軟體項目。Anthropic和OpenAI都在爭搶使用者。有開發者表示,自己每月支付200美元的Codex或Claude Code訂閱費,實際能用到價值1000多美元的服務。兩家公司都在用慷慨的用量限制把使用者往工作流裡引導,等人用習慣了,再按實際用量收費。從資料上看,OpenAI確實在縮小差距。2025年9月,Codex的使用量大約是Claude Code的5%。到2026年1月,這個比例上升到接近40%。Notion的聯合創始人西蒙·拉斯特(Simon Last)說,他和團隊在GPT-5.2發佈後從Claude Code切換到了Codex,主要原因是後者更穩定。“我發現Claude Code有時候會給出不精準的資訊,”他說,“它說自己正在處理任務,實際上並沒有進展。”在OpenAI負責Codex行為研究的凱蒂·施(Katy Shi)說,有些使用者覺得Codex的回應風格偏“干”,但越來越多人開始接受這種不刻意迎合的特點。“工程領域的工作,本來就需要能夠接受批評性反饋,不能因為表達方式直接就覺得被冒犯。”企業客戶也在逐步進入。OpenAI應用部門的CEO菲吉·西莫(Fidji Simo)稱:“ChatGPT已經成為AI領域的代表性產品,這在B2B市場是一個明顯優勢,多數企業傾向於使用員工已經熟悉的技術。”OpenAI銷售Codex的策略,主要是將其打包進ChatGPT的企業套件中一併提供。思科的總裁傑圖·帕特爾(Jeetu Patel)告訴員工,不用太在意使用Codex產生的費用,關鍵是要熟悉這個工具。有員工問他用了之後會不會失業,他的回答是:“不會,但不用一定會失業。不熟悉這些工具的人,慢慢會失去競爭力。”有開發者認為,OpenAI在B端市場的管道優勢正在發揮作用。不少公司已經採購了ChatGPT的企業版,在此基礎上增加一個Codex功能,決策成本並不高。也有分析指出,Codex最近的能力提升與GPT-5.2的推理能力最佳化直接相關。o系列模型採用的訓練方法,即讓模型在結果可驗證的程式設計任務中不斷試錯、獲得反饋,這對程式碼生成的質量有明顯幫助。程式設計本身就是一個反饋訊號明確的領域,程式碼要麼能運行要麼不能,這種特性對模型迭代很有利。05. 奧特曼的難題:既要速度,又怕失控AI程式設計智能體的影響已經不限於開發者社區。《華爾街日報》上個月將科技股1兆美元的拋售部分歸因於Claude Code,因為投資者擔心軟體本身的價值可能被壓縮。之後Anthropic宣佈,Claude Code可以對IBM那些運行COBOL語言的老系統進行現代化改造,IBM的股票遭遇了25年來最大單日跌幅。OpenAI也在加大投入。今年的超級碗廣告,他們投放的是Codex,而不是ChatGPT。在OpenAI總部,Codex的使用已經相當普遍。多位工程師提到,他們現在很少手寫程式碼,每天的工作主要是和Codex互動。一位參與了內部駭客馬拉松的工程師描述說,現場大約100人,用四小時時間通過Codex搭建一個可用的演示項目。不少項目既是用Codex開發的,目標也是為了讓工程師更好使用Codex。有的團隊做了個工具,把Slack消息自動彙總成周報,有的團隊用AI生成了一個內部服務的百科式指南。以前這些事情可能需要幾天才能完成,現在一個下午就能跑通流程。凱文·維爾(Kevin Weil)是前Instagram高管,目前負責OpenAI for Science部門,為研究人員開發AI產品。他說Codex現在會在夜間幫他處理一些項目,早上到公司檢查進度就行。這種做法已經成了他和幾百名同事的日常工作方式。OpenAI 2026年的目標之一是開發一個能夠自主進行AI研究的AI實習生。西莫表示,Codex最終會整合進ChatGPT和所有產品線,不僅是用來程式設計,而是協助處理各種任務。奧特曼說他想發佈一個通用版本的Codex,但對安全性還有些顧慮。1月底,他一個非技術背景的朋友請他幫忙安裝OpenClaw,但他沒有答應,認為“現在還不是時候”,那個智能體可能會誤刪重要檔案。但這件事過去幾周後,OpenAI就把OpenClaw的創作者招進了公司。不少開發者認為,Codex和Claude Code之間的差距確實在縮小,但也有機構對OpenAI的進度表示擔憂。一個叫Midas Project的非營利組織發佈報告稱,OpenAI在GPT-5.3-Codex上沒有完整披露網路安全風險,安全承諾的落實情況不夠透明。OpenAI的對齊負責人阿米莉亞·格拉澤(Amelia Glaese)否認為了推進Codex而犧牲安全,表示Midas對公司的承諾存在誤解。布羅克曼對AGI的進展保持樂觀,認為“項目正在按計畫推進”。但在不少矽谷工程師的印象裡,他一直是那種產品發佈前夜還在檢查程式碼庫細節的負責人。現在的狀況不太一樣了。布羅克曼面對的是幾十萬個AI智能體,在執行具體的任務和項目。他說這種新的工作方式“讓人感覺輕鬆了一些,因為以前確實需要記住很多細節”。但有時候,“你不太清楚那些事情具體是怎麼被解決的”。他說,這種變化會讓你“感覺對問題的感知不像以前那麼敏銳了”。 (騰訊科技)
Claude Code Security發布嚇壞資安產業市場陷入恐慌 資安股為何集體下挫?
日前,人工智慧新創公司Anthropic發布全新程式碼安全工具 Claude Code Security,主打能像資深資安人員一樣理解整個程式碼庫的邏輯與元件交互關係,而非僅比對已知漏洞模式,並自動生成具針對性的修補建議。消息公布後,資安相關族群出現短期震盪,部分龍頭公司股價走弱。追蹤資安產業的First Trust NASDAQ Cybersecurity ETF也出現連續數日回檔,引發市場討論:「AI是否對傳統資安產業形成威脅?」(相關新聞:Claude令市場陷入恐慌 全球百億美元市值一夕蒸發)但這個問題,真的那麼單純嗎?(First Tnust NASDAQ Cybersecurity ETF(CIBR))市場為何會出現壓力?Anthropic 在發布時指出,Claude Code Security 在測試階段已成功找出超過 500 個真實存在的程式碼漏洞,部分甚至是傳統資安工具長期未能偵測到的問題,市場可能將此視為潛在競爭訊號,進而調整資安類股的未來成長預期。從市場心理層面來看,生成式AI若能自動掃描漏洞:提供修補建議降低人工分析時間確實可能讓投資人產生聯想「這是否會削弱既有資安公司的價值?」然而,需要釐清的是目前Claude Code Security所聚焦的,是應用程式層級的程式碼分析與漏洞輔助修補。這屬於整體資安體系中的一個環節,而非完整的資安解決方案。資訊安全產業實際涵蓋範圍包括”防火牆與邊界安全”:端點安全(Endpoint Security)雲端安全架構零信任(Zero Trust)模型威脅偵測與回應(EDR / XDR)SOC安全營運中心身分與存取管理(IAM)流量分析與行為判讀勒索軟體防禦漏洞掃描只是其中一部分,因此,短期市場反應更可能來自於對未來競爭格局變化的預期調整,而非產業基本面立即發生根本性改變。在資本市場中,股價反映的是「預期」,不一定是「已發生的事實」。AI 的角色:把「想」變成「做」的輔助工具?正因如此,理解 AI 在資安中的真實角色,比跟隨市場情緒更為重要。將AI與資安視為對立關係,或許是一種過度簡化。在我的認知裡,AI 是一種輔助型工具,而非全能的決策者。它可以協助你整理知識、提升工作效率、協作文章撰寫,甚至幫你實現以前只停留在「想法」階段的事。舉個例子:假設你想打造一套自動語音報時系統,過去你可能因為技術門檻而難以起步,但現在透過 AI 的輔助,這個想法可以相對快速地被實現。目前市面上除了 Claude,也有 Gemini、ChatGPT 等多種 AI 工具,各有其擅長的應用場景。AI 真正的價值,在於降低實現門檻,讓更多人能將創意轉化為行動。換句話說:AI正在成為資安產業的加速器,而不是替代者。未來的競爭,可能不再是「AI公司 vs 資安公司」,而是「誰能更有效整合AI進入資安架構」,產業升級通常伴隨技術重組,而不是單向消滅。(除了Claude仍有許多AI可以做到圖片上列的事項例如Gemini、OpenAI...等)AI 越方便,你越需要守護自己的資訊安全AI 工具日益普及,使用便利性大幅提升,但隨之而來的資安風險也不容忽視。當你將 AI 工具安裝於電腦、整合進工作通訊軟體,或授予它存取你的檔案、照片等權限時,使用過程中的互動紀錄,通常會傳送至該服務商的伺服器進行處理。即便業者聲稱不長期保存資料或採用加密傳輸,資料在傳輸與處理過程中的風險仍然存在。建議大家在享受 AI 帶來的便利之餘,也建立清楚的使用界線:•避免將機密的工作文件、客戶資料輸入公開的 AI 服務•謹慎授權 AI 存取個人照片、通訊紀錄等敏感內容•定期檢視所使用工具的隱私權政策與資料處理方式AI 是幫助我們把不可能化為可能的存在,但在擁抱它的同時,守護屬於自己的數位邊界,同樣重要。因此,比起全面拒絕AI,更成熟的態度是:理解風險、設定界線、建立制度。**更多(分析、資產配置分享、財經閱讀筆記..等)歡迎至「ANSHI安實的沙龍」訂閱哦!※文章分享來自個人分析,不會給予該買或賣的評斷,純分享,也是一種自我紀錄。※投資理論沒有對錯,想法、策略只有適不適合自己,互相討論求進步(數據有誤,歡迎留言修正)。
Claude Code 工程師:像 Agent 一樣思考
概要Anthropic 工程師 Thariq 分享了建構 Claude Code 過程中關於 Agent 工具設計的經驗教訓。文章通過幾個真實案例,講述了 AskUserQuestion 工具的三次迭代、Todo List 到 Task 系統的演進、搜尋工具的變遷,以及漸進式發現機制的設計思路。核心觀點是:Agent 的工具設計沒有標準答案,你得不斷觀察模型的行為,反覆實驗迭代,學會「像 Agent 一樣看世界」。全文原文作者:Thariq(@trq212),發佈於 2026 年 2 月 28 日原文連結:https://x.com/trq212/article/2027463795355095314建構 Agent 最難的部分之一,就是設計它的「動作空間」(action space)。Claude 通過 Tool Calling 來執行操作,而 Claude API 提供了多種建構工具的方式,包括 bash、skills,以及最近新增的 code execution(關於程式設計式工具呼叫的更多內容,可以參考 @RLanceMartin 的文章)。面對這麼多選項,你該怎麼設計 Agent 的工具?只需要一個 bash 或 code execution 就夠了嗎?還是說需要 50 個工具,每個場景配一個?做道數學題我喜歡用一個類比來思考這個問題。想像你被給了一道很難的數學題,你希望手邊有什麼工具?答案取決於你自身的能力。紙筆是最基本的,但手算效率很低。計算器好一些,不過你得會用那些高級功能。最快最強的選擇是電腦,但前提是你得會寫程式碼。這個類比可以直接套用到 Agent 工具設計上:你要給它與其能力匹配的工具。 但你怎麼知道它的能力邊界在那?答案是:仔細觀察,閱讀它的輸出,反覆實驗。學會像 Agent 一樣看世界。以下是我們在建構 Claude Code 過程中總結的幾條經驗。提問的藝術建構 AskUserQuestion 工具時,我們的目標是提升 Claude 向使用者提問的能力(也叫 elicitation)。Claude 當然可以用純文字提問,但我們發現使用者回答這類問題時總覺得很費勁。怎麼才能降低這種摩擦,提高使用者和 Claude 之間的溝通效率?第一次嘗試:改造 ExitPlanTool我們先試著在 ExitPlanTool 上加一個參數,讓它在輸出計畫的同時附帶一組問題。這是最容易實現的方案,但 Claude 被搞糊塗了。我們同時要求它輸出計畫和提問,如果使用者的回答和計畫內容矛盾怎麼辦?Claude 是不是還得再呼叫一次 ExitPlanTool?這條路走不通。(關於我們為什麼要做 ExitPlanTool,可以參考這篇關於 prompt caching 的文章:https://x.com/trq212/status/2024574133011673516 )第二次嘗試:改輸出格式接著我們試了修改 Claude 的輸出指令,讓它用一種特殊的 Markdown 格式來提問。比如,要求它輸出一組帶備選項的問題列表,我們再把它解析渲染成 UI。這是最通用的方案,Claude 的格式輸出能力也還行,但不夠穩定。它會多說幾句話,漏掉選項,或者乾脆換一種格式輸出。第三次嘗試:AskUserQuestion 工具最後我們做了一個獨立的工具,Claude 可以在任何時候呼叫它,但在 plan mode 中會被特別引導去使用。工具觸發後會彈出一個模態框,展示問題列表並阻塞 Agent 循環,直到使用者回答完畢。這個工具讓我們得到了結構化的輸出,確保使用者能看到多個選項,還支援在 Agent SDK 或 skills 中靈活復用。最關鍵的是:Claude 確實喜歡呼叫這個工具,輸出效果也很好。再精心設計的工具,如果模型不知道怎麼用,那也是白搭。這是 elicitation 的最終形態嗎?不好說。正如下一個例子會展示的,對一個模型有效的方案,換一個模型未必好使。工具會過時Claude Code 剛上線時,我們意識到模型需要一個 Todo List 來保持工作節奏。在開始時寫下待辦事項,完成後逐項打勾。為此我們做了 TodoWrite 工具,用來建立和更新待辦列表,並展示給使用者。但即便如此,Claude 還是經常忘記自己該幹什麼。於是我們每隔 5 輪對話就插入一條系統提醒,告訴 Claude 當前的目標。然而隨著模型升級,情況反轉了。新模型不僅不需要這些提醒,反而覺得 Todo List 成了束縛。被反覆提醒 Todo 內容,讓 Claude 覺得自己必須嚴格執行列表,而不能靈活調整。同時,Opus 4.5 在使用子 Agent 方面能力大幅提升,但多個子 Agent 怎麼協作共享一個 Todo List 呢?看到這些變化,我們用 Task Tool 替換了 TodoWrite(關於 Task Tool 的詳細介紹見:https://x.com/trq212/status/2014480496013803643 )。TodoWrite 的目的是讓模型「不跑偏」,而 Task Tool 更側重於 Agent 之間的協作溝通。Task 支援依賴關係、可以跨子 Agent 同步進度,模型也可以自由修改和刪除任務。這個案例的教訓是:隨著模型能力提升,曾經必需的工具可能反過來變成約束。 你需要不斷重新審視之前的假設。這也是為什麼最好只支援少數幾個能力相近的模型。搜尋的進化對 Claude 來說,搜尋工具格外重要,因為它們決定了模型能否自主建構上下文。Claude Code 最初用的是 RAG 向量資料庫來尋找上下文。RAG 速度快、效果不錯,但需要建索引、做配置,在不同環境下容易出問題。更關鍵的是,上下文是系統預先「喂」給 Claude 的,Claude 沒有自己發現上下文的能力。但既然 Claude 能在網上搜尋資訊,為什麼不讓它搜尋你的程式碼庫?我們給了 Claude 一個 Grep 工具,讓它自己搜尋檔案、建構上下文。這是我們觀察到的一個趨勢:隨著 Claude 變得更聰明,只要給它合適的工具,它自主建構上下文的能力就越來越強。當我們引入 Agent Skills 時,正式提出了「漸進式發現」(progressive disclosure)的概念,讓 Agent 通過主動探索來逐步發現相關上下文。Claude 可以讀取 skill 檔案,而這些檔案又引用了其他檔案,模型可以遞迴地一層層往下讀。事實上,skills 的一個常見用法就是給 Claude 增加搜尋能力,比如教它怎麼呼叫某個 API 或查詢資料庫。一年下來,Claude 從幾乎無法自主建構上下文,進化到了能夠跨多層檔案巢狀搜尋,精準定位所需資訊。漸進式發現現在已經成為我們在不增加工具數量的前提下擴展功能的常用手段。藏在文件裡Claude Code 目前有大約 20 個工具,我們一直在問自己:這些都需要嗎?新增一個工具的門檻很高,因為每多一個選項,模型就多一分思考負擔。比如,我們發現 Claude 對自身瞭解不夠。你問它怎麼加入 MCP,問 slash command 是什麼,它答不上來。我們可以把這些資訊全塞進 system prompt,但使用者其實很少問這類問題,強行加進去只會帶來 context rot(上下文腐化),干擾 Claude 的本職工作:寫程式碼。於是我們嘗試了漸進式發現的方式:給 Claude 一個文件連結,讓它需要時自己載入搜尋。這招能用,但 Claude 會把大量搜尋結果全塞進上下文來找答案,其實使用者只需要一個簡潔的回覆。所以我們做了 Claude Code Guide 子 Agent。當使用者問 Claude 關於自身的問題時,Claude 會呼叫這個子 Agent。子 Agent 有詳細的文件搜尋指令,知道該搜什麼、返回什麼。雖然還不完美(Claude 被問到自身配置問題時偶爾還是會犯迷糊),但比之前好多了。我們在沒有增加任何工具的情況下,擴展了 Claude 的能力範圍。沒有標準答案如果你期待一套關於工具設計的嚴格規則,很遺憾,這篇文章給不了你。為模型設計工具,藝術的成分和科學的成分一樣多。它取決於你用的模型、Agent 的目標,以及運行環境。多實驗,仔細看輸出,大膽嘗試新方案。學會像 Agent 一樣看世界,像 Agent 一樣思考。 (AGI Hunt)
Claude Code 龍蝦化!上線遠端控制:手機隨時接管本地終端,開發環境無縫同步
Claude Code 剛剛推出了一項全新功能:遠端控制。OpenClaw 使用者早就用上了這項功能,說實話,“發起任務,然後用手機查看”這種工作流程一旦嘗試過就真的會上癮。現在,你可以在電腦終端跑起一個程式碼任務,然後拿起手機去散步或開會,隨時隨地接管任務進度。在此期間,Claude 會在你的本地機器上持續運行,而你可以直接通過 Claude App 或 claude.ai/code 網頁端控制整個會話。該功能目前面向 Max 使用者提供研究預覽版,並即將向 Pro 使用者開放。只需在終端輸入 claude rc 即可快速上手。核心亮點:裝置在變,本地環境不變遠端控制功能打通了網頁端、iOS 和 Android 移動端與本地機器的連接。當你在本地啟動遠端會話時,所有處理程序都在本地運行,沒有任何資料會被遷移到雲端。這意味著你可以實現以下操作:呼叫完整的本地環境:你的檔案系統、MCP 伺服器、工具和項目配置均保持可用狀態。多端同步辦公:對話記錄在所有連接裝置上即時同步,你可以無縫穿插使用終端、瀏覽器和手機傳送消息。無懼中斷:如果你的筆記型電腦進入休眠或網路斷開,只要機器重新上線,會話就會自動重連。這與此前推出的網頁版 Claude Code 有著本質區別。網頁版運行在 Anthropic 託管的雲基礎設施上,而遠端控制會話直接在你的本地機器上執行,與本地檔案系統互動,網頁和手機端只是監控和操作本地會話的窗口。想要上手?先核對這些門檻在使用遠端控制之前,需要確保你的環境滿足以下三個條件:訂閱要求:必須是 Pro 或 Max 計畫使用者。目前不支援團隊版、企業版,也不支援通過 API 金鑰使用。帳號認證:運行 claude 並使用 /login 命令完成網頁端登錄。工作區信任:至少需要在項目目錄中運行過一次 claude,並接受工作區信任彈窗。兩種方式啟動遠端會話無論是開啟新任務還是繼續當前工作,你都可以輕鬆喚起遠端控制。方式一:啟動全新會話進入你的項目目錄,在終端運行以下程式碼:claude remote-control該處理程序會在終端中保持運行狀態,等待遠端連接,並生成一個會話 URL 供其他裝置使用。按下空格鍵還能直接呼出二維碼,方便手機掃碼接入。運行期間,終端會即時顯示連接狀態和工具呼叫情況。此命令支援附加標誌參數:使用 --verbose 可以查看詳細的連接和會話日誌;使用 --sandbox 或 --no-sandbox 可以開啟或關閉沙盒模式,用於會話期間的檔案系統和網路隔離,沙盒功能默認處於關閉狀態。方式二:從現有會話無縫切換如果你已經處於一個 Claude Code 會話中,並希望在遠端裝置上繼續,只需輸入以下命令:/remote-control或者使用縮寫 /rc。這會立即啟動遠端控制,繼承你當前的對話歷史記錄,同樣會顯示會話 URL 和二維碼。需要注意的是,附加標誌參數在此命令下不可用。操作提示:在運行遠端命令前,建議先使用 /rename 給會話起個名字,這樣在其他裝置的會話列表中會更容易找到它。多端連接與全域配置遠端會話啟動後,你有三種方式接入:在任意瀏覽器中打開終端顯示的 URL,直接跳轉至網頁端。掃描 URL 旁的二維碼,直接在 Claude App 中打開。打開網頁端或 Claude App,在會話列表中通過名稱尋找。線上的遠端會話會帶有一個電腦圖示和一個綠色狀態圓點。如果你還沒有安裝移動端,可以直接在 Claude Code 內使用 /mobile 命令,獲取 iOS 或 Android 應用的下載二維碼。如果想讓每一次啟動都默認支援遠端控制,可以在 Claude Code 中運行 /config 命令,並將開啟所有會話的遠端控制選項設定為 true。隨時可以將其改回 false 來關閉。安全機制與使用限制在安全性方面,本地 Claude Code 會話僅發起出站 HTTPS 請求,絕不會在你的機器上開放入站連接埠。流量通過 Anthropic API 基於 TLS 加密傳輸,並採用多種生命周期極短、按獨立用途分配的憑證。不過,日常使用中還需注意以下限制條件:每個 Claude Code 實例每次只支援建立一個遠端連接。如果運行多個實例,它們各自擁有獨立的環境和會話。由於遠端控製作為本地處理程序運行,你的終端必須保持打開狀態。一旦關閉終端或停止 claude 處理程序,會話就會終止。如果機器處於喚醒狀態,但斷網時間超過約10分鐘,會話將超時並自動退出處理程序。此時需要重新運行命令啟動新會話。 (AI寒武紀)
一夜蒸發 310 億美元!Claude 新工具干翻 IBM 搖錢樹,AI 正在「清零」人類工位
如果你想摧毀一家公司,不需要打敗它,只需要讓人相信它可以被打敗。截至周一美股收盤,IBM 股價暴跌 13.1%,報每股 223 美元,創下 2000 年網際網路泡沫破裂以來最大單日跌幅。當天市值從 2408 億美元跌至約 2087 億美元,蒸發了約 310 億美元。是財報暴雷了嗎?不是。是重要大客戶跑路了嗎?也沒有。這一切的導火索,僅僅是 AI 公司 Anthropic 當天發佈的一篇部落格,宣佈旗下程式設計工具 Claude Code 可以幫助改造 COBOL 老舊系統,直接戳中了 IBM 最核心、最賺錢的遺留系統諮詢業務。沒有人證明 IBM 的生意垮了,但在恐慌的市場面前,已經不需要證據了。部落格地址:https://claude.com/blog/how-ai-helps-break-cost-barrier-cobol-modernizationCOBOL 是 IBM 的護城河,現在被 AI 盯上了要理解 IBM 為什麼跌得這麼慘,得先搞清楚 COBOL 是什麼,以及 IBM 靠它賺的是什麼錢。COBOL 是一種誕生於 20 世紀 50 年代的程式語言,今天仍在驅動美國約 95% 的 ATM 交易,以及大量銀行、政府、航空系統的日常運轉。IBM 長期銷售針對 COBOL 最佳化的大型主機,並圍繞它提供改造和諮詢服務。這門生意之所以賺錢,根源在於改造難度極高。讀懂幾十年沒有文件的老程式碼,往往要顧問團隊花上數年時間。這種高昂的理解成本,就是 IBM 最核心的競爭壁壘。Anthropic 的部落格說,Claude Code 可以自動梳理數千行程式碼之間的依賴關係,補全那些早已沒人記得的工作流文件,還能識別出人工分析師要花幾個月才能發現的系統風險。它進一步宣稱,原本以年計的現代化項目,用 AI 可以壓縮到幾個季度。當市場聽到這個消息後,立刻作出了反應:長期駐場、大團隊、以年計費——這套模式賺錢,是因為客戶沒有別的選擇。一旦 AI 提供了另一種可能,IBM 和客戶之間的議價天平,就不再是原來那個樣子了。這也讓 IBM 的處境因此顯得格外敏感。2025 年全年,IBM 諮詢業務收入約 210.55 億美元,基礎設施收入約 157.18 億美元,生成式 AI 累計簽約規模也超過了 125 億美元。當理解遺留程式碼這件事的成本被大模型顯著壓低,這些收入的含金量在市場眼中就打了折扣。有意思的是,IBM 和 Anthropic 其實並不是單純的對手。2025 年 10 月,兩家公司曾宣佈戰略合作,把 Claude 整合進 IBM 的開發工具體系,內部有超過 6000 名早期使用者報告平均生產力提升約 45%。同一種技術,既可能成為 IBM 自我改造的工具,也被看作顛覆它的武器。但在拋售情緒主導的當天,市場選擇了後者。IBM 暴跌其實不是這輪動盪的起點。早在 2 月 20 日,網路安全類股就已經經歷了一次集體閃崩,那天后來被一些分析師稱為軟體行業的「黑色星期五」。導火索是 Anthropic 宣佈推出 Claude Code Security。部落格地址:https://www.anthropic.com/news/claude-code-security這款工具能自動掃描程式碼庫中的安全漏洞,生成補丁供人工審查,並將原本由專業安全工具負責的漏洞掃描、軟體成分分析等功能,直接內建進了開發者的日常工作流。市場的反應同樣非常強烈。JFrog 當天單日暴跌 24.61%,因為它的核心業務高度依賴軟體供應鏈的管控,而這恰好是 AI Agent 最容易切入的領域。CrowdStrike、Cloudflare、Okta、Zscaler 等公司雖然主營業務並不是程式碼掃描,但也因為情緒「傳染」出現了明顯下跌,整個類股單日蒸發上百億美元,追蹤網路安全 ETF 的 BUG 基金跌至兩年多以來的最低點。當然,不少理智的分析師站出來反駁,說這種拋售毫無邏輯。比如摩根大通認為,投資者的擔憂被過度誇大。Wedbush Securities 的分析師措辭嚴厲地表示,這是自己職業生涯中見過的「最不合邏輯的交易」。他們的理由有一定說服力。AI 在幫助防守者掃漏洞的同時,也在幫助攻擊者找漏洞。到 2026 年,駭客已經開始用大模型發起更精準的釣魚攻擊,開發自動化的攻擊 Agent,甚至針對企業內部的 AI 模型實施「提示詞注入」和「記憶體投毒」。更棘手的是,企業內部大量未經授權部署的 AI Agent,一旦擁有操作內部系統和訪問敏感資料的權限,本身就成了安全隱患。這意味著安全的需求非但沒有消失,反而在擴張。CrowdStrike 提供的端點保護、Zscaler 提供的零信任網路訪問、各類身份與訪問管理工具,恰恰是應對這些新型 AI 威脅所必須依賴的基礎設施。SaaS 最不願承認,但正在發生的事APPSO 之前也報導過,AI 對整個 SaaS 行業造成了很大的衝擊。而 IBM 和安全股的動盪,是整個企業軟體行業更大危機的一個切面。過去二十年,SaaS 行業的繁榮建立在一個簡單邏輯上:企業員工越多,買的軟體席位就越多,供應商的訂閱收入就越穩。AI Agent 的出現打破了這個等式。以 Claude Cowork 為例,它能自主跨系統導航,獨立完成資料錄入、線索評分、多步驟業務審批等工作,企業不再需要維持大規模的基層操作團隊。一個原本需要五個人各自登錄帳號的財務部門,現在可能一個主管配合 AI 工具就夠了,那四個席位的訂閱費自然隨之消失。這種現像是 SaaS 廠商目前面臨的最直接威脅。在這場轉型中,處境最危險的是那些提供通用功能、主要服務中小企業的 SaaS 廠商,比如 HubSpot、Atlassian、Asana。這類產品的工作流相對標準化,很容易被 AI 直接模仿替代。越是那些功能通用、流程標準化的軟體(比如排日程、管任務的),越容易被 AI 直接平替。這種衝擊不只停留在大公司層面,對普通創業者也是一種降維打擊。一位名叫 Ira Bodnar 的創業者在 X 平台發了一篇名為《Claude 殺死所有創業公司》的帖子,迅速獲得了超過 300 萬次閱讀。文章 🔗 https://x.com/irabukht/status/2025846968245948795她兩個月前剛做出一款幫企業自動管理Google和 Meta 廣告帳戶的 AI 產品,付費客戶幾百個,成交率高達 70%,增長勢頭很好。一天早上醒來,她發現成交率跌到了 20%。原因很簡單:Anthropic 同期推出了 Meta 廣告連接器。功能還不完整,只能做分析、無法直接操作帳戶,但客戶已經開始觀望。Bodnar 在帖子裡寫道:「再過幾個月它就能做到了,所以繼續在這裡開發感覺意義不大。」IBM 失去的是估值,Bodnar 失去的是整個產品類別存在的理由。相比之下,更難被計算進股價、也更難被寫進報告的,是那些正在消失的普通崗位。畢竟,股價跌了還能漲回來,但就業市場的變化,慢刀子割肉,卻真實得多。當企業不再需要那麼多人去堆砌工作量時,最先遭殃的,是那些還沒上桌的年輕人。史丹佛大學數字經濟實驗室的研究指出,在受 AI 影響最明顯的職業裡,22 至 25 歲年輕畢業生的就業率相對下降了 13%,但與此同時,那些有豐富經驗的高級架構師,飯碗依然很穩。這個分化說明 AI 沒有像科幻電影裡那樣消滅所有人類崗位,只是悄悄從底部開始,把新人的崗位削沒了——以前,剛畢業的程式設計師總是靠寫寫簡單的基礎程式碼、修修不痛不癢的 Bug,一步步攢經驗往上爬。現在,這些「髒活累活」全是 AI Agent 的統治區。包括很多大廠現在很默契:我不大規模裁員,但如果有人辭職了,我絕對不再招新人,直接拿 AI 頂上空缺。對此,學生的選擇,已經說明了他們對市場的判斷。麻省理工學院的資料顯示,其入門程式設計課程在 2022 學年達到峰值後持續下滑,傳統電腦科學專業註冊人數從 823 人跌至 672 人,降幅超過 18%。與此同時,MIT 2022 年新設的「人工智慧與決策」專業,註冊人數從 37 人暴增到 372 人,漲了約十倍。杜克大學的 CS 入門課註冊人數同期下降約 20%,普林斯頓 CS 專業大三大四學生數量也出現了相似幅度的下滑。同樣是在 IBM 暴跌的同期,一篇由 Citrini Research 發佈的部落格《2028 年全球智能危機》在 X 平台上火了,收穫了 2000 萬+的閱讀量。文章 🔗 https://www.citriniresearch.com/p/2028gic作者假裝站在 2028 年往回看,描繪的圖景並不樂觀。企業用 AI 裁人,省下來的錢繼續買 AI,更強的 AI 讓下一輪裁員成為可能,被裁的人消費變少,企業收入下滑,又得靠 AI 進一步壓縮成本。一圈又一圈,沒有盡頭。作者自己也說,這只是一個思想實驗,不是預言。但讀完這篇文章再看今天的新聞,很難說它描述的東西完全是想像。SaaS 公司的訂閱收入在壓縮,IT 外包行業開始被質疑存在的必要性,應屆生找工作越來越難——傳導鏈條的前幾環,已經隱約可見。國際貨幣基金組織估計,全球約四成就業都暴露在 AI 的影響範圍之內,部分崗位會被增強,部分面臨萎縮,最終走向取決於各行業的互補程度與政策應對。世界經濟論壇預測,到 2030 年新技術淨創造的崗位約 7800 萬個,但這個再分配的過程,必然伴隨大量摩擦和痛苦。我們總喜歡用顛覆、炸鍋、王炸等聳人聽聞的詞彙來描述 AI 所帶來的衝擊,在我看來,這些詞都用錯了方向——AI 帶來的變化,更像是漲潮。漲潮不挑對象,不講立場,不管你是 IBM 這樣的百年巨頭還是 Bodnar 這樣的獨立創業者,水平線統一往上走。有人站在高地,有人站在灘塗,退潮之後才知道誰在裸泳——問題是,這次潮水好像沒有退的跡象。MIT 的學生已經在悄悄更換就業方向,大廠們同樣在默默等人自然離職然後不再補招,Citrini 那篇文章的閱讀量之所以能突破 2000 萬,也是因為太多人在裡面看到了自己隱約感覺到、但還沒說出口的那種不安。不安本身不是壞事。它至少說明,潮水還沒把人完全淹沒,還有時間想清楚自己站在那裡,又到底該如何在機器面前,找到自己那個沒法被替代的位置。 (APPSO)