2026 年 AI 如何深度接管工作 | Anthropic 首席產品官對話實錄

12月24日,Anthropic 首席產品官Mike Krieger 接受 AI Daily Brief 的訪談,本次對話復盤了過去一年 Vibe coding的崛起、Anthropic 聚焦程式設計領域的底層戰略邏輯、智能體化工作流的演進、AI Agent 在企業端的規模化落地障礙以及 2026 年企業級 AI 的戰略轉向。

Mike Krieger表示,程式設計不應僅被視為軟體開發,而是解決通用問題的一種極度全能的推理工具。他指出,Anthropic 戰略性聚焦程式設計並非只為服務程式設計師,而是因為程式設計是 AI 實現推理、自主規劃與長周期運行的最佳載體。 Vibe coding正在重塑人類與機器的協作邊界。

Mike Krieger認為,優秀的產品架構應能隨著底層智能的進化而自然“變薄”:隨著模型自主性增強,產品經理應主動簡化控制框架,拆除曾經為了輔助模型而搭建的互動“腳手架”。他指出,如果使用者覺得模型升級後性能提升不明顯,往往是因為過時且僵化的產品框架限制了模型的發揮。

Mike Krieger認為,2026 年將是 “AI 同事年”。企業將告別單純在現有介面塞入 AI 的補丁階段,轉而進入“智能體原生”的重構時代。AI 的核心價值將從“資訊檢索”進化為“可靠地分擔職責”,實現真正的委派式工作。

01

程式設計是 AI 具備通用推理與長周期自主規劃能力的底層工具

很多人認為 Anthropic 是 AI 程式設計領域的領軍者。這種對程式設計的聚焦是預先設定好的戰略支柱,還是因為模型在該領域展現出了卓越能力,才演變成了一種差異化的核心競爭力?

Mike Krieger: 每當 Anthropic 的產品負責人考慮戰略方向時,我都會強調,只有與公司對強人工智慧起源的長遠觀點保持一致,路徑才會最順暢。Anthropic 是一家極度專注的公司,這從我們選擇的特定賽道就能看出來。公司內部有一個根本信念,AI 若要真正強大,必須具備推理、自主規劃以及長周期運行的能力。更關鍵的是,它必須能夠編寫並執行程式碼。這不僅是為了軟體開發,更因為程式設計是解決通用問題的一種極度全能的工具。

這種信念在我去年 5 月加入之前就已存在,當時恰好趕上外界認知的覺醒。Claude 3 發佈後約一個月,社交媒體上出現了一個轉折點,使用者意識到模型可以編寫完整的程式碼檔案,而不僅是零碎的函數。雖然那些能力按現在的標準來看還很初級,但在當時非常令人震撼。隨後,我們推出了首個面向程式設計的產品體驗 Artifacts,讓 Claude 可以在聊天介面旁直接生成可運行的 React 網站。對許多人來說,那是他們第一次意識到Vibe coding,即在傳統開發環境之外與模型協作開發,是一種切實可行的新範式。

02

好的 AI 產品架構應隨著模型智能的提升而不斷簡化控制權

2025 年被認為是 AI Agent 程式設計之年,從早期 GPT Engineer 到後來的 Lovable,技術每一階段都在解鎖新場景。你們在內部開發 Claude Code 時的核心邏輯是什麼,作為產品專家,你如何設計那些今天有用但能隨底層智能進化而自然增強的產品?

Mike Krieger: 這是一個非常好的反思時刻。去年最後幾周,我們內部開發了一個叫 Claude CLI 的項目,也就是後來發佈的 Claude Code。它源自我們的 Labs 團隊,這個團隊專門負責從 0 到 1 的顛覆性創新,涵蓋從早期的電腦使用探索到各種實驗性項目。在 9 月到 12 月間,Claude Code 迅速成為了我們內部最好用的程式設計工具。它的核心邏輯是,隨著模型能力的提升,我們應該讓模型多思考一會兒,允許它們在更長的時間跨度內自主運作。假期裡我們一直在爭論是否要把它作為繼 Claude 網頁版和 API 之後的第三大產品支柱。我們意識到,如果我們不做,別人遲早也會發現這種低干預、任務導向型的模式。我們進入今年時就堅信,這會徹底改變軟體的建構方式。

(關於順應增長的產品原則)Anthropic 有一條核心產品原則叫作“順應指數增長”,我們致力於打造今天就有用,但架構上能隨著底層智能進化而自然增強的產品。在 Claude Code 上,我們隨著時間的推移反而簡化了外部的控制框架,因為模型自主性越強,就越不需要複雜的輔助結構。我們常發現,如果客戶覺得新模型提升不明顯,往往是因為他們被舊的框架限制住了。一旦放開約束,模型的進步就一目瞭然。我們經常和開發者討論,如果模型最終不再需要那麼多輔助腳手架,你的產品還能提供什麼獨特價值,或者模型是否正在蠶食你認為的核心貢獻?

(關於 SDK 的演進細節)的確如此。在我們將內部工具打磨並公開發佈後,我們發現用例一直在進化。在我們的駭客松裡,項目往往會扎堆在即將爆發的技術點上。第一次駭客松大家都在關注模型上下文協議(Model Context Protocol),簡稱 MCP。第二次是在 Claude Code 發佈前後,令我驚訝的是,很多項目根本不是為了寫程式碼,而是把 Claude Code 當作底層引擎。我們看到了生物資訊學方面的應用,後來我們將其整合進了面向生命科學的 Claude。還有人把它當作全自動網站可靠性工程師(SRE)來分析資料,或者當作自動化資料科學家。這些項目讓開發者跳過了繁瑣的基礎設施搭建,直接進入業務核心。基於此,我們將底層 SDK 重新命名為 Claude Agent SDK,因為 Code 這個詞已經涵蓋不了它所支援的廣泛場景了。

03

AI 規模化的關鍵在於讓非技術使用者跨越複雜性天花板並建立可靠性預期

要讓非開發者習慣這種新架構需要做些什麼,如何看待技術修補者與大眾互動標準之間的跨越?此外,目前 AI 使用分為高端工程、初級應用和流程重組,這三者本質上是一回事嗎?

Mike Krieger: 我們還處於早期階段。即使在部署了企業版 Claude 的公司裡,你也會在銷售或市場等部門發現一些“極客型建構者”。他們雖然沒寫過程式碼,但能熟練運用原語並通過提示詞來實現工作流自動化。不過,在互動介面和核心能力上,確實還有巨大的鴻溝需要填補。如果你的 AI 同事雖然有創意,但偶爾會在以前處理得完美的任務上犯些低級錯誤,你很難完全信任它。我們現在必須彌合理解力差距,確保這些系統可預測且可靠。同時,要改掉幾十年養成的操作習慣也需要時間。

習慣的養成往往是從第一次成功嘗試開始的。上周末我在用 Replit 和 Opus 跑項目時,順便在做早餐的空檔想給家裡做一個秘密聖誕老人小程序。因為我當時已經在那個工作狀態裡了,我隨手發了一個非同步請求,早餐做完,程序也寫好了。如果我當時沒在那個環境下,我可能根本不會想到用 AI 來做這件事。縮小習慣養成與能力認知之間的差距是關鍵。

(關於使用者群體細分)這是一個關於不同群體如何爬上複雜性階梯的問題。開發者、建構者與企業雖然共享底層模型,但感覺完全不同。軟體開發者是動力最強的群體,他們習慣於最佳化自己的工具環境。他們的反饋能形成閉環,幫助我們將需求傳達給研究團隊。在非技術建構者的中間地帶,目前存在一個複雜性天花板。我觀察我妻子使用這些工具時發現,你偶爾還是得用到一些特定的提示詞技巧。比如在處理項目時,模型可能會填滿上下文窗口,我知道這時候需要語義檢索,但模型沒主動提,她也不知道這個術語。我們的目標是幫使用者爬上這個複雜性階梯,從寫前端,到學會資料持久化、安全審查和性能工程。這就像是讓 AI 帶著你,重新走一遍我們當年在 Instagram 經歷的規模化擴張之路。在企業端,最大的問題是落地與產出之間的脫節。AI 的輸出必須質量極高,高到讓使用者真正感到省心。如果 AI 給出的只是一個半成品,使用者會覺得還不如自己動手快。所以我們現在更關注如何穩定提供高品質、可靠的初始產出。

04

2026 願景:企業將通過 MCP 和智能體原生設計實現 AI 的規模化分發與任務委派

相比 2025 年,企業在 2026 年的目標會有什麼變化?面對遺留系統和監管限制,如何解決可分發性問題,讓 AI 真正從工具變成可以獨當一面的同事?

Mike Krieger: 有兩點顯著不同。首先,企業對橫向智能體的興趣激增。我們不再只滿足於寫郵件的助手,而是開始擴展重複性的後台任務,比如國際化的“瞭解你的客戶”合規審查。這些流程複雜且重複,需要深度的企業內部知識。我們正在派出應用 AI 工程師,幫企業把這些需求轉化為靈活且可重複的智能體流程。其次,企業開始告別 V1 階段,即單純往現有介面塞一個 AI。他們現在正在重新設計產品,使其成為智能體原生產品。這意味著要讓 AI 能在後台完全調動產品的全部功能,這種轉型比在側邊欄加個聊天框要深刻得多。

(關於基礎設施與連接)關於基礎設施,我曾和一家大銀行的技術主管聊過,他提到他們必須為了 AI 重新梳理資料儲存、標註和血緣。當你讓 Claude 幫你製作儀表盤時,它必須能理解底層的資料庫結構。2026 年的主題就是補齊這些缺失的連接件。我們看到很多企業正用 MCP 封裝內部服務,下一步就是從檢索資訊進化到採取行動,讓 AI 真正參與業務流,比如為人工確認排隊決策。理想中的雲環境與現實中的遺留系統及監管限制之間存在巨大落差。我們目前的重點是可分發性,也就是把我們的智能和智能體原語,比如技能、SDK 和記憶能力,直接帶到企業的工作流所在地,無論它部署在那裡。我們將這些功能元件化,確保在主流雲平台上都能靈活呼叫。雖然小規模試點容易,但要達到生產級規模,必須在尊重企業現有約束的前提下提供服務。

(關於“同事”角色的演變)這可能是 2026 年的定義性特徵。我們在程式設計領域已經看到了這種苗頭,比如我們和 GitHub 的合作,你可以在拉取請求中直接標記 Claude,然後你去喝杯咖啡,它就把活幹完了。雖然模型現在還不懂職場裡的社交邏輯,但在具體職責的委派上,比如根據指定資料來源寫一份報告,已經近在咫尺。我們正在開發這種委派式的互動介面,並把在程式設計領域積累的經驗推廣到所有的知識工作中。關於 2026 年的期待,我的回答是:可靠地分擔你的工作。 (數字開物)