Fortune雜誌─又一巨頭推出其最強大模型，趕超OpenAI和Google

2025/05/27

•

上周四，在舊金山舉辦的首屆開發者大會上，人工智慧初創公司Anthropic發佈了最新一代“前沿”或尖端人工智慧模型Claude Opus 4和Claude Sonnet 4。這家估值超610億美元的公司在一篇博文中表示，備受期待的新模型Opus是“全球最佳編碼模型”，能夠“在需要持續專注且涉及數千步驟的長期任務中保持穩定性能”。由新模型驅動的人工智慧代理可對數千個資料來源展開分析，並執行複雜操作。

Anthropic發佈了最新一代“前沿”或尖端人工智慧模型Claude Opus 4和Claude Sonnet 4。圖片來源：GETTY IMAGES

此次發佈凸顯了科技公司在“全球最先進人工智慧模型”領域的角逐之激烈——尤其在軟體工程等領域——各企業紛紛採用新技術來提升速度與效率，Google上周推出的實驗性研究模型Gemini Diffusion便是例證。在一項對比不同大型語言模型軟體工程任務表現的基準測試中，Anthropic的兩款模型擊敗了OpenAI的最新模型，而Google的最佳模型則表現落後。

部分早期測試者已通過實際任務體驗新模型。該公司舉例稱，購物獎勵公司樂天株式會社（Rakuten）的人工智慧總經理表示，Opus 4在部署到一個複雜項目後“自主編碼近七小時”。

Anthropic技術團隊成員黛安·佩恩（Dianne Penn）告訴《財富》雜誌：“這實際上是人工智慧系統能力的重大飛躍。”尤其是當模型從“助手”角色升級為“代理”（即能自主為使用者執行任務的虛擬協作者）時。

她補充道，Claude Opus 4 增添了若干新功能，例如能更精準地執行指令，且在“記憶”能力上實現了提升。佩恩提到，從過往情況來看，這些系統難以記住所有歷史操作，但此次“特意開發了長期任務感知能力”。該模型借助類似檔案系統的機制來追蹤進度，並策略性地呼叫記憶資料以規劃後續步驟，如同人類會依據現實狀況調整計畫與策略。

兩款模型均可在推理與工具呼叫（如網頁搜尋）之間切換，還能同時使用多種工具（如同步搜尋網頁並運行程式碼測試）。

Anthropic人工智慧平台產品負責人邁克爾·格斯特恩哈伯（Michael Gerstenhaber）表示：“我們確實視此為一場向巔峰進發的競賽。我們希望確保人工智慧能造福所有人，因此要給所有實驗室施加壓力，促使其以安全的方式推動人工智慧發展。”他解釋稱，這包括展示公司自身的安全標準。

Claude 4 Opus所推出的安全協議，其嚴格程度遠超以往任何一款Anthropic模型。該公司的《負責任擴展政策》（RSP）作為一項公開承諾，最初於2023年9月發佈，其中明確規定：“除非實施可將風險控制在可接受範圍內的安全與保障措施，否則不會訓練或部署可能引發災難性傷害的模型。”Anthropic由OpenAI前員工於2021年創立，他們擔憂OpenAI過於追求速度與規模，而忽略了安全與治理。

2024年10月，該公司對《負責任擴展政策》進行更新，採用“更為靈活且細緻的方法來評估和管理人工智慧風險”，同時堅持承諾，即除非已實施充分的保障措施，否則不會訓練或部署模型。”

截至目前，Anthropic的所有模型均依照其《負責任擴展政策》被歸為人工智慧安全等級2（以下簡稱ASL-2），該等級“為人工智慧模型設定了安全部署與模型安全的基礎標準”。Anthropic發言人表示，公司並未排除新模型 Claude Opus 4達到ASL-2門檻的可能性，不過，公司正積極依據更為嚴格的ASL-3安全標準推出該模型——該標準要求強化防範模型被盜用和濫用的保護措施，涵蓋建構更強大的防禦機制，以杜絕有害資訊洩露或防止對模型內部“權重”的訪問。

根據Anthropic的《負責任擴展政策》，被歸入該公司第三安全等級的模型達到了更為危險的能力閾值，其功能強大到足以構成重大風險，比如協助武器開發或實現人工智慧研發自動化。Anthropic證實，Opus 4無需最高等級的保護措施，即ASL-4。

Anthropic的一位發言人表示：“我們在推出上一款模型Claude 3.7 Sonnet時，便已預料到可能會採取此類措施。當時我們認定該模型無需遵循ASL-3等級的保護措施。但我們也承認，鑑於技術進步之迅速，不久的將來，模型可能需要更嚴格的保護措施。”

在Claude 4 Opus即將發佈之際，她解釋稱，Anthropic主動決定依據ASL-3標準推出該產品。“此舉使我們能在需求產生之前，專注於開發、測試並完善這些保護措施。依據我們的測試結果，已排除該模型需要ASL-4等級保護措施的可能性。”不過，公司並未說明升級至ASL-3標準的具體觸發緣由。

Anthropic歷來會在產品發佈之際，同步推出模型或“系統卡片”，提供有關模型能力及安全評估的詳細資訊。佩恩向《財富》雜誌透露，Anthropic將在新推出Opus 4和Sonnet 4時發佈對應的模型卡片，發言人也證實卡片會與模型一同發佈。

近期，OpenAI和Google等公司均推遲發佈模型卡片。今年4月，OpenAI因在發佈GPT-4.1模型時未附帶模型卡片而遭受批評，該公司稱該模型並非“前沿”模型，無需提供卡片。今年3月，Google在Gemini 2.5 Pro發佈數周後才公佈其模型卡片，人工智慧治理專家批評其內容“貧乏”且“令人擔憂”。 (財富FORTUNE)

科技