Fortune雜誌─又一巨頭推出其最強大模型,趕超OpenAI和Google

上周四,在舊金山舉辦的首屆開發者大會上,人工智慧初創公司Anthropic發佈了最新一代“前沿”或尖端人工智慧模型Claude Opus 4和Claude Sonnet 4。這家估值超610億美元的公司在一篇博文中表示,備受期待的新模型Opus是“全球最佳編碼模型”,能夠“在需要持續專注且涉及數千步驟的長期任務中保持穩定性能”。由新模型驅動的人工智慧代理可對數千個資料來源展開分析,並執行複雜操作。

Anthropic發佈了最新一代“前沿”或尖端人工智慧模型Claude Opus 4和Claude Sonnet 4。圖片來源:GETTY IMAGES

此次發佈凸顯了科技公司在“全球最先進人工智慧模型”領域的角逐之激烈——尤其在軟體工程等領域——各企業紛紛採用新技術來提升速度與效率,Google上周推出的實驗性研究模型Gemini Diffusion便是例證。在一項對比不同大型語言模型軟體工程任務表現的基準測試中,Anthropic的兩款模型擊敗了OpenAI的最新模型,而Google的最佳模型則表現落後。

部分早期測試者已通過實際任務體驗新模型。該公司舉例稱,購物獎勵公司樂天株式會社(Rakuten)的人工智慧總經理表示,Opus 4在部署到一個複雜項目後“自主編碼近七小時”。

Anthropic技術團隊成員黛安·佩恩(Dianne Penn)告訴《財富》雜誌:“這實際上是人工智慧系統能力的重大飛躍。”尤其是當模型從“助手”角色升級為“代理”(即能自主為使用者執行任務的虛擬協作者)時。

她補充道,Claude Opus 4 增添了若干新功能,例如能更精準地執行指令,且在“記憶”能力上實現了提升。佩恩提到,從過往情況來看,這些系統難以記住所有歷史操作,但此次“特意開發了長期任務感知能力”。該模型借助類似檔案系統的機制來追蹤進度,並策略性地呼叫記憶資料以規劃後續步驟,如同人類會依據現實狀況調整計畫與策略。

兩款模型均可在推理與工具呼叫(如網頁搜尋)之間切換,還能同時使用多種工具(如同步搜尋網頁並運行程式碼測試)。

Anthropic人工智慧平台產品負責人邁克爾·格斯特恩哈伯(Michael Gerstenhaber)表示:“我們確實視此為一場向巔峰進發的競賽。我們希望確保人工智慧能造福所有人,因此要給所有實驗室施加壓力,促使其以安全的方式推動人工智慧發展。”他解釋稱,這包括展示公司自身的安全標準。

Claude 4 Opus所推出的安全協議,其嚴格程度遠超以往任何一款Anthropic模型。該公司的《負責任擴展政策》(RSP)作為一項公開承諾,最初於2023年9月發佈,其中明確規定:“除非實施可將風險控制在可接受範圍內的安全與保障措施,否則不會訓練或部署可能引發災難性傷害的模型。”Anthropic由OpenAI前員工於2021年創立,他們擔憂OpenAI過於追求速度與規模,而忽略了安全與治理。

2024年10月,該公司對《負責任擴展政策》進行更新,採用“更為靈活且細緻的方法來評估和管理人工智慧風險”,同時堅持承諾,即除非已實施充分的保障措施,否則不會訓練或部署模型。”

截至目前,Anthropic的所有模型均依照其《負責任擴展政策》被歸為人工智慧安全等級2(以下簡稱ASL-2),該等級“為人工智慧模型設定了安全部署與模型安全的基礎標準”。Anthropic發言人表示,公司並未排除新模型 Claude Opus 4達到ASL-2門檻的可能性,不過,公司正積極依據更為嚴格的ASL-3安全標準推出該模型——該標準要求強化防範模型被盜用和濫用的保護措施,涵蓋建構更強大的防禦機制,以杜絕有害資訊洩露或防止對模型內部“權重”的訪問。

根據Anthropic的《負責任擴展政策》,被歸入該公司第三安全等級的模型達到了更為危險的能力閾值,其功能強大到足以構成重大風險,比如協助武器開發或實現人工智慧研發自動化。Anthropic證實,Opus 4無需最高等級的保護措施,即ASL-4。

Anthropic的一位發言人表示:“我們在推出上一款模型Claude 3.7 Sonnet時,便已預料到可能會採取此類措施。當時我們認定該模型無需遵循ASL-3等級的保護措施。但我們也承認,鑑於技術進步之迅速,不久的將來,模型可能需要更嚴格的保護措施。”

在Claude 4 Opus即將發佈之際,她解釋稱,Anthropic主動決定依據ASL-3標準推出該產品。“此舉使我們能在需求產生之前,專注於開發、測試並完善這些保護措施。依據我們的測試結果,已排除該模型需要ASL-4等級保護措施的可能性。”不過,公司並未說明升級至ASL-3標準的具體觸發緣由。

Anthropic歷來會在產品發佈之際,同步推出模型或“系統卡片”,提供有關模型能力及安全評估的詳細資訊。佩恩向《財富》雜誌透露,Anthropic將在新推出Opus 4和Sonnet 4時發佈對應的模型卡片,發言人也證實卡片會與模型一同發佈。

近期,OpenAI和Google等公司均推遲發佈模型卡片。今年4月,OpenAI因在發佈GPT-4.1模型時未附帶模型卡片而遭受批評,該公司稱該模型並非“前沿”模型,無需提供卡片。今年3月,Google在Gemini 2.5 Pro發佈數周後才公佈其模型卡片,人工智慧治理專家批評其內容“貧乏”且“令人擔憂”。 (財富FORTUNE)