安全護欄優先於能力釋放,這是Anthropic第一次把這套邏輯寫進產品裡。
今年6月9號,Anthropic 正式發佈Claude Fable 5,這是其首個面向公眾開放的Mythos級模型。
發佈後,Fable 5在Agent Arena智能體競技場榜單登頂,綜合淨提升幅度達11.2%,創下該榜單有史以來最大分差紀錄,將此前的領跑者GPT-5.5和自家旗艦Opus 4.8同時甩在身後。
這不是一次普通的版本更新。
斷層第一:資料有多恐怖
Agent Arena從五個維度給模型打分,Fable 5在最能反映真實工作價值的兩項上拉開了恐怖差距:任務成功確認率提升18.2%,好評與投訴比提升30.6%。
換句話說,在"能不能把活幹完、使用者滿不滿意"這兩個最接近實際工作場景的指標上,Fable 5實現了斷崖式領先。
官方基準測試的數字同樣觸目驚心。
根據Anthropic同步發佈的system card,在衡量真實軟體工程能力的SWE-Bench Pro上,Fable 5得分80.3%,Opus 4.8為69.2%,GPT-5.5為58.6%——Fable 5與第二名的差距,比第二名與第三名之間的差距還要大。
在編碼項目的實戰表現上,Fable 5在Cognition的FrontierCode評測中位列所有前沿模型第一,即便在中等算力投入下也能保持領先。
資料直接說明了問題。OpenRouter顯示,發佈僅24小時,Fable 5每日處理Token量已達約2050億,超過同門旗艦Opus 4.8的約1470億——作為一個剛上線的新模型,這個增速相當驚人。
而Fable 5的定價是每百萬Token輸入10美元、輸出50美元,是Opus 4.8標準模式的兩倍。
Fable 5與Mythos 5:同一個核心,兩套訪問規則
理解這次發佈,必須先搞清楚一個容易被忽略的結構。
Anthropic這次實際上同時發佈了兩個模型:面向公眾的Claude Fable 5,以及僅限特定機構訪問的Claude Mythos 5。兩者共享同一套底層能力,區別不在於模型本身,而在於存取控制和安全護欄。
Fable 5在網路安全、生物、化學等高風險領域內建了安全分類器——一旦觸發,會自動降級為Opus 4.8作答,Anthropic披露平均約有低於5%的會話會觸發此機制。
Mythos 5則沒有這套分類器,但目前僅對Project Glasswing網路安全合作夥伴開放;針對生物和化學研究機構的可信訪問計畫即將開放,尚未正式啟動。
這是Anthropic第一次公開闡明處理頂級能力模型的商業邏輯:不是封存,而是分層釋放——把同一套能力用不同的護欄包裹,面向不同風險承受能力的使用者。
訂閱使用者的窗口只有兩周
但Fable 5對普通使用者並不是無條件開放的。
Anthropic的公告寫得相當直白:從6月9日至6月22日,Pro、Max、Team和企業訂閱使用者可以免費使用Fable 5。6月23日起,Fable 5將從上述訂閱計畫中移除,繼續使用需要消耗額度點數,按API費率計費。
Anthropic表示將盡快恢復訂閱內包含,但沒有給出具體時間表。也就是說,6月23日之後訂閱使用者仍可使用Fable 5,但需要額外付費,不再包含在原有訂閱費用之內。
Fable 5的算力消耗遠超此前任何模型,Anthropic尚無法在現有訂閱定價框架內承擔全量供給的成本。這也解釋了為什麼API定價直接翻倍——按量計費的企業和開發者可以不受限制地呼叫,而訂閱使用者則需要等待基礎設施擴容。
迭代間隔在坍縮但這次Anthropic主動劃了邊界
把這一年的發佈時間線攤開:Opus 4.7到Opus 4.8,間隔42天;Opus 4.8到Fable 5的公開發佈,只用了12天。間隔在坍縮、能力跳變卻在變大,這一趨勢是真實的。
值得注意的是,這次發佈的時機相當微妙。
就在Fable 5發佈前五天,Anthropic於6月4日發佈博文《When AI Builds Itself》,呼籲全球主要AI實驗室建立協調機制,共同為前沿AI發展設定應急響應機制,警告當前系統的進展速度已經快到可能觸發AI系統自主迭代、自我最佳化的臨界點——即AI系統開始自主設計並建構自己的下一代,人類對這一過程的掌控能力將大幅萎縮。
一邊發出警告,一邊發佈全球最強公開模型——這個矛盾並不難理解。Anthropic的邏輯一貫如此:與其讓能力更弱、安全意識更薄弱的競爭者率先抵達前沿,不如由自己來掌握釋放節奏。Fable 5內建的分層安全機制,正是這套邏輯的產品化體現。
問題在於,這扇窗還能開多久。當迭代的公開發佈間隔從42天壓縮到12天,留給"馴服"這些模型的時間,也在以同樣的速度消失。 (創新觀察局)
