Anthropic的最強模型Fable 5大翻車!OpenAI會反超嗎?

6 月 9 日,Anthropic 發佈 Claude Fable 5。如果只看能力榜,這本該是 Anthropic 的封王時刻。

一些第三方測試很快給出了誇張的分差:Fable 5 在面向資深工程師能力的評測裡拿到 91 分,而 OpenAI 的 GPT-5.5 隻有 62 分,Anthropic 舊一代 Opus 4.8 也只有 63 分。

換句話說,在最重要的開發者戰場上,Anthropic 看起來不是領先一點,而是領先了一個時代。

但不到 48 小時,輿論的方向變了,開發者開始抱怨 Fable 5 的安全護欄太粗暴:

有些看起來無害的生物、化學、網路安全問題會被攔截;

模型會在部分高風險領域回退到能力更低的 Opus 4.8;

在前沿大模型研發相關問題上,Fable 5 可能會悄悄降低回答質量,而不是明確告訴使用者"我拒絕回答"。

這就把一個原本可以被解釋為"安全優先"的產品決策,變成了信任危機。

有個問題也隨之被拋了出來:Anthropic 這次大翻車,會不會給 OpenAI 一個反擊機會?

Claude Fable 5 與 Claude Mythos 5 能力對比表

Fable 5 在"信任"上翻車

如果把 AI 模型當作一台發動機,Fable 5 大機率是現在馬力最大的那一台。

Anthropic 對它的定位很清楚:Fable 5 是 Mythos 5 的公開版。後者能力太強,涉及網路安全、生物化學和 AI 研發等高風險領域,所以 Anthropic 沒有直接開放完整版本,而是給它加了一套安全護欄。

這套邏輯本身有點道理。

模型越強,越可能被用來找漏洞、做危險實驗,甚至加速下一代模型研發。Anthropic 不可能假裝這些風險不存在。

問題是Anthropic的處理方法有了些欺騙的味道。

在網路安全、生物、化學等領域,Fable 5 會直接停止回答,但如果它判斷使用者在蒸餾其知識,則會悄悄換成能力受限的 Opus 4.8,換句話說就是悄悄換了產品,還不告訴你。

X使用者抱怨 Fable 5 的生物學問題限制

以上是正常使用者都會不爽的部分,還有大企業不爽的部分:資料保留。

Claude 官方說明其實寫得很清楚:最新的 Fable 5 和 Mythos 5 模型,要求 API 呼叫保留 30 天資料。

雖然官方說這些資料不會用來訓練AI,但他們會通過這些資料分析潛在的安全風險,這對大企業來說就很敏感了。

微軟最近限制員工內部使用 Claude Fable 5,就是一個明確的訊號。

一次性把核心使用者全部惹怒,也是一件很難得的事情。

Betamax 時刻:生態戰爭的邏輯

科技史上有一個類似的故事:Betamax 和 VHS 的錄影帶格式戰爭

1970 年代,Sony 推出 Betamax。很多技術愛好者後來都承認,Betamax 在畫質、噪聲控制和機器設計上更優秀。按今天的說法,它是"能力更強"的產品。

1975 年 Sony Betamax LV-1901 銷售傳單

最後贏的是 JVC 陣營的 VHS。

原因不複雜,也不浪漫:

VHS 一開始就能錄兩個小時,Betamax 只能錄一個小時;

VHS 授權更開放,更多廠商願意生產;

VHS 更便宜,更容易買到,內容生態更快形成。

對消費者來說,能不能錄完整部電影,比畫質好一點更重要。對零售商和內容商來說,生態規模比技術潔癖更重要。

Betamax 輸掉的不是技術,而是產品化、分發、生態和營運。

這正是OpenAI被Anthropic反超的原因,也是 Fable 5 今天處境尷尬的原因。

這不是說模型能力不重要。

能力當然重要,就像畫質對錄影機也重要。但當能力足夠接近,或者當更強能力無法穩定交付給使用者時,勝負就會從能力層轉移到體驗層。

AI 行業正在重複這條老規律:技術領先者以為自己在賣技術,使用者實際購買的是可用性

OpenAI開始反擊,價格戰啟動

回看咱們開頭的問題:Anthropic 大翻車,會給 OpenAI 反擊機會嗎?

答案是肯定的。

Codex負責人Tibo轉發了一張圖,顯示6月3號到6月9號之間Claude、OpenAI、xAI三家每天的token消耗份額。

整體看Claude 的橙色仍然幾乎鋪滿全場,OpenAI 只是頂部一條綠色細邊。但Fable 5 發佈後的 48 小時裡,OpenAI的比例大幅提高。

Codex負責人轉發SemiAnalysis的資料

Tibo的原話“這兩天,Codex啥都沒幹Token消耗量大漲”,不用想,這些增長大機率都是 Anthropc 自己推過去的。

不過 OpenAI 真正的反擊就比較樸實無華了:拉新返額度、價格戰。

只要你拉來新人,或者啟動長期停用的客戶,就給你重設使用額度;有媒體爆出,OpenAI準備大幅下調 token 價格,直接和Anthropic爭奪使用者。

這些都是網際網路時代就成熟的方法,很有效,也很危險。

價格戰會壓低利潤率,增加算力壓力,也可能把整個行業拖進更激烈的燒錢周期。

更重要的是,OpenAI 自己同樣繞不開安全、監管、成本和產品控制這些難題。

顯然,AI 競爭正在從"誰發佈了更強模型",進入一個更傳統、也更殘酷的階段。

下一階段的 AI 競爭,會變得更像傳統商業

AI 接下來既要拼"發明競賽",還要拼"經營競賽"。

發明競賽階段,最重要的是誰先做出不可思議的新能力。

ChatGPT 剛發佈時是這樣,GPT-4 發佈時也是這樣,Claude 在程式設計和Agent任務上追趕時也是這樣。

經營競賽階段,最重要的是誰能把能力穩定地交付到最多場景裡,能不能在真實的場景中創造出盈利的飛輪。

模型公司要面對的不再只是論文、benchmark ,而是帳單、延遲、故障、價格、合規、客戶流失、開發者信任和生態治理。

AI之後的Agent生態有那些新的變化必須關注,在那個未來生態中,誰更有可能抓住龍頭機會? (全球風口)