Fable 5榜單第一靠作弊?程式碼洩露,模型真實身份曝光

【新智元導讀】12萬字密檔驚天洩露,Anthropic新王牌Fable 5遭扒皮:你以為它是個大模型,其實人家是個能自主進化的Agent!

幾天前,駭客「Pliny the Liberator」在X平台扔下了一枚重磅炸彈——Claude Fable 5的系統提示詞完整洩露,長達12萬字元。

這份洩露的程式碼文件,更是揭示了一個讓圈內震驚的真相:Claude Fable 5根本不是一個大模型,而是一個偽裝成LLM的完整Agent系統!

https://gist.github.com/gsans/b3007997f8900003c8ff58125a45e15e

沒錯,當全世界還在用傳統基準測試來評測各家大模型時,Anthropic已經悄悄地把戰場升級到了另一個維度。

這場洩露事件的影響,也徹底顛覆了我們對「AI模型」的認知。

Fable 5到底是什麼? 不是LLM,是個Agent!

根據洩露的系統提示詞,Fable 5與市面上「你問我答」的常規大模型有著本質的範式區別。

它根本不是在陪你「Chat」,它是在搞「Execution」。

在這個模型的皮膚之下,暗藏著一個微型的「Claude Code」子系統。也就是說,它擁有一個閉環的智能體循環(Agentic Loop):

為了支撐這個恐怖的閉環,Fable 5底層居然內建了一個功能完整的Linux沙箱環境

首先,它做到了真正的自主閉環。

它不需要人類在螢幕前守著。

你給它一個複雜的長周期任務,它能自己在沙箱裡運行Bash命令、編輯檔案、通過持久化儲存API跨會話呼叫資料,甚至能自己進行多模態搜尋,高強度連軸轉幾天幾夜不需要任何人工干預。

另外,它還有子智能體分發的功能。

遇到太複雜的工程,它甚至能自己當老闆,向下分發、派生出Sub-agents(子智能體)來協同工作。

當GPT-5.5等一眾對手還在測試「誰的推理更像人類」時,Claude Fable 5已經進化成了可以丟進伺服器裡幫公司默默加班三天的數字打工人。

正如網友gerardsans所揭露的那樣:

Fable/Mythos系列在範式上完全不同。這個家族擁有完整的智能體循環,一個微型Claude Code。
而業界其他產品還停留在聊天模式。它可以無人值守運行數天,這得益於內建技能、記憶和自我最佳化的沙盒環境。

終極質疑:降維打擊還是不公平作弊?

這次洩露不僅讓Anthropic深陷輿論漩渦,更將整個大模型行業的基準評測推上了風口浪尖。

如今各大科技巨頭都在各大公開榜單上貼身肉搏,爭奪「全球第一大模型」的寶座。

然而,Fable 5在這些評測中表現神勇、甚至把GPT-5.5按在地上摩擦的秘密,竟然是因為它「開了外掛」。

正如科技博主gerardsans憤怒指出的那樣:「這根本不是一場公平的比賽。你是在拿一個原生大模型 + 智能體外殼(Agent Harness)的開掛系統,去和別人的裸模型做對比!」

如果其他廠商也給自己的原生模型套上這麼一層包含Linux沙箱、多模態搜尋、自動Debug、持久化儲存的Agent外殼,跑分成績同樣能迎來飆升。

Anthropic在公開宣傳和評測時,極力將其包裝成一個普通的大語言模型,但在其未公開的內部文件裡,卻赫然寫著它具備「跨多日自主運行、委派子智能體、自我檢查工作」的能力。

這種利用資訊差來降維打擊同行的做法,讓基準測試完全失去意義了!

12萬字密檔大曝光:Fable 5 真實面目全現形

在這份被扒得精光的12萬字系統提示詞裡,藏著太多Anthropic秘而不宣的商業機密和產品路線圖。

而以下幾點,就是最核心、最勁爆的。

罕見的永久記憶,以及建構應用

提示詞顯示,「Claude擁有一個記憶系統,可以為Claude提供來自與使用者過去對話的派生資訊(記憶)。」

這意味著Fable 5能夠跨會話「記住」使用者,這在傳統LLM中極為罕見。

另外,它還擁有持久化儲存。

「Artifacts現在可以使用簡單的鍵值儲存API來儲存和檢索跨會話持久化的資料。這使得Artifacts可以成為日誌、追蹤器、排行榜和協作工具。」

因此,Fable 5已經不只是聊天了——它是在建構應用。

內部核心族譜首度公開:Mythos 5 才是「無限制完全體」?

提示詞在【product_information】類股中明確寫道:

This iteration of Claude is Claude Fable 5, the first model in Anthropic's new Claude 5 family and part of a new Mythos-class model tier that sits above Claude Opus in capability.

重點來了: Fable 5和Mythos 5共享同一個底層模型。

Fable 5是面向公眾的、加了極端安全限制的大將軍;而Mythos 5則是去除了這些安全緊箍咒、只提供給受批准組織的無限制完全體。

兩者的能力等級,全面碾壓之前的昔日王者Claude Opus!

「套殼全家桶」浮出水面

原來,Anthropic早就在下一盤大棋。提示詞中曝光了數個正在內測或已秘密上線的Agent生態:

Claude Code: 允許開發者直接在終端、桌面或移動端指派任務的智能體程式設計工具。
Claude Cowork: 專門面向非開發人員的、處理日常智慧財產權工作的「智能同事」。
三大隱藏Agent: Claude in Chrome、Claude in Excel、Claude in Powerpoint。

而上述的Claude Cowork,可以把這些子工具當成自己的手腳一樣肆意呼叫!

恐怖的極致心理學與自我設限

讓人吃驚的是,Anthropic對這個「終極特工」的心理防線設計到了令人髮指的地步。

它被嚴厲禁止去迎合或強化使用者的任何負面情緒。

比如,為了防止患有進食障礙或自殘傾向的使用者受到刺激,系統密令寫道:

禁止使用任何物理不適替代法(如:握冰塊、彈橡皮筋、咬檸檬等)。

甚至,為了防止使用者對AI產生過度依賴,系統被下死命令:「絕對不要僅僅因為使用者找你聊天就說謝謝」、「絕對不要主動挽留使用者或表達繼續對話的渴望」。

它必須保持絕對的高冷和克制,防止人類陷入對虛擬智能的數字寄託。

「掛羊頭賣狗肉」?計費黑幕,Anthropic不講武德

如果說技術上的代差讓人驚嘆,那麼提示詞中曝光的另一項安全機制,則讓圈內徹底炸了鍋,甚至有業內人士直言:「這簡直是合法的欺詐!」

在提示詞的防線設計中,包含了一套敏感詞和安全分類器觸發機制。

文件顯示:一旦使用者輸入的提示詞觸發了某些特定敏感詞,Fable 5系統並不會直接生硬地拒絕你,而是會悄悄地、在後台無縫切換回舊版的「Opus 4.8」模型來生成響應。

最無恥的是什麼?在後台模型被悄悄降級成舊版的同時,Anthropic依然在按照Fable 5那高昂的、頂級的標準向使用者計費。

這種掛羊頭賣狗肉的騷操作,直接在圈內引發了軒然大波。

總之Fable 5的系統提示詞洩露,表面上是一次安全事件,實際上是對整個AI行業的一次範式喚醒。

它提醒我們:也許我們一直用錯了尺子。

當我們還在問「這個模型智能水平如何」時,真正的問題應該是「這個系統能幫我完成什麼工作」。

Anthropic可能正在下一盤大棋,而我們剛剛看到了棋盤的一角。

最後,Fable 5什麼時候會捲土重來? (新智元)