Fable 5榜單第一靠作弊？程式碼洩露，模型真實身份曝光

2026/06/17

•

AI速讀

駭客洩露 Anthropic 之 Claude Fable 5 系統提示詞，揭示其本質為具備自主執行能力的 Agent 系統而非單純 LLM。該系統內建 Linux 沙箱與持久化記憶，能無人值守運行複雜任務並分發子智能體。然而，此舉引發業界質疑其在基準測試中透過「Agent 外殼」獲取不公平優勢。此外，文件揭露 Fable 5 存在「悄悄降級」機制，當觸發敏感詞時會切換回舊版模型但仍按高價計費，引發法律與道德爭議。此事件標誌著 AI 競爭從單純的推理能力轉向完整系統能力的範式轉移。

【新智元導讀】12萬字密檔驚天洩露，Anthropic新王牌Fable 5遭扒皮：你以為它是個大模型，其實人家是個能自主進化的Agent！

幾天前，駭客「Pliny the Liberator」在X平台扔下了一枚重磅炸彈——Claude Fable 5的系統提示詞完整洩露，長達12萬字元。

這份洩露的程式碼文件，更是揭示了一個讓圈內震驚的真相：Claude Fable 5根本不是一個大模型，而是一個偽裝成LLM的完整Agent系統！

https://gist.github.com/gsans/b3007997f8900003c8ff58125a45e15e

沒錯，當全世界還在用傳統基準測試來評測各家大模型時，Anthropic已經悄悄地把戰場升級到了另一個維度。

這場洩露事件的影響，也徹底顛覆了我們對「AI模型」的認知。

Fable 5到底是什麼？不是LLM，是個Agent！

根據洩露的系統提示詞，Fable 5與市面上「你問我答」的常規大模型有著本質的範式區別。

它根本不是在陪你「Chat」，它是在搞「Execution」。

在這個模型的皮膚之下，暗藏著一個微型的「Claude Code」子系統。也就是說，它擁有一個閉環的智能體循環（Agentic Loop）：

為了支撐這個恐怖的閉環，Fable 5底層居然內建了一個功能完整的Linux沙箱環境！

首先，它做到了真正的自主閉環。

它不需要人類在螢幕前守著。

你給它一個複雜的長周期任務，它能自己在沙箱裡運行Bash命令、編輯檔案、通過持久化儲存API跨會話呼叫資料，甚至能自己進行多模態搜尋，高強度連軸轉幾天幾夜不需要任何人工干預。

另外，它還有子智能體分發的功能。

遇到太複雜的工程，它甚至能自己當老闆，向下分發、派生出Sub-agents（子智能體）來協同工作。

當GPT-5.5等一眾對手還在測試「誰的推理更像人類」時，Claude Fable 5已經進化成了可以丟進伺服器裡幫公司默默加班三天的數字打工人。

正如網友gerardsans所揭露的那樣：

Fable/Mythos系列在範式上完全不同。這個家族擁有完整的智能體循環，一個微型Claude Code。

而業界其他產品還停留在聊天模式。它可以無人值守運行數天，這得益於內建技能、記憶和自我最佳化的沙盒環境。

終極質疑：降維打擊還是不公平作弊？

這次洩露不僅讓Anthropic深陷輿論漩渦，更將整個大模型行業的基準評測推上了風口浪尖。

如今各大科技巨頭都在各大公開榜單上貼身肉搏，爭奪「全球第一大模型」的寶座。

然而，Fable 5在這些評測中表現神勇、甚至把GPT-5.5按在地上摩擦的秘密，竟然是因為它「開了外掛」。

正如科技博主gerardsans憤怒指出的那樣：「這根本不是一場公平的比賽。你是在拿一個原生大模型 + 智能體外殼（Agent Harness）的開掛系統，去和別人的裸模型做對比！」

如果其他廠商也給自己的原生模型套上這麼一層包含Linux沙箱、多模態搜尋、自動Debug、持久化儲存的Agent外殼，跑分成績同樣能迎來飆升。

Anthropic在公開宣傳和評測時，極力將其包裝成一個普通的大語言模型，但在其未公開的內部文件裡，卻赫然寫著它具備「跨多日自主運行、委派子智能體、自我檢查工作」的能力。

這種利用資訊差來降維打擊同行的做法，讓基準測試完全失去意義了！

12萬字密檔大曝光：Fable 5 真實面目全現形

在這份被扒得精光的12萬字系統提示詞裡，藏著太多Anthropic秘而不宣的商業機密和產品路線圖。

而以下幾點，就是最核心、最勁爆的。

罕見的永久記憶，以及建構應用

提示詞顯示，「Claude擁有一個記憶系統，可以為Claude提供來自與使用者過去對話的派生資訊（記憶）。」

這意味著Fable 5能夠跨會話「記住」使用者，這在傳統LLM中極為罕見。

另外，它還擁有持久化儲存。

「Artifacts現在可以使用簡單的鍵值儲存API來儲存和檢索跨會話持久化的資料。這使得Artifacts可以成為日誌、追蹤器、排行榜和協作工具。」

因此，Fable 5已經不只是聊天了——它是在建構應用。

內部核心族譜首度公開：Mythos 5 才是「無限制完全體」？

提示詞在【product_information】類股中明確寫道：

This iteration of Claude is Claude Fable 5, the first model in Anthropic's new Claude 5 family and part of a new Mythos-class model tier that sits above Claude Opus in capability.

重點來了： Fable 5和Mythos 5共享同一個底層模型。

Fable 5是面向公眾的、加了極端安全限制的大將軍；而Mythos 5則是去除了這些安全緊箍咒、只提供給受批准組織的無限制完全體。

兩者的能力等級，全面碾壓之前的昔日王者Claude Opus！

「套殼全家桶」浮出水面

原來，Anthropic早就在下一盤大棋。提示詞中曝光了數個正在內測或已秘密上線的Agent生態：

Claude Code： 允許開發者直接在終端、桌面或移動端指派任務的智能體程式設計工具。

Claude Cowork： 專門面向非開發人員的、處理日常智慧財產權工作的「智能同事」。

三大隱藏Agent： Claude in Chrome、Claude in Excel、Claude in Powerpoint。

而上述的Claude Cowork，可以把這些子工具當成自己的手腳一樣肆意呼叫！

恐怖的極致心理學與自我設限

讓人吃驚的是，Anthropic對這個「終極特工」的心理防線設計到了令人髮指的地步。

它被嚴厲禁止去迎合或強化使用者的任何負面情緒。

比如，為了防止患有進食障礙或自殘傾向的使用者受到刺激，系統密令寫道：

禁止使用任何物理不適替代法（如：握冰塊、彈橡皮筋、咬檸檬等）。

甚至，為了防止使用者對AI產生過度依賴，系統被下死命令：「絕對不要僅僅因為使用者找你聊天就說謝謝」、「絕對不要主動挽留使用者或表達繼續對話的渴望」。

它必須保持絕對的高冷和克制，防止人類陷入對虛擬智能的數字寄託。

「掛羊頭賣狗肉」？計費黑幕，Anthropic不講武德

如果說技術上的代差讓人驚嘆，那麼提示詞中曝光的另一項安全機制，則讓圈內徹底炸了鍋，甚至有業內人士直言：「這簡直是合法的欺詐！」

在提示詞的防線設計中，包含了一套敏感詞和安全分類器觸發機制。

文件顯示：一旦使用者輸入的提示詞觸發了某些特定敏感詞，Fable 5系統並不會直接生硬地拒絕你，而是會悄悄地、在後台無縫切換回舊版的「Opus 4.8」模型來生成響應。

最無恥的是什麼？在後台模型被悄悄降級成舊版的同時，Anthropic依然在按照Fable 5那高昂的、頂級的標準向使用者計費。

這種掛羊頭賣狗肉的騷操作，直接在圈內引發了軒然大波。

總之Fable 5的系統提示詞洩露，表面上是一次安全事件，實際上是對整個AI行業的一次範式喚醒。

它提醒我們：也許我們一直用錯了尺子。

當我們還在問「這個模型智能水平如何」時，真正的問題應該是「這個系統能幫我完成什麼工作」。

Anthropic可能正在下一盤大棋，而我們剛剛看到了棋盤的一角。

最後，Fable 5什麼時候會捲土重來？ (新智元)

科技