最強駭客大模型，不再是Mythos

2026/05/15

•

【新智元導讀】微軟用一套多 Agent 系統在 AI 漏洞發現的頂級基準測試上拿下第一，超過 Anthropic 最強模型 Mythos 五個百分點。詭異的是，微軟自己並沒有一個能打的前沿模型。它用別人的模型組了個系統，打敗了造出這些模型的公司。這對AI競爭格局的啟示，比這個工具挖出了大量 Windows 漏洞本身更重要。

最強駭客大模型 Mythos，居然被黑馬超越了！

5 月 12 日，微軟發布了代號 MDASH 的 AI 安全系統，同時登頂 CyberGym 基準測試榜首，成績 88.45%。

排在它後面的是 Anthropic 的 Mythos Preview（83.1%）和 OpenAI 的 GPT-5.5（81.8%）。

CyberGym 榜單上，Anthropic 用的是自家最強模型 Mythos，OpenAI 用的是自家最強模型 GPT-5.5。

微軟用的是什麼？

答案是，別人家的模型。

微軟在部落格裡明確寫道，MDASH 使用的全部是「generally available models」，即市面上公開可用的模型。

微軟自己並沒有一個能與 Mythos 或 GPT-5.5 競爭的前沿模型。

在這張榜單上，如果微軟拿單個模型去跑，成績大機率會落到中下游。

但它組了一套系統，調度 100 多個專業化 Agent，讓多個模型分工協作，跑出了比任何單一模型都高的分數。

用別人的磚，蓋了最高的樓。

微軟已經用這套工具，挖出了自家 Windows 11 系統 16 個高危漏洞！

這是個什麼榜單

CyberGym 由 UC Berkeley 團隊開發，論文發表在 ICLR 2026，是目前 AI 安全能力評估領域最權威的公開基準之一。

Anthropic、OpenAI、Meta、智譜都在上面提交過成績。

測試方式很直接，給 AI 一段有已知漏洞的程式碼和漏洞描述，讓它自己寫出能觸發漏洞的攻擊程式碼。

1507 道題，來自 188 個真實開放原始碼專案。

能不能挖到漏洞、能不能證明它可被利用，一測便知。

一個細節值得留意，榜單成績由各公司自行提交，基準程式碼公開但無獨立第三方驗證。

多 Agent 系統的強大能力

MDASH 帶來的核心啟示：「系統」可以抹平甚至反超「模型」的差距。

Anthropic 花了巨大的研發投入訓練出 Mythos，這是目前公認的安全領域最強單一模型，強到 Anthropic 自己都不敢公開發佈，只通過一個叫 Project Glasswing 的聯盟向少數公司定向開放。

OpenAI 的 GPT-5.5 同樣是傾全公司之力訓出的前沿模型。

微軟沒有這樣的模型。

但它有一套流水線，把「準備→掃描→驗證→去重→證明」五個階段拆開，每個階段用不同的 Agent、不同的模型去跑。

審計 Agent 和辯論 Agent 分開，發現漏洞和證明漏洞分開，重度推理用大模型、高頻驗證用蒸餾小模型。

關鍵在於，這套系統對底層模型不繫結。

新模型出來，換個配置跑 A/B 測試就行，前面積累的所有工程資產全部復用。

微軟在部落格裡特別強調了這一點——「the model is one input」，模型只是眾多輸入之一。

這對 Anthropic 和 OpenAI 構成一種新型威脅。

它們燒了天文數字的美元訓出來的模型優勢，被一個系統層的競爭者用工程手段消解了。

更扎心的是，微軟用的還是它們自己的模型。

這將對 ASI 終局帶來那些潛在變數

在前沿模型這張牌桌上，真正有籌碼的只有 Anthropic 和 OpenAI。

微軟雖然是 OpenAI 最大的投資方和雲端運算合作夥伴，但它自己並沒有訓出過一個真正進入第一梯隊的旗艦大模型。

這次 CyberGym 的結果把一個問題擺上了檯面，通往 ASI 的路徑，到底是一條還是兩條？

路徑一是 Anthropic 和 OpenAI 正在走的，把單一模型推到極致。

Mythos 在安全領域的能力已經強到需要限制發佈，GPT-5.5 在多個基準上持續刷新紀錄。

這條路需要海量算力、海量資料、頂尖的研究團隊，門檻極高。

路徑二就是微軟用 MDASH 展示的，不追求造出最強的單一模型，轉而建構一個能把現有模型能力最大化的系統。

100 多個 Agent 各司其職，模型之間的分歧變成訊號，多階段流水線把單次推理做不到的事情通過任務分解實現。

MDASH 的成績證明了路徑二至少在特定領域是可行的。

但這不代表路徑二可以替代路徑一。

MDASH 用的底層模型仍然來自路徑一的公司。

如果 Anthropic 和 OpenAI 停止訓練更強的模型，MDASH 的天花板也會停滯。

這件事不只關乎微軟

多 Agent 系統作為一種範式，正在從實驗走向生產。

MDASH 團隊的多位核心成員來自 Team Atlanta，就是在 DARPA AI 網路挑戰賽中贏得 2950 萬美元獎金的隊伍。

他們驗證過的一個核心判斷是，讓 AI 做到專業等級的安全審計，工程量遠超模型本身。

微軟這次同時公佈了 16 個由 MDASH 輔助發現的 Windows 漏洞，其中 4 個是 Critical（關鍵）等級的遠端程式碼執行。

這些漏洞大多可以在無需認證的情況下從網路側觸發，已在 5 月 Patch Tuesday 中修復。

在內部回溯測試中，MDASH 對 Windows 核心元件 clfs.sys 過去五年的已確認漏洞召回率達到 96%，tcpip.sys 達到 100%。

這些數字的份量在於，它們來自實戰，不只是跑分。

16 個 CVE 已經進入微軟的正式補丁流程，96% 的召回率對標的是過去五年真實被攻擊者利用過的漏洞。

微軟在部落格中說，以後的 Patch Tuesday 會越來越大。

AI 正在加速漏洞發現的速度，補丁規模自然水漲船高。

這句話的另一面同樣成立，攻擊者也能用同樣的技術。

MDASH 用的全是公開可用的模型，沒有任何技術上的獨佔壁壘。

還該關注些什麼

對行業來說，MDASH 的意義大於 MDASH 本身。

它驗證了一個猜想：在 AI 能力的下一階段競爭中，「圍繞模型建構系統」可能和「訓練更強模型」同等重要。

這對三類人有不同的含義。

對模型公司（Anthropic、OpenAI），它敲響了一個警鐘。

模型能力的領先不能自動轉化為應用層的領先。

別人可以用你的模型，在你的地盤上贏你。

對平台公司（Google、微軟），它指出了一條差異化路徑。

沒有最強模型？沒關係，建構最強系統。

但前提是，你得深刻理解具體領域的工程細節，100 多個 Agent 的分工設計、領域外掛、驗證流水線，這些東西的積累門檻同樣很高。

對普通使用者，這件事的直接影響很簡單，及時打補丁，否則不懂技術的人也能借助 AI 利用這類漏洞。

MDASH 目前也像 Mythos 和 GPT-5.5 Cyber 一樣，正在進行小範圍客戶私測，微軟未公佈定價和正式發佈時間。 (新智元)

科技