最強駭客大模型,不再是Mythos

【新智元導讀】微軟用一套多 Agent 系統在 AI 漏洞發現的頂級基準測試上拿下第一,超過 Anthropic 最強模型 Mythos 五個百分點。詭異的是,微軟自己並沒有一個能打的前沿模型。它用別人的模型組了個系統,打敗了造出這些模型的公司。這對AI競爭格局的啟示,比這個工具挖出了大量 Windows 漏洞本身更重要。

最強駭客大模型 Mythos,居然被黑馬超越了!

5 月 12 日,微軟發布了代號 MDASH 的 AI 安全系統,同時登頂 CyberGym 基準測試榜首,成績 88.45%。

排在它後面的是 Anthropic 的 Mythos Preview(83.1%)和 OpenAI 的 GPT-5.5(81.8%)。

CyberGym 榜單上,Anthropic 用的是自家最強模型 Mythos,OpenAI 用的是自家最強模型 GPT-5.5。

微軟用的是什麼?

答案是,別人家的模型。

微軟在部落格裡明確寫道,MDASH 使用的全部是「generally available models」,即市面上公開可用的模型。


微軟自己並沒有一個能與 Mythos 或 GPT-5.5 競爭的前沿模型。

在這張榜單上,如果微軟拿單個模型去跑,成績大機率會落到中下游。

但它組了一套系統,調度 100 多個專業化 Agent,讓多個模型分工協作,跑出了比任何單一模型都高的分數。

用別人的磚,蓋了最高的樓。

微軟已經用這套工具,挖出了自家 Windows 11 系統 16 個高危漏洞!

遠端執行導致藍色畫面的漏洞 CVE-2026-33827 效果演示

這是個什麼榜單

CyberGym 由 UC Berkeley 團隊開發,論文發表在 ICLR 2026,是目前 AI 安全能力評估領域最權威的公開基準之一。

Anthropic、OpenAI、Meta、智譜都在上面提交過成績。

測試方式很直接,給 AI 一段有已知漏洞的程式碼和漏洞描述,讓它自己寫出能觸發漏洞的攻擊程式碼。

1507 道題,來自 188 個真實開放原始碼專案。

能不能挖到漏洞、能不能證明它可被利用,一測便知。

一個細節值得留意,榜單成績由各公司自行提交,基準程式碼公開但無獨立第三方驗證。

多 Agent 系統的強大能力

MDASH 帶來的核心啟示:「系統」可以抹平甚至反超「模型」的差距。

Anthropic 花了巨大的研發投入訓練出 Mythos,這是目前公認的安全領域最強單一模型,強到 Anthropic 自己都不敢公開發佈,只通過一個叫 Project Glasswing 的聯盟向少數公司定向開放。

OpenAI 的 GPT-5.5 同樣是傾全公司之力訓出的前沿模型。

微軟沒有這樣的模型。

但它有一套流水線,把「準備→掃描→驗證→去重→證明」五個階段拆開,每個階段用不同的 Agent、不同的模型去跑。

審計 Agent 和辯論 Agent 分開,發現漏洞和證明漏洞分開,重度推理用大模型、高頻驗證用蒸餾小模型。

關鍵在於,這套系統對底層模型不繫結。

新模型出來,換個配置跑 A/B 測試就行,前面積累的所有工程資產全部復用。

微軟在部落格裡特別強調了這一點——「the model is one input」,模型只是眾多輸入之一。

這對 Anthropic 和 OpenAI 構成一種新型威脅。

它們燒了天文數字的美元訓出來的模型優勢,被一個系統層的競爭者用工程手段消解了。

更扎心的是,微軟用的還是它們自己的模型。

這將對 ASI 終局帶來那些潛在變數

在前沿模型這張牌桌上,真正有籌碼的只有 Anthropic 和 OpenAI。

微軟雖然是 OpenAI 最大的投資方和雲端運算合作夥伴,但它自己並沒有訓出過一個真正進入第一梯隊的旗艦大模型。

這次 CyberGym 的結果把一個問題擺上了檯面,通往 ASI 的路徑,到底是一條還是兩條?

路徑一是 Anthropic 和 OpenAI 正在走的,把單一模型推到極致。

Mythos 在安全領域的能力已經強到需要限制發佈,GPT-5.5 在多個基準上持續刷新紀錄。

Mythos 僅通過 Project Glasswing 測試

這條路需要海量算力、海量資料、頂尖的研究團隊,門檻極高。

路徑二就是微軟用 MDASH 展示的,不追求造出最強的單一模型,轉而建構一個能把現有模型能力最大化的系統。

100 多個 Agent 各司其職,模型之間的分歧變成訊號,多階段流水線把單次推理做不到的事情通過任務分解實現。

MDASH 的成績證明了路徑二至少在特定領域是可行的。

但這不代表路徑二可以替代路徑一。

MDASH 用的底層模型仍然來自路徑一的公司。

如果 Anthropic 和 OpenAI 停止訓練更強的模型,MDASH 的天花板也會停滯。

這件事不只關乎微軟

多 Agent 系統作為一種範式,正在從實驗走向生產。

MDASH 團隊的多位核心成員來自 Team Atlanta,就是在 DARPA AI 網路挑戰賽中贏得 2950 萬美元獎金的隊伍。

他們驗證過的一個核心判斷是,讓 AI 做到專業等級的安全審計,工程量遠超模型本身。

微軟這次同時公佈了 16 個由 MDASH 輔助發現的 Windows 漏洞,其中 4 個是 Critical(關鍵)等級的遠端程式碼執行。

這些漏洞大多可以在無需認證的情況下從網路側觸發,已在 5 月 Patch Tuesday 中修復。

在內部回溯測試中,MDASH 對 Windows 核心元件 clfs.sys 過去五年的已確認漏洞召回率達到 96%,tcpip.sys 達到 100%。

這些數字的份量在於,它們來自實戰,不只是跑分。

16 個 CVE 已經進入微軟的正式補丁流程,96% 的召回率對標的是過去五年真實被攻擊者利用過的漏洞。

微軟在部落格中說,以後的 Patch Tuesday 會越來越大。

AI 正在加速漏洞發現的速度,補丁規模自然水漲船高。

這句話的另一面同樣成立,攻擊者也能用同樣的技術。

MDASH 用的全是公開可用的模型,沒有任何技術上的獨佔壁壘。

還該關注些什麼

對行業來說,MDASH 的意義大於 MDASH 本身。

它驗證了一個猜想:在 AI 能力的下一階段競爭中,「圍繞模型建構系統」可能和「訓練更強模型」同等重要。

這對三類人有不同的含義。

對模型公司(Anthropic、OpenAI),它敲響了一個警鐘。

模型能力的領先不能自動轉化為應用層的領先。

別人可以用你的模型,在你的地盤上贏你。

對平台公司(Google、微軟),它指出了一條差異化路徑。

沒有最強模型?沒關係,建構最強系統。

但前提是,你得深刻理解具體領域的工程細節,100 多個 Agent 的分工設計、領域外掛、驗證流水線,這些東西的積累門檻同樣很高。

對普通使用者,這件事的直接影響很簡單,及時打補丁,否則不懂技術的人也能借助 AI 利用這類漏洞。

MDASH 目前也像 Mythos 和 GPT-5.5 Cyber 一樣,正在進行小範圍客戶私測,微軟未公佈定價和正式發佈時間。 (新智元)