【新智元導讀】微軟用一套多 Agent 系統在 AI 漏洞發現的頂級基準測試上拿下第一,超過 Anthropic 最強模型 Mythos 五個百分點。詭異的是,微軟自己並沒有一個能打的前沿模型。它用別人的模型組了個系統,打敗了造出這些模型的公司。這對AI競爭格局的啟示,比這個工具挖出了大量 Windows 漏洞本身更重要。
最強駭客大模型 Mythos,居然被黑馬超越了!
5 月 12 日,微軟發布了代號 MDASH 的 AI 安全系統,同時登頂 CyberGym 基準測試榜首,成績 88.45%。
排在它後面的是 Anthropic 的 Mythos Preview(83.1%)和 OpenAI 的 GPT-5.5(81.8%)。