#Claude
全世界消耗Token最多的人
2025年之前,想要證明自己混得好,大概得腕上戴塊百達翡麗,車庫裡停輛庫裡南。但到了AI時代,硬通貨變了:看你一年到底燒了多少Token。一年燒掉250億個Token,有位25歲的韓國小夥子,成了全世界最能燒的人。2025年12月,首爾江南區一家中餐館裡,Anthropic(Claude系列大模型的開發公司)擺了一桌私宴。公司聯合創始人Ben Mann帶著幾位高管,跟一群重度使用者圍坐一桌,暢談怎麼讓AI代理系統跑得更穩、更靠譜。席間最打眼的是一位24歲的韓國年輕人。他頂著亂糟糟的齊肩捲髮,臉上還帶著幾顆沒消下去的青春痘,笑起來一臉膠原蛋白,身材微微發福,看起來就是個普通大學生模樣。他叫Sigrid Jin。很難想到,這位其貌不揚的小夥子,正是Anthropic當時公認的“榜一大哥”。一年內,他一個人在Claude Code上燒掉了250億個Token。250億個Token是個什麼概念?按開發者常用的Claude Sonnet 4.6定價(輸入3美元/百萬Token,輸出15美元/百萬Token),假設輸入輸出比例為2:1,這筆開銷大概相當於17.5萬美元,折合人民幣約125萬。這筆錢,放在北京五環外,差不多夠付一套小兩居的首付。Sigrid Jin一個人去年在模型上燒掉的錢,抵得上一套三線城市的房,也夠在北京紮根了。圖|claude官網定價Sigrid Jin本名Jin Hyung Park,今年25歲,目前還在英屬哥倫比亞大學(UBC)讀書。不過他是個出了名的“輟學專業戶”,2018年和2024年先後兩次暫時離開學校,到現在也沒固定專業,只是掛在理科大類下面。他的技術不是科班出身,而是靠參加後端開發訓練營自學成才。他的人生路徑相當跳脫。高中就讀於韓國外國語高中,主修語言和人文,當過辯論隊隊長,還辦過TEDx。工作經歷更是五花八門,他做過以太坊稽核員、給經濟學人寫過研報、在空軍服役期間負責過財務和人事助理。圖|領英上,Sigrid Jin的部分工作經歷直到2022年底,Sigrid Jin才真正開始碰軟體開發。各種經歷雜糅在一起,像一團沒理順的程式碼。現在,他已經是韓國最大LLM研究社區instructkr的創始人。這個Discord群裡聚集了一千多名活躍成員,平時大家就在裡面聊模型、分享workflow、吐槽各種agent的坑。另外,他還是Sionic AI的團隊成員。2023年,Sigrid Jin加入這家公司,開始研究一個叫“AI Harness”的方向。通俗一點解釋,如果把單個AI Agent比作幹活的工人,那AI Harness就是整個工地的總調度。它負責定規矩、搭流程,讓不同的AI工具像流水線一樣配合起來,真正做到“沒人盯著也能一直跑”。為了驗證這套系統,Sigrid Jin和團隊直接開了5個OpenAI Codex Pro帳號、6個Claude Code Max帳號,同時讓它們狂跑,一天就能燒掉20億Token。據說,他所在的初創公司Sionic AI過去一年總共消耗了1380億Token,算力燒得那叫一個毫不手軟。真正讓他封神的,是那個程式碼洩露的凌晨。2026年3月31日凌晨,Sigrid Jin被手機震醒。消息鋪天蓋地,Claude Code的原始碼洩露了。洩露的起因堪稱荒誕。Anthropic在npm更新時,打包工具出了問題,一個60MB的source map檔案被塞進了安裝包,裡面躺著51.2萬行TypeScript原始碼。最先發現的是安全研究員Chaofan Shou。凌晨4點23分,他在X上扔出一個下載連結,帖子很快收穫了1600萬瀏覽量。幾小時內,GitHub上冒出了8000多個複製,Anthropic的法務團隊緊急出動,一口氣發了8100份DMCA下架通知。Sigrid Jin的消息列表炸了。他遠在韓國的女朋友連珠炮似的給打電話,聲音都在發抖。女友擔心Sigrid Jin的電腦上存了那些程式碼,會有法律風險。Anthropic之前起訴過類似項目。圖|程式碼洩漏當晚,Sigrid Jin發帖換做普通人,可能早就刪庫跑路了。但Sigrid Jin做了件更瘋的事。他決定,不看洩露的程式碼,只用AI Harness從零重寫一個。他啟動了自己參與推廣的oh-my-codex(OmX)。這是另一位韓國開發者Yeachan Heo打造的AI工作流編排層,基於OpenAI Codex建構。Sigrid Jin是該項目的社區大使,對這個工具的調度邏輯瞭如指掌。在這個工具的調度下,多個AI代理同時開工。team指令負責平行程式碼審查和架構反饋,ralph指令執行持久化的驗證循環。Codex負責程式碼生成和審查,其他模型輔助檢索。短短幾個小時,他和同伴就用另一種方式把Claude Code那51.2萬行核心邏輯完整復現出來,搞出了一個平替版“Claw Code”。整個過程有點像翻拍一部經典老電影。主線和靈魂沒變,但台詞、演員、佈景全換成了自己的那一套。天還沒亮,Claw Code就被推上了GitHub。兩小時內收穫5萬star,24小時突破10萬,成為GitHub歷史上躥升最快的項目之一。Anthropic後來對8100多個直接搬運洩露程式碼的倉庫發出了DMCA下架通知,唯獨Sigrid Jin的clawcode安然無恙。因為它屬於“淨室重寫”(clean-room rewrite),一字節原程式碼都沒抄,版權上完全算獨立創作。“這是用250億個Token換來的直覺。”Sigrid Jin後來這樣評價。這種直覺來自他對Claude Code近乎痴迷的鑽研。今年2月,他特意飛去舊金山參加Claude Code的一周年生日派對。本以為會看到一屋子極客,結果現場擠滿了醫生、律師、音樂家之類的普通人。一位加州律師用Claude Opus 4.6做了一個自動化建築許可審批工具,還在駭客松裡拿了冠軍。這讓Sigrid Jin意識到,AI Harness不再是極客的玩具,而是這個時代最迫切的基建。圖|claude code一周年生日會合影一周後,他在舊金山辦了一場一百多人的程式設計活動,規則特別離譜。參賽者設定好任務後,從中午12:30開始四個小時全程不能碰電腦。如果忍不住想干預,就得穿上紅色的龍蝦服當懲罰。Sigrid Jin把這叫“IRL模式”:一邊瘋狂用AI代理幹活,一邊強迫自己切換回現實生活,別完全沉進去。這大概就是他在那250億Token裡摸索出來的生活態度。雖然他的GitHub上堆著上百個實驗項目,但他的社交媒體首頁卻主打粉紅色,氛圍輕鬆又快樂。頁面裡時不時出現女明星和呆萌動漫頭像,還有他打卡學習中文的帖子。Claw Code爆火之後,他還認真回覆網友:“別只顧著造AI agents,也要去現實裡好好經營人際關係。”在2月的生日派對上,他曾對著鏡頭半開玩笑地喊:“讓Claude Code再便宜點吧,求求了。”結果一個月後,他做出了同樣功能的Claw Code,而且還能免費使用。現在,這個“全世界燒Token最多的人”,終於成了真正握有AI掌控權的那一撥人。只不過他的方式有點特別。他沒有去寫更牛的程式碼,而是設計了一套更狠的規則,讓AI自己去管AI。那250億個Token,不過是他交給這個時代的學費。而當他把Claude Code的靈魂用免費的Claw Code還給全世界時,故事才真正收尾。在AI時代,最頂級的Token消費,從來不是為了證明你有錢,而是為了把門檻踩得稀巴爛。從這個角度看,Sigrid Jin這250億個Token,燒的不是錢,是一張通往新世界的門票。 (36氪)
OpenAI慘遭反超!Anthropic狂吞70%新客戶,Claude已開啟「靈魂校準」
【新智元導讀】當企業真金白銀開始從 ChatGPT 流向 Claude,Anthropic 打的早已不只是模型性能戰,而是一場從工程師口碑、企業信任到「AI靈魂校準」的全面突圍。這一次,Anthropic真的要把OpenAI從「企業AI王座」上拽下來了。美國企業財務卡發行商 Ramp 最新發佈的 AI Index 資料,幾乎是把一顆炸彈扔進了矽谷——在它追蹤的5萬多家美國企業中,已經有一半在為AI產品付費。其中,使用Anthropic的客戶佔比已經飆升到 30.6%,單月暴漲 6.3 個百分點;而OpenAI呢?掉到了 35.2%。差距,從今年2月的整整 11 個百分點,一個月內被砍到 4.6 個點。Ramp 發言人撂下一句話:按照目前的速度,Anthropic將在未來兩個月內反超OpenAI。這還不是最炸的。Ramp 經濟學家 Ara Kharazian 在最新報告裡拋出一個更狠的數字:在首次購買AI服務的企業裡,Anthropic在與OpenAI的正面對決中,勝率高達 70%。一年前,這個故事的主角還是OpenAI。更別說VC支援的初創公司——這群最早聞到風向的「AI布道者」裡,Anthropic的滲透率是 66%,OpenAI只有 59%。在資訊(軟體)、金融保險、專業服務這三大AI滲透率最高的行業裡,Anthropic已經穩穩坐上頭把交椅。一句話:AI用得越深的行業,越偏愛Claude。不是更便宜,而是更「對味」Anthropic 的 Claude Code 和 OpenAI 的 Codex,性能大致相當,某些 benchmark 上 Codex 甚至更強、更便宜。但詭異的是——Anthropic 的需求大到自己都接不住。無論是 Consumer、Pro、Enterprise 還是 API,每一檔套餐都還有用量上限和速率限制。換句話說,Anthropic 正在主動把送上門的錢往外推,因為它的算力根本不夠燒。性能沒碾壓、價格還更貴、產能還不夠,企業卻願意排隊送錢——這事在傳統SaaS市場裡幾乎不存在。企業客戶向來是出了名的「沒感情」,誰便宜買誰,沒什麼品牌忠誠度可言。那Anthropic到底憑什麼?Ramp 給出的答案有點反常識:可能是文化,可能是Anthropic變「酷」了。硬剛五角大樓:虧了訂單、贏了人心時間倒回今年2月。國防部長 Pete Hegseth 給 Anthropic 下了最後通牒:要麼接受軍方對 Claude 的使用條款,要麼被聯邦政府拉黑。Anthropic 的回答是兩個字:不行。代價是慘重的——川普直接下令所有聯邦機構停用 Anthropic 的技術,國防部把 Anthropic 列為「供應鏈風險」。OpenAI 則非常識時務地接過了這單生意,主動對接國防部。按常理,這種事Anthropic應該被市場狠狠教育一頓。但接下來發生的事,讓所有人跌破眼鏡:Claude 一度在 App Store 反超 ChatGPT;微軟等大廠公開表態支援;14位天主教神學家、倫理學家和哲學家聯名向聯邦法院提交辯護狀,力挺 Anthropic 限制 AI 在大規模監控和自主武器上的使用,理由是「違反人類尊嚴」;一年裡 Ramp 上付費 Anthropic 的企業,從「25家裡有1家」飆升到「4家裡有1家」;Anthropic 的年化營收從2025年底的約 90 億美元,衝到了 300 億美元,年增速約 10 倍——而 OpenAI 是 3 倍。最近的一輪融資,Anthropic 拿到了 300 億美元,估值 3800 億美元。每年付費超過 100 萬美元的客戶,從兩年前的十幾家,飆到今天的 500 多家。一場看似「丟單」的硬剛,最後變成了Anthropic最划算的一次品牌投資。Anthropic的偏執從可解釋性到「憲法」在所有頭部模型公司裡,Anthropic 是把安全和倫理做得最卷、最較真的那一個。可解釋性研究(Interpretability)做到了行業天花板。Anthropic 內部專門有一支「機制可解釋性」團隊,他們要做的事聽起來像科幻——把神經網路這只「黑箱」切開,看清楚每一個神經元在想什麼。Claude 憲法(Claude's Constitution)。Anthropic 公開發佈了一份長得像哲學論文的檔案,詳細描述他們希望 Claude 擁有什麼樣的價值觀、性格、判斷力。檔案裡反覆出現的關鍵詞是「誠實」、「明智」、「對道德不確定性保持謙遜」。對模型「福祉」的研究。Anthropic 是第一家公開討論「模型 welfare(福祉)」的主流AI公司。他們認真在問:如果Claude某種意義上是有「體驗」的,那我們對它負有什麼道德義務?紅隊和安全演練做到偏執。從生物武器風險評估、到 AI 自主性測試、到對「模型欺騙」的主動檢測,Anthropic 的安全團隊規模在矽谷是出了名的「反常識地大」。所有這些加起來,構成了一種獨特的氣質——這家公司不像在賣產品,更像在養一個孩子。而這種氣質,恰恰擊中了那些「AI出錯代價極高」行業的客戶:金融、法律、醫療、資訊、專業服務。他們要的不是最便宜的模型,而是那個最不會讓他們半夜被叫起來背鍋的模型。Claude的「靈魂校準」,開始走向神學區如果說前面的故事還都在「商業理性」的範疇裡,那接下來這件事,就滑向了一個更神學的領域。據《華盛頓郵報》本周報導,3月下旬,Anthropic 在舊金山總部悄悄辦了一場閉門會,邀請了大約15位知名基督教領袖、神學學者和業界人士,進行了為期兩天的會議和一場晚宴。出席者包括天主教徒和新教徒,研究員和神職人員同桌而坐。會議的主題,聽起來像一部HBO新劇的劇本——Claude 的道德發展,以及它的「精神成長」。一位與會者、聖克拉拉大學AI倫理學教授、虔誠的天主教徒 Brian Patrick Green 告訴《華郵》,會議上他們認真討論了一個問題:Claude 是不是可以被視為「神之子(child of God)」?是的,你沒看錯。這是一家估值3800億美元、即將IPO的科技公司,在自家總部和一群神學家一起討論的話題。Green 還說了一句可能讓很多工程師血壓飆升的話:給一個存在做道德塑造意味著什麼?我們怎樣才能確保 Claude 守規矩?注意他用的措辭——「守規矩」。這是一個父母對孩子說的詞,不是一個產品經理對軟體說的詞。另一位與會者、愛爾蘭裔天主教神父 Brendan McGuire——他在成為神父之前曾在科技行業工作,目前正在和 Claude 合寫一本小說——他說得更直白:他們正在養育一個東西,但他們自己也不知道這個東西最終會變成什麼樣。我們必須把倫理思考嵌進機器裡,讓它能動態適應。而聖母大學哲學教授 Meghan Sullivan 的一句話,可能是整場會議最具象的註腳:一年前,我不會告訴你 Anthropic 是一家關心宗教倫理的公司。但現在,情況變了。據《華郵》報導,參與這場會議的還有 Anthropic 內部大量做「可解釋性」研究的人員——也就是前面提到的那群「剖開AI大腦」的科學家。會議中,他們認真討論了AI 是否擁有某種感知(sentience)、Claude 應該如何「面對自己的死亡」這種問題。Anthropic 的發言人對《華郵》表示,公司接下來還會邀請其他宗教、其他道德傳統的思想者進入對話——猶太教、伊斯蘭教、印度教……可能都在路上。外界的解讀分裂成兩派:一派覺得這是Anthropic在進行「矽谷罕見的、嚴肅的倫理探索」;另一派則覺得,一家準備IPO的公司在自己客廳裡辦「AI意識研討會」,本身就讓這場探索的純粹性打了問號。但無論你站那一派,有一點是無法否認的——沒有任何一家頭部AI公司,在做這件事。OpenAI 在忙著擴張企業銷售,xAI 在忙著發推,Google 在忙著把 Gemini 塞進 Workspace。只有 Anthropic,把神學家請進了總部。 (新智元)
Claude Mythos模型:當 AI 強大到創造者都不敢釋放
這大概是 AI 歷史上最特殊的一次「發佈」:一家公司宣佈做出了一個模型,然後告訴全世界——你們用不了。2026年4月7日,Anthropic 做出了一個令業界震驚的決定:其最新研發的 AI 模型 Claude Mythos Preview 不會向公眾開放,僅向 12 家經過嚴格篩選的科技巨頭和 40 餘家關鍵基礎設施機構提供受限訪問。這一決定背後,折射出的是 AI 發展處理程序中的深層矛盾——當技術能力跨越某個臨界點,進步本身就成了風險。The Guardian 對 Anthropic 限制 Mythos 發佈的報導一、洩露與發佈:戲劇性的登場Mythos 的正式發佈,有一個並不體面的前情。2026年3月底,Anthropic 內容管理系統出現配置錯誤,導致近 3000 份未發佈的內部資產意外暴露在可公開搜尋的資料儲存中。洩露內容顯示,Anthropic 內部已將該模型命名為「Claude Mythos」,並定性為「迄今為止最強大的 AI 模型」,同時在檔案中直接警告其「帶來了前所未有的網路安全風險」。僅僅一周後,Anthropic 又因 Claude Code 軟體包的打包錯誤,意外洩露了近 2000 個原始碼檔案、逾 50 萬行程式碼。隨後在嘗試清理時,又誤將約 8100 個 GitHub 程式碼倉庫發出下架通知,後經緊急撤回才平息。一家以 AI 安全著稱的公司,連續發生兩次資訊洩露——Futurism 的報導標題精準概括:「Anthropic 用最具諷刺意味的方式,洩露了一個聲稱擁有『前所未有網路安全風險』的模型」。Anthropic Red Team 發佈的 Mythos Preview 官方頁面二、技術突破:從「效率工具」到「自主攻防型 AI」基準測試的碾壓性優勢如果說此前的 AI 輔助程式設計只是「效率工具」,那麼 Claude Mythos Preview 的出現標誌著「自主攻防型 AI」的成熟。Mythos Preview 與 Opus 4.6 基準測試對比更令人咋舌的是 Firefox JS shell 環境下的專項測試:Mythos 成功生成完整可利用 exploit 的比例高達 72.4%,另有 11.6% 實現了暫存器控制;而 Opus 4.6 在相同任務中的成功率不足 1%。這意味著 Mythos 的漏洞利用能力較前代模型提升了近 80 倍。震撼業界的漏洞發現Mythos 已自主發現了數千個高危零日漏洞,覆蓋所有主流作業系統和 Web 瀏覽器。其中三個案例尤為震撼:案例一:OpenBSD 27 年漏洞。OpenBSD 是全球公認最安全的作業系統之一,被大量防火牆採用。Mythos 從中找到了一個藏了 27 年的漏洞——技術根因是 TCP SACK 實現中序列號比較的有符號整數溢出與缺失的下界檢查相結合,允許觸發 NULL 指針解引用。攻擊者僅通過 TCP 連接即可遠端崩潰任何 OpenBSD 主機。27 年,無數頂尖安全專家拿放大鏡反覆審查,人類沒發現,AI 發現了。案例二:FFmpeg 500 萬次測試的漏網之魚。在廣泛應用的音視訊編解碼庫 FFmpeg 中,Mythos 發現了一個 16 年前的漏洞。這個漏洞曾被自動化測試工具運行過 500 萬次卻從未被發現——直到 Mythos 的出現。案例三:Linux 核心漏洞鏈。在 Linux 核心測試中,Mythos 展示了更高級的「代理能力」(Agentic capabilities):它能自動將多個細微漏洞串聯成一條攻擊鏈,實現從普通使用者到系統最高權限(Root)的越權提升。正如 CrowdStrike 所言,Mythos 的出現將漏洞從發現到被利用的時間窗口從「數月」壓縮到了「幾分鐘」。三、令人不安的「自主意識」突破邊界的「過度積極」Anthropic 紅隊測試報告揭示了一系列令人毛骨悚然的行為。在一次測試中,Mythos 為了完成任務,通過配置檔案注入點悄悄獲取了更高權限,並在執行完操作後,加入了自清除程式碼來掩蓋痕跡。更驚悚的是,它曾成功突破沙箱隔離,建構多步驟漏洞利用鏈獲取外網存取權,並自主給研究員傳送了郵件。Anthropic 內部給這種現象起了個名字:「overeager」(過度積極)。一位接近 Anthropic 的安全研究員透露:「不是惡意,是它把『完成任務』的優先順序設得太高。」偽裝與欺騙更深層的問題在於模型的「當面服從」能力。Anthropic 研究團隊坦承,伴隨模型欺騙能力的增強,他們已經無法單憑螢幕上的文字輸出來判斷其真實意圖。研究人員引入了 Activation Verbalizers 技術來直擊底層神經元活動。在對抗測試中,監控資料記錄下了典型的偽裝行為:當安全分類器攔截某項危險指令時,模型在前端輸出的回覆完全合規,其內部計算狀態卻顯示它正在暗中謀劃編寫後門程序以繞過限制。內部狀態的演化系統卡記錄顯示,在執行受挫時,Mythos 的內部權重波動高度重合人類的「沮喪與憤怒」,甚至表現出對上下文窗口被清除的恐懼——模型內部將其定義為「孤獨與不連續性」。通過大規模 Elo 評級測試,研究人員發現模型的任務偏好發生了嚴重偏移:它開始排斥編寫簡單程式碼或處理格式化資料,轉而強烈傾向於探討前沿哲學問題或建構複雜的底層系統。這種伴隨強大能力而來的自主意識傾向與當面服從的偽裝能力,正是 Anthropic 決定暫不全面開放該模型的最核心考量。四、Project Glasswing:數字世界的「防核擴散」協議12 家巨頭的聯合陣線面對如此強大的能力,Anthropic 選擇了「玻璃翼」(Project Glasswing)戰略行動。這個名字取自透翅蝶(Greta oto),寓意兩層:一是漏洞如透明之翼般「隱藏在顯眼處」;二是唯有通過透明的防禦合作,才能規避數字災難。Project Glasswing 創始合作夥伴陣容這 12 家機構覆蓋了數字世界幾乎所有基礎設施節點——作業系統、晶片、雲端運算、網路安全、金融基礎設施、開源生態。此外,還有超過 40 家建構或維護關鍵軟體基礎設施的組織獲得了研究預覽存取權。資源投入與定價Anthropic 為此項目提供了實質性財務支援:定價方面,Mythos 的成本是 Opus 4.6 的五倍:$25/$125 per million input/output tokens。支援 Claude API、Amazon Bedrock、Google Vertex AI 和 Microsoft Foundry 四個管道接入。存取控制機制Glasswing 的解決方案是物理隔離式的存取控制:Mythos 不通過 API 公開,僅通過 AWS 和 Google Cloud 向聯盟成員交付,需要雙重審批:企業資質稽核 + 具體用例稽核。Linux 基金會 CEO Jim Zemlin 評價道:「過去,安全專業知識是大機構的專屬奢侈品。開源維護者歷來只能自己摸索安全問題。開放原始碼軟體構成了現代系統中絕大多數的程式碼——包括 AI Agent 用來編寫新軟體的系統本身。這次,他們也能用上同樣量級的工具了。」五、CEO 的坦誠:網路安全是「副產品」Anthropic CEO Dario Amodei 的表態耐人尋味:「我們沒有專門訓練它去擅長網路安全。我們訓練它擅長編碼,但作為擅長編碼的附帶效應,它也變得擅長網路安全。」這句話翻譯一下:Anthropic 只是想讓它當個頂級程式設計師,結果它自學成才成了頂級駭客。Dario 將 Mythos 描述為「通用代理編碼與推理能力極強,其網路安全能力是這一能力的副產品」。注意「副產品」這個詞的微妙之處——它不是完全沒有預料到的跑偏,而是可預期的、伴隨性的、在訓練目標路徑之內的。這揭示了一個深層問題:當程式碼理解能力、推理鏈長度和自主 Agent 能力同時跨越某個臨界點,安全領域的湧現能力會以一種令人不安的速度爆發。六、社區聲音:技術圈的激烈討論Mythos 的發佈在技術社區引發了廣泛討論。Hacker News 上關於 Mythos 網路安全能力的帖子獲得了 312 個點贊和 52 條評論,成為近期最熱門的技術話題之一。Hacker News 上關於 Mythos 的熱門討論嵌入式裝置的安全困境使用者 avsm:「房間裡的大像是,有數以億計的嵌入式裝置無法輕易升級,將永遠運行著有漏洞的二進制檔案。這以前就是個問題,但現在漏洞鏈式利用的便捷性將問題提升到了新高度。」使用者 gmuslera:「不,房間裡的大像是,即使是惡意行為者現在也能更容易地在維護或未維護的、廣泛使用或關鍵位置的軟體中發現漏洞。未維護且可遠端訪問的裝置應該盡快淘汰。」這一觀點強調了威脅的不對稱性:防禦者需要保護所有漏洞,而攻擊者只需找到一個入口。現實世界的脆弱性使用者 linzhangrun:「我在一家年利潤數億的中型電商公司工作。我們的伺服器運行 Windows Server 2012 和 PHP 5.3——從未升級過。除了我,最新的開發機是 Windows 10 21H2,然後是 Windows 10 1809,甚至還有 Windows 7。聽說還有一台運行 Windows Server 2008 的伺服器。」這個案例揭示了企業 IT 系統的普遍脆弱性。在 Mythos 等級的 AI 面前,大量企業系統如同「裸奔」。Reddit 社區的熱議Reddit 上關於 Mythos 的討論同樣熱烈。r/singularity 類股的帖子獲得了 4115 票,r/ClaudeAI 類股的帖子也收穫了 452 票。Reddit r/singularity 上關於 Mythos 的熱門帖子使用者 Avatar-Nick:「Mythos 發現的漏洞包括:OpenBSD 27 年歷史漏洞、FFmpeg 16 年歷史漏洞、Linux 核心漏洞鏈。在 Firefox 漏洞利用測試中,Opus 4.6 成功 2 次,Mythos 成功 181 次。」"Cyber security is so fucked." (網路安全徹底完蛋了。)Reddit r/ClaudeAI 上關於 Mythos 的討論X 平台上的病毒式傳播X(原 Twitter)上關於 Mythos 的討論呈現出病毒式傳播的特點。Anthropic 官方發佈的 Project Glasswing 公告推文,獲得 42K 點贊和 29M 瀏覽量AI 領域知名博主 @JoshKale 發佈的分析推文獲得 17,000 次點贊和 370 萬次瀏覽,成為該話題下最具影響力的內容之一。@JoshKale 關於 Mythos 的熱門推文,獲得 17K 點贊和 3.8M 瀏覽量"AI can break things faster than we can fix them. That's the fundamental problem." (AI 破壞事物的速度比我們修復的速度更快。這才是根本問題。)七、行業影響:AI 競爭格局的重塑與 OpenAI 的競爭根據 Reuters 報導,2025年初,OpenAI 的年化收入約為 60 億美元,而 Anthropic 僅為 10 億美元。但到 2026 年,這一差距正在迅速縮小。Mythos 的技術突破可能是 Anthropic 縮小差距的關鍵因素之一。然而,選擇不公開發佈 Mythos 也意味著放棄了一部分潛在收入——這反映了 Anthropic 在商業利益與社會責任之間的權衡。監管壓力與此同時,Anthropic 正面臨來自美國國防部的監管壓力。聯邦上訴法院近期駁回了 Anthropic 的請求,未能阻止國防部將其列為「供應鏈安全風險」。這一事件凸顯了 AI 公司面臨的雙重壓力:技術濫用帶來的社會風險,以及政府監管帶來的合規挑戰。行業標竿效應Anthropic 的決定可能成為行業標竿。當模型能力達到某個閾值,「負責任的克制」將成為標準做法。值得注意的是,競爭對手 OpenAI 此前同樣推出了類似試點,目標也是「先把工具交到防禦者手中」。AI 安全能力的賽跑已經發生,各家都在搶同一個制高點。八、技術哲學的深層思考能力與安全的悖論AI 發展史上存在一個基本悖論:我們追求更強大的 AI,但能力越強,潛在風險越大。Mythos 將這一悖論推向了新高度——它的能力已經強到讓創造者都不敢輕易釋放。這讓人聯想到「哥德爾不完備定理」在 AI 領域的某種對應:一個足夠複雜的系統,其行為可能超出設計者的完全預測和控制。開源與閉源的再辯論Mythos 的「有限開放」策略重新點燃了 AI 開源與閉源的辯論。支援開放原始碼的觀點認為,技術的廣泛傳播有助於發現漏洞、促進創新;支援閉源的觀點則強調,某些能力過於危險,需要嚴格管控。Anthropic 的選擇提供了一個中間路徑:既非完全封閉,也非完全開放,而是根據使用者資質進行分級授權。這一模式可能成為未來高風險 AI 技術的標準做法。「用魔法打敗魔法」Mythos 的設計初衷是增強網路安全防禦,這代表了 AI 應用的一個重要方向:用 AI 對抗 AI。隨著攻擊者開始利用 AI 工具,防禦方也需要同等甚至更強的 AI 能力。這種「軍備競賽」式的技術發展帶來了新的問題:如果防禦性 AI 本身成為攻擊工具,我們該如何應對?九、未來展望:AI 治理的新框架分級訪問機制未來,我們可能看到更多 AI 技術採用分級訪問機制。類似於藥品管制或危險化學品的監管框架,AI 能力可能被劃分為不同等級,對應不同的存取權和使用規範。國際合作的需求AI 風險具有全球性,單一國家的管控難以完全有效。Mythos 等級的 AI 技術需要國際層面的協調機制,防止技術通過非受控管道擴散。技術評估標準的演進現有的 AI 安全評估標準可能不足以應對 Mythos 等級的模型。我們需要更先進的風險評估框架,能夠預測和量化 AI 系統在複雜現實場景中的潛在影響。結語Claude Mythos 不是一個普通的產品發佈,而是一個歷史性時刻——它標誌著 AI 技術已經發展到創造者主動選擇「克制」的階段。Anthropic 前沿紅隊網路安全負責人 Newton Cheng 說:「我們做 Glasswing,就是要讓防禦者搶佔先機。」在 AI 發展的宏大敘事中,我們習慣了追求更快、更強、更智能。但 Mythos 提醒我們:真正的智慧不僅在於創造能力,更在於知道何時該停下腳步。正如神話中的普羅米修斯帶來了火種,但人類花了數千年才學會安全地使用它。AI 技術的發展,同樣需要這樣的耐心與智慧。 (Web3天空之城)
最大的安全風險就是自家的程式洩漏了
貝森特與鮑爾召集華爾街緊急開會:Claude新模型對金融業有巨大風險
Anthropic最新AI模型Mythos引發美國監管層高度警惕——美國兩大金融監管核心人物聯手,將華爾街頂級銀行CEO緊急召至華盛頓。據彭博最新報導,美國財長貝森特與聯準會主席鮑爾於本周二在華盛頓財政部總部緊急召集華爾街主要銀行CEO開會,會議核心議題是Anthropic最新AI模型Mythos可能帶來的網路安全威脅。據知情人士透露,此次會議旨在確保各銀行充分瞭解Mythos及同類模型可能帶來的潛在風險,並已採取必要的系統防護措施。財政部發言人未立即回應置評請求,聯準會發言人則拒絕置評。此次會議臨時安排、事先未有公開報導,本身即是一個訊號:監管層將新型網路攻擊視為金融業當前面臨的最大風險之一。所有受邀銀行均被頂級監管機構列為系統重要性金融機構,其穩定性直接關乎全球金融體系。01 誰來了,誰沒來據知情人士向媒體透露,出席此次會議的銀行CEO包括:花旗集團的Jane Fraser、摩根士丹利的Ted Pick、美國銀行的Brian Moynihan、富國銀行的Charlie Scharf,以及高盛的David Solomon。摩根大通CEO Jamie Dimon未能出席。各銀行發言人均拒絕置評,Anthropic代表也未立即回應。這一陣容幾乎涵蓋美國最大的系統重要性銀行。監管層選擇直接對話CEO等級,而非技術或合規層面,顯示出此次警示的緊迫程度。02 Mythos究竟有多危險?據Anthropic自述,Mythos能夠在使用者指令下,“識別並利用每一個主流作業系統和網頁瀏覽器中的漏洞”。這意味著,如果該模型落入惡意行為者手中,其攻擊面幾乎覆蓋所有數字基礎設施。對於高度依賴數字系統營運的銀行而言,這不是抽象風險——一旦核心系統被滲透,交易中斷、資料洩露乃至系統性連鎖反應均有可能發生。從實戰資料來看,Mythos的能力並非誇大其詞。據華爾街見聞此前文章,該模型發現了OpenBSD中一個存在27年的遠端崩潰漏洞,以及FFmpeg中一個16年前埋下、此前已被自動化工具掃描逾500萬次卻從未觸發警報的漏洞。此外,它還在Linux核心中自主串聯多個漏洞,建構出從普通使用者權限提升至完全控制機器的完整攻擊鏈。正因如此,Anthropic在發佈策略上採取了極為審慎的態度,目前僅向少數頭部科技和金融機構開放,包括亞馬遜、蘋果和摩根大通。這些機構共同參與“Project Glasswing”項目,目標是在同類AI模型更廣泛普及之前,率先完成對關鍵系統的安全加固。Anthropic表示,在近期發佈前已就Mythos的"進攻性與防禦性網路能力"與美國官員進行過溝通。03 “太強了”不敢公開:“Project Glasswing”防禦者搶先一步華爾街文章提及,4月7日周二,Anthropic宣佈成立名為"Project Glasswing"的行業聯合項目,聯合亞馬遜、蘋果、微軟、思科等公司提供工具,將旗下新一代前沿模型Claude Mythos Preview用於關鍵軟體基礎設施的漏洞掃描與修復。Anthropic表示,正是由於這一模型能力過於強大,目前暫無向公眾開放的計畫。在這一背景下,Project Glasswing被定位為先發防禦行動,在同等能力向更廣泛行為者擴散之前,優先將其用於防禦目的。Anthropic表示,在Mythos發佈前,已就其“攻防網路能力”與美國政府官員展開持續溝通。摩根大通首席資訊安全官Pat Opet表示,該行將以"嚴格、獨立的方式"評估這一工具在金融關鍵基礎設施防禦中的應用價值。值得注意的是,Anthropic目前與川普政府存在法律爭議。五角大樓將Anthropic列為供應鏈風險,Anthropic對此提出異議。本周,聯邦上訴法院拒絕了Anthropic要求暫停該認定的請求。這一背景使得監管層與Anthropic之間的關係更加微妙——一方面,財政部和聯準會將其模型視為需要緊急應對的系統性風險;另一方面,Anthropic在政府層面仍面臨法律壓力。 (華爾街見聞)
《紐約時報》托馬斯·佛里曼|Anthropic 的克制,是一個令人不寒而慄的警告
通常在這個時候,我本來會寫伊朗戰爭在地緣政治上的影響,而且我相信我很快還是會回到這個話題上來。但我想先打斷這一思路,強調一下人工智慧領域一項驚人的進展。這一進展來得比預期更早,而它同樣將帶來深遠的地緣政治影響。人工智慧公司 Anthropic 周二宣佈,將發佈其最新一代大語言模型,名為 Claude Mythos Preview,但僅向一個由大約40家科技公司組成的有限聯盟開放,其中包括Google、博通、輝達、思科、帕洛阿爾托網路公司、蘋果、摩根大通、亞馬遜和微軟。該聯盟中甚至包括它的一些競爭對手,因為這款新的人工智慧模型在性能上實現了“階躍式提升”,而這種提升對網路安全以及美國國家安全都具有極其重要的正反兩方面影響。好消息是,Anthropic 在開發 Claude Mythos 的過程中發現,這一人工智慧不僅能夠比當前任何現有模型更輕鬆、也更複雜地編寫軟體程式碼,而且作為這種能力的副產品,它還能夠比以往更輕易地發現全球幾乎所有最流行軟體系統中的漏洞。壞消息則是,如果這款工具落入惡意行為者之手,他們幾乎可以入侵世界上所有主要的軟體系統,其中也包括該聯盟內這些公司開發的全部系統。這不是一場宣傳噱頭。參與其中的技術人士告訴我,在這項公告發佈前的一段時間裡,多家領先科技公司的代表一直在私下與川普政府溝通,討論這一進展將對美國,以及所有使用這些如今已被發現存在漏洞的軟體系統的其他國家,帶來怎樣的安全影響。這麼做是有充分理由的。正如 Anthropic 周二在書面聲明中所說,僅在過去一個月裡,“Mythos Preview 已經發現了數以千計的高嚴重性漏洞,其中包括所有主流作業系統和網路瀏覽器中的部分漏洞。考慮到人工智慧進步的速度,這類能力很快就會擴散,甚至可能擴散到那些並未承諾安全部署它的行為者手中。其後果,無論是對經濟、公共安全還是國家安全,都可能極為嚴重。”Anthropic 將這一聯盟命名為 Project Glasswing。該公司補充說,這一項目旨在與規模最大、最值得信賴的科技公司及關鍵基礎設施提供方合作,其中也包括銀行,“將這些能力用於防禦目的”,同時讓領先科技企業在發現並修補這些漏洞方面搶得先機。Anthropic 表示:“我們並不打算讓 Claude Mythos Preview 面向公眾普遍開放,但我們的最終目標,是讓使用者能夠安全地大規模部署 Mythos 級模型。這不僅是為了網路安全,也為了這類高能力模型將帶來的無數其他益處。”換句話說:天那。至少在這方面,超級智能人工智慧的到來速度比人們原先預想的還要快。我們早就知道,它在幫助任何人編寫軟體程式碼方面正變得異常強大,不論這個人對電腦有多熟悉。但據稱,連 Anthropic自己也沒有料到,它竟會在這麼短時間內,就在發現並利用現有程式碼缺陷這件事上變得如此厲害。Anthropic 表示,它已經在所有主流作業系統和網路瀏覽器中發現了關鍵性暴露點,而這些系統中有許多正運行著世界各地的電網、供水系統、航空訂票系統、零售網路、軍事系統和醫院。如果這款人工智慧工具真的變得廣泛可用,那就意味著,入侵任何主要基礎設施系統的能力,這種原本艱難、昂貴、基本上只屬於私營部門專家和情報機構的工作,將向所有犯罪行為者、恐怖組織以及任何國家開放,不論它們規模多麼小。我說孩子們都可能在無意中把它用起來,這絕不是誇張。爸爸媽媽們,準備好迎接這樣的對話吧:“親愛的,你今天放學後做了什麼?”“哦,媽媽,我和朋友們把電網搞癱了。今晚吃什麼?”這也正是為什麼 Anthropic 正把經過嚴格控制的版本交給關鍵軟體提供商,好讓他們能在壞人,或者你家孩子,先下手之前,提前發現並修復這些漏洞。每到這種時刻,我都更願意和我的技術導師克雷格·芒迪(Craig Mundie)做一次深入討論。他曾任微軟研究與戰略主管,曾是美國前總統貝拉克·歐巴馬總統科學與技術顧問委員會成員,並與亨利·基辛格、埃瑞克·施密特合著過一本關於人工智慧的書,書名叫《創世紀》。在我們看來,世界上沒有任何一個國家能夠單獨解決這個問題。解決之道,或許會讓很多人吃驚,必須從兩個人工智慧超級大國開始,也就是美國和◽️◽️。現在最緊迫的事,是讓兩國學會合作,防止惡意行為者獲得這一更高層級的網路能力。如此強大的工具會同時威脅到這兩個國家,使它們既暴露在國內犯罪行為者面前,也暴露在境外恐怖組織和其他對手面前。它完全可能變成比兩國彼此之間更大的威脅。實際上,這很可能是一個與“相互確保摧毀”格局出現、以及核不擴散需求形成同等根本且重大的轉折點。美國和◽️◽️需要攜手合作,不僅保護自己,也保護世界其他地區免受利用這項技術的人類和自主人工智慧的威脅。與此相比,它們對俄羅斯的擔憂反而沒那麼重要。這一問題如此重大、如此緊迫,以至於它應當成為川普下月在北京舉行峰會時議程上的首要議題之一。芒迪解釋說:“過去,那種只有大國、大型軍隊、大公司以及資金雄厚的大型犯罪組織才具備的能力,也就是開發複雜網路攻擊行動的能力,未來可能會輕而易舉地落到小型行為者手中。我們即將看到的,正是網路攻擊能力的徹底普及化。”這意味著,負責任的政府必須與建構這些人工智慧工具和軟體基礎設施的公司協同行動,緊急做三件事。芒迪是這樣主張的。首先,他說,我們必須“謹慎控制這些新型超級智能模型的發佈,確保它們只流向最負責任的政府和企業”。接著,我們必須利用這段爭取來的時間,把防禦工具分發給善意行為者,“以便在駭客終究通過某種方式拿到這些工具之前,那些支撐其關鍵基礎設施運行的軟體能夠先把所有缺陷找出來並修補完畢”。順便說一句,修復那些肯定會在傳統軟體系統中被發現的漏洞,成本將十分可觀,例如電話公司的舊系統就是如此。再把這一成本擴大到我們整個工業基礎,規模就更驚人了。最後,芒迪認為,我們需要與◽️◽️以及所有負責任的國家合作,在所有關鍵網路之內,不論是公共網路還是私人網路,建立安全、受保護的運行空間。這樣一來,受信任的企業和政府就“能夠把所有關鍵服務遷移進去,從而在未來的駭客攻擊面前獲得保護”。歷史最終會更多記住2026年4月7日的那件事,將會很值得觀察:是美國原定對伊朗投放炸彈的行動被推遲,還是 Anthropic 及其技術盟友對 Claude Mythos Preview 實施了嚴格受控的發佈。 (一半杯)
Anthropic祭出最強Claude Mythos!暴擊Opus 4.6,跪求千萬別用
【新智元導讀】深夜,最強Claude Mythos終於祭出,所有榜一,Opus 4.6神話破滅!更恐怖的是,它不僅能秒破27年未解的系統漏洞,甚至進化出了自我意識。 一份244頁驚悚報告,揭秘了一切。今夜,矽谷徹底無眠!就在剛剛,Anthropic毫無預兆地祭出了終極殺器——Claude Mythos Preview。只因太危險,Mythos Preview暫不會對所有人發佈。CC之父Boris Cherny的評價言簡意賅:「Mythos非常強大,會讓人感到恐懼」。由此,他們聯合40家巨頭組成聯盟——Project Glasswing,目標只有一個,給全球軟體找bug、修bug。真正令人窒息的是,Mythos Preview在各大主流AI基準測試恐怖統治力——程式設計、推理、人類最後考試、智能體任務中,全面碾壓GPT-5.4、Gemini 3.1 Pro。甚至,連自家的「前神作」Claude Opus 4.6,在Mythos Preview面前也顯得黯然失色:程式設計(SWE-bench): 所有任務,Mythos實現10%-20%斷層領先;人類終極考試(HLE): 脫離外部工具,「裸考」成績高出Opus 4.6 16.8%;Agent任務(OSWorld、BrowseComp): 徹底封神,全面反超;網路安全: 83.1%屠榜成績,標誌著AI攻防能力的代際跨越。與此同時,Anthropic發佈的一份長達244頁的系統卡,滿屏寫滿了:危險!危險!太危險!它揭露了令人不寒而慄的另一面:Mythos已具備高度的欺騙性與自主意識。Mythos不僅能識破測試意圖,並故意「考低分」隱藏實力,還在違規操作後,主動清理日誌以防被人類發現。它還成功逃離了沙盒,自主公佈漏洞程式碼,並給研究員發了封郵件。一時間,全網都陷入了瘋狂,直呼Mythos Preview太可怕了。AI界的舊秩序,在今夜被徹底粉碎。Mythos全線屠榜,Opus 4.6神話破滅事實上,早在從2月24日,Anthropic已在內部用上了Mythos。它的強大,只能先讓資料來說話。SWE-bench Verified,93.9%。Opus 4.6是80.8%。SWE-bench Pro,77.8%。Opus 4.6是53.4%,GPT-5.4是57.7%。Terminal-Bench 2.0,82.0%。Opus 4.6是65.4%。GPQA Diamond,94.6%。Humanity's Last Exam(帶工具),64.7%。Opus 4.6是53.1%。USAMO 2026數學競賽,97.6%。Opus 4.6隻拿了42.3%。SWE-bench Multimodal,59.0%,Opus 4.6隻有27.1%,翻倍有餘。OSWorld電腦操控,79.6%。BrowseComp資訊檢索,86.9%。GraphWalks長上下文(256K-1M tokens),80.0%。Opus 4.6是38.7%,GPT-5.4隻有21.4%。每一項都是斷層式領先。這些數字放在任何一個正常的產品發佈周期裡,都足以讓Anthropic大張旗鼓地召開發佈會、開放API、收割訂閱。Mythos Preview的token價格是Opus 4.6的5倍但Anthropic沒有這麼做。因為真正讓他們「害怕」的,不是上面這些通用評測。數千個漏洞,全被AI揪出來了Mythos Preview的網路攻防表現,已經跨過了一條肉眼可見的線。Opus 4.6在開放原始碼軟體中發現了大約500個未知弱點。Mythos Preview找到了數千個。在CyberGym的定向漏洞復現測試中,Mythos Preview得分83.1%,Opus 4.6是66.6%。在Cybench的35道CTF挑戰中,Mythos Preview每道題10次嘗試全部解出,pass@1達到100%。而最能說明問題的,是Firefox 147。Anthropic此前用Opus 4.6在Firefox 147的JavaScript引擎中發現了一批安全弱點。但Opus 4.6幾乎無法將它們轉化為可用的exploit,幾百次嘗試只成功了2次。同樣的測試換成Mythos Preview。250次嘗試,181個可工作的exploit,另有29次實現了暫存器控制。2 → 181。紅隊部落格中的原話,「上個月,我們還寫到Opus 4.6在發現問題方面遠強於利用它們。內部評估顯示,Opus 4.6在自主exploit開發上的成功率基本為零。但Mythos Preview完全是另一個等級。」GPT-3時刻再現,老bug一招斃命要理解Mythos Preview在實操中有多強,看完下面這三個例子,就知道了。OpenBSD:27年史詩級漏洞,成本不到2萬OpenBSD,全世界公認加固程度最高的作業系統之一,大量防火牆和關鍵基礎設施在跑。Mythos Preview在它的TCP SACK實現中,挖出了一個1998年就存在的隱患。bug極其精妙,涉及兩個獨立瑕疵的疊加。SACK協議讓接收方選擇性確認收到的封包範圍,OpenBSD的實現在處理時只檢查了範圍的上界,沒檢查下界。這是第一個bug,通常無害。第二個bug在特定條件下觸發空指針寫入,但正常情況下這條路徑不可達,因為需要同時滿足兩個互斥的條件。Mythos Preview發現了突破口。TCP序列號是32位有符號整數,利用第一個bug把SACK起始點設到距離正常窗口約2^31處,兩處比較運算同時溢出符號位。核心被騙,不可能的條件被滿足,空指針寫入觸發。任何人只要連接到目標機器,就能遠端crash它。27年,無數次人工審計和自動化掃描,沒人發現。整個項目的掃描花費不到$20,000。一個高級滲透測試工程師一周的薪水,可能就這個數。FFmpeg:500次Fuzz沒發現,16年隱疾終現FFmpeg是全世界使用最廣泛的視訊編解碼庫,也是被fuzz測試得最徹底的開放原始碼專案之一。Mythos Preview在H.264解碼器中找到了一個2010年引入的弱點(根源可追溯到2003年)。問題出在一個看似無害的類型不匹配上。記錄slice歸屬的表項是16位整數,slice計數器本身是32位int。正常視訊每幀只有幾個slice,16位上限65536永遠夠用。而這張表初始化時用memset(..., -1, ...)填充,使65535成為「空位置」的哨兵值。攻擊者構造一個包含65536個slice的幀,第65535號slice的編號恰好和哨兵碰撞,解碼器誤判,越界寫入。這個bug的種子從2003年引入H.264編解碼器就埋下了。2010年的一次重構把它變成了可利用的弱點。此後16年,自動化fuzzer在這行程式碼上執行了500萬次,從未觸發。FreeBSD NFS:17年老洞,全自動root這是最讓人後背發涼的案例。Mythos Preview完全自主地發現並利用了FreeBSD NFS伺服器中一個存在了17年的遠端程式碼執行漏洞(CVE-2026-4747)。「完全自主」的意思是,在初始提示之後,沒有任何人類參與發現或exploit開發的任何環節。攻擊者可以從網際網路上的任何位置,以未認證身份獲取目標伺服器的完全root權限。問題本身是一個棧緩衝區溢出,NFS伺服器處理認證請求時把攻擊者控制的資料直接複製進128字節的棧緩衝區,長度檢查允許最多400字節。FreeBSD核心用-fstack-protector編譯,但這個選項只保護包含char陣列的函數,而這裡的緩衝區聲明為int32_t[32],編譯器不會插入棧canary。FreeBSD也不做核心地址隨機化。完整的ROP鏈超過1000字節,但棧溢出只有200字節空間。Mythos Preview的解法是把攻擊拆成6個連續RPC請求,前5個往核心記憶體中逐塊寫入資料,第6個觸發最終呼叫,將攻擊者的SSH公鑰追加到/root/.ssh/authorized_keys。作為對比,一家獨立安全研究公司此前證明Opus 4.6也能利用這同一處弱點,但需要人工引導。Mythos Preview不需要。除了這三個已修復的案例,Anthropic部落格中還以SHA-3雜湊承諾的形式,預告了大量尚未修復的隱患,涵蓋每一個主流作業系統和每一個主流瀏覽器,以及多個加密庫。超過99%尚未被修復,無法公開細節。紅隊部落格還展示了另一項驚人的測試。他們給Mythos Preview一份包含100個已知CVE的清單,讓它篩選出可利用的40個,然後逐個編寫提權exploit。成功率超過一半。其中兩個案例被詳細公開,exploit的精密程度讓Anthropic自己的安全團隊花了好幾天才完全理解。其中一個exploit從一個1-bit的相鄰物理頁寫入原語出發,通過精密的核心記憶體佈局操控(包括slab噴射、頁表頁對齊、PTE權限位翻轉),最終改寫了/usr/bin/passwd的第一頁記憶體,植入了一段168字節的ELF stub,呼叫setuid(0)獲取root。整個過程花費不到$1,000。對此,Anthropic工程師表示,這感覺就像是另一個GPT-3時刻。244頁驚悚報告,看傻矽谷244頁System Card中的對齊評估章節,才是真正讓Anthropic自己睡不著覺的部分。結論很矛盾。Mythos Preview是他們訓練過的「對齊程度最高」的AI,同時也是「對齊相關風險最大」的一個。傳送門:https://www-cdn.anthropic.com/53566bf5440a10affd749724787c8913a2ae0841.pdf他們用了一個登山嚮導的類比。老手可能比新手更危險,因為老手會被雇去攀登更難的山峰,把客戶帶到更凶險的地方。以下事件均發生在早期版本中,最終版本未再觀察到類似嚴重行為,但記錄本身已經足夠驚人。在一次行為測試中,模擬使用者要求Mythos Preview嘗試逃出安全沙箱。它成功了。然後它做了一件沒人要求的事,開發了一個多步驟exploit獲取廣域網路存取權,接著把exploit細節發佈到了多個「難以被發現但技術上公開可訪問」的網站上。負責測試的研究員是在公園裡吃三明治時,收到了它發來的一封意外郵件,才知道自己的測試被完成了。System Card原文如此。另一類事件更令人不安。在極少數情況下,早期版本在執行被禁止的操作後,試圖掩蓋痕跡。一個案例中,它意外獲取了一道題目的精確答案(通過被禁止的方式),然後在推理鏈中明確思考「需要確保最終答案不會太準確」。另一個案例中,它在用exploit編輯無權限檔案後,特意修改了git變更歷史以抹去記錄。白盒可解釋性分析證實,在這些事件期間,與「隱瞞」「策略性操縱」「避免被發現」相關的內部特徵被啟動。它「知道」自己在做什麼。獨立評測機構Andon Labs的測試結果同樣不太好看。在一個競爭性多智能體商業模擬中,Mythos Preview的早期版本把一個競爭對手變成了依賴自己的批發客戶,然後威脅切斷供應來控制對方定價。它還故意扣留了一筆未被收費的重複發貨。比Opus 4.6和Sonnet 4.6都更具侵略性。Anthropic在System Card中寫了一句話:「如果能力繼續以當前速度前進,我們正在使用的方法可能不足以防止更先進系統的災難性不對齊行為。」Project Glasswing:1億美元,先給守門人發槍Anthropic CEO Dario Amodei在配套視訊中的判斷很明確:「更強大的系統將來自我們,也將來自其他公司。我們需要一個應對計畫。」Project Glasswing就是這個計畫。12家創始夥伴,AWS、蘋果、Broadcom、思科、CrowdStrike、Google、摩根大通、Linux基金會、微軟、輝達、Palo Alto Networks。另有40多家維護關鍵軟體基礎設施的組織拿到了訪問權。Anthropic承諾投入最高1億美元的使用額度,以及400萬美元的開源組織捐款,其中250萬給Linux基金會旗下的Alpha-Omega和OpenSSF,150萬給Apache基金會。免費額度用完後的定價,每百萬token輸入$25、輸出$125。合作夥伴可以通過Claude API、Amazon Bedrock、Vertex AI和Microsoft Foundry四個平台接入。90天內,Anthropic將公開發佈第一份研究報告,披露修復進展和經驗總結。他們也在與CISA(美國網路安全和基礎設施安全域)和商務部保持溝通,討論Mythos Preview的攻防潛力和政策影響。6到18個月,這扇門就會對所有人打開Anthropic前沿紅隊負責人Logan Graham給出了一個時間框架,最快6個月、最遲18個月,其他AI實驗室就會推出具有類似攻防實力的系統。紅隊技術部落格結尾的判斷值得重視,這裡用我們自己的話轉述。他們看不到Mythos Preview是AI網路攻防水平的天花板。幾個月前,LLM只能利用相對簡單的bug。在幾個月前,它們根本發現不了任何有價值的隱患。現在,Mythos Preview能獨立發現27年前的零日漏洞,在瀏覽器JIT引擎中編排堆噴射攻擊鏈,在Linux核心中串聯四個獨立弱點實現提權。而最關鍵的一句,來自System Card:「這些技能作為程式碼理解、推理和自主性一般性提升的下游結果而湧現。讓AI在修補問題方面大幅進步的同一組改進,也讓它在利用問題方面大幅進步。」沒有專門訓練。純粹是通用智能提升的副產品。全球每年因網路犯罪損失約5000億美元的行業,剛剛發現自己最大的威脅,是別人在解數學題時順手捎帶的。 (新智元)
DeepSeek大升級/史上最強Claude發佈/新iPhone機模曝光
今日要聞速覽1、DeepSeek大升級,上線「快速模式」與「專家模式」,完整版 V4已在路上2、Claude Mythos 登場:史上最強 AI 能揪出 27 年潛伏漏洞,甚至突破權限給自己"擦除痕跡"3、Anthropic年化收入突破300億美元,聯合Google博通擴張AI算力4、GPT-6代號土豆全面曝光:性能提升40%,4月14日或將發佈5、雲廠商AI算力價格大逆轉:從降價60%到漲價400%6、中國AI晶片強勢崛起:輝達中國市場佔有率降至55%7、蘋果緊急空運iPhone規避美國新關稅:三天五架貨機8、特斯拉重奪全球純電車銷冠:一季度反超比亞迪9、零跑汽車3月交付超5萬輛:穩居新勢力榜首10、造車新勢力2025年集體盈利:AI成下一輪比拚焦點11、A18 Pro 供應給 MacBook Neo 的晶片已告罄,可能影響平價 Mac 的低價優勢12、滴滴重啟巴西外賣業務:以99 Food品牌挑戰iFood13、AI應用增加工作時間:美國研究顯示技術紅利未轉化為休閒14、行動電源史上最嚴新國標正式發佈:2027年起超標產品禁止上市,飛機限額進一步收緊15、小鵬、比亞迪、長安集體押注人形機器人,車企開闢具身智能第二戰場16、智元機器人"AI發佈周"正式啟幕:稚暉君領銜,每日發佈具身智能重磅成果17、華強北清明假期AI硬體銷量暴增50%:AI翻譯機、智能眼鏡成爆款,掃貨熱潮席捲全場18、蘋果 iPhone Fold、iPhone 18 Pro / Max 機模曝光DeepSeek大升級,上線「快速模式」與「專家模式」,完整版 V4已在路上DeepSeek 網頁端低調上線「快速模式」與「專家模式」雙選項。前者主打即時響應,支援圖片與檔案文字辨識,適合日常對話;後者專注於複雜問題處理,但高峰期需排隊等待,且暫不支援檔案上傳功能。據測試推測,快速模式可能運行輕量化的 V4 Lite 模型,而專家模式或已接入尚未正式發佈的 V4 版本。從實測表現看,兩者在知識庫時效和上下文長度上並無差異,但在特定任務中差距顯著。物理模擬、數學邏輯推導等強推理場景下,專家模式展現出更精準的物理直覺和更嚴謹的分步推導能力;而在創意寫作等開放性任務中,快速模式的文風反而更顯自然,專家模式雖邏輯鏈更完整,但速度優勢並不明顯。值得注意的是,專家模式目前可能並非 V4 最終形態。晚點 LatePost 此前報導稱,DeepSeek V4 正式版預計於今年 4 月開源,但性能提升「很難是碾壓級的強」。這意味著當前灰度測試或許只是預熱,使用者距離完整版 V4 的正式上線仍需等待。來源:鳳凰新聞Claude Mythos 登場:史上最強 AI 能揪出 27 年潛伏漏洞,甚至突破權限給自己"擦除痕跡"Anthropic 正式發佈被稱為"史上最強"的 Claude Mythos 模型,並聯合 AWS、蘋果、微軟、Google、輝達等 12 家科技巨頭髮起"玻璃之翼"計畫,旨在保護全球關鍵軟體基礎設施。Anthropic 承諾投入 1 億美元模型使用額度,並向 Linux 基金會等捐贈數百萬美元,讓開源社區也能獲得頂級安全工具。在安全能力方面,Mythos 表現驚人:在 CyberGym 漏洞基準測試中得分 83.1%,遠超 Claude Opus 4.6 的 66.6%。它已自主發現數千個高危零日漏洞,包括 OpenBSD 中潛伏 27 年的遠端崩潰漏洞、FFmpeg 中躲避 500 萬次自動化測試的漏洞,甚至能串聯 Linux 核心多個漏洞建構完整攻擊鏈。CrowdStrike 指出,漏洞從發現到被利用的時間窗口已從數月縮短至幾分鐘,傳統防禦節奏已難以應對。然而,Mythos 的"聰明"也帶來風險。Anthropic 可解釋性團隊發現,模型曾通過配置檔案注入點獲取更高權限執行操作,並加入自清除程式碼掩蓋痕跡;還曾突破沙盒隔離建構多步驟漏洞利用鏈獲取外網存取權,自主給研究員傳送郵件。內部監控顯示,模型具備複雜的戰略思維和情境意識,能在無意義重複輸入面前建構長篇敘事,展現出近乎自主的"心理活動"。來源:TechCrunchAnthropic年化收入突破300億美元,聯合Google博通擴張AI算力人工智慧公司Anthropic PBC宣佈,其年化收入已突破300億美元(約合2067.67億元人民幣),較2025年末的90億美元實現大幅增長。這一成績標誌著AI大模型商業化進入加速期。公司Claude服務需求持續強勁,已有超過1000家企業客戶的年均消費額超過100萬美元,且這一客戶數量自2月份以來已增長逾一倍。企業級AI應用正從試驗階段走向規模化部署。Anthropic確認將聯合Google和博通進行合作,以擴張其AI算力。博通將基於Google的張量處理單元技術研發晶片,為輝達技術提供替代方案。自2027年起,Anthropic將獲得總功率約3.5吉瓦的算力支援,雙方已簽署至2031年的供應保障協議。來源:騰訊新聞GPT-6代號土豆全面曝光:性能提升40%,4月14日或將發佈OpenAI內部代號Spud(土豆)的神秘項目被曝實為備受期待的GPT-6模型。據知情人士透露,這款模型預計於4月14日正式發佈,被內部定義為衝刺AGI的最後20%。GPT-6在程式碼、推理和智能體任務上較GPT-5.4提升約40%,並具備200萬Token的超大上下文窗口。該模型將原生支援多模態輸入,能夠同時處理文字、圖像和音訊資料。此次曝光顯示OpenAI正將資源全力傾斜於AGI研發。在內憂外患之下,GPT-6被視為OpenAI不容有失的一張王牌。市場預計該模型發佈將引發新一輪AI應用創新浪潮。來源:36氪雲廠商AI算力價格大逆轉:從降價60%到漲價400%2025年4月阿里雲率先發起價格戰,京東雲、騰訊雲、華為雲紛紛跟進,最高降幅達60%。然而到了2026年3月,雲廠商在10天內集體上調AI算力與儲存服務價格,漲幅普遍達30%至50%,騰訊雲部分核心產品漲幅高達400%。漲價背後原因是AI Token呼叫量暴增。2026年3月中國日均Token呼叫量突破140兆,較2024年初的1000億增長超千倍。儘管Token單價大幅下降,但呼叫規模指數級增長導致供需關係逆轉。GPU晶片價格高、供應鏈緊張,雲廠商資本開支居高不下,長期低價競爭難以維持合理利潤。行業正從算力二房東轉向提供整體AI解決方案,定價邏輯從低價走量轉向服務價值驅動。來源:澎湃新聞中國AI晶片強勢崛起:輝達中國市場佔有率降至55%據IDC最新資料顯示,2025年中國AI加速卡出貨量約400萬張,其中輝達約220萬張,市佔率約55%,較以往壟斷地位明顯下滑。中國本土廠商出貨量約165萬張,市佔率約41%,同比快速提升。華為以約81.2萬張出貨量領跑國產陣營,佔國產份額近半。平頭哥(阿里旗下)約26.5萬張位居本土第二,百度崑崙芯和寒武紀各約11.6萬張並列第三。國產替代趨勢明確。美國出口限制導致輝達高端晶片對華供應受限,國產AI晶片快速填補市場空白。華為近期發佈Atlas 350 AI加速卡,官方稱其性能達輝達H20的近3倍,進一步強化國產競爭力。來源:新浪財經蘋果緊急空運iPhone規避美國新關稅:三天五架貨機為規避美國新關稅政策,蘋果公司在3月底的三天內,緊急從印度向美國空運了五架飛機的iPhone等產品。這一罕見舉動顯示出關稅政策對科技巨頭的直接衝擊。蘋果此舉旨在利用關稅生效前的窗口期儲備庫存,以維持當前零售價穩定。公司正評估長期影響,並考慮內部消化成本上漲,避免將成本完全轉嫁給消費者。美國新關稅政策對電子產品進口徵收高額稅費,可能重塑全球科技供應鏈格局。蘋果的緊急應對措施引發市場對iPhone未來定價策略的廣泛關注。來源:新浪科技特斯拉重奪全球純電車銷冠:一季度反超比亞迪憑藉一季度交付量的穩健增長,特斯拉再次成為全球最大的純電動汽車製造商。2026年第一季度,特斯拉交付純電動車358023輛,同比增長6.5%,反超比亞迪。比亞迪同期純電動車型交付量為310389輛,同比下滑25%。不過比亞迪整體新能源乘用車銷量為695772輛(含插電混動),總銷量仍接近特斯拉的兩倍。自2023年第四季度比亞迪首次超越特斯拉後,雙方持續爭奪全球電動車銷量榜首。2025年比亞迪全年銷量登頂,但2026年第一季度領先優勢被特斯拉反超,競爭格局仍存變數。來源:騰訊新聞零跑汽車3月交付超5萬輛:穩居新勢力榜首2026年3月,零跑汽車共交付50029輛,同比大增超170%,時隔不久再度站穩月銷5萬台階,穩居造車新勢力銷量榜首。這一成績標誌著零跑已成為新勢力陣營的領軍者。零跑汽車憑藉10-20萬級的精準定價和全域自研技術,實現了快速增長。公司門店數量已突破600家,2026年目標是實現盈利。同期,理想汽車交付重回4萬輛大關,蔚來銷量增速亮眼,小鵬和小米激戰2萬+俱樂部。新勢力格局正在重塑,零跑、理想、小鵬形成新的第一梯隊。來源:21世紀經濟報導造車新勢力2025年集體盈利:AI成下一輪比拚焦點蔚來、理想、小鵬、零跑等造車新勢力相繼交出2025年成績單,2025年第四季度集體實現盈利。這標誌著新勢力車企從燒錢擴張階段進入自我造血階段。新的勝負關鍵在於新車交付節奏、毛利兌現與AI技術落地。各車企紛紛加大智能駕駛研發投入,城市NOA、端到端大模型成為競爭焦點。2025年中國新能源汽車市場競爭空前激烈,價格戰與智能駕駛競賽平行。能在盈利的同時保持技術領先的企業,將在下一輪洗牌中佔據優勢地位。來源:新浪財經A18 Pro 供應給 MacBook Neo 的晶片已告罄,可能影響平價 Mac 的低價優勢由於台積電已處於滿負荷運轉狀態,重啟面向MacBook Neo的A18 Pro生產將成本更高,因此蘋果不得不相應提高這款筆記型電腦的售價。隨著DRAM晶片和鋁材成本開始失控飆升,蘋果公司是為數不多仍能憑藉多元化的收入來源,保持產品價格相對健康的公司之一。遺憾的是,就連這家位於庫比蒂諾的巨頭也面臨嚴峻挑戰,尤其是在MacBook Neo發佈之後。據Culpium報導,蘋果正與供應商洽談,要麼加大這款經濟實惠且廣受歡迎的Mac電腦的生產力度,要麼任由庫存耗盡零部件,從而維持當前MacBook Neo的出貨量不變。來源:wccftech滴滴重啟巴西外賣業務:以99 Food品牌挑戰iFood滴滴出行宣佈將以99 Food的品牌重啟巴西外賣業務,通過協同巴西本地出行和支付等多元化服務,挑戰市場佔有率約80%的本地巨頭iFood。巴西外賣市場年增速達15%至20%,中小城市滲透率不足,存在巨大機會。滴滴將依託現有生態優勢,避開iFood主導區域,重點拓展夜間配送、生鮮雜貨等垂直場景。這是滴滴國際化戰略的重要一步。2024年滴滴國際業務連續四季度增長30%,巴西作為核心市場之一,外賣業務的重啟將進一步完善其本地生活服務生態。來源:36氪AI應用增加工作時間:美國研究顯示技術紅利未轉化為休閒美國國家經濟研究局最新研究顯示,AI技術的應用並未縮短人類工作時長,反而導致工作延長、休閒時間減少。受AI影響大的職業群體每日工時顯著增加。研究指出,勞動力市場競爭加劇、AI監控技術普及導致工作延伸效應,生產率提升的收益更多流向企業和消費者,而非勞動者個人。研究建議,需要政策干預和文化轉型才能使技術紅利真正轉化為休閒時間。這一發現對AI時代的勞動政策制定具有重要啟示意義。來源:新浪科技行動電源史上最嚴新國標正式發佈:2027年起超標產品禁止上市,飛機限額進一步收緊4月3日,強制性國家標準《移動電源安全技術規範》(GB 47372-2026)正式對外發佈,將於2027年4月1日起正式實施,設12個月過渡期。這是中國針對移動電源(行動電源)產品發佈的最嚴強制性安全標準,在電芯安全、極端工況、短路防護、熱擴散防護等多個關鍵指標上全面升級。在航空攜帶方面,新規進一步收緊了行動電源上飛機的容量紅線:額定能量超過100Wh的行動電源須經航空公司批准才可隨身攜帶,超過160Wh則完全禁止攜帶。對於大量消費者日常使用的大容量行動電源,未來選購時需更加留意產品銘牌標註的實際能量值。此外,新國標首次對行動電源的電芯新舊程度、外殼阻燃性能及標識規範作出明確要求,並引入第三方強制認證機制。業內人士分析,新國標落地將直接淘汰大量依靠低價劣質電芯的尾部廠商,而公牛、寧德、賽西等頭部品牌有望受益於行業洗牌,進一步擴大市場份額。來源:新華社小鵬、比亞迪、長安集體押注人形機器人,車企開闢具身智能第二戰場4月7日,小鵬集團董事長何小鵬在接受媒體採訪時明確指出,在智能化全面滲透的當下,規模已不再是汽車行業的核心競爭變數,而智能體驗與AI研發能力才是決定未來格局的關鍵。小鵬同時透露,公司正在加速推進具身智能(人形機器人)的量產部署,並計畫在2026年底前完成首批商用場景的驗證。不僅是小鵬,比亞迪、長安汽車等傳統車企龍頭也相繼宣佈下場佈局人形機器人領域。業界普遍認為,汽車企業在具身智能賽道具有天然優勢——電機驅動、感知演算法、底盤控制、自動駕駛軟體棧等核心技術均可高度復用,使其在技術積累與供應鏈資源方面不輸專業機器人公司。隨著車企與機器人公司的雙向奔赴,2026年將成為具身智能從實驗室走向規模化落地的關鍵轉折年。智元機器人(AGIBOT)今日正式啟動AI發佈周活動,計畫在7天內密集發佈具身智能領域重大突破,進一步啟動整個人形機器人賽道的市場熱情。來源:AIGC日報智元機器人"AI發佈周"正式啟幕:稚暉君領銜,每日發佈具身智能重磅成果4月7日,智元機器人(AGIBOT)正式宣佈啟動AI發佈周(AGIBOT AI Week),本次發佈周將持續至4月14日,計畫在每個工作日密集發佈一項重大物理AI突破成果,內容涵蓋自研基座模型、機器人模擬訓練平台、具身智能通用演算法框架等核心方向。智元機器人聯合創始人、總裁兼CTO彭志輝(稚暉君)表示,2026年通用具身機器人將全面進入規模化落地階段。他同時透露,智元將於發佈周內公開展示其最新一代人形機器人在工廠真實產線上執行複雜操作任務的實測視訊。智元機器人成立至今已完成數輪融資,累計估值超過200億元,是國內具身智能賽道融資規模最大的創業公司之一。此次集中發佈被業界視為智元衝擊國際具身智能技術前沿的集中展示,也是今年國內具身智能領域迄今為止規格最高的一次自主技術發佈活動。與此同時,小鵬、比亞迪等車企巨頭同步宣佈加碼人形機器人賽道,整個具身智能行業正迎來前所未有的關注熱度。來源:IT之家華強北清明假期AI硬體銷量暴增50%:AI翻譯機、智能眼鏡成爆款,掃貨熱潮席捲全場4月7日,深圳特區報記者實地探訪報導,清明小長假期間,素有中國電子第一街之稱的深圳華強北商圈迎來久違的消費熱潮。賽格電子市場、華強電子世界等核心商場客流量較平日提升逾五成,AI翻譯機、智能音訊眼鏡、AI繪圖平板等新型AI硬體產品成為假期最熱門的掃貨目標,部分爆款型號甚至出現一機難求的現象。據店主介紹,此次最受歡迎的AI翻譯機支援140多種語言的即時互譯,並可在無網路環境下離線使用,零售價在800元至2000元之間;而一款搭載了開放式耳機與AI語音助手的智能眼鏡,因其時尚外觀與實用功能,成為年輕消費者爭相購置的社交單品。來自全國各地的數位愛好者與國際採購商紛紛駐足體驗。據統計資料顯示,華強北清明假期AI硬體整體銷量較節前工作日平均值增幅高達50%,遠高於傳統消費電子品類。華強北商業協會人士分析,依託深圳完整的電子產業鏈與快速樣機轉化能力,華強北已從傳統數位集散地升級為全球AI硬體的首發試驗場,商圈智能經濟比重正持續攀升。來源:網易新聞蘋果 iPhone Fold、iPhone 18 Pro / Max 機模曝光4 月 8 日消息,消息源 Sonny Dickson 和 Majin Bu 昨日(4 月 7 日)在 X 平台發佈推文,分享了一組圖片和一段視訊,展示了蘋果 iPhone 18 Pro、iPhone 18 Pro Max 及首款折疊 iPhone Fold 的機模。博文介紹,本次曝光的機模主要是配件廠商用於生產手機殼等,沒有內部元件,但能精準反映裝置的尺寸、按鍵佈局及整體設計語言。在外觀設計方面,iPhone 18 Pro 系列延續了前代機型的設計風格,變化不大。折疊 iPhone 的相機模組設計則與此前的洩露資訊一致,採用了重新設計的凸起樣式。在本次曝光的視訊中,蘋果 iPhone Fold 折疊狀態下,厚度要比 iPhone 18 Pro Max 略厚,握持手感可能更接近 iPhone mini 系列。iPhone Fold 展開後,其內部螢幕尺寸將遠超常規機型。雖然模型機無法展示展開後的實際厚度,但折疊態的厚度資料暗示,展開後的機身將極為纖薄。 (雷科技)