#Opus
最強Claude意外洩露!完勝Opus 4.6,代號「卡皮巴拉」,奧特曼又要睡不著了
就在剛剛,Anthropic 洩露了一個從未公開過的新模型。沒有小道消息鋪墊,沒有「知情人士透露」的前戲,Anthropic 自己的 CMS 資料庫忘了關權限,近 3000 份內部檔案直接躺在公網上,被《Fortune》記者翻了個底朝天。劍橋大學網路安全研究員 Alexandre Pauwels 受邀驗證了這批材料的真實性和規模。Anthropic 發言人隨後向《Fortune》確認:模型確實存在。🔗 https://m1astra-mythos.pages.dev/這個模型叫 Claude Mythos,內部代號 Capybara(卡皮巴拉)。它跳過了 Opus 升級版的劇本,跳過了 Sonnet 換皮的套路,直接開闢了一個凌駕於 Opus 之上的全新第四層級。Anthropic 自己在草稿裡的原話:「Mythos 是一個全新層級模型的名字,比我們的 Opus 模型更大、更智能。在此之前,Opus 一直是我們最強大的模型。」如果你覺得 Claude Opus 4.6 已經夠猛了,那 Mythos 就是 Anthropic 在說:那只是熱身。Opus 之上,到底強了多少Anthropic 現有產品線是三層結構:Haiku 最輕最快,適合輕量任務;Sonnet 居中,性價比之選;Opus 最大最強,重型推理擔當。這個框架從 Claude 3 時代延續至今,行業裡幾乎所有人都默認 Opus 就是 Anthropic 的天花板。Mythos 把這個天花板掀了。洩露的草稿博文顯示,與當前最強的 Claude Opus 4.6 相比,Mythos 在多個核心領域取得了「顯著更高的分數」。至少覆蓋了三大方向:軟體程式設計。 這是當前 AI 模型競爭最白熱化的戰場。Claude Opus 4.6 本身已經是公認的程式設計最強模型之一,而 Mythos 在程式設計基準上進一步拉開了差距。對於每天用 Claude 寫程式碼的開發者來說,這意味著一個量級的躍升,不是小數點後面的微調。學術推理。 數學、科學、邏輯推理,這些考驗模型「深度思考」能力的硬骨頭,Mythos 同樣顯著領先。草稿中特意把「學術推理」作為獨立測試維度單獨拎出來講,說明 Anthropic 對這個方向的突破底氣很足。網路安全。 這是最炸裂的部分。草稿博文中有一段話,措辭之重,在 Anthropic 歷來的官方敘事中極為罕見:儘管 Mythos 目前在網路安全能力上遠超任何其他 AI 模型,但它預示著即將到來的一波浪潮,屆時模型將能以遠超防禦者努力的速度來利用漏洞。注意用詞:不是「領先」,不是「優於」,是「遠超」。而且這是洩露出來的內部評估,不是市場部寫的宣傳稿,用詞份量完全不同。Anthropic 發言人在確認 Mythos 存在時,用了兩個定性:「質的飛躍」 和 「迄今為止最強大的模型」。過去兩年,AI 模型的競爭一直在同一個量級上貼身肉搏。GPT 系列、Gemini、Claude、Llama,各項基準你追我趕,差距用個位數百分比來量。而 Mythos 暗示的已經不是追趕了,是變道超車。這大概就是為什麼,每次 Anthropic 有大動作,社交媒體上總有人第一時間 @Sam Altman:睡了嗎?太強了怎麼辦?Anthropic 的答案是:先把解藥發出去一家以「安全第一」立身的 AI 公司,在自己內部文件裡承認造出了一個可能讓攻擊者碾壓防禦者的東西。這種坦率在行業裡幾乎沒有先例。於是 Anthropic 做了一個罕見的決定:Mythos 的第一批使用者,不是開發者,不是企業客戶,而是網路安全防禦機構。邏輯很簡單:如果這個模型的攻擊能力確實如內部評估所言,那在放給所有人之前,得先讓守門的人拿到同樣的武器。毒藥還沒散出去,解藥先到位。這在 AI 行業的發佈史上幾乎沒有先例。OpenAI 發 GPT-4 的時候做過紅隊測試,Google 發 Gemini 做過安全審查,但沒有那家公司把「安全防禦者優先使用」寫進正式的發佈路線圖裡。Anthropic 這麼做,要麼是真的被自己造出來的東西嚇到了,要麼是在用一種極其高明的方式給 Mythos 的能力背書。又或者兩者兼有。與此同時,Mythos 的運行成本是另一個現實問題。草稿坦承「服務成本非常昂貴」,需要大幅最佳化效率才會考慮面向大眾。翻譯一下:這只卡皮巴拉目前是實驗室裡的珍稀品種,想讓它走進千家萬戶的聊天窗口,Anthropic 還得先把飼養成本打下來。但訊號已經出去了。當競爭對手還在為 Opus 等級的模型絞盡腦汁時,Anthropic 已經在討論 Opus 之上的東西該怎麼安全地放出來了。兩家公司,撞上同一隻卡皮巴拉每個大模型都有內部代號。GPT-4 叫過 Arrakis,Google 用寶石命名。而 Anthropic 給有史以來最強模型取的代號,是一隻卡皮巴拉,就是那個在網際網路上以「呆萌臉 + 跟誰都能和平共處」聞名的 meme 之王。怎麼實錘的?洩露的部落格有兩個版本。V1 通篇用「Mythos」,V2 把每一個「Mythos」都替換成了「Capybara」,連文中每處引用都做了對應修改。說明這個模型在 Anthropic 內部相當長時間裡就叫「卡皮巴拉」,「Mythos」是後來包裝出來的發佈名。但 AI 圈最知名的卡皮巴拉 IP 早就有主了。阿里通義千問 Qwen 的吉祥物就是卡皮巴拉,社區裡到處是卡皮巴拉頭像和周邊,品牌認知度拉滿。所以當 Mythos 的代號被曝光,社交媒體直接炸了。而全場最佳來自千問前技術負責人林俊暘親自現身評論區,只留了一句:「capybara? seriously?」兩家爭奪 AI 王座的公司,不約而同看上了同一隻呆頭呆腦的大囓齒目。2026 年 AI 圈最有喜劇張力的一幕,大概就是這了。最低級的配置錯誤扒了底褲最後聊聊這次洩露本身,因為它的荒誕程度值得單獨說。Anthropic 把原因歸結為「外部 CMS 工具中的人工配置錯誤」,同時特意強調跟 Claude、Cowork 或任何 AI 工具無關。後半句的急切耐人尋味:最近多家科技公司因 AI 生成程式碼引發技術事故頻頻上新聞,而 Anthropic 恰恰是那個最高調宣傳用 Claude Code 自動化內部流程的公司。「不是 AI 干的」,他們顯然覺得有必要把這句話說清楚。技術本質很簡單。劍橋研究員指出,CMS 系統中上傳的所有資產默認公開,除非手動設為私密。Anthropic 忘了點那個開關。和 AWS S3 儲存桶忘關權限一個性質的低級失誤,有充分文件記錄,完全可以預防。一家正在造有史以來最強網路安全 AI 的公司,被最基礎的權限配置疏忽扒了個精光。你很難想出比這更諷刺的劇本。同一批檔案裡還藏著一場閉門 CEO 峰會的細節:計畫在英國一處 18 世紀鄉間莊園酒店舉辦,Anthropic CEO Dario Amodei 將出席,對像是歐洲大型企業掌門人。一場精心策劃的高端商務社交,就這樣和產品草稿一起被晾在了陽光下。Anthropic 發言人的回應是:「這些只是考慮發佈的早期草稿,不涉及核心基礎設施、AI 系統、客戶資料或安全架構。」技術上沒錯。但當你的「早期草稿」裡白紙黑字寫著這個模型可能引發「AI 驅動的漏洞利用浪潮」,這就已經不是一次普通的內容洩露了。洩露本身的戲劇性是其次,關鍵在於它無意間撕開了一個行業一直在迴避的問題:當模型強大到連造它的人都需要先給自己買保險,我們到底該興奮還是該緊張?過去兩年,AI 公司的發佈節奏像軍備競賽,每家都在說自己更快更強更安全。但 Mythos 的洩露文件裡,罕見地出現了一種不同的語氣:「我們造出了一個自己都需要小心對待的東西」。有人會說,這不過是 Anthropic 的另一種行銷,用「太強了所以要謹慎」來製造稀缺感。也許吧。但如果你讀過那些草稿原文就會發現,那種措辭的份量不像是市場部能寫出來的。當一家公司在內部文件裡承認自己的產品「預示著一波 AI 驅動的漏洞利用浪潮」,這要麼是史上最大膽的行銷,要麼就是真話。而這一切,只是因為有人忘了在 CMS 後台點一個「設為私密」的按鈕。 (APPSO)
剛剛,Anthropic王炸Claude洩露!全面碾壓Opus 4.6引爆全網
【新智元導讀】Opus之後,絕密Claude爆出!就在剛剛,頂配Claude Mythos全網洩露,被稱為有史以來「最強模型」,程式設計、推理全面超越。Anthropic一不小心,洩露了王炸!剛剛,《財富》獨家爆出——由於一次罕見的「人為配置」錯誤,最強大模型「Claude Mythos」絕密細節公之於眾。Claude Mythos代號「Capybara」,代表最高「層級」,是一款具有劃時代意義的全新模型。它不僅在程式設計、推理上,全面碾壓最強Claude Opus 4.6,更具備了強大的「網路攻擊」與「防禦能力」。參數規模或達10T內部測試顯示,Mythos將會帶來前所未有的安全風險。Anthropic至今按兵不動,是因為深知這頭「猛獸」一旦出籠,後果將無法預料。一時間,全網瞬間炸了!更多關於Mythos的爆料徹底刷屏。甚至,據傳未來幾周,Anthropic將通過Claude API對外開放Mythos。頂配Claude Mythos首次洩出全網炸鍋這件事的起因,讓人啼笑皆非。幾天前,網路安全公司LayerX Security和劍橋大學研究人員發現,Anthropic用於發佈官博的內容管理系統(CMS),因外部工具配置失誤結果導致——3000份原本應保密的內部檔案,暴露在公開可訪問的資料庫中。今天,《財富》意外檢索到了一篇博文草稿,爆出了Claude Mythos(Capybara)全新模型完成了訓練。而且, Anthropic至今未發,因為內部評估後太危險!眾所周知,Claude模型一共有三種杯型:Opus、Sonnet和Haiku。Capybara的定位是,一個比最強大的Opus體量更大、更智能,但也更昂貴的全新「頂配等級」。在官方撤下之前,網友M1及時將原文做了一個存檔。草稿部落格中,每一句話的含金量極高——與我們之前最好的模型Claude Opus 4.6相比,Capybara在軟體編碼、學術推理,以及網路安全等各項測試中的得分大幅提升。Claude Mythos是一款遠超以往、我們迄今開發過的最強大的AI模型。Claude 4.6 Opus的實力已無需贅言,但Mythos的出現,才是真正意義上的「終結者」。這種等級的跨越,遠比參數的增長更令人震撼。Anthropic自己都怕了,不敢放出!不過,Claude Mythos的極致性能,也帶來了極致的危險。Anthropic在草稿部落格中警示,新模型將會帶來巨大的「網路安全」風險。在網路攻擊上,Mythos遙遙領先於全球任何一款模型。因此,它極有可能被駭客用於發起大規模、破壞力極強的網路攻擊。其手段將遠遠超出防禦人員的應對能力。換句話說,Anthropic擔心駭客會利用Mythos發起大規模的網路攻擊,所以至今不敢發佈。部落格草稿中表示,正是因為存在這種風險,該模型發佈計畫的重點才會放在網路防禦者身上。我們將率先向相關機構開放搶先體驗權,讓他們能夠搶佔先機,在即將到來的一波由AI驅動的漏洞利用浪潮中,率先提高自家程式碼庫的穩健性。更多爆料:獨家高管閉門會除了新模型,洩露的PDF檔案還意外曝光了Anthropic的一項絕密商務行程:Dario Amodei即將前往英國一處18世紀莊園改造的豪華酒店,舉辦一場僅限受邀者參加的頂級CEO閉門峰會。這場針對歐洲最具影響力商業領袖的聚會,將潛在的巨頭客戶展示「Claude尚未發佈的神秘能力」。對此此次洩露,Anthropic承認,使用的一個外部CMS工具出了問題,導致草稿內容被曝光。洩露的許多檔案似乎是過去部落格文章用剩或廢棄的素材,比如圖片、橫幅和 logo。然而,有幾份檔案顯然是私密或內部文件。例如,其中一份檔案的標題就是在描述某位員工的「育兒假」。目前,Anthropic已緊急封鎖了該資料檢索通道,並承認了這場由「人為錯誤」引發的公關災難。 (新智元)
Google殺瘋了Gemini 3 推理模式封神,碾壓 GPT-5.2,科研工程界迎終極神器
2026 年 AI 科研賽道再迎王炸!Google官宣 Gemini 3 Deep Think 推理模式重磅升級,劍指科學研究與工程落地的複雜難題,多項基準測試成績直接刷新全球紀錄,不僅碾壓 GPT-5.2、Claude Opus 4.6 等競品,更達到世界頂尖程式設計師、奧賽金牌級水平。更重磅的是,Google首次開放該模式 API 早期訪問,科研人和工程師的效率天花板,直接被重新定義!實測封神!全維度霸榜,多項成績碾壓主流大模型此次升級的 Gemini 3 Deep Think,最硬核的底氣就是實打實的測試成績,在數學、物理、程式設計、抽象推理等全維度高難度基準測試中,實現全面霸榜,無工具加持下的表現堪稱驚豔。在抽象推理核心測試 ARC-AGI-2 中,它拿下 84.6% 的超高正確率,遠超 Claude Opus 4.6 的 68.8% 和 GPT-5.2 的 52.9%,成績直接斷層領先。“終極人類考試” 中,48.4% 的得分也甩開 Claude 的 40.0%、GPT-5.2 的 34.5%,盡顯高階推理實力。程式設計領域更是直接封神,Codeforces 競賽程式設計基準中斬獲 3455 的 Elo 評分,遠超 Gemini 3 原版的 2512 和 Claude 的 2352,達到世界頂尖程式設計師水準。而在 2025 年國際奧賽中,數學、物理、化學理論測試均拿下金牌級成績,物理更是達到 87.7% 的正確率,把 GPT-5.2 的 70.5% 遠遠甩在身後。就連多模態理解、凝聚態物理理論等偏門高難領域,它也表現亮眼,MMMU-Pro 測試 81.5% 正確率、CMT-Benchmark 50.5% 得分,均大幅領先主流競品,真正實現了 “文理通吃、科工全能”。直擊痛點!專為科研工程而生,破解真實場景難題Google此次升級並非單純的參數堆砌,而是精準瞄準科研和工程場景的核心痛點 —— 真實工作中資料雜亂、問題邊界模糊、需要長鏈路邏輯推理,而 Deep Think 就是為解決這些問題量身打造。它摒棄了大模型常見的 “表面化推理”,擁有更深度的邏輯鏈分析能力,能處理科研中複雜的因果推導、工程裡精密的流程最佳化。Google已展示其實際應用價值:協助數學家快速發現論文中的邏輯漏洞,從繁雜的公式推導中定位問題;助力工程師最佳化半導體晶體生長工藝,通過多維度資料分析找到工藝提升的關鍵節點。不同於普通大模型只能做 “輔助性文案工作”,Deep Think 能真正深度參與科研和工程的核心環節,從理論分析到實際落地,提供可落地、可驗證的解決方案,讓 AI 從 “工具” 變成真正的 “科研夥伴”。重磅開放!API 解鎖,兩類使用者率先嘗鮮在成績亮眼、應用落地的雙重加持下,Google此次也邁出了關鍵一步 —— 打破封閉,首次開放 Gemini 3 Deep Think 的使用權限,讓頂尖 AI 能力走出實驗室,真正服務於科研和產業界。目前該模式已面向Google AI Ultra 訂閱使用者全面開放,這類使用者可直接體驗全功能的深度推理能力。更值得關注的是,Google首次通過Gemini API,向部分研究人員、工程師及企業提供早期存取權,這意味著相關從業者可將該模型接入自有系統、科研平台,實現定製化的深度應用。從以往的 “專屬封閉” 到如今的 “有限開放”,Google的這一動作,也讓全球科研和工程界看到了頂尖 AI 技術普惠的可能,未來無論是高校的基礎研究,還是企業的工程落地,都有望借助這一工具實現效率躍升。行業震動!AI 科研工具迎來新拐點,競爭再升級Gemini 3 Deep Think 的升級與開放,不僅讓科研人和工程師迎來 “效率神器”,更在全球 AI 行業引發連鎖震動,讓大模型的競爭從 “通用能力比拚” 轉向 “專業場景深耕”。此前,主流大模型更多聚焦於通用對話、內容生成,在專業科研工程領域的表現始終差強人意,而Google此次精準卡位高難度專業場景,用實打實的成績證明了大模型在硬核領域的落地價值。這也給其他 AI 廠商指明了方向:單純的參數競賽已無意義,能解決真實專業問題的模型,才擁有真正的核心競爭力。對於科研和工程界而言,這一升級更是一場效率革命 —— 以往需要團隊數天甚至數月的邏輯推導、工藝最佳化、程式碼編寫,如今借助 Deep Think 可能幾小時就能完成,大大縮短了研究和開發周期。而隨著 API 的逐步開放,未來還將催生更多基於該模型的專業工具,推動科研和工程領域的智能化升級。從全維度霸榜的測試成績,到直擊痛點的場景落地,再到打破封閉的 API 開放,Google Gemini 3 Deep Think 的此次升級,每一步都踩在了 AI 行業的核心發展點上。它不僅展現了Google在大模型領域的技術領先,更讓我們看到了 AI 賦能硬核科研、推動產業升級的無限可能。隨著頂尖 AI 技術的逐步普惠,科研和工程的智能化時代,已然加速到來! (硬核科技喵)
GLM-5 漲價背後的真相:算力稀缺才剛剛開始
一個意料之中的訊號昨天上午,智譜 GLM-5 的 Coding Plan 漲價 30%。這個事情引起了很大的討論,我也非常理解,畢竟價格是最敏感的話題。當時我的第一反應是:終於還是漲了。雖然很反共識,但我一直預期 Token 會漲價,這個訊號是對我預期的一個確認。模型越強,Token 越稀缺,價格越貴。智譜在商業化上確實顯得不夠成熟,他們最大的失誤就是低估了模型能力進步帶來的指數級增長,一開始給的 plan 太大方,現在模型更大了,算力不夠,要麼砍用量,要麼漲價,沒有商業模式支撐的服務無法健康長久。昨晚一個朋友因為沒買到 Coding Plan,來借我的 API key。這時候我才意識到,這次漲價之後,依然是限購狀態。漲價+限購,一代人有一代人的茅台?漲價背後的真相要理解這次漲價,只需要看清一個結構性矛盾:供給是線性的,需求是指數的。先看供給側。Google 2026 年的資本開支相比2025年,差不多翻倍。這已經是全球最有錢的科技公司之一,傾盡全力在砸算力基礎設施了。你不可能讓台積電明天就多造出十倍的晶片。供給側的增長曲線,是一條緩慢爬升的直線。再看需求側。需求不是一重指數,是三重指數疊加。第一重指數:Coding 模型能力提升解鎖新場景。特別是從 Vibe Coding 到嚴肅的 Agentic Engineering 這一躍升。每一次能力提升,都打開一片10倍的 Token 消耗場景。第二重指數:Agent 數量本身在爆發式增長。在未來一個人背後可能有 10 個、100 個 Agent 在 7×24 小時不間斷地呼叫模型。人會睡覺,Agent 不會。人一天工作 8 小時,Agent 一天工作 24 小時。Agent 的數量乘以 Agent 的工作時長,這個數字的增長速度遠超任何人類使用者的增長。第三重指數:Seedance 2.0,Nano Banana Pro 這樣的多模態模型的 Token 消耗量遠超純文字。視訊生成、圖像理解、程式碼工程,每一個場景的單次消耗都是純文字對話的幾十倍甚至上百倍。當這些場景被模型能力解鎖之後,Token 的消耗量會出現斷崖式的躍升。三重指數疊加在一起,面對的是一條線性增長的供給曲線。供給翻 2 倍,需求翻 10 倍甚至 100 倍。這種結構性的失衡,在可預見的未來一年內,只會增強不會逆轉。所以漲價不是智譜的選擇,是物理定律的選擇。有人天真地說,不用擔心,大廠會打價格戰的。你見過賣金鋪打價格戰嗎?稀缺的東西,不存在價格戰。GLM-5 憑什麼值這個價漲價 30% 需要底氣,這種底氣憑什麼?看三件事就夠了。第一,Coding 能力逼近 Claude Opus 4.5。GLM-5 幾個 Coding 能力的跑分上,已經追上了 Sonnet 4.5,開始朝著 Opus 4.5 逼近。在多個權威指標上都是開源模型的 SOTA。跟自己比,從 GLM-4.7 到 GLM-5,內部評估的程式設計任務平均增幅超過 20%。除了指標的提升外,GLM-5 不只是"寫程式碼更好了",而是從寫程式碼進化到了寫工程。它能自主完成後端重構、深度偵錯、長程規劃與執行,已經在朝著資深架構師的方向邁進。第二,Agent 能力是真正的長程任務執行。在 BrowseComp、MCP-Atlas、τ²-Bench 三個 Agent 評測基準上,GLM-5 均為開源第一。在 Vending Bench 2 的模擬經營測試中,GLM-5 經營一年期的自動售貨機業務,最終帳戶餘額達到 4432 美元,接近 Opus 4.5。有些榜是可以刷的,但模擬經營榜,代表模型真的能"做事"。長程任務中的目標一致性、資源管理、多步驟依賴處理,是 Agentic Engineering 時代的核心能力。第三,模型參數翻倍,推理成本也提高了。GLM-5 的參數規模從 355B(啟動 32B)擴展到 744B(啟動 40B),預訓練資料從 23T 提升到 28.5T,以 MIT License 完全開源。在頂級模型中,這種開放程度極為罕見。同時值得注意的是,GLM-5 已經完成了與華為昇騰、寒武紀、摩爾線程等國產算力平台的深度適配。在全球算力稀缺的大背景下,這件事的戰略意義非同小可。總之,使用者付的錢多了 30%,但拿到的能力漲了遠不止 30%。人是為更好的結果買單,所以漲價完全沒毛病。實測體感GLM-5 是第一個國內敢去對標 Claude Opus 的模型我個人測試,目前的水平肯定是達不到 Opus 4.6 水平的但我發現 GLM-5的思維方式和 Opus 4.6 非常像,思考深度非常深,有時候我看著這兩個模型的思考國產,都會非常驚嘆太聰明太全面了。但遺憾的是 GLM-5 還不具備 Opus 4.6 的獨立思考能力,會和 ChatGPT 一樣順著我的意思說。這是我用 GLM-5 寫的一個體感小遊戲,叫《抓馬》能寫出直接可玩的遊戲,還是非常強悍的。我和老婆玩了好幾盤,胳膊都有點累,所以錄視訊的時候已經沒有表情了。。 (AGENT橘)
Claude Opus 4.6 天價發佈、DeepSeek 的物理極限、下周宏觀避險指南
今天忙著體驗Opus 4.6,文章寫的有點晚了,真的太有意思了,就是真的太貴了!!!尤其是今天出的這個Claude Opus 4.6的急速模式(Fast mode),那更是一個貴字了得,反正我是沒敢用。這個急速模式和Opus 4.6性能一致,但速度達到了正常模式下的2.5 倍!更離譜的是價格較Opus 4.6翻了6倍!!!6倍價格換2.5倍速度,從純數學角度看,這筆帳確實不太划算。但商業世界從來不是純數學,對於業餘碼農來說可能不影響什麼。但是對於一個正在緊急修複線上事故的工程師來說,每多等10秒鐘,都意味著更多的使用者流失和更大的業務損失。對於用Claude Code快速迭代產品原型的獨立開發者來說,省下的時間可以直接換算成更早的上線日期。“Anthropic將Fast Mode定義為一次早期的市場實驗。其核心意圖在於探索:在模型‘智力’競爭已趨於白熱化(甚至觸及天花板)的當下,‘速度’這一新維度,究竟能支撐起多大的商業想像空間。”開放模型運行速度提升2.5 倍,成本卻高出6 倍較小的批處理規模。Deepseek 的帕累托最優曲線(解讀:在多個目標互相衝突時,你能達到的“物理極限邊界”)呈現如下狀態:Claude Opus 4.6 版本為 100 Tok/s/使用者Deepseek 在 100 時為 6 千 Tok/s/GPU以每秒 250tok/使用者計算,實際接近 1k。什麼是 100 tok/s?(使用者體驗層)這是一個衡量標準。100 tok/s/使用者 意味著使用者在螢幕上看到文字生成的速度是每秒 100 個 token(約 70-80 個漢字)。對人類閱讀來說,這個速度極快,體驗非常好(幾乎不需要等待)。2. GPU 吞吐量對比(成本效率層)當兩家模型都強制要求達到這個“絲滑速度”時,效率差異就體現出來了:為什麼Claude Opus和DeepSeek差這麼多仍然要發佈?從某種意義上說,這是在‘AI通膨’背景下的一次關鍵試探。當前,AI通膨在成本端已十分顯著(如雲端H100算力價格的飆升),這種壓力正逐漸向下游傳導。關鍵在於,這種漲價能否像Claude一樣最終由終端使用者買單(即使用者願意支付更高的Token費用)。如果這一步走通了,AI Agent(智能體)的商業邏輯將徹底理順:行業將從單純依賴Capex(資本支出)的‘軍備競賽’,轉向具備真實造血能力的商業閉環。這才是對市場質疑最有力的回應。昨天說今天要聊宏觀,玩AI玩過頭了。宏觀就是一句話,風險是否正在醞釀?簡單說一些關鍵,雖然上周各大類資產(如大宗商品、外匯)的波動率已經開始抬頭,但利率市場的波動率依然被壓制在較低水平 。這種背離現象背後的邏輯是:市場對宏觀經濟“軟著陸”的基本共識尚未動搖,但對單一資料點的敏感度正在急劇上升 。退一步來看,“雖然宏觀大背景未變——美國經濟增長向好、通膨態勢緩和,但風險依然存在。鑑於當前就業增長已顯疲態,一旦勞動力市場進一步放緩,此前的樂觀預期將面臨考驗。目前,市場焦點已鎖定下周的非農就業資料,以判斷利率波動率是否會再度抬頭。”美國:就業資料成為市場波動的總開關美國市場目前處於高度緊繃狀態。儘管整體增長前景依然具有支撐性,通膨也在降溫,但本周疲軟的職位空缺和初請失業金資料打破了平靜,成為了避險情緒的催化劑 。市場對下周非農就業資料的敏感度已顯著提升 。這成為了決定後續行情的關鍵分水嶺:風險情景:如果失業率出現反彈跡象,意味著勞動力市場未能走穩,那麼被壓抑的利率波動率將瞬間爆發,市場將劇烈震盪 。基準情景:如果失業率保持穩定或小幅下降,聯準會將繼續維持“觀望”模式,這將有助於穩定前端利率,讓市場重回平靜 。宏觀先聊到這,下周主要的宏觀資料大家心裡有數即可,明天有時間再聊,我又要去幹Opus 4.6了,真的很多想法需要他去實現!今夜註定是不眠夜。 (北向牧風)
Claude Opus 4.6殺死程式設計比賽!挖出500個day0漏洞,生成k線成交量分佈,還有PPT直出
凌晨突襲,Opus 4.6多場景性能領先GPT-5.2。智東西2月6日報導,今天凌晨,Anthropic正式發佈旗艦模型Claude Opus 4.6,是Anthropic首款開啟100萬token上下文窗口測試功能的旗艦級模型。Opus 4.6具備更縝密的規劃能力,能維持更長時間的智能體任務執行,可以在龐大程式碼庫中穩定運行,並能夠進行自我糾錯。在基準測試中,Opus 4.6在智能體程式設計評估Terminal-Bench 2.0中獲得最高分,於綜合性多學科推理測試Humanity's Last Exam中也坐穩了第一名的寶座。針對金融、法律等經濟價值領域的GDPval-AA評估中,Opus 4.6也是第一,並較第二名的GPT-5.2拉開約144個Elo分差,較前代版本Claude Opus 4.5提升了190分。就在Opus 4.6發佈後幾分鐘,OpenAI把GPT-5.3-Codex也搬了出來“正面硬剛”。截至台北時間2月6日11點,X平台上有關“Claude VS Codex”的話題下已有4.1萬條討論。Varick Agent的CEO“vas”發帖稱:“Claude 4.6 Opus僅用一次呼叫就重構了我的整個程式碼庫。25次工具呼叫,新增3000多行程式碼,建立了12個全新檔案。它模組化了所有內容,拆解了單體架構,理順了混亂的邏輯。結果沒一個能運行,但重構後的程式碼,實在是美得驚人。”有網友展示出他用Opus 4.6一次性做出的k線成交量分佈表。評論區紛紛感嘆:這要是真的,那一切都結束了。在話題討論中,有不少網友都自發測評了Opus 4.6與GPT-5.3 Codex這兩款模型,還曬出了測試Agent在複雜現實世界任務中的表現的Terminal-Bench,結果顯示GPT-5.3 Codex比Opus 4.6領先了11.9%。在網友的測評中,在程式設計方面GPT-5.3 Codex獲得的好評似乎更多。有網友發出對比:“Opus 4.6有100萬上下文+企業/知識工作+發現500個零日漏洞+Claude程式碼中的Agent叢集-基準測試成績不如Codex 5.3;而gpt-5.3-codex有程式碼基準測試勝出+速度更快+任務中轉向,但上下文窗口不到Opus的一半。”還有網友放出了更直觀的性能對比圖:價格上,在200K上下文以內(包括200K),Opus 4.6輸入每百萬token的價格為5美元(約合人民幣34.69元),輸出每百萬token的價格為25美元(約合人民幣173.45元);超過200K上下文,Opus 4.6輸入每百萬token的價格為10美元(約合人民幣69.38元),輸出每百萬token的價格為37.5美元(約合人民幣260.18元)。此外,Anthropic還將向Pro與Max使用者限時贈送價值50美元(約合人民幣346.9元)的額外使用額度,不適用於Team版、企業版及API/控制台使用者。使用額外額度的使用者需同時滿足以下兩個條件:1、已於2026年2月4日(太平洋時間)晚11:59前開通Pro或Max訂閱;2、在2026年2月16日(太平洋時間)晚11:59前啟用額外用量功能。Claude Opus 4.6即日起在claude.ai官網、API介面及所有主流雲平台同步上線。開發者可通過Claude API呼叫claude-opus-4-6模型。01. “大海撈針”測試得分76% 緩解“上下文衰減”問題在多語言程式設計測試SWE-bench Multilingual中,Opus 4.6的成績較Opus 4.5提升1.6分;在網路安全漏洞復現測試CyberGym中,Opus 4.6獲得66.6分,較Opus 4.5提升15.6分,是Sonnet 4.5分數的兩倍多。Opus 4.6在長文字連貫性測試Vending-Bench 2中以 8017.59 的分數大幅領先,在計算生物學BioPipelineBench測試中也以53.1分的成績位居第一。Opus 4.6在從海量文件中檢索相關資訊方面能力較上一代有所提升。這一優勢延伸至長上下文任務,它能在處理數十萬token時更穩定地保持和追蹤資訊,減少資訊漂移,並能捕捉到可能遺漏的深層細節。Anthropic團隊在部落格中稱,使用者常抱怨AI模型存在“上下文衰減”問題——即對話超過一定token數量後性能會下降。對此,研究團隊對Opus 4.6進行了MRCR v2的“8針-100萬”變體測試,這是類似於一種在浩瀚文字中檢索隱藏資訊的“大海撈針”式基準測試。在這個測試中Opus 4.6得分達76%,而Sonnet 4.5僅得18.5%。Opus 4.6的綜合基準測試如下圖所示。總而言之,Opus 4.6在長上下文中尋找資訊更精準,吸收資訊後的推理能力更強。02. 行為失范率極低 新增六類網路安全探測工具智能水平的飛躍並未以犧牲安全性為代價。在Anthropic的自動化行為審計中,Opus 4.6的行為失范率極低,行為失范包括欺騙、奉承、助長使用者妄想以及配合濫用等情形。其安全對齊程度與前代旗艦模型,即迄今為止對齊度最高的Claude Opus 4.5保持同等水準。值得注意的是,Opus 4.6在所有近期Claude模型中展現出最低的過度拒絕率,即模型未能回應良性查詢的情況。在部落格中,Anthropic團隊透露,針對Opus 4.6,他們開展了迄今最全面的安全評估體系,首次應用多項全新測試方法並對既有評估方案進行升級。Anthropic團隊新增了使用者福祉評估、更複雜的危險請求拒答能力測試,並更新了模型隱蔽執行有害行為的評估標準。同時,其運用可解釋性科學的新方法進行實驗,開始探究模型特定行為背後的成因,以期發現標準測試可能遺漏的問題。針對Opus 4.6在特定領域可能被危險利用的突出能力,研究團隊同步部署了新的防護機制。尤其鑑於該模型顯著增強的網路安全能力,他們開發了6種新型網路安全探測工具以幫助追蹤不同形式的潛在濫用行為。同時,Anthropic也在加速推進Opus 4.6在網路防禦領域的應用,通過其協助發現並修復開放原始碼軟體漏洞。他們認為網路防禦者利用Claude這類AI模型來平衡攻防態勢至關重要。網路安全領域發展迅速,Anthropic將根據對潛在威脅的認知持續調整和更新防護措施,近期其可能啟動即時干預機制以阻斷濫用行為。03. API新增自適應思考功能 Claude Code現可多智能體平行通過API介面,開發者們還可以獲取到更精細的模型算力控制方案,並為長期運行的智能體任務帶來更高靈活性。具體新增以下功能:1、自適應思考:此前開發者僅能在啟用或停用深度思考模式間二選一。現在通過自適應思考功能,Claude可自主判斷何時需要深度推理。在默認算力等級(高)下,模型會在必要時啟動深度思考,開發者也可通過調整算力等級來改變其觸發頻率。2、算力調控:現提供四個可調節的算力等級:低、中、高(默認)、極致。3、上下文壓縮(測試版):長程對話與智能體任務常觸及上下文窗口限制。當對話接近可配置閾值時,上下文壓縮功能將自動總結並替換早期對話內容,使Claude能夠執行更長任務而不受限制。4、100萬token上下文(測試版):當提示內容超過20萬token時,將適用高級定價。5、128k輸出token:Opus 4.6支援最高128k token的輸出長度,使Claude能完整處理需要大規模輸出的任務,無需拆分為多次請求。6、美國境內推理:對於需要在美國境內運行的工作負載,可選擇美國專屬推理服務,定價為標準token費用的1.1倍。在Claude與Claude Code平台,Anthropic新增了多項功能:Claude Code中新增智能體團隊的研究預覽功能。現在使用者可以啟動多個平行工作的智能體,它們將自主協同配合,特別適用於程式碼庫審查這類可拆分為獨立、重讀取的子任務。在與常用辦公工具的協作體驗方面,Claude Excel整合版現在能夠處理長時程與高難度任務,支援先規劃後執行、自主解析非結構化資料並推斷正確格式,還能單次完成多步驟修改。Excel整合版還能搭配PowerPoint整合版使用,使用者可先在Excel中處理並結構化資料,再通過PowerPoint實現可視化呈現。PowerPoint整合功能現已面向Max、Team及企業版使用者開放研究預覽。04. 放手兩千次會話 智能體團隊“煉”出十萬行C編譯器Anthropic官方還給出了一個開發者使用平行Claude智能體團隊建構C語言編譯器的案例。在這個案例中,開發者指派Opus 4.6率領智能體團隊建構一個C語言編譯器,隨後便基本放手任其運行,僅用兩周,就完成了一個小團隊一個月的工作。在為期兩周、近2000次Claude Code會話中,Opus 4.6消耗了20億個輸入token並生成1.4億個輸出token,總成本略低於2萬美元(約合人民幣13.88萬元),這個成本僅相當於開發者個人獨立完成所需投入的零頭。最終Opus 4.6做出了一個有著10萬行程式碼規模的編譯器,並且是淨室實現,即開發全程Claude無網路存取權,僅依賴Rust標準庫。這個編譯器能在x86、ARM和RISC-V架構上建構可啟動的Linux 6.9核心,還能編譯QEMU、FFmpeg、SQLite、PostgreSQL、Redis等大型項目。該編譯器在包括GCC torture測試套件在內的大多數編譯器測試中達到99%通過率,甚至通過了編譯器、作業系統等底層技術的 “終極測試”:成功編譯並運行第一人稱射擊遊戲《Doom》。經過多輪實踐,開發者總結出了協調多個Claude高效協作的四大核心方法:1、改進測試框架:在項目後期,Claude每次實現新功能時都會頻繁破壞現有功能。為此開發者建構了持續整合流水線,實施更嚴格的檢查機制,讓Claude能更好地測試自身工作,確保新提交不會破壞現有程式碼。2、站在Claude的視角設計適配環境:每個智能體都啟動於無上下文的新容器中,會花費大量時間自我定位,尤其在大型項目中。甚至在運行測試前,為幫助Claude自助,開發者需要在說明中要求維護詳細的README文件和進度檔案,並需頻繁更新當前狀態。3、簡化平行機制:當存在多個獨立失敗的測試時,平行化輕而易舉,但當智能體開始編譯Linux核心時卻陷入困境。與包含數百個獨立測試的套件不同,編譯Linux核心是單項巨型任務,所有智能體都會遇到相同的bug,修復後卻互相覆蓋修改,運行16個智能體也不行,因為它們都卡在解決同一問題上。為此,開發者編寫了新測試框架,將GCC作為線上驗證編譯器進行比對。這讓每個智能體都能平行工作,在不同檔案中修復不同bug,直至Claude的編譯器最終能編譯所有檔案。4、多元智能體角色分工:LLM編寫的程式碼常重複實現現有功能,因此開發者指派了一個智能體專門合併發現的重複程式碼。另一個負責最佳化編譯器本身的性能,第三個則專攻輸出高效的編譯程式碼,還讓一個智能體以Rust開發者視角批判項目設計並進行結構性改進,另設智能體專注文件工作。開發者稱,該成果已經逼近Opus的能力邊界,但仍有需要提升的方面:1、16位x86編譯器缺失:缺乏從真實模式啟動Linux必需的16位x86編譯器,該環節需呼叫GCC(x86_32和x86_64編譯器為自主實現);2、彙編器與連結器不完善:這兩部分是Claude最後開始自動化的模組,目前仍存在較多缺陷。演示視訊中使用的是GCC彙編器與連結器;3、相容性未達全替代標準:雖能成功建構眾多項目,但尚不能完全替代真實編譯器;4、程式碼生成效率偏低:即使啟用所有最佳化選項,其輸出程式碼效率仍低於停用最佳化的GCC;5、Rust程式碼質量有限:程式碼質量尚可,但遠未達到專業Rust程式設計師的水準。05. 結語:Anthropic在安全性上下了狠功夫Opus 4.6在長上下文理解、複雜推理與智能體協作等方面的性能提升,為企業級高密度、長周期任務提供了新的解決方案。同時,在Anthropic的部落格中,他們用了很大篇幅來寫新模型的安全性。Anthropic通過增強安全評估體系與部署主動防護機制,展現出對AI風險治理的前置性投入。 (智東西)
一個介面測了 N 個模型,DeepSeek V3.2 把我的頭給想禿了。。。
DeepSeek-V3.2 突然發佈,那參數強得離譜……基本上把 GPT-5 都按在地上摩擦了。圖:國外網友瘋狂研究 DeepSeek 3.2累不累啊?Benchmark 資料直接拉滿,而成本更是暴擊一堆海外頂尖模型。價格只有 GPT-5 的約 20%,輸出 Token 甚至只有它的 1/24。圖:DeepSeek  V3.2 參數大家都嗨了。而且這玩意還完美適配 Claude 生態,只需要改名成“deepdeek-reasoner”就好了。作為一個有“模型收集癖”的老玩家,我當時的反應和大家一樣:“扶我起來,我要測它!”但剛坐到電腦前,我就萎了。01| 以前測模型的“勸退”流程你們有沒有算過,以前我們要想對比測試幾個模型,得掉多少根頭髮?想測 DeepSeek?去官網。想測 Claude?去外網。想測阿里通義?去阿里雲。每個平台都得註冊帳號,綁手機,填發票資訊,還得先充值(那怕我只測幾毛錢)。最崩潰的來了。每家的 API 文件都長得不一樣!這家的參數叫 max_tokens,那家非要叫 max_output_tokens。為了相容這堆亂七八糟的介面,我得寫一堆 if-else 的“屎山程式碼”。圖:傳統的模型使用流程我就想簡單的問一句:“DeepSeek V3.2 和Claude Opus 4.5 到底誰寫程式碼更好?”結果這還沒開始測,我已經被“配環境”給勸退了。02|降維打擊:一個介面,通吃所有我實在不想再這麼折騰了,還好有朋友給我推薦了一個神器。它把市面上幾乎所有叫得上名字的頂尖模型(DeepSeek-V3.2、Opus 4.5、Gemini 3 Pro...),全部封裝成了一個標準的 OpenAI 相容介面。市面上做模型中轉的工具不少,但能以雲廠商的底座做到如此絲滑封裝的,還真不多。這就是七牛雲。它不僅僅是省事,這是玩法的降維打擊。這意味著,在我的視角裡,DeepSeek 和 Claude 不再是兩個需要分別配置的龐然大物,它們只是兩個不同的“字串名字”而已。我要做的,就是配置一次七牛雲的 Key。然後? 然後我就擁有了整個 AI 世界。03| 極致偷懶:Vibe Coding 實現“模型自由”既然介面統一了,我甚至連程式碼都懶得自己寫了。我打開了 Google AI Studio,然後開啟了 Vibe Coding(氛圍感程式設計) 模式。不到 10 分鐘,我擼了一個模型競技場出來:圖:模型競技場我一口氣把市面上的主流模型全擼了進來,想測那個測那個。這感覺,太 tm 爽啦!放在程式碼裡也一樣,以前我的程式碼(一堆亂七八糟的 import):import openaiimport anthropic# 此處省略50行噁心的配置程式碼現在我的程式碼:只需要改 model 參數,其他全都不用動client = QiniuAI(api_key="...")# 1. 遇到難題?切 CEO 帳號response = client.chat(model="deepseek-v3.2", messages=complex_task)# 2. 髒活累活?切 牛馬 帳號response = client.chat(model="qwen-turbo", messages=format_task)這就很舒服了。下次有新的模型一上,我不需要改邏輯,改個字串就能無縫升級。比如我突發奇想寫一個賽博朋克風的俄羅斯方塊,DeepSeek V3.2 Speciale 號稱宇宙無敵,先拿它來試試。結果它整整思考了 453 秒....圖:DeepSeek V 3.2 Speciale 思考時間很長然後寫了這玩意。。。圖:DeepSeek V3.2 Speciale 生成的遊戲接著我再試試 Gemini 3 Pro,我只需要在這裡換個模型名字就可以了。這回它不到 2 分鐘就完成了,快到飛起。圖:模型競技場中選擇模型而且這個效果也是碾壓啊。。 所以,模型好不好,不要光看跑分,實際跑一下吧。。。圖:Gemini 3 Pro 生成的遊戲整個過程非常絲滑,畢竟他們是做雲的,這速度非常流暢,不管模型在那,延遲都很低。但不得不說,DeepSeek V3.2 這個最牛逼的模型(Speciale),也是真的慢。04 最後的碎碎念:小孩子才做選擇這個模型競技場對我這種博主來說,太有用了。在這個“三天一個新模型”的瘋狂時代,效率就是生命。我是真的不想再把時間浪費在註冊帳號和配環境上了。很多人問我到底那個模型好?說實話這個問題沒有答案,模型各有千秋,我也會同時使用多個模型。下一步我還想做一件事兒,就是把多個模型放在一塊組成一個委員會,就是所謂的 LLM Council。圖:設想中的 LLM Council這也是有了七牛雲這個“萬能插座”後才能實現的玩法。你想想,每次你問一個問題,背後是一整個“復仇者聯盟”在給你出謀劃策。這才是 AI 正確的打開方式。小孩子才做選擇,成年人當然是全都要! (AI范兒)
終結OpenAI壟斷的11人
【新智元導讀】估值飆升至3500億美元,Claude Opus 4.5強勢登頂企業級市場,Anthropic正式終結了OpenAI的獨角戲時代。從Instagram創始人到OpenAI的「決裂者」,這11位頂尖人物組成了矽谷最豪華的「復仇者聯盟」。他們用一場驚天逆襲證明,在通往AGI的狂飆突進中,對安全的極致堅守才是最深的護城河。如果你在2021年走進Anthropic的辦公室,看到的只是一群從OpenAI「叛逃」出來的理想主義者;但如果你今天再看Anthropic的高管名單,你會發現這已經不再是一個簡單的實驗室,而是一支足以撼動矽谷版圖的「全明星復仇者聯盟」。隨著Anthropic的估值在本月飆升至驚人的3500億美元,Claude Opus 4.5更是拿下了企業級市場32%的份額。在這個龐大的數字帝國背後,是11個性格迥異、背景傳奇的掌舵者。他們有人曾一手打造了Instagram,有人曾是OpenAI最核心的大腦,有人則是守護過Netflix全球資料的守夜人。這是一份關於信仰、決裂與重塑的名單。權力的雙核:兄妹與決裂故事的起點始終是Dario Amodei(CEO)。這位前Google科學家和OpenAI研究副總裁,在四年前做出了一個震驚業界的決定:帶著六名親信出走。原因很簡單,他無法接受老東家在安全問題上的激進。Dario是那種典型的「技術苦行僧」,他拒絕了OpenAI的併購提議,堅守獨立研究。而站在Dario身旁的,是他的親姐姐Daniela Amodei(總裁)。哥哥仰望星空,妹妹腳踏實地。Daniela有著極罕見的履歷:從政治競選的泥潭中摸爬滾打,轉型為Stripe的風控經理,再到OpenAI的安全副總裁。在Anthropic,她是那個能讓理想主義落地的人,直接管理著包括CTO在內的核心高管,確保這家公司的骨架不會被飛速增長的肌肉壓垮。矽谷頂流的跨界當「濾鏡」遇上「大腦」最令人意想不到的加盟者,無疑是Mike Krieger(首席產品官)。作為Instagram的聯合創始人,他曾定義了全球數億人的視覺語言。在將自己的新聞應用Artifact賣給雅虎僅一個月後,他就閃電加入了Anthropic。Krieger的到來是一個強烈的訊號:Claude不想只做工程師的玩具。這位擁有極致產品嗅覺的產品天才,正準備把冷冰冰的模型變成人人愛用的國民級產品。同樣來自頂級商業戰場的還有Rahul Patil(CTO)。兩個月前,他剛從支付巨頭Stripe的CTO位置上卸任。在微軟、亞馬遜和甲骨文歷練多年的他,深諳如何駕馭龐大的工程系統。如今,他接過了指揮棒,掌管著這家AI巨頭所有的工程命脈。「叛逃者」聯盟:為了即使機器不失控在技術核心圈,Anthropic幾乎匯聚了「反叛軍」的精華。Jan Leike(對齊科學負責人)的名字本身就是一面旗幟。他曾是OpenAI「超級對齊」團隊的聯席主管,卻因絕望於前東家對安全的忽視而憤然離職。他的名言「為後AGI時代的人類繁榮而最佳化」,在Anthropic找到了真正的共鳴。在這裡,他不再是孤獨的守望者,而是掌舵者。Jared Kaplan(首席科學官)則是一位理論物理學家出身的「第一性原理」信徒。作為約翰霍普金斯大學的教授,他用量子場論的思維去解構神經網路,為公司確立了長期的科研航向。Tom Brown(首席計算官)曾是GPT-3的幕後締造者。這位自學成才的工程天才,如今正在指揮一場被YCombinator稱為「人類歷史上最大規模的基礎設施建設」。他的任務簡單而艱巨,為甚至還沒誕生的ASI打好地基。Sam McCandlish(首席架構師),另一位擁有史丹佛理論物理博士學位的初創元老。他的論文引用量超過10萬次,但他並沒有留在象牙塔裡,而是從CTO轉型為架構師,專注於那些最硬核的模型訓練難題。守夜人與布道者在這個充滿了不確定性的時代,安全感是最大的奢侈品。Vitaly Gudanets(首席資訊安全官)曾在Netflix全球擴張期間守護其資料安全。作為Lightspeed的營運合夥人,他看慣了科技圈的起起落落。今年9月,他選擇站到Anthropic的城牆上,為這艘巨輪抵禦來自網路世界的暗箭。Jack Clark(政策負責人)則有著最獨特的視角。他從彭博社的一名科技記者起家,寫出了著名的Import AI通訊,最終轉型為OpenAI的政策總監並隨後聯合創立了Anthropic。他是這個極客團隊對外的窗口,遊走在各國政府與國際組織之間,試圖為AI制定規則。Krishna Rao(CFO),這位曾在Airbnb和Fanatics掌管財務戰略的高管,正在為Anthropic繪製一張通往兆市值的藏寶圖。這11個人,有的來自象牙塔,有的來自名利場;有的為了逃離危險,有的為了追尋真相。他們聚在一起,相信人類的理性可以駕馭自己創造的神蹟。在這個瘋狂加速的時代,或許只有這群曾見過深淵、並對其心存敬畏的人,才配握緊那把通往未來的鑰匙。 (新智元)