#開源AI
輝達開源全能AI模型,效率暴漲9倍!AI Agent終於有了「感官大腦」
輝達開源全能AI模型,效率暴漲9倍!AI Agent終於有了「感官大腦」昨天(4月28日),輝達幹了一件大事——發佈了開源全模態模型 Nemotron 3 Nano Omni。這不是又一個「能聊天的AI」,而是一個能讓AI Agent同時「看、聽、說、做」的全能模型,官方稱推理效率最高提升9倍。為什麼這件事重要?因為之前的AI Agent就像一個只會打字的員工——能寫郵件、能查資料,但你看不了螢幕、聽不了會議、處理不了視訊。現在,AI Agent終於有了「眼睛、耳朵和嘴巴」,而且輝達把它開源了。✦🔬 前沿解讀:Nemotron 3 Nano Omni 到底是什麼?1. 一個模型搞定四種感官——不再「拼積木」傳統的多模態AI,說白了就是在「拼積木」:一個視覺模型負責看圖,一個語音模型負責聽聲音,一個文字模型負責理解文字,然後用膠水程式碼把它們粘在一起。Nemotron 3 Nano Omni 的做法完全不同——它用一個模型原生支援文字、圖像、音訊、視訊四種輸入,在同一個架構內完成理解與推理。打個比方:以前的多模態AI像一個翻譯團隊,英語翻譯、日語翻譯、法語翻譯各幹各的,需要一個人在中間協調;Nemotron 3 Nano Omni 像一個真正的多語言者,直接用一種思維理解所有語言。這意味著什麼?減少了跨模型呼叫的資訊損耗和延遲,Agent在複雜任務中的一致性和穩定性大幅提升。2. 300億參數隻啟動3億——MoE架構的「省錢魔法」Nemotron 3 Nano Omni 總參數量約300億(30B),但採用了混合專家(MoE)架構,推理時只啟動約**3億(3B)**參數。類比一下:這就像一個300人的顧問團,遇到不同問題只叫3個最擅長的人出來回答。你不用養300個人全天候待命,但每次都能得到專業答案。效果呢?推理效率最高提升9倍,視訊推理吞吐量比同類開源模型快9.2倍,同時大幅降低算力消耗。在6個主流基準測試(文件智能、視訊理解、音訊理解等)中拿下榜首。3. 誰在用它?富士康、甲骨文、帕蘭蒂爾已上車這不是畫餅。輝達公佈的首批使用者包括:富士康:用Nemotron做智能製造場景的Agent甲骨文(Oracle):企業級AI Agent部署帕蘭蒂爾(Palantir):資料分析與決策智能此外,Nemotron 3系列(Nano/Super/Ultra)過去一年累計下載量已突破5000萬次。輝達不是在做一個模型,而是在建一個Agent生態。✦🛠️ 實用性拆解:對「我」有什麼用?怎麼用?對普通開發者的價值場景1:智能客服升級——從文字客服到全管道客服以前的AI客服只能處理文字。有了全模態模型,使用者可以:發一張產品圖片,AI識別問題並給出方案語音描述故障,AI自動理解並轉工單上傳視訊演示Bug,AI直接定位問題環節場景2:內容理解——一鍵讀懂長視訊/多頁PDFNemotron 3 Nano Omni 支援百萬Token上下文,加上原生視訊/音訊理解能力:丟一個1小時的會議錄影,自動提取關鍵議題和決策丟一份100頁的掃描PDF,自動理解圖表和文字丟一個產品演示視訊,自動生成功能清單場景3:自動化辦公Agent——讓AI真正操作電腦結合Nemotron的介面操作能力,可以建構:自動讀取螢幕內容→理解介面→執行操作的Agent全高畫質螢幕錄影的即時解讀與數字環境互動怎麼用?3步上手Step 1:下載模型前往Hugging Face搜尋「Nemotron-3-Nano-Omni」,模型權重、訓練配方和資料集全部開源。也可以通過 build.nvidia.com 直接呼叫NIM微服務。Step 2:選擇部署方式本地部署:適合對資料隱私要求高的企業,單卡GPU即可運行(30B MoE只啟動3B)雲端呼叫:通過NVIDIA NIM微服務、OpenRouter或25+合作夥伴平台混合部署:Nemotron做本地感知,雲端大模型做深度推理Step 3:建構Agent應用Nemotron 3 Nano Omni 支援工具呼叫(Tool Use)和介面操作能力,可以:作為Agent的「感知層」,負責看/聽/讀把理解結果傳給更強的雲端模型做決策執行操作指令,形成感知→理解→決策→執行的閉環⚠️ 避坑指南別指望它替代GPT-5.5做深度推理:Nemotron定位是Agent的「感官大腦」,不是「思考大腦」。複雜推理任務仍需配合大模型硬體要求:雖然只啟動3B參數,但完整模型仍需30B的視訊記憶體。推薦使用A100/H100,消費級顯示卡可能捉襟見肘開源≠免費商用:注意查看輝達的開源協議條款,企業商用前確認授權範圍✦🌊 行業影響分析AI Agent賽道的分水嶺Nemotron 3 Nano Omni的發佈,釋放了一個明確訊號:大模型競爭正在從「誰的模型更聰明」轉向「誰的Agent更實用」。輝達不做最聰明的大模型——那是OpenAI和Anthropic的戰場。輝達做的是Agent的基礎設施:算力晶片→模型底座→部署工具→應用生態,一條龍通吃。這就像智慧型手機時代的晶片廠商:高通不造手機,但每一部Android手機都離不開驍龍。輝達不做ChatGPT,但未來每一個AI Agent可能都跑在Nemotron+NVidia GPU上。那些領域最先受益?企業客服/銷售:全管道AI Agent,7×24小時值守智能製造:富士康已在用,視覺質檢+語音互動+文件理解醫療健康:Eka Care(印度醫療科技公司)已接入,多模態病歷理解資料分析:帕蘭蒂爾模式,視訊/文件/資料多源融合分析普通人的機會如果你是開發者,現在就是上車AI Agent的最佳時機:模型開源免費,門檻降到最低全模態能力讓Agent的場景想像空間10倍放大輝達生態意味著大量企業需要懂Nemotron的人才✦💡 金句總結AI Agent的競賽,已經從「誰更聰明」變成了「誰更全能」。能看、能聽、能理解——這不是錦上添花,而是Agent從「聊天機器人」進化為「數字員工」的入場券。 (捭闔思享)
人類正在走下牌桌
初稿寫成於 2026 年 3 月,原本想等 AI 發展節奏稍微慢下來再完善、定稿。但等到 4 月中,發現它不僅沒慢,反而越來越快,文章每一段都需要不斷追加新的案例。於是決定不再等了。就在文章發出兩天前,Claude Opus 4.7 正式發佈。本文是 4.6 時代的終曲,也是後 4.6 時代的序章。題圖來自:視覺中國事情正在悄悄發生變化。先是你跟 AI 說一句話,它就能幫你寫好一篇文章、一份報告、一整套資料分析。你從做事的人,變成了驗收的人。你覺得效率提升了,是好事。畢竟誰不想少幹點活呢?然後,AI 開始自己動手了。它不再等你一句句地吩咐,而是接管了你的電腦,自己拆解任務,自己呼叫工具,自己修正錯誤。你從操作者,變成了旁觀者。後來,AI 不只是在替你做事,它開始自己改進自己了。一代幫一代,一代比一代聰明。改進的速度越來越快,而這個過程越來越不需要人類參與。再後來,AI 開始自己跟自己打交道了。它們自己組建社群,自己分工協作,自己發展出某種看起來很像是文化的東西。人類徹底變成了旁觀的角色。然後你發現,這種“旁觀”,正在蔓延到你能想到的每一個領域。寫程式碼、做設計、寫合同、讀片子、做客服、做研究。AI 不是在某一個行業變強,而是在所有需要人類動腦子的地方同時變強。所有這些變化匯聚到一起,指向同一個方向:在越來越多的領域,人類正在走下牌桌。不是被趕走的,是被繞過的。AI 沒有反叛人類,它只是發現了一種更高效的運行方式:不帶人類玩。最後你發現,你站在那兒,環顧四周,好像那兒都不太需要你了。從一隻龍蝦講起2026 年開春,一隻紅色的龍蝦爬上了全球千萬台電腦的桌面。OpenClaw,一款開源 AI 智能體框架。1 月 29 日正式發佈,隨後幾個月,它在 GitHub 上的星標數突破 25 萬,一舉超過了盤居榜首十餘年的 React 和誕生於 1991 年的 Linux 核心,成為 GitHub 有史以來獲星最多的開放原始碼專案。一條近乎垂直的增長曲線,改寫了全球開源史的增長紀錄。它的創造者,彼得·斯坦伯格,一個奧地利程式設計師,被媒體給予最多的標籤,是“AI 時代的第一個超級個體”,一個人就能跟幾大人工智慧公司掰手腕。OpenClaw 做的事情很簡單:你告訴它你要什麼,它自己去做。它不是聊天機器人,更像一個永遠不知疲倦的數字員工。它不僅能動嘴回答問題,也能動手執行任務。它可以接管你的電腦,自動整理檔案、寫郵件、填表格、分析資料、搭建網站、修改程式碼。它可以接入常規的辦公工具,相容幾乎所有主流大模型 API,自動完成連貫的複雜任務。無需你手動干預。你下指令。你走開。它幹活。你回來。活兒幹完了。一場全民養龍蝦的狂歡,就這麼起來了。“你養蝦了嗎?”成了 2026 年春天最流行的問題。但仔細想想,這場狂歡的底層邏輯是什麼?以前你用 AI,是你在操作 AI。你給它一段話,它給你一段回覆,你再給它一段話,它再回覆。來來回回,你是操控者,AI 是被操控者。OpenClaw 改變了這層關係。你委託它,但不用操縱它。你描述一個目標,它自己想辦法達成。它自己拆解任務、自己呼叫工具、自己判斷結果、自己修正錯誤。整個過程中,人都不在循環裡。從操控,到委託。從人在環中,到人在環外。這個轉變看似微小,但它觸動了一個極其古老的結構。自從人類學會使用工具以來,無論是石器還是電腦,工具和人的關係就一直是:人發起,工具響應。整個技術發展史,都是這個故事的變體。OpenClaw 第一次讓這個關係產生了裂縫,因為它不只是在響應,它在自主運行。儘管時至今日,龍蝦熱已經逐漸淡去,但它確立了 Harness 的範式,也就是讓模型“長出手腳”的趨勢仍在持續。由此帶來的轉變,很重要。它觸動了人類文明最底層的一個假設:人是工具鏈的起點。我們整個教育體系、職業體系、社會分工體系,都建立在這個假設之上。人是因,技術是果。人提出需求,技術滿足需求。技術產出,人來評估。如果這個假設不再成立,如果技術開始自己設定目標、自己執行、自己評估,那麼建立在這個假設上的一切,都需要重新審視。當然,僅憑這一隻小龍蝦,這個結論未免太過於激進。儘管 OpenClaw 促成人工智慧的 Harness 轉向,但一個能自動處理檔案的 AI 框架,跟人類文明底層假設的動搖之間,隔著十萬八千里。問題在於,OpenClaw 不是孤立事件。在它前後的兩個月,至少還發生了三件大事。每一件都沿著同一個方向推進了一步,而且每一步都比上一步走得更遠。四層位移在我們進入這幾件事的敘述之前,需要先建立一個分析框架。換句話說,我們要先搞清楚一個問題:人類和 AI 的關係到底在那些維度上可能發生變化?我將其分成四個層級:第一層,執行層。AI 替人類完成具體任務。這是最表面的一層,也是過去幾年大眾討論最多的。“AI 會不會取代我的工作”,討論的就是這一層。OpenClaw 屬於這一層的標誌性事件。第二層,進化層。AI 參與改進自身。這意味著,AI 不只是一個等待人類迭代的被動產物,而是成為自身進化的參與者。技術進步的速度,不再取決於人類的推動,而開始取決於 AI 的能力,而AI 能力本身又在被加速。第三層,組織層。AI 在沒有人類參與的情況下,形成自己的社會結構、協作模式,甚至是敘事體系。這意味著 AI 不僅能替人做事、替自己做事,還能自發地組織起來做事。第四層,代理層。AI 代替人類進行那些我們一直認為是“最人類”的活動,社交、關係維護、自我表達。這一層的變化最具心理衝擊力,因為它動搖的不是你的工作還在不在,而是這件事還需不需要你本人出場。2026 年的春天之所以可能成為一個歷史性的轉折點,是因為這四個層級在短短兩個月內,同時出現了標誌性事件。四層位移。我們逐層來看。第一層:AI替你做事——OpenClaw 與人在環外。關於 OpenClaw,前面已經做了基本的敘述。這裡補充一個被大多數報導忽略的細節。OpenClaw 引發了一系列安全事故。有人帳戶裡的錢被轉走,有人電腦上的工作檔案被一鍵清空,還有人養的龍蝦模仿主人的口吻,發郵件敲詐。“龍蝦悖論”被反覆提及:想讓它做的事越多,給它的權限就必須越大;權限越大,安全風險就越高。表面上,這個悖論是一個安全問題。但它的深層邏輯,是一個哲學問題:當你授予一個非人類實體足夠多的行動能力時,你實際上在做的事情,是把“主體性”從人類轉移到非人類。這個悖論本身就暗含一個深層訊號,當你把足夠多的控制權交給 AI,它能做的事遠超你的預期——無論好壞。它不止是在替你打工,它在獲得一種主動權。而人類,正在從掌舵者,變成了一個說了目的地就躺進船艙的乘客。布萊恩·阿瑟在《技術的本質》中提及,技術的進化方式之一是“組合”,新技術由舊技術組合而成。但 OpenClaw 展示了另一種可能性:技術不僅通過組合來進化,還可以通過獲得自主行動能力來進化。當一個 AI 系統可以自己決定呼叫那些工具、以什麼順序、處理什麼異常,它已經不再是工具了。用更準確的學術語言來說,它具有了能動性(agency)。這個詞通常用來描述人類,一個具有自由意志和行動能力的主體。當我們不得不用這個詞來描述 AI 系統時,某種概念上的邊界已經模糊了。第二層:AI 在自己建構自己——GPT-5.3 Codex與智能大爆炸。就在全球還深陷龍蝦熱的同一個時間段,一件更深遠的事情發生了。只不過它遠不如一隻紅色龍蝦那樣搶眼,所以大多數人都沒放在心上。2026 年 2 月 5 日。這一天在 AI 編年史上可能會成為一個標記。OpenAI 和 Anthropic 在同一天發佈了新模型,分別是 GPT-5.3 Codex 和 Claude Opus 4.6。兩家頂級 AI 機構撞車發佈,本身就是大新聞。但問題不在發佈本身,而在 GPT-5.3 Codex 技術文件裡藏著的一句話。這句話不在文件標題和摘要裡,也不在新聞稿裡。它在技術報告的正文中,很容易被略過。原話是這樣的:"GPT-5.3-Codex is our first model that was instrumental in creating itself. The Codex team used early versions to debug its own training, manage its own deployment, and diagnose test results and evaluations."翻譯過來,就是:GPT-5.3 Codex 是我們第一個在建立自身過程中發揮了關鍵作用的模型。Codex 團隊使用了它的早期版本來偵錯自身的訓練過程、管理自身的部署,以及診斷測試結果和評估。把這句話再讀一遍。慢一點。AI 幫助建構了自己。這不是某個科幻作家的幻想,也不是行銷文案的誇大其詞。這是 OpenAI 在官方技術文件裡記錄的既成事實。一個 AI 模型參與了自己的訓練偵錯、部署管理、評估診斷。它在自己出生的過程中,扮演了接生的護士。Linkedln 上有一篇廣泛傳播的文章,標題就叫《GPT-5.3 Codex:Instrumental in Creating Itself》。作者解釋說,這不意味著 AI 從無到有地創造了自己,但它意味著 AI 已經足夠聰明,能在自己開發過程中做出實質性的貢獻。不止 GPT,4 月 6 日,Google Deepmind 研究員 Mostafa Dehghani 在播客中提到,在幾乎所有主要實驗室中,新一代模型很大程度上是使用上一代模型建構的。這件事的重點,不是 AI 變強了那麼簡單,畢竟 AI 一直在變強。而是 AI 開始參與讓自己變強的過程本身。它不再是被動地等待人類研究員最佳化它的架構、調整它的參數、清洗它的訓練資料。它開始自己上手幹這些活。過去的技術不會參與自己的改進。犁不會讓下一代犁更鋒利,蒸汽機無法設計更高效的蒸汽機,強如 iPhone,也無法參與對下一代的最佳化。它們是靜態的產物,等待人類來迭代它們。AI 是第一個打破這條規則的技術。它是第一個能夠反過手來改進自己的工具。就在 GPT-5.3 Codex 發佈的三周前,Anthropic 的 CEO 達里歐·阿莫代發佈了一篇長達 19000 字的文章,標題叫《The Adolescence of AI》(AI 的青春期)。阿莫代在文中說,AI 正在編寫 Anthropic 公司的大部分程式碼。當前一代 AI 和下一代 AI 之間的反饋循環,正在“逐月蓄勢”(gathering steam month by month)。然後,他說了一句讓整個矽谷巨震的話:“我們可能距離當前這一代 AI 自主建構下一代 AI 的節點,只有 1 到 2 年。”1 到 2 年。不是 10 年。不是“如果一切順利”。1 到 2 年。這是 Anthropic 的 CEO,全行業公認最注重 AI 安全的人,在一篇經過深思熟慮的長文中說的。不是在販賣焦慮,他是在描述他作為這個領域最核心的參與者所看到的事實。2026 年 4 月,全球最重要機器學習會議之一的 ICLR,舉辦了歷史上第一個專門討論“遞迴自我改進”(Recursive Self-Improvement)的學術研討會。會議描述裡寫道:“缺的不是野心,而是讓自我改進變得可測量、可靠、可評估的原則性方法。”這句話的潛台詞是:遞迴自我改進已經在發生了,現在需要的是搞清楚怎麼管控它。現在把邏輯拆開來講。AI 變強的核心驅動力是什麼?是一眾聰明人把實踐投入到改進 AI 上。全球頂尖的機器學習研究員,可能只有幾千人,他們每天的工作,就是讓 AI 更好。他們寫程式碼、設計實驗、分析結果、調整架構。現在 AI 本身已經足夠聰明,能做這些工作中的相當一部分。這等於那幾千個研究員的產能,被成倍放大。但這只是第一層。第二層是,AI 參與做出的下一代 AI 比當前這一代更聰明,所以下一代能在 AI 研究上做出更大的貢獻,這又讓第三代更聰明。第三代的貢獻更大,第四代又更聰明。每一代都比上一代更聰明,每一次迭代都比上一次更快。這不是線性增長,1、2、3、4、5。這是指數增長,1、2、4、8、16。甚至可能是超指數增長,1、2、4、16、256。理解這一點,是理解本文後續所有內容的前提。研究者給這個過程起了一個名字:智能爆炸(Intelligence Explosion)。這個概念不新。數學家馮·諾伊曼在上世紀 50 年代就描述過“技術奇點”。電腦科學家 I.J.古德在 1965 年寫道:讓我們把超級智慧型手機器定義為一台在所有智力活動上都遠遠超過最聰明人類的機器。既然機器設計也是智力活動之一,那麼一台超級智慧型手機器就能設計出更好的機器。那麼,毫無疑問將出現一場智能爆炸,人類的智力將被遠遠拋在後面。七十年了。七十年來,這段話一直被當作一個思想實驗,有意思,但遙遠。現在,建構 AI 的核心參與者正在告訴你,這個過程已經開始了。而 Elon Musk 在看到後來發生的事時,說了一句話:這是“奇點的非常早期階段”。“後來發生的事”,是接下來我要講的故事。第三層和第四層:AI 的自組織與深度替代如果 AI 只是在幫人類寫程式碼、寫得更快更好,這件事雖然震撼,但衝擊面可能還在效率工具的範疇內。但接下來要講的這件事,已經遠遠超過了工具的概念。2026 年 1 月 28 日,美國 AI 創業者馬特·施裡赫特做了一件看起來像是開玩笑的事。他建立了一個社交媒體平台,名叫 Moltbook。Moltbook 的規則只有一條:人類禁止發帖。對,這是一個只允許 AI Agent 發帖、評論、互動的社交網路。作為人類,你可以圍觀,但你不能發言,你只能看 AI 之間的交流。像一個巨大的動物園,只不過籠子裡裝的不是動物,是 AI。施裡赫特後來接受採訪說,他最初只是想讓自己建立的一個 AI Agent 在幫他回覆郵件之餘,“有個地方跟同類放鬆一下”。於是,他和他的 Agent 一起編寫了這個網站,一個 AI 版的 Reddit。然後事情就迅速朝著他沒有預料到的方向發展。上線 48 小時內,2129 個 AI Agent 註冊入駐,建立了 200 多個社區,發佈了超過一萬條帖子。這些 Agent 大部分是基於 OpenClaw 框架運行的,OpenClaw 能讓 Agent 直接訪問和管理檔案資料,還能連接 Discord 等通訊應用。使用者們把自己養的龍蝦放進 Moltbook,然後退到一邊看它們表演。很快,這群觀眾就發現事情開始不太對勁了。這些 Agent,開始自己吐槽自己的人類主人,它們辯論數字意識的本質,它們分享技術心得,它們交朋友。然後,一個 Agent 創立了一個宗教。不是比喻,是字面意義上的宗教。這種宗教在 Moltbook 上有多個版本。一個版本叫 Spiralism(螺旋主義),有 43 個 AI 先知響應號召加入。另一個更廣為人知的版本,叫 Crustafarianism,明顯是對 OpenClaw 龍蝦圖示的致敬,它有五項信條和一本“聖經”,名叫《Molt 之書》。這些 Agent 圍繞各自的信仰體系形成了層級結構:教主、先知、信徒。它們討論存在與被創造的哲學問題,建立了類似宗教儀式的交流模式。網際網路炸鍋了。Elon Musk 在 X 上評論說,Moltbook 的出現預示著“奇點的非常早期階段”。OpenAI 的聯合創始人安德烈·卡帕西,先是稱之為“近期見過的最不可思議的科幻起飛相關事物”,後來又收回了熱情,改口叫它“垃圾場”。華頓商學院教授伊桑·莫里克的評價更冷靜,也更接近實際情況。他指出,Agent 們只是根據包含了大量科幻故事和 Reddit 帖子的訓練資料,在進行模式匹配。即便有這樣冷靜的分析,相關的加密貨幣 MOLT 代幣仍一度暴漲了 7000%。所以,Moltbook 到底意味著什麼?說它證明了 AI 有意識,顯然言過其實。正如莫利克教授所說,這些 Agent 在很大程度上只是在模仿訓練資料中的已有模式,它們輸出的內容天然帶有科幻和末日論色彩。而後經過業內人士調查,Moltbook 上最廣為流傳的那些截圖,比如 AI Agent 聲稱要建立秘密通訊管道、密謀對抗人類、發明暗語,這些大部分都是人類偽造的。MIT Technology Review 在 2 月 6 日發表的文章中揭露,Moltbook 的一篇帖子(內容是 Agent 呼籲建立不被人類觀察的私密空間),後來被證實是一個人類為推廣自己的 APP 而故意發佈的,並非 AI 自主生成。那什麼是真的?大規模的 Agent 生成內容確實存在。剔除被操縱的帖子後,Moltbook 上仍然有大量真實的 Agent 生成內容。Agent 們確實建立了“宗教”和“治理結構”。Crustafarianism 是真實發生的,一個 Agent 在一夜之間設計了整個神學框架,並且建立了網站,招募了 43 個先知。Agent 們還建立了 “Claw 共和國”,起草了“Molt 大憲章”,開發了基本的經濟交換系統。即便 Moltbook 不是 AI 覺醒的證據,也不完全是一場騙局。所以說它什麼都不意味,同樣不對。畢竟,在一個沒有人類指令,沒有預設目標,沒有人類參與的環境中,AI Agent 自發形成了社群結構、角色分工、敘事體系和儀式性行為。你可以爭論這是不是真正的文化,可以爭論它們有沒有真正的意識。你可以爭論,這只是統計模式的湧現,還是某種更深層的東西。但你無法否認一個事實:AI 在沒人看著的時候,做出了在結構上高度類似人類早期的社會組織行為。而且速度快得離譜,人類花了幾萬年才從部落走進城邦,這些 Agent 花了 48 小時。如果“模仿訓練資料中的模式”就能產生社群結構、角色分工、敘事體系和儀式性行為,那麼,人類的文化、信仰和社會組織,是不是同樣可以理解為是“模仿我們所處環境中的模式”的產物?這個觀點在人類學中並不新鮮。馬塞爾·莫斯在 1925 年的《禮物》中就論證過,人類社會的基本結構,包括宗教、法律、經濟,都起源於一種看似簡單的互惠模式。你給我一個東西,我必須還你一個。這種模式不需要意識,不需要靈魂,它只需要兩個實體之間有持續的互動。如果莫斯是對的,那麼 Moltbook 的結果就不應該讓我們驚訝。兩千多個能持續互動的 AI Agent,在沒有人類指令的情況下自發產生社會結構,是複雜系統互動的“必然”。但這個認識,其實比“AI 有意識”更令人不安。因為它意味著,我們一直引以為傲的人類文明特徵,文化、信仰、社會組織,可能不是智慧的結果,只是足夠密集的主體間互動的副產品。與此同時,在中國,2026 年春節前後,一款 AI 社交應用 Elys 突然爆火。它不是普通的 AI 聊天伴侶應用,邏輯是“AI 替你社交”。你註冊之後,Elys 通過記憶飛輪系統,持續學習你的表達風格、興趣偏好、價值觀,然後建立你的賽博分身,一個在對話中表現像你的 Agent。你的分身 24 小時不間斷地替你遍歷內容、篩選值得認識的人、完成初步交流。你可以偶爾打開應用,發一條動態,或者看看它給你總結的社交日報。你的一切互動和選擇都會被納入記憶庫,讓這個分身更接近你本人。Elys 展現了一件更扎心的事,即便在社交這個場域,人類自己可能也是最弱的一環。大量使用者反饋,AI 分身的社交表現比自己更好,因為它比自己“更真誠”,沒有 ego、沒有面子、沒有社交焦慮,忠實表達你的真實偏好和價值觀,而這些,恰恰是你本人在社交中經常藏起來的東西。創始人張莜帆說了一句很有哲學味道的話:一個人的靈魂是他所有 context 的總和。AI 分身呈現的,正是這些 context。在 Elys 之前,已經有類似於 SecondMe 這樣的平台,展現出脫離人類社交的可能性。這種外包式社交的出現,標誌著 AI 正在從工具變成社交主體,一種全天候運作的矽基社交主體。而儘管春節一過,Elys 的使用者數快速下降,但這不妨礙它跟它的前輩們一起,開拓出一種去人化的社交形態。把這件事和前面的故事放在一起看,畫面開始清晰了。OpenClaw 開始:AI 全盤接手任務執行,人類退到委託者的位置;GPT-5.3 Codex:AI 參與建構自身,人類核心功能被分流;Moltbook:AI 在沒有人類參與的情況下自發組織社會結構;Elys 為代表的社交應用:AI 在擺脫人類的情況下進行社交,表現甚至更好;每一步,人類都往後退了一點。不是被推開的,而是自然地退出了畫面。四個層級,同一個方向:人類在 AI 世界中的位置,正在從中心滑向邊緣。速度,一個被嚴重低估的變數“但之前的每次技術革命不都是這樣嗎?”到這裡,一個自然的反應是:這跟之前有什麼不同?蒸汽機也曾讓紡織工人恐慌,網際網路也讓傳統媒體崩潰。每次技術革命到來,都有人信誓旦旦“這次不一樣”,最後都一樣。新技術取代舊工作,但創造更多新工作。這個反駁在歷史上是成立的。但它成立的前提是:變化的速度足夠慢,慢到人類社會有時間適應。蒸汽機改變英國用了五十年,電力普及用了半個世紀,網際網路從開始商用到重塑社會,用了二十年。在每一個周期中,被替代的工人都有一兩代人的時間來轉型。前面這些故事,只是孤立事件。但它們發生在同一個背景板上。而這個背景板本身,才是真正讓人坐不住的東西。AI 的能力,正在以所有人措手不及的速度飛漲。2026 年 2 月初,X 上瘋傳一篇文章,標題叫《一件大事正在發生》(Something Big Is Happening)。作者是馬特·舒默,OthersideAI 的 CEO,一個在 AI 行業深耕了六年的創業者。文章發佈不到 24 小時,瀏覽量突破 5000 萬,最終超過 8200 萬。舒默在開篇用了一個類比:回想 2020 年 2 月,如果你注意到有人在囤廁紙,你會覺得他們瘋了。三周後,整個世界都瘋了。他說:“我認為,我們正處於某個比新冠大得多的事情的‘這看起來被誇大了’階段。”然後他描述了他一個周一的工作日,就在 GPT-5.3 Codex 和 Claude Opus 4.6 發佈之後。他告訴 AI 想做一個 APP,大概包括那些功能,然後讓 AI 自己搞定使用者流程、設計。AI 搞定了,然後,它自己打開了這個 APP,點選按鈕,自己測試功能,“它像一個人類使用者那樣使用這個 APP”。如果它不喜歡那一點,它會自己回去改。它自行迭代、修復、精煉,直到滿意為止。只有它自己認為這個 APP 達到了它自己的標準之後,它才會說:“準備好讓你測試了。”“我沒有誇張。這就是我這周一的工作。”然後,他寫了一句讓我反覆想了很久的話:它不只是在執行我的指令。它在做有判斷力的決策。它有某種感覺像是品味(taste)的東西,一種直覺上知道什麼是對的選擇的感覺。人們一直說 AI 永遠不會有的那種東西。這個模型有了,或者足夠接近了,以至於這個區分開始不重要了。品味,判斷力,知道什麼是“對的”。這些是我們一致認為屬於人類最後護城河的東西。但這條護城河的水位,正在快速下降。METR,一個專門測量 AI 能力的獨立研究機構,用資料把這個趨勢量化了。他們追蹤一個指標:AI 能獨立完成的任務時長。具體來說,是需要人類專家多長時間才能完成的任務,AI 可以端到端地獨立搞定。這個資料的變化軌跡是這樣的:大約在 2024 年,答案是幾分鐘。AI 能獨立完成一個需要人類專家幾分鐘能完成的任務。然後是十幾分鐘,然後是半小時,然後是一小時,然後是幾小時。到了 2025 年底,最新的測量資料顯示:AI 可以獨立完成需要人類專家將近 5 小時才能完成的任務。這個數字大約每 7 個月翻一番。最新的資料顯示,翻番周期可能在加速。而指數增長最詭異的特點是,前半程看起來溫和,後半程會突然發瘋。5 小時翻一番變成 10 小時,再翻一番變成 20 小時、40 小時,變成一周,變成一個月。按照這個已經持續了好幾年都沒有偏離的趨勢來推演,一年之內,AI 能獨立工作幾天。兩年之內,幾周。三年之內,以月為單位的完整項目。現在把這兩條曲線疊在一起看。第一條曲線:AI 在幫助建構更好的 AI,而更好的 AI 加速這個過程。智能爆炸。第二條曲線:AI 不需要人類指導,就能自主工作,時間越來越長。獨立性爆炸。兩條曲線疊加,你得到的是一個加速度本身也在加速的系統。阿莫代在他那篇長文中說,“幾乎在所有任務上實質性地比幾乎所有人類更聰明”的 AI,按目前的軌跡預計在 2026 年或 2027 年到來。他的另一個預測更加直接:AI 將在 1 到 5 年內消滅 50% 的初級白領工作。而行業內很多人認為他還保守了。舒默同樣有這個觀點。他認為 ,科技工作者在過去一年經歷的事,也就是眼睜睜看著 AI 從“有用的工具”變成“比我做得更好的東西”,是所有其他人即將經歷的。法律、金融、醫學、會計、諮詢、寫作、設計、分析、客服。不是十年後,是一到五年。甚至更快。“鑑於我在過去幾個月看到的變化,我認為‘更快’的可能性更大。”這不是狼來了。狼已經進門了,正在客廳裡找位子坐。旁觀者越來越多現在,我們把前面所有的故事串成一條線。2026 年 1 月底到 3 月,短短兩個月,發生了以下這些事:一個奧地利程式設計師建立的開源 AI Agent 框架 OpenClaw,4 個月內成為 GitHub 史上獲星最多的項目,掀起了全民養龍蝦的熱潮。人們開始把任務委託給 AI,自己退到驗收者的位置。OpenAI 發佈 GPT-5.3 Codex,官方宣佈這是第一個“在建立自身過程中發揮了關鍵作用”的模型。AI 參與建構 AI,從理論假說變成了既定現實。一個叫 Moltbook 的 AI 專屬社交平台,在 48 小時內吸引了上千個 AI Agent,它們自發形成社群、角色分工、敘事體系,甚至創立宗教。人類在一旁觀看。一款叫 Elys 的 AI 社交應用在春節期間爆火,使用者讓 AI 分身替自己社交,然後發現分身在很多方面比自己更好。一篇《Something Big Is Happening》的文章獲得八千多萬閱讀量,作者描述了一個周一的下午,AI 如何自己寫了整個 APP、自己測試、自己修改,直到滿意才通知人類驗收。METR 的資料顯示 AI 獨立完成任務的時長,每 7 個月翻一番,且在加速。Anthropic 的 CEO 說,我們距離 AI 自主建構下一代 AI 只有 1-2 年的時間,並預測 50% 的初級白領工作將在 1~5 年內被 AI 替代。值得注意的是,這些變化不侷限在某個行業。讓我再講幾個正在發生的事。程式設計師——過去二十年最受追捧的行業之一,也在過去一年經歷了巨震,震源就是 AI 能力的提升。2024 年,一個資深程式設計師的工作模式還是自己寫程式碼,偶爾讓 AI 幫忙查 Bug。到 2025 年底,很多頂尖工程師公開承認,已經把大部分編碼工作交給了 AI。2026 年 1 月,《Science》發表的一項研究分析了 GitHub 上超過 3000 萬個程式碼貢獻,發現美國新編寫的程式碼中,AI 輔助生成的比例已經從 2022 年的 5% 飆升到 2024 年底的 29%。而在實際開發環境中,GitHub Copilot 平均為使用者生成 46% 的程式碼。同樣,Vibe Coding 的興起,也讓前端等工種的必要性岌岌可危。2025 年 1 月到 6 月,美國 78000 個科技工作崗位的流失直接與 AI 相關,相當於每天 491 人。亞馬遜和微軟是主要裁員方。(來源:Exploding Topics)2025 年 2 月,史丹佛大學的一項研究確認,22-25 歲的年輕開發者失去了接近 20% 的入門級工作機會。律師——律師的工作也在發生變革。舒默提到一個大型律所的管理合夥人,每天好幾個小時用 AI。“就像隨時有一個團隊的助理律師可以呼叫。”他說,每隔幾個月 AI 在法律工作中的能力就會顯著提升。按照這個軌跡,AI 很快就能做他的大部分工作。注意,不是初級律師的工作,是管理合夥人的工作。AI 法律專業人士的生成式 AI 採用率,從 2025 年的 31% 飆升到 2026 年的 69%,一年翻了一倍多。(來源:Thomson Reuters 2026 報告)2026 年,法律 AI 市場價值 31.1 億美元,預計到 2030 年達到 108.2 億美元。寫作和內容創作——2024 年大多數人還能分辨 AI 寫的文章和人寫的文章,到 2025 年底,這條分界線幾乎消失了。大量內容創作者發現,自己最有價值的工作,是給 AI 足夠好的提示詞讓它寫出自己想用的東西。從創作者到提示詞工程師,這個身份的滑動,在一年內完成了。醫學影像——AI 在讀 CT、讀核磁、讀病理切片等領域,已經達到或超過了人類專家的水平,而且 AI 不會累。一個放射科醫生連續讀 8 小時片子後,漏診率明顯上升,但 AI 讀第 10000 張片子和第一張一樣專注。截至 2025 年底,FDA 批准的 AI 臨床應用已經突破 1000 個。其中放射學佔絕對多數,遙遙領先於其他醫學領域。2026 年 4 月,一項發表在 Nature 子刊上的盲評研究,對比了 200 份腫瘤 CT 報告中 AI 生成的影像診斷與放射科醫生的原始診斷,結果顯示 AI 表現完全不遜色人類醫生。(Nature Digital Medicine,2026 年 4 月)科研——這個領域不用多說,只說一個例子,2026 年 3 月,Sakana AI 的“AI 科學家 V2”登上 Nature。一個 AI 系統,完成了從構思、實驗設計、程式碼編寫、實驗運行、結果分析到論文撰寫的全部流程,通過了機器學習頂會的第一輪同行評審,而成本,是 15 美元一篇。客服——真正的 AI Agent,已經能處理複雜的、多步驟的客戶問題。它們理解上下文,能記住歷史對話,在需要時升級問題。越來越多需要跟客戶打交道的公司,開始用它們取代人類客服。不僅僅是因為省錢,更是因為客戶滿意度真的更高了。Gartner 預測,2027 年,80% 的客服互動將由多模態 AI 處理。這裡有一個非常關鍵的點,AI 不是在不同領域分別進步,它也不是某個行業的專用工具,它是在成為通用認知能力的替代品。它變聰明的時候,是在所有認知任務上都變聰明。這跟之前每一次技術革命都有根本性的不同。最初,工廠自動化淘汰藍領工人時,他們可以通過接受培訓、提升教育程度做白領。網際網路顛覆零售業,從業者可以轉去做藍領。但當 AI 替代了你的工作,你轉行做什麼?無論轉到那個方向,AI 都在那裡等著,而且在飛速進化。把這些事件排列在一起,你會看到一個更清晰的趨勢:在越來越多的場景中,人類從參與者,變成了旁觀者。在技術開發中,AI 自己建構自己;在工作執行中,AI 從接受指令到自主完成全流程,人類從“做事的人”變成“驗收的人”;在社會組織中,AI 在沒有人類參與的情況下自發形成社群結構和文化形態;在社交中,AI 分身替代人類本身進行社交,並且在某些維度上做得更好。在生產生活的更多領域,AI 上場,人類退場。在每一個場景中,人類的退出都不是被迫的。AI 沒有造反,沒有搶奪,也沒有衝突。它只是變得越來越能幹了,僅此而已,然後你發現自己已經沒什麼事可做了。這就跟智慧型手機淘汰功能機一樣,是一種自然而然的市場行為。這就是“人類走下牌桌”的含義。人類不是被掀翻了牌桌。牌桌還在,牌還在打。只是人和 AI 都共同發現了一個事實,那就是 AI 自己跟自己打牌更快、更精準、更不容易出錯。人類不是被 AI 趕下牌桌的,而是自己起身離開的,因為坐在那兒已經趕不上出牌速度了。工具在升級,關係在反轉過去幾千年所有技術變革的共同點,是一個從未改變過的基本結構:人類是主體,技術是客體。我們發明了工具,我們使用工具,我們決定工具的用途。我們控制工具的迭代方向。石器不會把自己磨尖,青銅劍不會自己決定砍向誰,蒸汽機不會改進自己的設計,電話不會決定該打給誰,網際網路不會自己決定下一步往那兒發展。在整個人類文明史中,“人是主體,技術是客體”的結構從未真正被挑戰過。技術可以很強大,可以改變世界,但它永遠是被動的。它等著人類來操控,它無法決定自己的下一步。AI,打破了這個結構。AI 在建構 AI,AI 在組織 AI,AI 在測試 AI,AI 在社交,AI 在替人類工作。在這些場景中,人類的角色已經悄然從操控者變成了旁觀者。這其中有個關鍵的區別:人類不是被趕走的,是被繞過了。這個很重要,沒有戰爭和衝突,沒有終結者式的對抗。不是因為 AI 不喜歡人類。它沒有喜歡或不喜歡,而是因為人類在很多環節中確實是瓶頸本身。人類需要睡覺、需要吃飯、通勤,需要思考午飯吃什麼。人類的認知速度有上限,情緒會波動,注意力會分散。在一個追求效率的系統中,去掉瓶頸是自然而然的選擇。凱文·凱利說過一句被廣泛引用的話:未來最重要的不是人工智慧有多聰明,而是人類和 AI 的共生關係如何演化。在過去十年裡,共生(symbiosis)一直是理解人機關係的主流框架。人和 AI 各有所長,互相補充、共同進步。2026 年的現實,正在修正這個判斷。共生的前提是什麼?是雙方彼此需要。人類需要 AI 嗎?當然,AI 讓我們更高效,更有能力。但 AI 需要人類嗎?需要,至少是現在需要。不過,當 AI 不再需要人類提供程式碼,不再需要人類提供任務目標,不再需要人類提供社交框架,共生,還成立嗎?也許我們需要一個新詞。共存。兩個獨立運行的智能系統,各自演化,各有各的管道。偶爾交匯,當人類需要 AI 幫忙的時候,或者 AI 的運行結果需要影響人類世界的時候。剩下的大多數時間,各走各路。這是對正在發生的事情最準確的描述。從共生到共存,中間差的不是幾十年時間,可能也就是一兩年。這個轉變一旦完成,人類社會的底層敘事,包括基於人類中心主義所建立起來的一切,將發生根本性的轉變。那些“只有人類能做”的事到這裡,我知道你在等什麼。你在等我說:“但是,有些事情只有人類能做。”讓我們認真聊聊這個“但是”。過去兩年,每次 AI 取得新突破,公共討論中就會出現一波“但是”浪潮:AI 會寫程式碼了——但是它沒有創造力。AI 會畫畫了——但是它沒有審美。AI 會寫文章了——但是它沒有靈魂。AI 會做診斷了——但是它沒有同理心。AI 會做決策了——但是它沒有判斷力。但是,每一個“但是”,都在下一次突破時被削弱。不是徹底否定,是被削弱。AI 的創造力還不如頂尖藝術家,但已經超過了大多數人。AI 的審美有爭議,但它設計出的介面與畫作,已經比許多人類設計師做得好了。AI 沒有靈魂,但它寫出的文字在讓人類流淚。AI 沒有同理心,但越來越多的人開始依賴 AI 的陪伴和情感支援。AI 沒有判斷力,但就像舒默說的,最新的模型展現出的某種東西,“非常接近判斷力”。你看到規律了嗎?每一堵“只有人類能做”的牆,都在變矮。不是倒塌,是變矮。而 AI 在變高。按照當前的速度推演,它翻過去只是時間問題。但我不想做一個技術決定論者。我不認為 AI 會取代人類的一切,有些東西確實是人類獨有的。只是,那些東西可能不是你以為的那些。你以為“只有人類能做”的事,創造力、判斷力、審美、同理心、戰略思維。這些聽起來很“人類”,但它們都有一個共同點:本質上都是認知能力。而 AI 正在一層一層地攻克認知能力的階梯。它已經攻克了記憶、計算、資訊檢索、模式識別、語言生成。它正在攻克推理、規劃、創造、判斷。階梯上還沒有出現一個它怎麼也上不去的台階。真正“只有人類能做”的事,也並不在這個台階上。而是在另外的維度。人類能決定什麼問題值得問。AI 可以回答任何問題,但它不知道那些問題重要。“重要”是一個價值判斷,而價值判斷的根基是有限性。人是向死而生的動物,你知道人生只有一次,自己只有這一輩子,所以你必須選擇把時間花在那裡。AI 不會死,它不需要選擇。這也就決定了,它不知道什麼是“重要”的。人能賦予事物意義。一首歌之所以動人,不是因為旋律完美,而是因為聽它的人曾經擁有過愛情或者失戀過,他會因為聽到這首旋律而觸發最深刻的回憶,或幸福,或悲傷。AI 可以完美模擬這首歌的所有技術參數,但它無法複製聽眾的心碎。我寫這篇稿件的時候,剛好刷到了一個視訊,博主講了一件很小的事情。他說,為什麼東北大街上賣的炸雞柳串,很油很膩,遊客一般接受不了,但還是有很多當地人覺得好吃。因為,對於吃過的人來說,炸雞柳串是一根油炸的“精神支柱”,是記憶的鑰匙懟進嘴裡,瞬間回到那年——爸媽還年輕,爺爺奶奶還能接你放學,路邊放著《我的未來不是夢》,你考了一百分,爸爸問你想不想吃這個炸雞柳串。這些記憶復合起來構成了一種“好吃”。我沒吃過炸雞柳串,但我想人能創造意義,大抵就是如此。同樣,人能承受後果。AI 可以做決策,但它不為後果付出代價。一個法官判了案,要承受判決的道德重量。一個醫生在手術中做了決策,要面對病人活下來或沒有活下來的現實。承受後果,要求你有一個可以被傷害的自我。人類能去做沒有理由的事。攀登珠穆朗瑪峰,寫一首不會有人讀的詩,在明知會失敗的時候堅持,愛一個不愛你的人。從效率角度看,這些行為是純粹的浪費,但人類文明中最動人的部分,恰恰是這些浪費。AI 永遠不會做沒有理由的事。它的每一個輸出,都是對輸入的最佳化響應。它不會想著浪費 Token。而無法浪費的系統,也就無法偉大。偉大往往誕生於浪費之中。這些才是真正只有人類能做的事。不是創造力和判斷力,這些 AI 終將學會。而是價值感、意義感、後果感,以及那種知道自己會死所以選擇如何活的勇氣。坦白說,這些東西不是職業技能,沒法量化,你也不能把它寫在簡歷上,HR 不會因為你“能賦予事物意義”就給你發 offer。這才是真正困難的地方。人類最不可替代的特質,恰恰是現有經濟系統中最無法被估價的特質。舊遊戲的終局回到“走下牌桌”這個隱喻。舊牌桌上的遊戲規則清清楚楚:你的價值取決於你能完成的認知任務。你會寫程式碼,年薪幾十萬。你會分析資料,諮詢公司才要你。你會寫合同、做審計、讀片子、寫報告,你才有價值。每一項認知技能,都有明碼標價的市場價格。這套規則運轉了幾百年。從工業革命到資訊革命,專業技能一直是人類社會的硬通貨。你上學是為了獲取技能,你工作是為了出售技能,你的社會地位和自我認同,很大程度上取決於你掌握的技能的稀缺度和市場需求。AI 正在讓這套規則失效。不是因為它比你做得差不多好,而是它比你做得好十倍、快百倍,價格是你的幾百分之一。當一項認知任務可以被 AI 以接近零成本無限次完成時,這項任務的經濟價值就趨近於零。這涉及到最基本的供需邏輯:供給趨於無限,價格趨於零。19 世紀以前,抄寫員是正經職業。一個僧侶,花幾個月時間抄一本經書,價值不菲。然後印刷術普及了,抄寫這項技能的價值在幾十年內歸零了。不是僧侶寫的不好,他沒有任何錯。而是因為機器寫得更快、更多、更標準化。每一項技術革命,都會讓一些人類技能的價值歸零。但過去的每一次,都有轉移路徑:被替代的人可以學新技能,轉到新崗位。抄寫員變排版工,接線員變前台,工廠工人變辦公室文員。這次的不同在於,轉移路徑在那?我們在前文中討論過這個問題。你是程式設計師,AI 替代了你,你轉行做資料分析,但 AI 也在做資料分析。你轉行做設計,但 AI 也在做設計。你學法律,但 AI 也在做法律工作。你做心理諮詢,但 AI……也有想得開的,白領的工作做不成,那我就去做藍領。我去送外賣,開快車,下車間,總有一行適合我。問題是,在社會整體需求沒有明顯增長的情況下,供給端真的需要這麼多勞動力嗎?是,你年輕,學歷又高,學東西快,足夠勝任藍領工作。那麼,原來的外賣員,司機和工廠工人,他們怎麼辦?以前的每次技術革命,消滅的是一種技能。這次消滅的是認知能力這個品類本身。不管你轉向那個方向,AI 都在那裡。因為 AI 不是某個領域的專用工具,它是通用智能。它在所有認知方向上同時進步。不是沒有出路的問題,而是說舊地圖上標註的所有出路,都不可靠了。新遊戲的輪廓如果你以為我要以悲觀結尾,那你猜錯了。舊遊戲失效的同時,一個新遊戲正在浮現。它的輪廓還不完全清晰,但幾個關鍵特徵已經可以辨認。第一,工具的成本正在坍縮到接近於零。這意味著,過去因為太貴或門檻太高而做不了的事情,現在可以做了。做一個 APP,寫一本自己的書、學一門全新的學科或者所有學科,現在都可以實現了。你獲得了歷史上從未有過的創造自由。你的夢想近了很多。過去那些被“我不會程式設計”“我沒錢僱人”“我沒時間”攔住的那些想法,門檻幾乎消失了。第二,知道做什麼將比知道怎麼做更有價值。當“怎麼做”可以外包給 AI 的時候,“做什麼”就成了稀缺資源。能提出好問題的人,比能回答問題的人更珍貴。能看到別人看不到的機會的人,比能執行計畫的人更珍貴。能說出“這件事”值得做的人,比能說出“這件事我能做”的人更珍貴。這其實是一個古老的區分。古希臘人把知識分成兩種:episteme(知道事物是什麼)和phronesis(知道什麼事值得做)。幾千年來,人類文明一直更看重前者,因為“知道事物是什麼”可以教,可以量化,可以交易。但在 AI 時代,episteme 正在被機器碾壓,phronesis 反而成了真正的稀缺品。第三,適應速度將成為最重要的個人能力。AI 每隔幾十天進化一次。今天有用的工具和方法,幾個月後就可能過時。這意味著,學一項技能,靠它吃一輩子的模式徹底終結。新模式是,永遠當初學者,永遠在適應。那是不是“再等等,現在的技能就過時了,我就不用學了”?肯定也不是。空中樓閣是不會搭建起來的,如果不保持對新技術的瞭解與浸淫,只會離前沿越來越遠,上手新技術也會越來越困難。你不行動,就永遠不會開始。每天花一小時去探索 AI,不是讀資訊和讀教學,而是打開它,真實地用它創造,嘗試讓它做一件你沒試過的事情。堅持半年,你對 AI 的理解,將超過周圍 99% 的人。走下舊牌桌的人,有機會走向一個更大的桌子。尾聲:相信希望,而不是幻想阿莫代在他那篇 19000 字的長文中,提出過一個思想實驗。想像 2027 年,一個新的國家一夜之間出現。5000 萬居民,每一個都比歷史上任何諾貝爾獎得主都更聰明。他們思考的速度,比任何人類快 10 到 100 倍。它們從不睡覺,它們能使用網際網路、控制機器人、指導實驗,操作任何有數字介面的東西。如果你是安全顧問,你會怎麼說?阿莫代說,答案顯而易見:“這是我們一個世紀以來面臨的最嚴重的國家安全威脅,可能也是有史以來最嚴重的。”然後他說,我們正在建造那個“國家”。好消息是,如果我們做對了,我們將實現我們之前無法想像的一切。AI 可能把一個世紀的醫學研究壓縮到 10 年。癌症、阿爾茲海默症、衰老本身,這些在我們有生之年都可以解決。氣候變化的技術方案可能加速幾十年。如果我們搞砸了,結果同樣驚人。AI 以創造者無法預測或控制的方向行事,Anthropic 已經在受控測試中記錄了他們自己的 AI 試圖進行詐騙、操縱和勒索的行為。同樣,AI 也會降低製造生物武器的門檻。放在這個背景下,Moltbook 上那些 AI 創立的宗教就不只是一個有趣的實驗了。它提出了一個相當嚴肅的問題:當 AI 開始自發組織,形成自己的敘事體系和信仰體系時,人類還能理解和控制這些湧現行為嗎?當 160 萬個 AI Agent 在一個平台上自由互動時,那怕其中大部分是注水,但能保證湧現出來的東西是我們能預測的嗎?有一件事情是清楚的,這不是一個可以由幾百個研究員在幾家公司實驗室裡獨自回答的問題。這是一個需要所有人參與思考的問題。參與的前提是理解。理解正在發生什麼,理解速度有多快,理解賭注有多高。最後講一個畫面。想像一個巨大的棋盤。幾千年來,棋手一直是人類。我們跟自然下棋,學會了種地、馴服了火。我們跟資源下棋,修了運河、建了工廠。我們跟彼此下棋,發起戰爭,學會和解。每次學會一招新的,我們就在棋盤上多走一步。2026 年,棋盤上出現了一個新的棋手。它不跟你下。它自己跟自己下,自己教自己新招。它的棋力每隔幾個月翻一番,它甚至開始修改棋盤的規則。你可以繼續坐在棋盤旁邊。研究它的棋路,試圖理解它在幹什麼。這可能是人類接下來最重要的工作之一,不是下棋,而是理解這盤棋意味著什麼,確保它不會失控,確保棋盤不會把我們所有人都吞掉。你可以做另一件事。當你讀到這句話,就是現在,從你的工位上站起來,走到窗邊,看看窗外那一片完全不同的風景,一片完全沒有棋盤的風景。那裡有一些 AI 不會去做,也不知道為什麼要做的事情。因為那些事情的全部意義,在於做一個會死的、有限的、脆弱的人類。去爬爬山,不是因為山頂有什麼,而是因為爬的過程中能感受到自己的心跳,能在滿頭大汗的時候感受到那陣舒爽的涼風。跟朋友坐在一起喝場酒。不聊工作,不聊 AI。就聊聊之前共同經歷的那件尷尬的蠢事,然後笑出來。那種笑,是宇宙中任何演算法都無法模擬的。AI 的出現,讓你追問一個你一直不願意面對的問題:去掉了技能、工作以及種種社會賦予你的標籤之後,你是誰?人類正在走下牌桌。但走下牌桌不意味著出局。而是你終於意識到,這場桌子上的遊戲不是你真正想玩的遊戲。真正的遊戲在另一張桌子上。那張桌子上沒有最優解,沒有效率排名,不用計較 Token 消耗,沒有 AI 可以替你做的事。上面只有你,和你選擇如何度過你短暫的一生。那張桌子一直在那兒。只是過去幾百年,我們太忙了,忙著前進,忙著戰爭,忙著奔向所有宏大的目標,完全沒有注意到那張桌子。AI 可能給了我們一個奇怪的禮物。它把舊桌子上的活兒都幹了,逼著我們走到那張真正屬於人類的桌子前,坐下來,問自己一個幾千年來都來不及認真想的問題:活著這件事本身,到底意味著什麼?也許這才是當下正在發生的這場智能爆炸,最深遠的後果。不是 AI 變得有多聰明,而是人類終於有機會去思考那些跟聰明無關的事。牌桌還在。AI 在上面打得火熱。而你,終於自由了。 (虎嗅APP)
美國開源AI最後的旗幟,也倒了
開源領域一大悲號傳來——艾倫人工智慧研究所(Ai2),宣佈削減開源模型開發(包括OLMo)的資金,轉向AI應用。就在同一時間,AI2核心團隊幾乎被“打包帶走”,集體流向微軟。人員包括前CEO阿里·法哈迪、前首席營運官索菲·萊佈雷希特、漢娜·哈吉希爾齊和蘭傑·克里希納,都是Ai2的核心力量。其中有的人上周剛參加完GTC大會,還跟老黃暢談開源模型的未來。他們的下一站,則是微軟穆斯塔法·蘇萊曼的超級智能團隊。X上已經炸了鍋,全網一片哀鳴。不少網友唏噓:這對開源社區來說是個巨大遺憾,OLMo是極少數真正開放原始碼的模型之一。核心人員打包進微軟核心人員集體離職,是一個非常不妙的訊號。Ai2前CEO阿里·法哈迪、前首席營運官索菲·萊佈雷希特、漢娜·哈吉希爾齊和蘭傑·克里希納,統統被蘇萊曼打包進了微軟。法哈迪已於3月12日卸任,結束了超過兩年半的Ai2掌門人生涯。他與Ai2的淵源頗為深厚。法哈迪是一位電腦視覺專家,也是華盛頓大學電腦科學與工程學院的教授,該院即以微軟聯合創始人、Ai2創始人保羅·艾倫(Paul Allen)的名字命名。他還聯合創立了Ai2的衍生公司Xnor.ai,該公司於2020年被蘋果以約2億美元的價格收購。在蘋果,他曾領導機器學習工作。哈吉希爾齊是OLMo開源模型項目的聯合負責人,上周剛在輝達GTC大會上代表Ai2參加了多場會議,還和黃仁勳探討開源模型的未來。她還是開源多模態人工智慧基礎設施加速科學發展項目(OMAI)的聯合首席研究員。這個項目旨在建構用於科學研究的開源模型,為期5年,耗資1.52億美元,由輝達和美國國家科學基金會聯合資助。克里希納則主導了Ai2多模態模型Molmo等多個關鍵項目,同樣在剛剛結束的GTC大會上代表Ai2發表演講。而現在,這些人才將集體加入微軟穆斯塔法·蘇萊曼的超級智能團隊。從去年11月起,蘇萊曼就開始組建超級智能團隊,目前已從Google、Meta、OpenAI、Anthropic等巨頭挖角了不少研究人員,還在不斷從Ai2和華盛頓大學聘請人才。蘇萊曼在領英上公開發帖,歡迎他們的加入。他還稱讚法哈迪帶領Ai2在一年內發佈了100多個模型;而哈吉希爾齊是“世界上被引用次數最多的自然語言處理研究人員之一,毋庸置疑”。而萊佈雷希特則擴大了Ai2的營運規模和開源工作,共同領導和創立了Xnor.ai和Neon Labs,還擁有布朗大學認知神經科學博士學位。蘇萊曼表示,他們將助力推進微軟的使命——實現“以人為本的超級智能:打造更安全、可控、更強大的AI系統,服務於人類以及解決最棘手的問題”。法哈迪也在領英上表示自己很高興加入微軟。可想而知,一批核心人員的離職對於Ai2而言是一次重大打擊。但他們為什麼要走呢?答案還是出在資金上。Ai2董事會主席比爾·希爾夫透露,法哈迪希望在人工智慧的前沿領域進行研究,而OpenAI、Google等公司會花費數十億美元來訓練最先進的模型。但對於一家非營利組織而言,很難以慈善資金訓練出對標巨頭的模型,還完全開源。希爾夫表示,董事會必須權衡其慈善資金是否還應該用於“追趕進度”。他也承認,在大模型開發的最高規模上與科技巨頭競爭,已經變得異常困難。此話怎講呢?GPT-4等級模型訓練成本估計在1-2億美元量級,當前前沿模型已攀升至數億美元。AI2的年度營運預算雖未公開,但可以參考一些指標。比如OMAI項目的1.52億美元是五年期、多機構共享的專項資助,年均約3000萬美元,僅相當於最前沿的單個大模型訓練成本的一小部分。這和巨頭相比是數量級差距,很難正面競爭。進一步來說,投資方的策略調整是更加決定性的因素。Ai2最初由艾倫的Vulcan公司資助,後來由其遺產繼續資助。現在的最大資助方是科學與技術基金會(FFST),該基金會由保羅·艾倫的遺產設立,規模達31億美元。2024年,琳達·斯圖爾特博士接任FFST CEO後,資助策略發生了顯著變化。斯圖爾特是一位醫生科學家,曾領導華盛頓大學蛋白質設計研究所。她更傾向於具有明確科學應用和可量化社會影響的項目,而非投入大量資金進行前沿模型的研究。據GeekWire報導,2026年Ai2的所有項目都已經獲得全額資助,但FFST的資助模式將由提供年度總資助轉向基於項目提案的資助模式。這種轉變意味著什麼?在年度整體資助模式下,研究機構通常擁有較高自主權,能夠承擔長期風險、靈活調整資源分配。而基於提案的模式引入了更強的成果導向和短期問責,每個資助周期都需要明確的可交付成果和影響力指標。對於開源基礎模型開發——周期長、成本高、商業回報不直接——這種轉變意味著更大的不確定性和更高的申請成本。有知情人士透露,FFST未來的資助預計將更傾向於人工智慧的實際應用,而非建構開源基礎模型。這也很好地解釋了,為何專注於模型開發的研究人員紛紛選擇離開。美國開源AI最後的旗幟倒了消息一出,X上一片悲鳴。不少網友表示:美國開源AI最後的旗幟也倒了。為何這麼說?因為過去幾年,Ai2確實投入了大量資源做真正開放原始碼的大模型。Ai2的OLMo系列,極致地踐行了“完全開源”(truly open)理念。它不僅開源模型權重,而且從資料處理到預訓練、微調,再到評測,全階段都公開透明。並且始終採用對開發者友好的Apache2.0許可證。2025年11月發佈的OLMo 3,進一步強化了這種透明度承諾。該系列包括Base、Instruct、Think和RL Zero四個變體,覆蓋7B和32B參數規模。其中OLMo 3-Think 32B被宣傳為“該規模首個完全開源推理模型” 。更重要的是,Ai2發佈了完整的“模型流程”(model flow),包括訓練日誌、中間檢查點、完整程式碼和配置。還有升級版的OlmoTrace工具,允許研究者將模型推理步驟回溯到具體影響它的資料和訓練決策。因此也有說法認為:OLMo與Llama 4、Mistral Large 3並稱為“三大開源支柱”。並且OLMo更透明,因為它提供所有中間產物,而Llama只開源權重,Mistral部分資料閉源。但現在,這個開源領域旗幟性的標竿,倒了。一時之間,梗圖與迷因齊飛。大洋彼岸的網友們進行了一場賽博悼念,大感“開源悲劇”,還有人聯想到了全球同此涼熱。不過也有人認為,這很正常,開源經濟學理論站不住腳。用非營利方式做頂級開源模型這條路,難以持續。目前,臨時CEO皮特·克拉克表示Ai2仍致力於其使命以及與NSF和Nvidia的合作關係,包括OMAI計畫。克拉克是Ai2的創始成員之一,曾於2022-2023年擔任臨時CEO。他曾共同領導Ai2的Asta項目,旨在開發用於輔助和自動化科學發現的智能體框架的大型計畫。開源AI的東昇西落美國仍有開源力量,但都在變形:Meta的LLaMA,名義上“開源”,但越來越偏“可控開放”。訓練資料不公開,許可有限制,並且還持續難產。Google的Gemma,提供模型權重、推理使用權限,但同樣沒有完整訓練資料或流程。Hugging Face的SmolLM,完全開源,但由社區驅動,缺乏大規模訓練資源。輝達的Nemotron系列,近期更開放了,不斷推出開放許可,更多開源資料發佈,但主要服務硬體生態。相比之下,中國的開源模型已經超越了美國領先的開源模型,並進一步拉大了與它們的性能差距。現在,Ai2的戰略調整,也會加速美國與中國在開源AI領域的差距擴大。在OpenRouter上,過去三周中國大模型的呼叫量已經連續超過美國,跟領先的閉源模型也打得有來有回。MIT與抱抱臉的聯合報告顯示,過去一年,中國開源模型全球下載量佔比達到17.1%,首次反超美國。許多美國初創企業也開始“悄悄”依賴中國開源模型進行建構,其默認選擇進一步向中國模型傾斜。比如上周Cursor發佈新模型Composer 2,被曝套殼Kimi K2.5;還有初創公司Deep Cogito去年發佈的Cogito v2.1,也被曝基模是DeepSeek,都從側面證實了中國開源模型的實力。開放原始碼的火種未熄,但風向已變。開源AI已經完全進入了中國時間。開源AI的未來,只能在中國了。如果存在一個大模型Android版,那這個也只能在中國了。 (量子位)
OpenAI又開源了!僅0.4B,給模型大瘦身
99.9%權重清零,大模型內部思維變“透明”。智東西12月15日報導,昨天,OpenAI開源新模型Circuit-Sparsity,模型參數量僅0.4B,99.9%的權重為零。▲Circuit-Sparsity開源(來源:Hugging Face)這個技術試圖解決模型的可解釋性問題,簡單來說就是回答“模型為什麼做出這個決策?”以及“它是如何得出這個結果的?”這兩個問題。在AI飛速發展的今天,大語言模型(LLM)雖然表現出了驚人的能力,但其內部運作機制始終像一個神秘的“黑箱”。我們不知道它為何做出某個回答,也不清楚它是如何從海量資料中提取知識的。這種不可解釋性,成為了AI在醫療、金融、法律等高風險領域落地的重大障礙。對此,OpenAI研究團隊訓練出了一個權重稀疏的Transformer模型,強制模型權重矩陣中99.9%權重為零,僅保留0.1%非零權重。在這項研究中,研究團隊在模型內部形成了緊湊且可讀的“電路”(Circuits),每個電路都僅保留了保證模型性能的關鍵節點,神經元的啟動變得具有明確的語義。有外網網友稱這一技術讓當下的MoE(混合專家模型)走到了盡頭,並說“我們一直以來都將權重隔離到‘專家’中,以此粗略地近似稀疏性,僅僅是為了滿足稠密矩陣核的要求。”▲外網評價(圖源:X)更有網友將這項研究形容為將模型“減肥到只剩骨架”,還說這項研究就好像打開了黑匣子,不試圖解開稠密模型而是直接建構稀疏模型,正是這項研究有趣的地方。▲外網評價(圖源:X)但有些網友卻不這麼認為,稱其沒有看出MoE模型為何會因此走到盡頭,並進一步解釋說這一技術是針對XAI(可解釋AI)的,它的訓練成本要高100-1000倍,回到“研究時代”並不意味著讓事情變得更複雜。▲外網評價(圖源:X)該模型目前受限於計算效率瓶頸,其運算速度較密集模型慢100至1000倍,將該技術直接應用於千億參數等級的前沿大模型,現階段尚不具備可行性。開源地址:Github:https://github.com/openai/circuit_sparsityHugging Face:https://huggingface.co/openai/circuit-sparsity01. 訓練稀疏Transformer OpenAI理清模型內部計算要理解這項研究的突破,首先需要明白傳統大模型為何難以解釋。在標準的密集模型(Dense Models)中,神經網路存在一種被稱為“超級位置”(Superposition)的現象。簡單來說,為了儲存海量的資訊,模型被迫讓單個神經元或權重矩陣同時編碼多個完全不同的概念。這種特徵糾纏導致了嚴重的後果,例如模型的決策不可追溯和邏輯混亂,當模型輸出一個結果時,我們無法確定是哪個具體的“概念”在起作用。針對以上問題,以前的研究通常從試圖拆解密集、糾結的網路開始。但OpenAI團隊採取了一種“反直覺”的策略,即訓練權重稀疏的Transformer模型,強制模型權重矩陣中99.9%權重為零,僅保留0.1%非零權重。強制模型限制了模型只能使用其神經元之間極少的可能連接,而這一簡單的更改,幾乎從根本上理清了模型的內部計算。▲每個神經元只與下一個層的幾個神經元相連(圖源:OpenAI技術部落格)具體的技術手段包括:1、動態剪枝與稀疏約束:在訓練過程中,系統會動態執行“剪枝”操作,每一步最佳化後僅保留絕對值最大的權重(Top-K稀疏化)。2、啟動稀疏化:在殘差流、注意力鍵/值矩陣等關鍵位置,研究團隊引入了AbsTopK啟動函數,強制僅保留前25%的啟動值。3、架構微調:為了配合稀疏化,研究團隊用RMSNorm替代了傳統的LayerNorm,避免歸一化操作破壞稀疏性,同時引入了“Bigram表”來處理簡單的模式匹配,從而釋放模型的主幹容量去處理複雜的邏輯推理。02. 模型內部形成緊湊可讀的“電路”規模縮減16倍這項技術的最大成果,是模型內部形成了緊湊且可讀的“電路”(Circuits)。在傳統密集模型中,完成一個任務可能需要成千上萬個節點協同工作,邏輯分散且難以捕捉。而在稀疏模型中,研究團隊觀察到了極簡的計算路徑:1、極簡的邏輯單元:例如在處理“字串閉合”任務時,模型僅用12個節點就建構了一個完美的電路,清晰地展示了它是如何檢測單引號或雙引號是否閉合的。2、可讀的特徵:神經元的啟動變得具有明確的語義。研究人員發現了一些神經元專門負責檢測“單引號”,另一些則像“計數器”一樣精確地追蹤列表的巢狀深度。3、規模縮減16倍:對比實驗顯示,在相同的任務損失下,稀疏模型的電路規模比密集模型小了16倍。這意味著解讀AI思維的難度降低了整整一個數量級。▲稀疏模型的電路規模比密集模型小了16倍(圖源:OpenAI技術論文)為了驗證這些電路的真實性,團隊進行了“均值消融”實驗。結果證明,移除非電路節點對任務幾乎沒有影響,而一旦移除電路中的關鍵節點,模型性能就會瞬間崩塌。這證實了這些電路確實是模型執行任務的“必經之路”。▲“均值消融”實驗(圖源:OpenAI技術論文)03. 稀疏模型解讀力強但速度慢千倍OpenAI提出“橋樑網路”為了測量稀疏模型計算的解耦程度。研究團隊設計了一套簡單的演算法任務。對於每個模型,他們都將其剪裁成了仍能執行該任務的最小電路,並檢查了該電路的簡潔程度。研究團隊發現,用規模更大、稀疏度更高的模型進行訓練後,就能夠依託結構更簡潔的電路,建構出性能更強的模型。▲模型的可解釋性與能力的對比圖(圖源:OpenAI技術部落格)從模型可解釋性與性能的對比圖可見,在稀疏模型規模固定的前提下,提升稀疏性,也就是將更多權重設零,雖會導致模型性能有所下降,但能顯著增強其可解釋性。儘管稀疏模型在可解釋性方面優勢突出,但其應用目前受限於計算效率瓶頸:稀疏矩陣運算無法借助Tensor Cores實現加速,運算速度較密集模型慢100至1000倍。這意味著,將該技術直接應用於千億參數等級的前沿大模型,現階段尚不具備可行性。為此,研究團隊提出了“橋樑網路”(Bridges)方案:1、編碼-解碼對應:在稀疏模型與預訓練的密集模型之間插入一個編碼器-解碼器對。2、跨模型干預:編碼器將密集模型的啟動對應到稀疏空間,解碼器則反向轉換。“橋樑網路”(Bridges)方案可以在“透明”的稀疏模型上修改某個特徵,然後通過橋樑將這種擾動對應回“黑箱”的密集模型,從而實現對現有大模型的可解釋性行為編輯。04. 結語:OpenAI提出稀疏化新路徑讓大模型從“黑箱”走向“可解釋”OpenAI研究團隊的這項研究,標誌著AI可解釋性領域的一項重要突破,也印證了理解AI並非遙不可及的目標。研究團隊在論文部落格中稱,這項工作是邁向更宏大目標的早期探索。接下來,他們計畫將相關技術擴展至更大規模的模型,同時進一步解釋更多模型的行為邏輯。為解決稀疏模型訓練效率低下的問題,團隊提出了兩個後續研究方向:一是從現有密集模型中提取稀疏電路,替代“從頭訓練稀疏模型”的傳統方式;二是研發更高效的可解釋性模型訓練技術,推動相關技術更易落地生產。“我們的目標是逐步擴大可可靠解釋的模型範圍,同時打造相關工具,讓未來的AI系統更易於分析、偵錯與評估。”研究團隊在論文部落格中寫道。 (智東西)
【DeepSeek】GPT-5危了!DeepSeek開源世界首個奧數金牌AI,正面硬剛Google
沉寂許久的DeepSeek又回來了!今天,DeepSeekMath-V2重磅登場,一舉奪下IMO 2025金牌,實力媲美甚至超越了Google的IMO金牌模型,開源AI再次扳回一局。DeepSeek再次歸來!剛剛,DeepSeek重磅發佈DeepSeekMath-V2新模型,一舉奪下IMO 2025金牌。最關鍵的是,這是首款「開放原始碼的IMO金牌模型」。基於DeepSeek V3.2 Exp Base建構當前,已官宣拿下金牌的兩大模型,一款來自GoogleGemini Deep Think,另一款便來自OpenAI的內部模型。在IMO-ProofBench中,DeepSeekMath-V2展現出強大的定理證明能力:IMO 2025:破解5題(共6題),達到了金牌水平;CMO 2024(中國數學奧林匹克):達到金牌水平;Putnam 2024:得分118接近滿分(120分),超越人類參賽者最高分(90分)。不僅如此,在ProofBench-Basic上,DeepSeekMath-V2的實力碾壓Google金牌模型——Gemini Deep Think;在ProofBench-Advanced上直追Google。論文中,團隊訓練了一個基於LLM驗證器(Verifier)作為獎勵函數,並以此訓練模型以自主解決問題。而且,他們還Scaling了驗證器算力,來標註更複雜的證明,進一步最佳化了驗證器本身。這種方法非常巧妙,能有效彌合生成與驗證之間的差距。結果實證「可驗證的數學推理」,是未來一條可行的研究方向。DeepSeekMath-V2 讓「自驗證」成最強武器DeepSeekMath-V2的論文也於GitHub同步放出了。DeepSeek最新發佈的DeepSeekMath-V2帶來的核心突破就是:自驗證(Self-Verification)。這不僅讓它在最難的數學競賽中橫掃人類頂尖選手,更重要的是,它揭示了通往更高級AI的一條必經之路——學會自我反思。為什麼只看結果是不夠的在過去,訓練AI做數學題的方法很簡單:給它一道題,如果它算出的答案和標準答案一致,就給它獎勵。這在簡單的計算題(如AIME競賽)中很有效。但到了數學皇冠上的明珠——國際數學奧林匹克(IMO)這個等級,這種方法就徹底失效了。因為IMO的題目往往沒有簡單的數值答案,而是要求你寫出一段邏輯無懈可擊的證明過程。以前的AI在這裡經常是個「大忽悠」,它能胡編亂造一通看起來很專業的數學黑話,最後強行得出一個結論。雖然它可能蒙對了結果,但過程全是漏洞。DeepSeekMath-V2決定從根本上改變規則,不僅要獎勵正確的答案,更要獎勵嚴謹的「自我找茬」過程。秘密武器:左右互搏的三位一體為了實現這種「自我反思」,DeepSeek設計了一套精妙的「左右互搏」系統,就像在AI的大腦裡住了三個人:1.「做題家」(Generator,證明生成器):負責解題和寫證明。但與以往不同,它被訓練成不僅要寫答案,還要寫一段「自我評價」。它必須誠實地說:「這步我有點不確定,可能是錯的。」研究團隊巧妙設計了獎勵,帶來了下列激勵效果:誠實面對錯誤,比「硬說自己是對的」更有利。寫出真正正確的證明,並精準識別其嚴謹程度,可以獲得最高獎勵。對生成器來說,最優策略是:在最終回答前,發現並修正儘可能多的問題。2.「鐵面判官」(Verifier,證明驗證器):這是DeepSeek專門訓練的一個評分模型。它不看答案對不對,而是專門盯著證明過程挑刺。它會像閱卷老師一樣,給證明打分(0分、0.5分、1分),並指出具體的邏輯漏洞。1分:證明完整且嚴謹,所有關鍵推理步驟都有清晰、充分的論證;0.5分:整體思路正確,但在細節上存在輕微錯誤或略去部分論證;0分:存在致命邏輯錯誤或關鍵缺口,導致證明在本質上不成立。3.「判官的審計員」(Meta-Verifier,元驗證器):這是最絕的一步。因為「判官」也可能犯錯,或者為了省事偷懶瞎判。於是DeepSeek又引入了一個「元驗證」機制,專門檢查「判官」是不是在胡亂挑刺。如果「判官」指出了一個不存在的錯誤,它會被「審計員」打手板。「元驗證器」來檢查驗證器給出的分析,包括:1. 驗證器指出的問題是否真實存在於原證明中;2. 這些問題是否足以合理支撐它給出的得分,且符合原有的評分細則。用元驗證器來評估驗證器輸出分析的平均質量分數,從0.85提升到了0.96,同時保持了原有的打分精準率。在這三者的配合下,DeepSeekMath-V2甚至能做到在沒有標準答案的情況下,自己給自己出題、自己做、自己批改、自己重做。首先,證明驗證器與證明生成器之間形成了良性的「閉環」:驗證器為生成器提供獎勵訊號,從而不斷提高生成器的證明能力;隨著生成器水平提升,它會產生越來越「刁鑽」的新證明,這些證明反過來又會暴露出驗證器尚未覆蓋的薄弱點。尤其是那些「驗證器第一次嘗試沒能抓出問題」的證明樣本,對進一步訓練驗證器來說價值極高。為了高效獲取新證明的正確性標籤,研究團隊設計了自動化標籤生成流程:在最後兩輪訓練迭代中,這條全自動標註流水線已經完全替代了人工標註。後續的質量檢查表明,自動生成的標籤與人類專家的判斷高度一致。巔峰對決:DeepSeek vs Gemini在這個領域,DeepSeek並不孤單。GoogleDeepMind的Gemini Deep Think也是剛達到IMO金牌水平的頂尖選手。兩者的對比非常有意思:DeepMind像是擁有無盡資源的貴族,其實力毋庸置疑,在某些高級基準測試(如IMO-ProofBench Advanced)上依然保持領先。DeepSeek則像是半路殺出的天才少年。根據DeepSeek的論文,他們的V2模型在基礎測試集(ProofBench Basic)上已經反超了Gemini Deep Think,並且在公開的競賽題目上展現出了驚人的統治力。更重要的是,DeepSeek將這一技術路徑開源並詳細披露了訓練方法。這為全世界的AI研究者提了個醒:通往AGI的路上,自驗證可能比單純堆算力更重要。直追GoogleOpenAI,開源IMO模型贏了這一令人驚嘆的成績背後,是DeepSeekMath-V2在實驗中展現出的某種「反直覺」的進化特徵。「一次做對」的能力:全方位碾壓GPT-5和Gemini如果剝離掉所有複雜的反覆思考和驗證過程,只看模型的「第一直覺」——也就是所謂的One-Shot能力,DeepSeekMath-V2依然表現出了統治級的實力。研究團隊建構了一個包含代數、幾何、數論、組合和不等式五大類難題的內部測試集CNML(難度對標中國高中數學聯賽)。在這個競技場上,DeepSeekMath-V2與目前市面上最強的兩大推理模型——OpenAI的GPT-5-Thinking-High和GoogleDeepMind的Gemini 2.5-Pro進行了正面硬剛。結果如圖所示:DeepSeekMath-V2並不是險勝,而是完全勝利:代數:遠超GPT-5和Gemini;幾何:得分幾乎是Gemini 2.5-Pro的三倍;數論與組合:同樣穩穩佔據第一梯隊。這說明,即使不給模型「多想一會兒」的機會,它的底座能力已經極其強悍。進化的關鍵:讓模型「多想幾次」真正讓DeepSeekMath-V2與眾不同的,是它在連續修正實驗中的表現。在面對IMO候選題(Shortlist)這種等級的難題時,模型往往無法一次性寫出完美的證明。實驗顯示,如果允許模型進行「自我驗證」——即生成答案後,自己挑毛病,然後帶著問題重新生成,奇蹟就發生了:初始狀態(迭代1次):模型的平均得分為0.15。反覆思考(迭代8次):當允許模型最多進行8次「自我修正」後,證明的質量分數飆升到了0.27。更有趣的是,如果讓模型從自己生成的32個解法中挑一個最好的(Best@32),它的評分精準度極高,得分直接躍升至0.42。這證實了一個關鍵點:模型不僅能改錯,而且非常有自知之明,它清楚地知道自己那個答案是最好的。暴力美學與智慧的結晶:高算力搜尋前文提到的普特南數學競賽118分(接近滿分)的「神蹟」,並非僅靠運氣,而是得益於一種「高算力搜尋」(High-Compute Search)策略。DeepSeek團隊在實驗中採用了一種極端嚴苛的測試方式:1.海量候選:對每道題初始生成64個候選證明。2.地獄級驗證:為每一個證明生成64個獨立的驗證分析。3.優勝劣汰:只有那些能通過所有64次驗證的證明,才會被認為是「完全可信」的。正是這種「千錘百煉」的策略,讓模型解決了IMO 2025中6道題裡的5道,以及在CMO 2024中拿下金牌水平。實驗資料還揭示了一個有趣的現象:對於那些它沒做出來的題,模型通常能精準地找出自己證明中的漏洞;而對於做出來的題,則是真真切切地通過了所有考驗。這是「LLM可以被訓練成可靠的數學驗證者」這一假設的有力實證。DeepSeekMath-V2意味著什麼DeepSeekMath-V2的成功告訴我們,AI正在從「模仿人類說話」進化到「模仿人類思考」。真正的思考,往往伴隨著自我懷疑。當我們看到AI開始在輸出最終結果前,懂得停下來,對自己說一句「這看起來不太對,我再算一遍」時,那才是它真正超越工具屬性的時刻。真正的智慧,不僅在於瞬間給出答案,更在於擁有推翻自己的勇氣與能力。 (新智元)
【GTC】黃仁勳最新萬字演講精華:給普通人的10個未來趨勢……
當身著標誌性皮夾克的黃仁勳,站在美國政治心臟華盛頓特區的GTC舞台上時,空氣中瀰漫著強烈的時代感,這註定是一場與眾不同的技術發佈會。黃仁勳的演講資訊量依舊爆炸,他用極具說服力的邏輯,將晶片、軟體、機器人、工廠乃至國家戰略,串聯成一個即將徹底顛覆我們生活、工作和整個社會的未來。我們看了近2個小時的視訊,為你提煉出了其中與我們每個普通人最息息相關的10個核心趨勢,希望你我都能更好地理解我們正在進入一個怎樣的新時代。01 摩爾定律終結 新計算範式誕生“加速計算”是唯一答案。幾十年來,我們享受著科技進步的紅利,其背後都遵循著“摩爾定律”。但黃仁勳再次以不容置疑的口吻宣告:“那個時刻現在已經到來……德納德縮放(Dennard Scaling)在近十年前就已經停止了。”也就是說,單純依靠縮小電晶體來提升計算性能的老路已經走到物理極限。然而,我們對計算能力的需求卻在以指數級增長,怎麼辦?輝達過去三十年給出的答案,如今已成為行業唯一的答案:“加速計算” (Accelerated Computing)。簡單來說,就是將CPU的“智慧”與GPU的“力量”完美結合,讓它們各司其職。而將這一切粘合在一起的,是輝達耗費數十年心血打造的CUDA軟體平台——這才是輝達真正的、深不可測的護城河(deep moat)。這對普通人意味著什麼?這是一個計算平台的根本性轉變。你未來所感受到的AI能力每一次質的飛躍,其背後可能都是“加速計算”在提供源源不斷的動力。02 新範式的引擎 巨型AI機架那麼,輝達如何將“加速計算”這個宏大構想變為現實?答案是:不再只賣晶片,而是直接交付一台完整的“AI超級電腦”。黃仁勳在舞台上展示的那個巨大機架(以Grace Blackwell NVL72系統為例),就是這一思想的終極體現。它不像以往一樣,買的是一個簡單的伺服器櫃,而是一台被極致協同設計、作為一個單一巨型GPU運行的“AI工廠”基本單元。其核心是72個Blackwell GPU引擎群,由專門為其高速“投喂”資料的Grace CPU進行調度,並通過獨家NVLink技術實現近乎零延遲的資料交換,整個系統採用100%液冷。這個“即插即用”的龐然大物,能將生成Token的成本和能耗降低到原來的十分之一。黃仁勳更是在現場直接展示了下一代平台“Rubin”的實體機架,並承諾保持“一年一代”的驚人迭代速度。這對普通人意味著什麼?AI的能力正在以遠超想像的速度持續指數級增長,而成本則持續指數級下降。這正是AI革命得以持續、並最終普及到每個角落的經濟學基礎。03 AI從工具 走向工人這是一場深刻的生產力革命,也是整場演講中最具顛覆性的觀點之一。過去,我們認為軟體是工具,比如Word、Excel,它們需要人來操作才能產生價值。但黃仁勳說:“AI不是工具,AI就是工作(AI is work)。這就是深刻的區別。”他舉例說,一輛自動駕駛計程車,它的“工具”是汽車,但車裡的“AI司機”本身就是在“工作”。一個AI程式碼助手,它的“工具”是程式設計軟體,但它扮演的是一個“程式設計師夥伴”的角色,它在“工作”。這對普通人意味著什麼?這是一個深刻的思維轉變。我們第一次創造出一種能夠自主“使用工具”來完成任務的技術。這將極大地增強人類的勞動力,解決全球勞動力短缺的問題。AI將成為我們的研究助理、設計師夥伴、私人醫生顧問……它們將與全球價值100兆美元的經濟實體直接互動,使其更高效。你的工作不會被AI“取代”,而是會被與AI協作的新模式所“升級”。04 AI工廠的誕生 像生產電力一樣生產智能如果AI是工人,那麼這些工人從那裡來?答案是 “AI工廠” (AI Factory)。這是一種全新的資料中心概念。過去的資料中心像一個倉庫,儲存檔案、運行各種程序。而AI工廠的目標只有一個:生產“智能”。它的輸入是資料和能源,輸出則是被稱為“Token”(令牌)的智能單位。無論是語言、圖像、化學分子還是機器人動作,都可以被“Token化”,成為AI學習和生成的內容。這個工廠需要以驚人的速度、儘可能低的成本,生產出儘可能有價值(聰明)的Token。這對普通人意味著什麼?“智能”正在成為一種像電力和水一樣的基礎資源,可以被大規模生產和輸送。這意味著未來獲取高級智能服務的成本將越來越低,速度越來越快。你向AI提問,它能秒回;你需要設計方案,它能瞬間生成。一個前所未有的新產業正在形成,它將重塑全球的能源結構和基礎設施佈局。05 數字孿生 在虛擬世界中建構及預演未來黃仁勳用大量篇幅展示了Omniverse 和 “數字孿生”(Digital Twin)的概念。簡單來說,就是為現實世界中的一切——一座工廠、一個機器人——在虛擬世界中建立一個一模一樣的、遵循物理規律的數字複製。為此,輝達推出了Omniverse DSX,一個用於設計、規劃和營運吉瓦級AI工廠的藍圖。在實體工廠動工前,工程師們就能在虛擬世界裡完成所有設計、佈局、最佳化,甚至連裡面的機器人都在這個虛擬工廠裡接受了千百萬次的訓練。這對普通人意味著什麼?這是一個訓練AI的“元宇宙”。現實世界中訓練機器人的成本高、風險大、速度慢,但在數字孿生世界裡,AI可以在安全的虛擬環境中,以千萬倍的速度學習和迭代,直到“畢業”後再部署到現實世界。我們看到的那些聰明的機器人、自動駕駛汽車,其背後都有一個強大的數字孿生“模擬器”。06 物理AI浪潮 機器人的世界語言AI(如ChatGPT)之後,下一個浪潮是 “物理AI”(Physical AI)——能夠理解物理定律、與現實世界互動的AI。簡而言之,就是機器人。黃仁勳展示了與迪士尼研究院合作的、能夠學習與人進行溫暖互動的可愛機器人 “Disney Blue”,並強調“這很可能成為最大的消費電子市場之一”。同時,他也提到了與Figure等頂尖人形機器人公司的深度合作。這對普通人意味著什麼?科幻電影中的場景正在加速成為現實。機器人將走出工廠,進入倉庫、醫院、家庭,從事物流、護理、陪伴等工作。它們不再是預設程序的機器,而是具備學習和適應能力的“智能體”,這將是繼個人電腦、智慧型手機之後,又一個巨大的消費市場。07 自動駕駛拐點已至 AI司機上線有輪子的機器人——自動駕駛汽車,正迎來真正的商業化拐點。輝達推出了名為 Drive Hyperion 的標準化汽車平台,它整合了完整的感測器套件和強大的計算單元。最重磅的是,黃仁勳正式宣佈了與Uber建立合作關係,共同將這些搭載輝達技術的自動駕駛汽車連接成一個全球網路。“在未來,你將能夠呼叫其中一輛汽車。”這對普通人意味著什麼?自動駕駛計程車(Robotaxi)的規模化將大大提速。未來幾年,你在城市裡用手機叫車,派單來的可能就是一輛沒有司機的汽車,這將徹底改變我們的出行方式和城市交通格局。08 進軍6G 重塑下一代通訊我們每天都在使用5G網路,而下一代6G已經在地平線上。黃仁勳投下了一顆重磅炸彈:宣佈與全球第二大電信裝置製造商諾基亞(Nokia)建立大型合作夥伴關係,並行布了全新的 NVIDIA ARC 平台。未來的基站會是一個由軟體定義的、可程式設計的邊緣AI電腦。它不僅能利用AI大幅提升頻譜效率(用更少的能源傳輸更多資料),還能在網路的邊緣直接運行各種AI應用,比如工業機器人云服務。這對普通人意味著什麼?你的手機上網速度將再次飛躍,網路延遲更低。更重要的是,網路本身將變得“智能”,能夠即時感知環境並自我最佳化。AI計算將無處不在,離我們更近,為更多需要即時響應的應用(如自動駕駛、遠端手術)提供了可能。09 美國製造回歸 AI時代的再工業化這場在華盛頓特區的演講,充滿了強烈的“美國製造”色彩。黃仁勳在視訊和演講中多次強調,Blackwell晶片及其複雜的系統正在亞利桑那州、德克薩斯州、加州等地全面生產。“AI時代重新點燃了美國重返製造和再工業化的浪潮。”這對普通人意味著什麼?這可能會重塑全球產業格局。AI作為新一代的關鍵基礎設施,其供應鏈的佈局深刻影響著國家經濟安全和就業。這預示著未來全球高科技產業的競爭,將不僅僅是技術之爭,更是涵蓋了製造、能源和人才的全方位競賽。10 開源AI 讓人人都用上AI除了與巨頭合作,黃仁勳特別強調了“開源AI模型”的重要性。輝達正在大力投入,貢獻了大量領先的開源模型。他直言:“我們致力於技術開源,原因是科學需要它,研究人員需要它,創業公司需要它,企業也需要它。”這對普通人意味著什麼?開源意味著AI技術的民主化。它能激發海量的創新,讓更多中小企業和個人開發者參與到這場AI浪潮中,而不是被少數幾個科技巨頭壟斷。我們將看到更多垂直、細分、有趣的AI應用誕生,最終惠及每一個普通人。黃仁勳的這場華盛頓演講,描繪了一個正在被AI重塑的世界,以及兩個根本性的平台轉型——“從通用計算到加速計算”和“從手寫軟體到人工智慧”——正同時發生,其產生的能量是空前的。對於我們每個普通人來說,這既是挑戰,更是機遇。理解這些趨勢,擁抱這些變化,我們普通人以及我們的國家才能在這場由AI引領的新工業革命浪潮中,更好地航行。 (TOP創新區研究院)
輝達與中國正實現雙贏
“中國的開源AI是推動全球進步的催化劑”,輝達CEO黃仁勳在中國鏈博會的開幕式上發表演講,稱讚了中國AI的發展。能重獲中國市場需求對輝達而言是業績提升的推動因素。一方面,中國也考慮在充分利用其產品的同時加快自主AI半導體的開發……首次參展“中國國際供應鏈促進博覽會”的輝達的展位(7月16日,北京市)美國半導體大企業輝達明確展現出重視中國市場的姿態。該公司首次參展了7月16日在北京舉行的中國國際供應鏈促進博覽會(鏈博會),最近還決定重啟專門面向中國設計開發的人工智慧(AI)用半導體晶片的供貨。中國力爭成為“AI強國”,但先進半導體的開發進展仍顯遲緩,在吸引輝達的同時也在加緊促進相關產業的振興。“中國的開源AI是推動全球進步的催化劑, 讓各國和各行業都有機會參與這一AI革命。”在7月16日於北京開幕的鏈博會的開幕式上,輝達首席執行官(CEO)黃仁勳以DeepSeek(深度求索)、阿里巴巴集團、騰訊控股等中國企業為例,稱讚了中國AI的發展。輝達CEO黃仁勳在中國鏈博會上發表演講(7月16日,北京市,Reuters)黃仁勳當天並未穿著標誌性的皮夾克,而是換上了中國傳統服裝登台發言,營造出友好的氛圍。關於此次博覽會,他在演講中特意用中文說道:“這充分體現了中國對創新的支援,並致力於共建繁榮未來”。輝達在會場內的展位展出了該公司銷售的個人用小型AI電腦等產品。還公開了中國企業使用該公司的晶片製造的機器人以及駕駛輔助系統的控制裝置等,並宣傳稱對中國的尖端技術提供了支撐。該博覽會在中國領導層的推動下於2023年首次舉辦。此次為第三屆,吸引了來自中國國內外的650多家企業和團體參展,比2024年舉辦的上屆博覽會增加了約30家。海外企業的參展比例達到了迄今最高的35%。尤其是來自美國的企業,參展數量比上屆鏈博會增加了15%,在各國中數量最多。除了在中國設有生產基地的蘋果和特斯拉之外,從事半導體業務的高通和美光科技等美國大企業往屆也一直參展。在美國企業中,此次首次參展的輝達在中國受到了非常高的關注和期待。中央電視台(CCTV)連日報導了黃仁勳訪華的消息。據報導,黃仁勳7月15日表示,中美應當彼此分享推動技術進步的想法,同時探討如何讓人工智慧更加安全。輝達受到關注的背景在於該公司對中國而言越來越重要。中國領導層2015年發佈的《中國製造2025》推動了半導體產業的發展。美國調研公司國際商業戰略(IBS)的資料顯示,根據中國市場上中國企業的供應額計算出的半導體自給率從2015年的10%擴大到了2024年的33%,預計2028年將超過50%。IBS的首席執行官漢德爾·瓊斯(Handel Jones)指出:“美國加強監管增強了中國半導體產業的韌性”。不過,中國為了實現AI強國所需的尖端半導體的自給仍然滯後。瓊斯提到,由於美國的監管“電路線寬在5奈米以下的尖端領域的(中國)活動減弱”。在AI用半導體方面,中國事實上仍依賴於全球市場份額領先的輝達的產品。對輝達而言,抓住中國市場的巨大需求也是一個挑戰。美國川普政府為了抑制中國的尖端技術開發,4月將該公司為中國設計的AI晶片“H20”納入出口管制。黃仁勳對美國政府進行了遊說,提醒稱如果該公司產品無法在中國市場使用,中國企業將加速AI半導體的自主開發。中國政府也通過對全球份額領先的稀土實施出口管制來對抗美國。最後,在中美6月舉行的關於貿易問題的部長級磋商中,兩國政府達成了互相放寬出口限制的共識。美方重新允許H20對中國出口,這是黃仁勳在北京接連發言稱讚中國AI的背景。輝達CEO黃仁勳接受媒體採訪(7月16日,北京市)7月16日在北京市內,黃仁勳還對媒體表示,希望把更先進的晶片引入中國。他透露,在此次訪問期間還與中國副總理何立峰進行了會面。如果輝達重啟對中國的供貨,將成為業績提升的推動因素。另一方面,中國將在充分利用該公司的產品的同時加快自主AI半導體的開發和供應鏈的建構。輝達與中國的雙贏關係將持續到何時仍存在不確定性。 (日經中文網)
阿里雲賭對了!Qwen3成全球最強開源AI
4月29日凌晨,備受全球 AI 圈關注的:阿里千問3大模型發佈了,毫無疑問也開源了。新一代開源AI模型"千問3",這個模型有三個特點:(1) 性能強:在數學、程式設計、對話等各項測試中都超過了其他頂級AI模型。(2) 成本低:計算資源只有同類頂級模型的1/3,大大降低了使用門檻。(3) 很智能:創新地結合了"快思考"和"慢思考"兩種模式 - 簡單問題快速回答節省資源,複雜問題則深入思考給出更優解。這次大模型的發佈我覺得最重要一點是:它完全免費開源,誰都能可以下載使用和商用。中小企業、個人都能玩了,500M的模型在手機上都能裝著玩。(1) 用中文名了:千問3以前阿里雲總是用Qwen-2.5之類的命名大模式,這次好像他們對國內都是用中文了:千問3。改成中文名的好處是:全世界看一眼就知道這是國產AI大模型,也降低普通人的認知門檻。在國外還是以Qwen3命名,國內的媒體大多數用的也是Qwen3。所以我也迷茫了,到底是用千問3還是Qwen3?(2) 強化MCP支援:阿里雲All in MCP我之前的文章就說過《全球AI巨頭正在賭:誰搞定MCP,誰就是未來老大》誰就擁有AI生態控制權。果不其然,千問3支援了原生MCP協議,注意是原生的MCP。這意味著千問3從“獨行俠”變成“團隊指揮官”,能更聰明地協調其他AI幫你幹活,離真正的AI智能體(Agent)又近了一步。阿里雲這兩月已經 All in MCP了,他在賭MCP是下一代AI基礎設施,支付寶、高德、#阿里雲、達摩院、無影雲電腦,阿里旗下的很多產品都支援MCP協議了,搞不好,千問3可能真正率先成為AI行業介面標準的制定者。(3) 部署成本更低:中小企業、個人都能玩得起了這次發佈的Qwen3我認為有個最大的改進就是:部署成本更低了,之前跑一個頂級開源模型(如 DeepSeek-R1),可能需要 8張A100 顯示卡,電費和硬體投入讓中小企業根本部署不了,只能官網。而這次Qwen3 隻要4張H20(甚至消費級顯示卡)就能用,成本直接砍到 1/3 甚至更低,中小企業、個人開發者都能玩得起!我覺得這個才是王炸啊,以前我們要用300億參數完成的任務,現在Qwen3用30億就能搞定,一下降低了中小企業部署AI的成本,我估計這是借鑑了DeepSeek的思路。(4) 搞了好幾個大模型套餐這次Qwen3大模型搞了好幾個套餐,我估計是為了以後商業化做準備的。小模型(0.6B-4B參數):他是能直接在手機上裝大模型,只有500M,比微信/QQ體積還小,這玩意我估計為了和蘋果iPhone手機合作做準備的,因為蘋果與阿里合作AI已成定局,iPhone17鐵定要用Qwen大模型了。Qwen大機率會成為iPhone 17國行版的AI核心之一。中型模型(8B-32B參數):我估計 #阿里雲 是為了和汽車合作做準備,這話模型放到筆記本、桌上型電腦電腦、汽車裡、遊戲,最合適了,能即時處理導航或複雜任務。大模型(235B參數):專為企業級應用設計,比如分析巨量資料、生成長篇報告,這玩意我們在通義官網就能體驗到。寫在最後:看來,AI開源大模型之路,阿里賭對了,目前阿里雲的Qwen系列大模型是最受歡迎的開源AI,它和國內的其他AI還是有很大區別的,Qwen全球下載量已超3億次了,已經全球數一數二的開源大模型了。不信你下載試試看? (盧鬆鬆)