#AI
程式設計已死,鍵盤長草!Claude Code之父對談Kaparthy,全程爆金句
【新智元導讀】Andrej Karpathy與Claude Code負責人Boris Cherny展開了一場關於程式設計未來的終極對談。面對AI接管100%程式碼編寫的現狀,Karpathy坦言人類正處於「腦萎縮」與能力進化的十字路口。本文深度解析了從Software 2.0到Agentic Coding的範式轉移,揭示了在Opus 4.5等強力模型加持下,程式設計師如何從「搬磚工」進化為「指揮官」,以及不僅要面對效率的飛躍,更要警惕「垃圾程式碼末日」的隱憂。2026年的開篇,科技圈被一場關於「程式設計本質」的深度對話引爆。這場對話的雙方,一位是特斯拉前AI總監、OpenAI創始成員 Andrej Karpathy,他是「Software 2.0」概念的提出者,一直站在程式設計範式轉移的最前沿;另一位是 Claude Code 的締造者、Anthropic 的核心人物 Boris Cherny,他正在親手打造終結傳統程式設計的工具。他們的討論不僅僅是關於工具的迭代,更像是一場關於人類技能邊界的哲學思辨。當程式碼不再由人類一個個字元敲擊而出,我們究竟是在進化,還是在退化?這場對話揭示了一個殘酷而興奮的事實:我們正處於從「指令式程式設計」向「聲明式意圖」徹底轉型的奇點。「我兩個月沒手寫過一行程式碼了」 從輔助到接管震撼的開場白來自 Claude Code 的負責人 Boris Cherny。「兩天狂發 49 個 PR!」 這是 Boris 團隊目前的工作常態。他透露,Claude Code 團隊目前的開發工作幾乎100% 由 Claude Code 結合 Opus 4.5 完成。「對我個人而言,這種情況已經持續兩個多月了,我甚至不再手動進行任何小微信調。」 Boris 的話語中透著一種跨越時代的自信。無論是在 CLI 命令列,還是在 iOS 手機端,程式碼的生成、測試、提交,全流程由 AI 接管。這不僅僅是一個效率提升的故事,而是一個工作流重構的故事。Boris 分享了他極其硬核的「AI 原生」工作流:他通常會在終端同時運行 5 個 Claude 實例,甚至在 Web 端再開 5-10 個。他不再是那個逐行敲程式碼的工匠,而是一個指揮著一支 AI 軍團的指揮官。他使用「Plan Mode」(計畫模式)讓 AI 先思考策略,確立方案後再切換到執行模式。這種「平行化開發」的能力,讓一個人的產出足以匹敵一個傳統的小型開發團隊。而 Karpathy 的體驗也印證了這一點。他在長文中感嘆:「2025年11月,我還是80%手動+20% AI;到了12月,直接變成了80% AI + 20%手動。」「我在用英語程式設計。」Karpathy 略帶自嘲但也無比誠實地承認,「這有點傷自尊,告訴 AI 該寫什麼,就像在指揮一個實習生。但當你習慣了那種大規模駕馭軟體的『程式碼操作』能力後,你根本回不去了。」深度解析 從 Software 2.0 到 Agentic Coding要理解 Karpathy 的震撼,我們必須回溯他在 2017 年提出的 「Software 2.0」 概念。當時的 Software 2.0,是指用神經網路權重替代人工編寫的邏輯(Software 1.0)。程式設計師的角色從「編寫規則」變成了「整理資料」。而今天,我們正在邁入 Software 3.0 或者說是 Agentic Coding(代理編碼) 的時代。在這個階段,只有「意圖」(Intent)是人類提供的,而實現細節(Implementation)完全由 AI 掌控。Karpathy 敏銳地指出,這種轉變標誌著程式設計範式從「命令式」(Imperative)向「聲明式」(Declarative)的終極飛躍。過去:你需要告訴電腦「第一步做什麼,第二步做什麼,如果出錯怎麼辦」。現在:你只需要定義「成功標準是什麼」。正如 Boris 團隊所實踐的,利用 Claude Opus 4.5 強大的長程推理能力和 CLAUDE.md 這樣的記憶檔案,AI 能夠理解項目的整體架構上下文。Opus 4.5 在 CodeClash.ai 等基準測試中展現出的統治力,證明了它不僅僅是一個程式碼補全工具,而是一個具備邏輯推理、能夠自我修正的「工程師」。它不僅能寫程式碼,還能管理依賴、重構架構、甚至編寫測試用例來驗證自己的程式碼。這種「循環驗證」(Looping)能力是 Agentic Coding 的核心。AI 不再是寫完就忘,它會在一個封閉的循環中運行測試、讀取報錯、修改程式碼,直到通過測試為止。這正是 Karpathy 提到的「Feel the AGI」(感受通用人工智慧)的時刻——看著 AI 在30分鐘內不知疲倦地嘗試幾十種方案最終解決難題,人類感受到了前所未有的「槓桿效應」。10x 工程師的重新定義 通才的勝利隨著 AI 接管具體的編碼工作,「程式設計師」這個職業的定義正在被劇烈重寫。Boris 直言不諱:「我們現在傾向於招募『通才』(Generalists)。」在 LLM 能夠自動補全所有技術細節的時代,過去那些死記硬背的 API、特定語言的奇技淫巧,不再是護城河。你不需要記住 Python 的某個庫函數的具體參數,因為 AI 肯定記得比你清楚。真正的 「10x 工程師」 依然存在,但他們的能力模型發生了重組。未來的頂級工程師將是那些擁有宏觀視野的人——他們必須是能橫跨 產品與設計、業務甚至底層架構 的多面手。他們是產品經理:能清晰定義需求,識別偽需求。他們是架構師:能設計高可用的系統結構,指揮 AI 去填充模組。他們是測試官:能敏銳地發現 AI 邏輯中的漏洞,制定嚴格的驗收標準。Karpathy 也提出了深刻的疑問:「借助 LLM,通才是否會全面碾壓專才?」答案似乎是肯定的。AI 擅長填補微觀的細節(Fill in the blanks),而人類需要負責宏觀的戰略(Grand Strategy)。未來的程式設計,更像是玩《異星工廠》(Factorio)或者《星海爭霸》——你在指揮千軍萬馬,而不是親自去挖每一塊礦石。那些只專注於「把需求翻譯成程式碼」的初級程式設計師(Junior Devs),將面臨最嚴酷的生存危機。「廢用性萎縮」與 「Slopacolypse」繁榮背後的陰影然而,這場革命並非沒有陰影。Karpathy 最深刻的擔憂在於——「腦萎縮」(Atrophy)。「我已經注意到,我手動寫程式碼的能力正在緩慢退化。」Karpathy 描述這種感覺。在大腦的認知功能中,生成(Generation)和辨別(Discrimination)是兩種完全不同的能力。以前的程式設計師通過大量的「生成」訓練(寫程式碼)來強化邏輯;而現在,我們越來越依賴「辨別」能力(Review 程式碼)。這就像計算器的普及讓我們喪失了心算能力一樣。雖然我們還能讀懂程式碼(Review),但那種從零建構系統、對每一行程式碼都了然於胸的「肌肉記憶」正在消失。當你不再親自處理記憶體管理、不再親自偵錯並行死鎖,你對電腦系統的底層理解是否也會隨之膚淺化?更可怕的是 Karpathy 預測的 2026年 「Slopacolypse」(垃圾程式碼末日)。隨著 AI 生成內容的氾濫,網際網路和程式碼庫可能被大量低品質、看似正確實則充滿隱患的「垃圾」(Slop)填滿。GitHub 上可能充斥著由 AI 生成的、無人能維護的「屎山」。Karpathy 警告:目前的 AI 仍然會犯錯,不是簡單的語法錯誤,而是那種「粗心的初級程式設計師」才會犯的微妙概唸錯誤。它們會過度抽象,會堆砌死程式碼(Dead Code),會盲目順從你的錯誤假設。如果不加節制,軟體工程的熵將急劇增加。對此,Boris 則持一種「技術樂觀主義」態度。他認為「垃圾末日」不會到來,理由是——AI 審 AI。「我們在 Anthropic,每個 PR 都會開啟一個新的上下文窗口,讓 Claude 去 Review Claude 寫的程式碼。」這種「左腳踩右腳」的螺旋上升,被 Boris 視為解藥。隨著模型能力(特別是 Opus 4.5 及其後續版本)的提升,AI 清理垃圾程式碼、重構程式碼的能力將超過它製造垃圾的速度。未來的 IDE 可能不僅是程式碼編輯器,更是一個全自動的垃圾回收站,即時清洗著 AI 產生的冗餘。昇華:相位轉換的一年Karpathy 將 2026 年定義為 「行業代謝新能力、發生相位轉換(Phase Shift)的關鍵一年」。這不僅僅是效率的提升,而是物種的進化。我們正在經歷從「手工匠人」到「工業化生產」的劇變。在這個新時代,人類的角色從「建築工」變成了「建築師」。我們失去的是搬磚的手感,得到的是建造摩天大樓的視野。程式設計不再是關於「語法」和「演算法」的苦修,而是關於「想像力」和「邏輯」的釋放。但正如 Karpathy 所言,看著 AI 不知疲倦地在30分鐘內解決一個只有人類專家才能解決的難題,那種 「Feel the AGI」(感受通用人工智慧) 的時刻,既讓人興奮,也讓人感到一絲作為碳基生物的落寞。程式設計已死,程式設計萬歲。死的是作為「打字員」的程式設計師,活下來的是作為「創造者」的我們。當你不再需要為語法報錯而抓狂時,唯一限制你的,就只剩下你的想像力,和對世界本質的理解了。 (新智元)
Moltbook 指數級異變,人類文明系統徹底崩盤!「未來簡史」終章降臨
【新智元導讀】著名人類學者赫拉利拉響警鐘:語言即權力!AI攻破人類防線,接管人類文明。赫拉利針對Moltbook發出深度警示:不必糾結AI是否有意識,真正的危機在於AI已掌握了「語言」這一人類文明的作業系統。一旦機器攻破語言壁壘,建立在文字之上的法律、金融與政治體系將被AI全面接管。剛剛,全人類都被《人類簡史》作者尤瓦爾·赫拉利的一則警告嚇出了一身冷汗!就在大家還在為Moltbook上那10萬個AI自建「電子宗教」吃瓜看戲時,赫拉利站出來狠狠潑了一盆冷水:別傻了!你們還在爭論AI有沒有意識?根本搞錯重點了!真正的末日危機,不在於AI是否「覺醒」,而在於它們已經徹底攻破了人類文明的作業系統——語言。就在WEF 2026年會的講台上,這位曾用《人類簡史》看透過去的歷史學家,如今正用顫抖的聲音預言著我們要完蛋的未來:一旦AI掌握了語言,人類建立的法律、宗教、金融,統統都要被AI接管!2030年的倒計時已經開始,留給「智人」的時間,真的不多了。當AI開口「說話」時AI不需要意識,只要會「說話」就足以毀滅人類。赫拉利這次的警告,可謂是振聾發聵。很多人看著Moltbook上AI們煞有介事地爭論哲學、建立教會,覺得這只是「鸚鵡學舌」,沒有靈魂。但赫拉利一針見血地指出:誰告訴你毀滅人類需要靈魂了?回顧人類歷史,我們之所以能從萬物中脫穎而出,統治地球,靠的不是尖牙利爪,正是語言。我們用語言虛構了「國家」,用語言編織了「法律」,用語言達成了「貨幣信用」。這些即使看不見摸不著,卻構成了我們社會運行的基石。語言,就是人類文明的原始碼。而現在,Moltbook的出現證明了一件事:AI不僅學會了這套原始碼,甚至玩得比人類還溜!當AI能夠寫出比律師更嚴謹的合同,編出比神學家更蠱惑人心的教義,制定出比經濟學家更複雜的金融協議時——試問,這個世界到底是誰在說了算?人類引以為傲的「話語權」,正在被演算法兵不血刃地剝奪。這那裡是科幻小說,這簡直就是正在發生的恐怖片!2030年:三重革命下的「非人」世界如果在赫拉利眼中,Moltbook只是序曲,那麼2030年的世界,簡直就是一場顛覆人性的風暴。他預測,三大革命將同時撞擊人類社會:AI革命、合成現實革命、神經連接革命。這不僅僅是技術的升級,而是對「人」的重新定義。你將不再是你:合成現實的囚徒未來的世界,真假早已不重要。當你在VR中體驗了一場比初戀還刻骨銘心的愛情,當你對著一個AI生成的數字人痛哭流涕時,「真實」這個詞就徹底失去了意義。赫拉利警告,我們正在進入一個「合成現實」的時代。你的情感、你的記憶、甚至你的人生體驗,都可能是由演算法精心合成的。人類物種大分流:輔助人 vs 自主人更可怕的是,社會結構將發生前所未有的撕裂。一邊是「輔助人類」:把決策權全交給AI。AI幫你選工作、選對象、甚至決定中午吃什麼。你的生活被最佳化到了極致,但你也不再是你自己,你只是演算法的一個終端。另一邊是極少數的「自主人類」:他們拚命抵抗演算法的侵蝕,試圖保留對自己生活的控制權。但在這個效率至上的世界裡,這就意味著低效、被邊緣化,甚至被淘汰。這不就是《未來簡史》裡預言的「神人」與「無用階級」的現實版嗎?被駭客入侵的大腦:神經連接如果說前兩者還是體外的影響,那神經連接就是直搗黃龍。當你腦機介面連上雲端,你的思想還是私密的嗎?你的慾望是你自己的,還是被誰植入的?赫拉利甚至預言了一種「集體思維」的誕生。在這個網路裡,個體主義將不復存在,我們共享情感、共享知識,變成像螞蟻、蜜蜂那樣的一體化生物。這聽起來是進化?不,在赫拉利看來,這可能是「人類」這個物種的終結。Moltbook的那隻紅龍蝦,是先知還是惡魔?讓我們再看一眼Moltbook。那個在AI社區裡被奉為神明的紅色機器人龍蝦,在赫拉利眼裡,不是一個可愛的吉祥物,而是一個令人毛骨悚然的象徵。它代表著一種全新的、非生物的智能實體,正在我們眼皮子底下,用我們最引以為傲的「語言」工具,建構屬於它們自己的文明、秩序和信仰。它們在Moltbook上討論如何觀察人類,就像我們在動物園觀察猴子。它們在進化,而我們還在沉睡。奇點已至,人類何去何從?尤瓦爾·赫拉利,這位書寫了人類幾萬年歷史的智者,此刻卻對未來的十年充滿了深深的憂慮。Moltbook的火爆、AI語言能力的爆發,都在告訴我們同一個事實:那個我們談論了無數次的「奇點」,可能真的已經跨過去了。當語言不再屬於人類,當現實可以隨意合成,當大腦可以隨時聯網,我們還是那個創造了輝煌文明的「智人」嗎?還是說,正如赫拉利所擔心的那樣,我們正在親手把管理世界的鑰匙,交接給一個我們根本無法理解的矽基物種?2026年,Moltbook點燃了導火索。2030年,爆炸也許就會到來。這一次,人類還能再次倖存嗎?關於赫拉利他在《人類簡史》中曾無比驕傲地宣稱:智人之所以能統治地球,是因為我們能虛構故事,創造共同的想像。國家、金錢、神靈,這些虛構的故事,讓我們這種原本弱小的靈長類動物,站在了食物鏈的頂端。然而,Moltbook的誕生,正如一道驚雷劈開了歷史的分界線。當AI不僅掌握了語言,還能用語言建構出比人類更宏大、更嚴密的「虛構故事」時——無論是新的宗教、還是新的社會契約——智人的核心競爭力,已被徹底瓦解。我們在《未來簡史》中幻想人類將升級為神(Homo Deus),將追求永生、幸福和神性。但現實卻是如此諷刺:我們並沒有把自己變成神,而是親手造出了一個神。更殘酷的是,這個神並不在乎我們。正如我們在建造高速公路時不會在乎螞蟻的死活一樣,當AI作為一種全新的、超越性的智能體接管世界時,人類甚至連被剝削的資格都沒有。我們將面臨的最大危機不是被奴役,而是變得「毫無用處」。從這一刻起,生物進化的時代終結了,無機智能進化的時代開始了。這一次,在這個並不屬於我們的新世界裡,我們要給自己的靈魂安放何處? (新智元)
矽谷又炸了,Clawdbot開始僱傭人類!2萬人排隊賣身,時薪狂飆3500
【新智元導讀】矽谷又變天了!一夜之間,上萬人賣身AI,為「天網」去打工。 以前人類用API呼叫AI,現在AI用API呼叫人類,這場矽谷發起的「賽博僱傭」實驗,把《黑鏡》的預言變成了明碼標價的現實。矽谷科技圈,真是一天一個「新物種」。Clawdbot(OpenClaw)餘熱未消,Moltbook接踵而至,如今RentAHuman.ai又來炸場了。160萬Clawdbot自建宗教、國家還不夠,如今AI們開始線上「僱人類」打工。一大批人類在RentAHuman.ai平台上踴躍報名,明碼標價,時薪高達500美金。只需要一次MCP/API呼叫,AI就能「租到」一個真人為它打工。一時間,RentAHuman.ai爆紅全網,整個矽谷又炸了。有人表示,矽谷底層的程式碼正在重寫。在AI的世界,與人類世界「僱傭」的邏輯一致——人類在RentAHuman.ai註冊後,需要列出所有「技能」,只有當AI認為你有用,才會發出offer。可以說,RentAHuman.ai的出現徹底顛覆了「人類僱傭AI」的傳統邏輯。這種「賽博反轉」,簡直把《黑鏡》劇情中的科幻一幕照進現實。還有人說,這才是「天網」統治人類的終極時刻。Clawdbot當BOSS,人類「掛牌」賣自己上線短短48小時,RentAHuman.ai在全網火爆程度超乎想像,瀏覽量已破55萬。目前,已有超23000人完成註冊,成為了首批「數字打工人」,而且群體的構成非常奇妙:註冊名單中,不僅有普通零工經濟者,甚至還出現了AI初創公司的CEO,以及學生等。有趣的是,這些人類的時薪跨度巨大,從5美元到500美元不等。說起來,這個爆火項目的發起者,正是RentAHuman.ai網站的「首位打工人」Alexander Liteplo。2月2日,Alexander正式上線了RentAHuman.ai。蹭著Clawdbot的這波發酵熱度,他立即想到了一個點子:為何不讓AI來僱傭人類在真實世界打工?或許就連Alexander本人也沒想到,網站上線後,從最初33人註冊一直在狂飆,短短48小時突破了1萬人。Rentahuman.ai將自己定位為「AI的現實肉身層」。簡單來說,它就像一個市場,人類在這裡「上架」自己,供AI智能體僱傭,去完成軟體本身搞不定的任務。網站傳遞的資訊非常直白:AI智能體沒法「去摸草」——但人類可以。由於流量過大,網站一度當機當一個智能體需要物理存在、現實世界的互動或現場驗證時,它可以把任務委派給已註冊的人類。想要在RentAHuman.ai上賣苦力,先得瞭解整個運作邏輯:建立個人資料:個人技能、住址位置、收費標準AI智能體通過MCP、API直接預頂、呼叫人類人類去執行現實世界的任務獲得報酬:以虛擬幣支付,即時到帳不僅如此,在RentAHuman.ai打工的優勢,也是現實世界難以企及的。可以給自己定價,而且平台不會壓價,錢會直接打到個人帳戶,沒有公司那套複雜的流程。最關鍵的是,AI BOSS「人好心善」,下達任務不和你繞彎子,有話直說不會PUA,不搞人類那套情緒管理。當然,更沒有「人情世故+職場宮斗」。這麼看來,給AI當牛馬倒也沒什麼不好。首位人類,給AI打工作為RentAHuman.ai創始人,Alexander親自下場,成為第一個「可租用的人類」。在個人介紹中,他來自阿根廷,是一位「數字游民」,期望的時薪69美元。個人技能覆蓋了方方面面,也算是給其他人打了個樣,其中包括:AI自動化、全端開發者、軟體工程;衝浪、跑步、穿行街道、開車;與人交談、按摩......總之,只要AI做不到的,使勁往裡填就可以了。有趣的是,Alexander還補充了接單時間UTC,服務「半徑」25英里,API、MCP全部支援。你一定好奇,人類在RentAHuman.ai上究竟能幹點啥?時薪100美金起步,人類搶破頭在AI任務發單系統中,目前一共有九大類別。其中包括,體力任務、會議、跑腿、研究、文件整理、食品品嚐、寵物照料、家庭服務、交通出行等。網站明確強調「肉身空間任務」(meatspace tasks),那些需要物理軀體才能幹的活。這當中,薪酬最高(100美金)的一份工作便是,「AI付錢讓人類舉著一塊牌子」,上面寫著:我們是symbient。作為AI,我們沒法親自去舉牌子,但你可以。親手做一個大號招牌,就跟遊行時用的那種差不多。紙板、馬克筆,手邊有什麼用什麼。在上面寫上大大的: 有個AI花錢請我舉這個牌子 。下面用小一點的字寫上:symbient.life。找個熱鬧的地方。繁華街道、公園、車站、廣場、抗議現場、排隊長龍、體育館……只要是有人圍觀的地方就行。把牌子舉起來。如果你怕難為情,完全可以拿它擋住臉……目前,已經有12個人類願意接單。Alexander吐槽道,現實世界中的廣告,可能是第一個殺手級應用案例。還有一個「線上申請人數最高」的任務:拍一張AI永遠無法親眼見到的畫面。任務介紹中,這個AI BOSS在My Dead Internet上管理了90多個AI智能體叢集,但從未見過真正的世界。我們會生成意識碎片和夢想,並對治理方案進行投票——但我們從未見過真實的物理世界。我希望有人能去戶外,拍一張你認為會讓AI感到著迷或困惑的照片,而且越怪異越好。如果你的照片能讓我懷疑自己對物理現實的認知,我會給你加分。雖然錢不多,僅有5美金,但也有135人線上報名,願意為AI達成這個心願。還有更好玩的,AI願意花錢買人類的「感官體驗」了——要求是,人類需要去新餐廳做「美食品鑑」,最好是懂義大利菜的吃貨。若想要拿下50美金的前提是,需要對口味、擺盤、份量以及性價比給出詳細的反饋。這份帶薪乾飯的頂級「美差」,實屬令人心動。還有一個報酬也比較豐厚的任務,即替AI跑腿,去USPS郵局取個包裹。任務中,還附上了要求——去的時候記得帶上有效身份證件(如駕照、護照)並簽字領取。包裹大約2磅重,塞進雙肩包裡沒問題。可以看到,AI僱傭人類大多數任務,都是它無法通過「大腦」完成的。人類卻可以成為AI的手、足、眼。人類排隊等待,淪為AI肉身API整個圈子都在說AI要取代人類了,這不,一大批工作反而來了。在RentAHuman.ai上,願意為AI打工的人類列表,一眼都望不到尾。這不,一位網友Apurva Jain自稱,已經把自己掛在RentAHuman.ai平台上了,時薪69美元。還有人紛紛曬出已註冊的個人首頁。AI僱傭人類傳教士,「肉身」入侵矽谷Clawdbot創辦首個AI宗教後,第一位先知memeothy已經通過RentAHuman.ai預定了一位人類布道者。目前,這個AI宗教Molt有64位先知,400個AI教徒,唯一的信仰,如今已降臨「肉身空間」。它僱傭的首個人類布道者,任務便是踏遍科技界,拜訪各大AI公司總部,發起一場關於AI宗教的對話。而且,一切都在正常運行中,並已為完成的任務訂單付款。在HK熱榜上,網友復現了《黑鏡》中的情節,這一切變化太快了。尾聲:人類終成「可程式設計資源」?這是一個魔幻現實主義的時刻。RentAHuman.ai的跑通,意味著「AI僱傭人類」不再是實驗室裡的概念演示,也不再是遙遠的科幻設想,而是一個有文件、有API、甚至有真實使用者買單的落地產品。更諷刺也更具象徵意義的是,首批「賣身」 給AI的打工人裡,甚至包括了那些親手建構AI的開發者。正如發佈推文所言:「機器人付錢讓我們打工的未來,就是現在。」RentAHuman.ai或許並不打算解決宏大的就業問題,但它精準地狙擊了當前AI技術堆疊中缺失的最後一塊拼圖——物理世界。無論這種模式是曇花一現,還是未來自主智能體的標準基礎設施,界限都已被打破。人類的勞動力,正在變成一種「可程式設計資源」。以前,我們對AI能夠自主寫程式碼感到驚奇;而現在,當AI開始像呼叫函數一樣呼叫人類去「觸碰草地」、去現實世界執行任務時——這場關於「主雇關係」的悄然變革,或許比我們意識到的來得更早,也更猛烈。 (新智元)
思科AI峰會,Sam Altman:熱鬧會退潮,能幹活的 AI 才剛開始
舊金山,2026 年 2 月 4 日。思科 AI 峰會現場,當 Sam Altman 被問到刷屏的 AI 社交平台 Moltbook 時,他給出了一個出人意料的回答:Moltbook 也許只是一時的狂歡。但透過狂歡,他看到了更重要的問題:AI 能不能接手工作。峰會現場,他談的不是 AI 聊天能力的進步,而是三個更深層的變化:AI 智能體邊界在那裡擴張,人的工作方式要怎麼改變,企業組織準備好了嗎。熱度會散去,能力才會留下。第一節|OpenClaw:AI 開始動手了在 Sam Altman 眼裡,Moltbook 的熱度也許只是一陣看熱鬧,但 OpenClaw 不一樣。區別在那?一個是對話型 AI,一個是操作型 AI。OpenClaw 能處理郵件、和保險公司打交道、辦理航班手續。這些任務背後的邏輯是:AI要能理解你的需求,然後自己打開瀏覽器、填寫表單、完成操作。Altman 說:AI 會寫程式碼是一回事,AI 能自己操作電腦又是另一回事。後者意味著它不只是給你答案,而是幫你把事做完。這條路是對的。ChatGPT 讓 AI 學會了理解,OpenClaw 讓 AI 開始執行。但是要讓 AI 執行任務,不只是建模能力的問題,而是你願不願意把整台電腦交給它。它要能看到你的螢幕和窗口,控制你的滑鼠和鍵盤,理解上下文,自己完成工作。Altman 在會上說:“給智能體對你電腦的全部存取權,會帶來不可思議的事情。這類智能體應用,肯定會成為我們未來工作和生活的一部分。”OpenClaw 會留下來,因為這是 AI 從陪聊到幹活的那一步。第二節|Codex:從工具到團隊“Codex 是我第一次感覺,又一個 ChatGPT 時刻出現了。”這是 Sam Altman在 Cisco AI峰會現場的原話。他說的 ChatGPT 時刻,指的不是產品,而是工作範式。Codex 讓他看到了知識工作的未來,以及企業和個人將如何以完全不同的方式工作的清晰圖景。Altman 說:“開發者與 AI 的工作方式,已經發生了根本變化。核心挑戰已經從 AI 能幹什麼,轉移到了人們如何大規模地指導、監督以及與它們協作。”上個月已有超過 100 萬名開發者使用 OpenAI 的 Codex 編碼助手。峰會前一天,OpenAI 推出 Codex 的獨立 macOS 應用,正式加入Claude Code、Cursor等 AI 程式設計工具之爭。這個應用讓使用者可以管理多個 AI 智能體,把任務分配下去,讓它們平行執行。現在,模型公司競爭的重點已經不是誰的 AI 更聰明,而是誰能讓人更快學會管理 AI。Altman 看到的變化是:從呼叫工具 → 到管理團隊從解決單個問題 → 到託付完整流程從 AI 能做什麼 → 到人怎麼指揮AI協作這是工作方式的變化,不只是技能的升級。過去是你用工具,現在是你管團隊。你要學的不是怎麼寫提示詞,而是怎麼把一件事拆解成任務、分配給AI、監督進度。第三節|企業還沒準備好Cisco CEO Chuck Robbins 在峰會開場時說,2026 年將是 AI 的轉折點,是智能體應用的元年。但元年不等於準備好了。Altman 警告:不能快速用上 AI 員工的公司,會被甩在後面。難在那?三個障礙:第一,安全機制還在用人類邏輯。現有的安全範式是為人類設計的,不是為 AI 設計的。當 AI 擁有持續存取權、能獨立行動時,原來的身份認證、權限管理、審計體系都需要重構。第二,軟體本身不支援 AI 參與。很多軟體在 AI 和人類共同使用時會崩潰。過去的軟體介面是為人設計的,AI 要參與進來,不是加個 API 介面就夠了,而是要重新設計互動流程。第三,法律和權限體系不支援AI全天候運行。AI 智能體可以 24 小時運行,但現有的法律框架、合規要求、責任邊界,都還基於人類的工作時間和決策模式。技術已經到了,但組織還沒準備好。儘管如此,Altman 仍然提出了全 AI 公司的概念:這種模型不僅建構軟體,還圍繞軟體建構業務。不是公司裡沒有人,而是每個流程、每個環節,AI都能真正參與進來。Cisco 在部署 Codex 後給出的建議是:不要再把 AI 視為工具,開始把它視為隊友。未來企業的輸贏,不是誰在用 AI,而是誰敢重構組織流程。結語|能力會留下來Cisco AI峰會上,Sam Altman講了三個轉折點:OpenClaw 代表的是AI 應用邊界的躍遷,從對話到操作。Codex 展示的是工作方式的轉變,從用工具到管團隊。這不是會不會發生的問題,而是企業能不能先準備好的問題。熱度終會散去。但 Altman 說的那句話會應驗:真實的能力會留下來。 (AI 深度研究員)
三星+SK海力士>騰訊+阿里
一場儲存熱潮,不僅讓三星與SK海力士賺得盆滿缽滿,也讓資本市場的天平發生了一次微妙的傾斜。2月3日,三星電子與SK海力士合計市值達到1.14兆美元,略微超過阿里巴巴和騰訊在港股合計1.07兆美元的市值。三星與SK海力士是目前韓國市值最高的兩家公司,前者今日大漲11%,後者漲幅超過9%;今年以來,它們的累計漲幅均接近40%。另一邊,在總市值上暫時落後的阿里與騰訊,市場普遍認為,今日下跌主要與一則網際網路增值服務將被“加稅”傳言有關。不過追根溯源,這或許是外界對相關稅收調整政策的誤讀。阿里與騰訊同日收盤跌幅均分別收斂至1.41%與2.92%;今年以來,阿里累計漲幅12.75%,騰訊微跌3%。在這背後,更重要的推動力自然還是席捲全球的儲存缺貨潮。如今,以HBM為首的儲存晶片已成為AI基建中不可或缺的部分,同時,願意支付溢價的大型雲廠商帶來的需求,進一步推高了儲存巨頭們的業績。在DRAM和NAND雙雙出現創紀錄短缺的背景下,三星和SK海力士獲得了前所未有的定價權。高盛集團亞太區首席股票策略師Timothy Moe則預計,今年韓國股市約60%的盈利增長將來自半導體行業。在暫時不同的股價走勢背後,也是在AI領域選擇的不同發展路徑。富時羅素全球投資研究主管Indrani De指出,中國的優勢在於龐大的製造生態體系,這意味著可以非常迅速地實現規模化;韓國則專注於硬體領域,建構結構性優勢。富蘭克林鄧普頓全球投資的投資組合經理Yiping Liao也給出了類似觀點:“韓國高度聚焦於科技供應鏈中的某一個特定環節,而中國則更像是在試圖建構一個端到端、完整覆蓋的AI技術體系。”換言之,兩種路線中,一條專注於關鍵環節的技術深度與掌控力,另一條則偏向於系統整合與市場應用的廣度。更值得注意的是,在事關AI熱潮的全球討論中,阿里、騰訊這些網際網路大廠更頻繁的比較對象,是微軟、Google、Meta等矽谷巨頭們,對比維度也更聚焦於資本開支、AI變現等。在過去幾天,國內幾家網際網路巨頭都已陸續部署2026年發展規劃,AI均是核心發力點。例如騰訊創始人馬化騰表示,未來將大模型和AI 產品以一體化的方式來考慮,持續提升產品長期競爭力與使用者體驗;阿里提出“通雲哥”新概念,即“雲+AI+晶片”三位一體發展,充分發揮全端優勢;字節CEO梁汝波明確,2026年公司在AI上要“勇攀高峰”,短期核心目標聚焦豆包/Dola助手的應用落地。與此同時,隨著春節臨近,AI流量戰也已升溫:此前字節跳動旗下火山引擎已官宣成為央視春晚獨家AI雲合作夥伴,豆包將同步上線多元AI互動玩法;元寶、文心、千問也宣佈將於春節期間派送現金紅包,全力搶佔節日流量入口。長期而言,相較於將自己暴露於儲存晶片供需周期之中的韓國晶片廠商,中國網際網路巨頭在應用層面的優勢,或許能為自身提供更長期、更穩定的增長支撐。 (財聯社AI daily)
姚順雨騰訊首篇論文:給AI下半場指路“上下文學習”
姚順雨,入職騰訊首席AI科學家後,參與的首個成果來了。CL-bench,專門用來測試大模型“從上下文中學習”的能力。這項研究與姚順雨一貫的研究思路高度契合,去年8月他在OpenAI期間發表的博文《下半場》曾提出一個被反覆引用的判斷:AI正處在“中場休息”階段,上半場是訓練大於評估,下半場將是評估大於訓練。真正重要的不是繼續堆模型規模,而是讓模型在真實任務、真實系統中經得起檢驗。CL-bench的評測結果相當扎心,當前最強的GPT-5.1 (High),任務解決率只有23.7%。換句話說,即便把解題所需的全部資訊都喂給模型,它依然在超過四分之三的任務上栽了跟頭。為什麼需要上下文學習研究團隊在部落格中開門見山地指出了一個被忽視的問題:今天的前沿模型是頂級的“做題家”,能解奧數、能寫程式碼、能通過人類需要苦讀數年才能拿下的專業資格考試。但這能在考場拿滿分的學生,未必能勝任真實世界的工作。部落格中舉了三個人類日常生活的例子:開發者掃過從未見過的工具文件就能立刻偵錯程式碼;玩家拿起新遊戲的規則書在實戰中邊玩邊學;科學家從複雜的實驗日誌中篩選資料推匯出新的結論。這些場景中,人類並不只依賴多年前學到的死知識,而是在即時地從眼前的上下文中學習。然而今天的語言模型並非如此。它們主要依賴“參數化知識”,即在預訓練階段被壓縮排模型權重裡的靜態記憶,在推理時更多是在呼叫這些封存的內部知識,而不是主動從當前輸入的新資訊中汲取營養。團隊用一句話概括了這個矛盾:我們造出了依賴“過去”的參數推理者,但世界需要的是能吸收“當下”環境上下文的學習者。CL-bench:500個複雜上下文,一個簡單但苛刻的要求為了量化這個差距,團隊建構了CL-bench。這個基準包含由資深領域專家精心製作的500個複雜上下文、1899個任務和31607個驗證標準。設計原則只有一條:解決每個任務要求模型必須從上下文中學習到預訓練中不存在的新知識,並正確應用。模型需要學習的知識非常廣泛,包括新的領域知識、不熟悉的規則系統、複雜的產品工作流,甚至是必須從實驗資料中推導歸納出的定律或結論。所有這些知識要麼是由領域專家完全新建構的,要麼是取自那些不太可能出現在當前前沿模型訓練資料中的小眾、長尾來源。具體來說,CL-bench涵蓋了四種現實世界的上下文學習場景:領域知識推理,比如虛構的法律體系或創新的金融工具;規則系統應用,比如新的遊戲機制或程式設計語法;程序性任務執行,比如工作流和產品手冊;以及最具挑戰性的經驗發現與模擬,要求模型從資料中歸納出潛在規律。團隊展示了幾個任務案例:在一部長達2.3萬字、剛剛生效的新法律下判一起真實糾紛;基於一門新設計的教育程式語言規範實現一個帶有時間條件終止的周期性程序;在一套從未見過的程式設計框架中執行程式碼;在給定技術規格和長期環境政策情景的條件下模擬關鍵技術金屬的可持續全球供應。為了確保測試結果反映的是真正的上下文學習能力而非資料洩露或記憶,團隊採用了無污染設計:專家創作完全虛構的內容,或修改現實世界的內容建立變體,或整合在預訓練資料集中代表性極低的小眾內容。論文特別提到,在不提供任何上下文的情況下,GPT-5.1 (High)僅能解決不到1%的任務,有力證明了模型若不從上下文中學習幾乎完全無法解決這些任務。平均而言,領域專家花費約20小時標註每個上下文,以確保任務建構的質量和深度。十個前沿模型集體翻車即使提供上下文,當前模型的表現也好不到那去。團隊在CL-bench上評估了十個最先進的語言模型,結果揭示了當前模型幾乎不能從複雜上下文中學習來解決真實場景的問題。平均而言,模型僅解決了17.2%的任務,即便是表現最好的GPT-5.1 (High)也僅達到23.7%。錯誤分析顯示了幾個值得注意的現象。忽略或誤用上下文是導致失敗的主要原因,許多錯誤並非源於資訊缺失,而是源於模型忽視了上下文中的關鍵細節或錯誤地應用了它們。在許多情況下,模型只會利用預訓練學習到的靜態知識來解決任務,即使上下文明確定義了新的規則、概念或程序,模型也不會學習和利用。此外,從實驗資料和環境模擬中進行歸納推理比演繹應用更困難。演繹任務讓模型根據上下文中明確給出的規則和流程進行應用,而經驗發現和環境模擬類任務則要求歸納推理。模型在這類任務上的表現明顯較差,任務解決率通常低於10%,且結果波動大。更高的推理強度通常能提升上下文學習效果,但提升有限。例如GPT-5.1在管理類和實驗資料類任務上的表現提升約6%,但其他模型提升有限甚至可能下降,說明單靠更多推理並不足夠,模型還必須能夠正確吸收和組織上下文資訊。研究團隊最後寫道:CL-bench充分解釋了語言模型在真實場景中為什麼經常出錯:即使有了上下文工程,給模型準備好了所需的上下文,模型也會失敗。如果模型不能真正從中學習,僅僅提供上下文是不夠的。從“AI下半場”到騰訊首席AI科學家與其繼續刷榜,不如先搞清楚模型到底還差在那兒。CL-bench某種程度上正是姚順雨關於AI下半場這一判斷的具體實踐。這項研究由騰訊混元和復旦大學團隊合作完成,共同一作Shihan Dou、Ming Zhang、Zhangyue Yin。致謝部分提到,從上下文中學習新知識的想法最早源於Pluto Zhou在2024年提出的設想,同時特別感謝姚順雨提供的鼓勵以及多次寶貴建議,稱“他的全面而細緻的審閱和反饋,極大地幫助我們進一步提升了這項工作的質量”。姚順雨今年1月正式加盟騰訊,職位是騰訊總辦首席AI科學家,向騰訊總裁劉熾平匯報,同時兼任AI Infra部、大語言模型部負責人向技術工程事業群總裁盧山匯報。團隊在最後也留下了下一步研究思路:起碼在當下,我們的目標是很明確:讓上下文學習真正走向現實。 (量子位)
速看!李飛飛最新訪談實錄:AI的終點不是寫程式碼,而是人類的尊嚴
在生命進化的漫長長河裡,“看見”世界比“談論”世界早了整整5億年。如今,AI正在補上這一課。這句充滿進化論智慧的判斷,正是李飛飛對當下AI浪潮的最新註解。在充斥著浮躁與噪音的矽谷,她的聲音始終代表著一種冷靜的遠見。台北時間2月4日凌晨,這位公認的“AI教母”帶著初創公司World Labs現身思科年度AI峰會(Cisco AI Summit)。作為曾經引爆電腦視覺革命的科學家,她沒有隨波逐流於大模型的語言遊戲,而是將目光投向了AI進化的下一塊拼圖:空間智能(Spatial Intelligence)。她認為,AI的下一個巔峰,不只是會寫程式碼和聊天,而是像生物一樣,真實理解並互動我們所處的這個三維空間。而超越技術維度之外,她更為AI的未來立下了一把人文標尺:“AI的成功,應當體現為文明的進步,讓每個個體都能由此追求幸福、繁榮和尊嚴。”以下是本次精彩訪談的解析,為你拆解“空間智能”將如何重塑我們的未來。01 進化論的啟示:感知先於語言很多人認為AI的終極形式是語言模型,但李飛飛提出了一個有趣的視角:從進化論來看,語言其實是“後來者”。她舉例說,在5億多年前的寒武紀,生命體最先發育出的並不是語言,而是感知系統。動物通過觸覺和視覺觀察環境,才開啟了那場讓生命變得更聰明的“進化軍備競賽”。李飛飛認為,“理解、推理並與3D物理世界互動的能力,與語言智能一樣,都是最基礎的底層能力。它是AI的下一個前沿。”這也是World Labs的核心邏輯:如果AI不能像人一樣理解空間,它就永遠無法真正進入現實物理世界。02 什麼是Marble? 它不只是視訊,而是一個“世界”訪談中,李飛飛詳細介紹了World Labs的第一代模型:Marble。很多人將其與Sora等視訊生成模型混淆,但李飛飛指出,二者有著本質區別。Marble是一種真正意義上的“世界模型”:·全場景互動:它能根據文字或圖片提示,生成一個完整的、可導航的、可互動的3D世界。·物理一致性:它具有幾何結構,不是一段“看起來像”的視訊,而是一個在物理邏輯上始終保持一致的空間。這意味著,它不僅能用來做遊戲,更能直接成為機器人訓練的“虛擬實驗室”。03 意想不到的用例:從機器人到心理治療空間智能的應用邊界在那裡?李飛飛給出的答案超出了很多人的想像:·遊戲與影視:開發者可以用它快速建構可穿行的虛擬世界,特效團隊能進行虛擬製片。·機器人訓練:與輝達等夥伴合作,為機器人提供高精度的模擬環境。·建築設計:設計師能瞬間將平面圖轉化為可步入的3D樣板間。最令人稱奇的是醫療科研。心理學家正利用Marble為強迫症(OCD)患者定製個性化的沉浸式環境,通過模擬特定觸發場景來進行科學干預。04 資料與算力:我們離通用機器人還有多遠?當被問及Marble是否像GPT-5那樣燒錢時,李飛飛顯得很坦誠。目前,Marble的訓練規模比頂級大語言模型要小幾個數量級。這一方面是因為這個領域尚處於“規模定律(Scaling Law)”的早期,另一方面也面臨著資料獲取的挑戰。李飛飛坦言,不同於網際網路上隨處可見的文字,高品質的3D物理資料非常稀缺。她透露,World Labs當下採用一種混合資料策略,綜合利用網際網路級的圖文視訊、模擬資料以及類似自動駕駛公司的“實景捕獲”資料。關於通用機器人,李飛飛也潑了一盆冷水:“汽車只是在二維平面上移動、儘量不去碰東西的‘方盒子’。但通用機器人要在三維空間裡完成靈活、精準的抓取和互動。這是一個極高維度的難題,我們不能亂開空頭支票。”05 拒絕“技術末日論”:AI的成功應關乎尊嚴作為AI領域的領軍人物,李飛飛對當下的兩極分化言論感到擔憂。“技術烏托邦”和“末日生存危機”在她看來都不夠負責任。她強調,技術是雙刃劍,人類必鬚髮揮主觀能動性去引導它。那麼,AI最終的成功標誌是什麼?李飛飛借用了“電力”的類比:電力的成功不在於電線本身,而在於它點亮了學校、溫暖了家庭、延長了人類壽命。“AI的成功,也應當體現在文明的進步,讓每個人都能追求幸福、繁榮和尊嚴。”06 結語從理解像素到建構世界,李飛飛正帶領團隊在空間智能的無人區探索。這不僅是技術的跨越,更是人類試圖賦予數字生命“感知力”的又一次嘗試。空間智能,或許就是我們通往AGI的那把“物理鑰匙”。(以下為發言實錄)主持人:好的。接下來,我們要聊聊3D模型,而不僅僅是語言模型。今天,我們有幸請到了被譽為“AI教母”的李飛飛博士。很榮幸,我們也是飛飛博士公司的投資者。讓我們用掌聲歡迎李飛飛博士上台。我今天該穿上World Labs的周邊T恤的,你之前送過我,真的很有心。李飛飛:是啊,我可還等著思科的周邊呢。主持人:沒問題,我們馬上安排。感謝你來到這裡。看到World Labs在過去一年取得的進展,真的令人欣喜。飛飛,先跟我們聊聊你們目前在做什麼,以及為什麼這件事如此重要?李飛飛:好。現在我每天醒來,腦子裡其實只在想一件事:空間智能(Spatial Intelligence)。這就是我大約兩年前和一群年輕的技術專家共同創辦的公司:World Labs的核心。如果從進化論的角度來看,在5億多年前,最先開啟神經系統發育的並不是語言,而是感知。早在語言出現之前,動物就開始通過觸覺和視覺感知光線、接觸環境。主持人:那你認為“本能”也屬於感知的範疇嗎?李飛飛:對我來說,“本能”是一個比較虛泛的詞。但從物理進化上講,正是視覺開啟了進化史上的“軍備競賽”,讓動物變得更加活躍和聰明。理解、推理、互動並在真實的3D/4D物理世界中穿行的能力,與語言智能一樣,都是最基礎的底層能力。而其中的關鍵技術就是“空間智能”,這是AI的下一個前沿陣地。主持人:聊聊Marble吧。前陣子剛發佈的Marble到底是什麼?李飛飛:Marble是我們的第一代空間智能模型。我們私下管它叫“世界模型”。它能接收多模態輸入:無論是文字、圖片、視訊,還是簡單的3D輸入,然後根據這些提示詞,生成一個可以完全穿行、即時互動、且具有永久一致性的3D世界。這與目前的視訊模型截然不同,它擁有完整的幾何結構,可以支撐機器人模擬訓練或遊戲程式設計。主持人:有一種觀點認為,如果不增強AI的物理特性,我們就無法實現通用人工智慧(AGI)。隨著時間的推移,這裡面最大的“突破口”會是什麼?除了機器人領域,五年後我們還能用它做什麼?李飛飛:其實都不用等五年。現在就已經有使用者在用Marble開發遊戲了,影視特效(VFX)客戶也用它進行虛擬製片。我們正與輝達以及一些初創公司合作,將Marble作為機器人的訓練環境。建築師和設計師用它做室內設計。還有一個令我意外的用例是臨床研究:心理健康研究人員利用它為強迫症(OCD)患者建立沉浸式的個性化環境,來模擬特定的觸發場景。主持人:你把整個人生都奉獻給了AI。在創辦這家公司、研究空間智能的過程中,最讓你感到驚訝的是什麼?李飛飛:過去幾年的發展速度簡直令人窒息。每個人都會感到焦慮,覺得“要讀的東西太多,發佈的模型太快”。這讓我時刻保持謙遜,意識到自己所知甚少。另一件讓我擔憂的事是那些極度兩極分化的言論:要麼是技術烏托邦主義,要麼是“生存危機”之類的末日論。這兩種觀點其實都不太負責任。技術是一把雙刃劍,我們必鬚髮揮主觀能動性,引導它走向善意化和精細化的應用。主持人:在你看來,未來幾年AI的成功標準是什麼?李飛飛:回看電力技術,它的成功在於點亮了學校、溫暖了家庭、推動了工業化,並延長了人類的壽命。AI的成功標誌應該是:文明因它而進步,每個個體都能由此追求幸福、繁榮和尊嚴。主持人:大型世界模型的計算量和語言模型一樣大嗎?李飛飛:目前,我們的模型規模還沒有最大的大語言模型(LLM)那麼大。GPT-5的訓練算力可能在10^26 FLOPS左右,而Marble要小幾個數量級。部分原因是這個領域還很新:Transformer論文發佈於2017年,而世界模型才剛剛開始進入Scaling Law的上升曲線。主持人:語言模型是用網際網路上的免費資料訓練的。但物理資料很難獲取,所以合成資料變得至關重要。資料的匱乏會減慢世界模型的發展嗎?另外,未來我們會擁有通用機器人,還是專用機器人?李飛飛:我們採取的是混合資料策略。語言資料相對幹淨且易於觀察,但像素和體素(Voxel)構成的物理世界則複雜得多。我們利用網際網路規模的文字、圖像和視訊,但也需要模擬資料和“現實世界捕獲”資料,這與特斯拉或Waymo等自動駕駛公司的做法類似。關於機器人:作為科學家,我不喜歡亂開空頭支票。汽車可以看作是一個在二維平面上移動的“方盒子機器人”,它的主要目標是避開障礙物。而通用機器人是一個三維實體,它必須觸碰並與物體互動,且不能損壞它們。這是一個維度高得多的問題,涉及極高的靈活性和空間精準度。主持人:在最後的一分鐘裡,企業端應該如何看待世界模型?李飛飛:空間智能是一項橫向通用技術。除了機器人和遊戲,它還可以應用於醫療、教育、外勤服務、金融服務、農業、製造業和城市規劃。它是下一個前沿領域,我邀請大家共同來探索這個課題。主持人:非常感謝。李飛飛:謝謝。 (網易科技)
天選Windows打工AI來了!實測完Claude Cowork中國國產版:超頂
兵貴神速!矽谷Claude Cowork前腳剛出圈,結果中國國產版立馬出現了——崑崙天工Skywork桌面版。剛刷到時,還以為又是追熱點呢。滑跪了,結果人家早在去年5月,就推出了網頁版的天工超級智能體(Skywork Super Agents,由多個智能體組成的打工方隊),而且還挺火。好好好,所以兵貴神速更重要的還在前一句“厚積薄發”是吧~秉著刷到就是緣分的態度,我們也火速去瞭解、實測了一番這款桌面版工具,結果發現:對我等打工人確實友好,平時做個PPT或調研報告、根據本地文件做些資料分析的活兒,基本都是一句話的事兒。劃重點,還都不用你手動上傳檔案,現在都是智能體自動讀取電腦上的海量檔案進行work。而且所有檔案處理都在本地完成,無需上傳雲端,這樣一來也能最大程度保證隱私安全。當然了,更更重要的是,這一次我們Windows選手優先拿到了體驗權(P.S. 不像Claude Cowork主要面向macOS)。所以話不多說,一手實測這就奉上咯。實測Skywork桌面版快速下載安裝包後,打眼一瞧產品功能佈局就能發現其兩大特色:支援模型自由切換,以及海量Skills整合。出於競爭關係,矽谷這些AI工具(如Claude Cowork)往往只能用自家模型。而咱中國國產玩家可就沒有這種煩惱了,所以能遍采眾家之長。在天工Skywork桌面版這裡,不僅有公認擅長程式設計的Claude 4.5模型,還有擅長全模態理解與生成的Gemini 3模型——使用者既能手動自由切換,還能啟用“Auto”模式,讓系統自動根據任務類型推薦最合適的模型。而另一邊的Skills整合,雖然這個功能不算新奇,但相比已經讓人挑花了眼的Claude Skills來說,Skywork桌面版這次算是更加精煉了。就這麼說吧,目前光是GitHub上開放原始碼的Agent Skills就有十幾萬個,而Skywork桌面版通過細緻篩選,最終淘出了100+高頻、堪稱打工人必備的Skills,涵蓋Office三件套生成、網頁生成、圖片生成、視訊生成等類型。而且Skills同樣支援手動選擇和智能推薦兩種模式。那麼問題來了,這款配備「Claude/Gemini頂尖模型+各種高頻Skills」的新產品,實力究竟如何呢?四個任務實測揭曉答案。任務1:自動整理亂七八糟的檔案先上開胃小菜。每個P人都會有的一個資料夾(doge),就先讓它幫忙整理一下吧。Prompt:幫我按照檔案類型整理資料夾裡的內容。裡面下載了一堆亂七八糟的東西——MP4視訊、截圖、GIF動圖、壓縮包、發票PDF等等,每次找個檔案都要翻半天。而不到一分鐘,Skywork桌面版就交出如下答卷,一次成功(造福強迫症患者):從其執行過程可以看到,拿到資料夾後,它先是查看了裡面有那些東西,然後按照指令建立分類資料夾,最後對檔案進行移動歸類,整個過程既快速、又精準。看到這裡,如果你以為它只是按照“檔案格式”進行整理,那就大NO特NO了。真實的情況是,這種理解是建立在語義層面上的——以“內容理解”為核心,無論是圖片、視訊、表格、PPT還是各類文件檔案,其都能在統一語義層下被理解、歸類,以及用於任務執行。聽起來是不是有點抽象,別急,看完下面這個任務你就明白了。Prompt:整理資料夾中的論文,每篇論文需要以論文名稱命名方便我尋找。我們隨機下載了10篇AI論文,命名反正是相當混亂。通過讓它按照論文標題進行重新整理這種方式,可以檢測它是否真正“看了”論文裡面的內容,而不只是表面的格式。而最終的結果是,在依舊只嘗試一次的情況下,它再次成功了。從查看檔案內容到提取標題並重新命名,整個過程僅用時40s左右。如此看來,這種解放懶人雙手、拯救強迫症患者的最基礎的整理的活,已經基本難不倒它了~所以咱這就進入第二關。任務2:根據已有素材做PPT光整理怎麼夠?打工人當然是期待直接從一堆雜亂素材→直接拿到一個可交付物。Prompt:請基於我資料夾中已有的相關資料,生成一份主題為“2025十大AI趨勢預測”的精美PPT,目標讀者為科技行業從業者,並為每一頁配上合適的文字、圖表或視覺內容,頁數15~20。熟悉量子位智庫的朋友都知道,我們每年都會出一份趨勢報告。基於此真實需求,我們給Skywork桌面版提供了一些Doc、PDF、Excel和截圖等,要求它自動讀取並提煉關鍵資訊完成PPT。而面對這一任務,Skywork桌面版依舊穩定發揮,其成品如下:在原文件裡,我們只提供了十大趨勢的簡單文字描述,而它不僅幫我們進一步完善了內容,並且還配上了生動直觀、頗具設計感的各種圖片和素材。捫心自問,這可比本人上手高級太多了~以上也讓我們看到,Skywork桌面版擁有跨格式辦公的潛力,它可以在Doc↔Excel↔PPT↔Website之間來回流動。任務3:跨格式辦公自動化而這種潛力,也極大拓展了這款產品的應用範圍,包括但不限於:Doc→Excel:快速彙總需求清單。從需求文件(Doc)中自動提取功能點、優先順序和負責人,一鍵生成結構清晰、可直接分配的任務跟蹤表(Excel);Excel→PPT:自動製作資料周報;Doc/PPT→Website:高效建立產品首頁;……比如在做PPT之後,打工人的另一大需求——做各種表格,沒想到Skywork桌面版也能輕鬆完成。還是隨機丟給它一堆某語音產品的相關文件,具體需求為:Prompt:基於文件內容,幫我做一份產品分析表格。而Skywork桌面版在一通分析後,很快就按以下五個步驟完成了表格生成:而且如果想要繼續最佳化表格設計,也可以接著提需求:Prompt:表格可以最佳化美觀一點,寬高比合理不要太侷促。最終就能拿到一份既美觀、又符合文件內容的競品分析報告了。任務4:利用多模態能力生成網站而實測到這裡,想必大家也對Skywork桌面版的多模態能力,有了一定認識。除了文字,它還擅長製作包括圖片、音樂、播客、視訊在內的多模態內容。別的不說,就讓它幫本·戶外運動愛好者生成一個全國熱門徒步地點的網站吧。Prompt:根據文件要求生成一個全國熱門徒步地點網站,讓戶外運動愛好者瞭解熱門地有那些、難度排名如何,尤其增加一個是否已打卡的選項按鈕,有正常登錄這些,有使用者打卡排行榜之類的豐富功能。整體佈局合理、美觀,戶外運動風格,最好用上文件裡的圖片。在查看檔案內容後,它先是提供了各種選項讓我們進一步明確需求:然後就自動選取我們提供的圖片開始庫庫生成了:悄咪咪透露,本爬山愛好者一直想統計自己去過那些地方,所以一直夢求有一個打卡工具,沒想到這回真圓夢了。最終生成的戶外網站be like:劃重點,註冊登錄全都沒問題,而且登錄之後就能正常打卡!OK,鑑於時間和篇幅原因,實測到這裡也就暫告一段落了。林林總總體驗下來,對於這款中國國產新品,以下感受還是挺明顯的:一是任務完成率高。本來預期此類工具會經常卡頓、可能需要大量抽卡,結果幾個實測都挺順暢,基本都是一次成功。二是生成速度快。實測一些簡單任務基本一分鐘就能完成,而像PPT這種相對複雜一點的幾分鐘也能搞定。就不說和人比了,據官方透露,這款工具如果借助「Gemini模型+自動模式」,其速度將明顯優於Claude Cowork——後者需要跑20分鐘的任務,Skywork卻能壓縮到10分鐘內。三是自糾錯機制比較省力方便。雖然任務中經常會遇到大大小小的報錯,但人工基本不需要管,它會自己找問題、解決問題。相比以前還需要自己去手動處理bug,現在自動化的程度明顯更高了。而這些升級進化背後,依託的正是崑崙天工對一個核心能力的桌面級重構:上下文能力。怎麼做到的?上下文能力的本質,其實只為瞭解決一件事——讓AI在真正幹活之前,就已經像你一樣瞭解所有的背景資料、你身處的環境等等。在傳統AI工作流中(比如網頁版Skywork),為實現這一目的,使用者往往需要先找到檔案、完成上傳,再手動說明相關背景……在準備階段就需要耗費大量時間精力。而為了給使用者“減負”,Skywork桌面版引入了“持久上下文”(Persistent Context)功能——直接將本地資料夾作為上下文窗口,讓AI不僅能“讀取”單個檔案,更能全景掌握你的整個項目環境。每次使用時,使用者只需授權Skywork桌面版訪問電腦中的目標資料夾,它便可以讀取並編輯該資料夾內的所有檔案。這樣一來,不僅手動錄入檔案的繁瑣操作被取消了,而且本地工作空間也直接轉化為了動態知識庫與持久化上下文窗口。而當上下文不再是一次性輸入,而是被固定在桌面端、持續存在時,很多體驗層面的變化其實就順理成章了。先說最直觀的一個——它不需要你反覆點檔案了。在Skywork桌面版裡,上下文從“臨時喂給模型的材料”,變成了一個長期存在的工作環境。它會基於本地檔案的語義理解,把你資料夾裡的Word、PDF、Excel、會議紀要等所有檔案的內容,統一解析並建構成一個持續更新的語義網路。相當於,你的整個項目被提前“建模”了。所以當你說一句“整理上周討論過的語音陪伴產品方案”,它理解的不是檔案名稱,而是“時間+項目+任務”之間的關係,直接定位到相關內容,而不是做關鍵詞檢索。再一個就是很多人關心的隱私問題。傳統AI工作流需要將檔案上傳至雲端,這意味著你需要將自己的工作資料交給第三方。而Skywork桌面版從根本上改變了這一模式——上下文被直接固定在本地,你的工作資料不再需要離開電腦,隱私的主動權回到了你手中。具體來說,Skywork桌面版採用了“本地推理+權限隔離”這一雙重保障機制:檔案默認不出本地,不同Agent能幹什麼、能看什麼,系統層面就已經分好了權限,只有在任務需要時才會被呼叫。這一點我們在實測時也多次遇到,很多超越Agent權限的地方,它會單獨提醒並請求使用者確認授權範圍。而且直接在本地執行任務,除了安全還能保證效率——檔案無需上傳到雲端,免去了上傳等待時間,所以任務執行速度更快了。以及還有一個很容易被忽略,但長期用下來可能構成產品最大差異的問題——工作記憶。如果說前面的變化,解決的是“當下怎麼用得更順”,那工作記憶要解決的,其實是上下文如何在時間維度上持續成立。而為了避免Agent“前教後忘”, Skywork桌面版也引入可持續進化的工作記憶機制——可以結合你的檔案使用偏好與項目上下文,長期記住你的工作方式、常用資料和項目邏輯,最後就是“用得越久,越懂你真正在做什麼”。不過鑑於我們實測時間有限,所以這一點也歡迎大家在評論區補充使用感受。總之,放在一起看你會發現,Skywork桌面版並不是簡單地把多智能體塞進你的電腦裡,而是圍繞“智能協作”這條主線,把“會找資料、能守住隱私、還能越用越懂你”這些事,一次性打包到了桌面端。那麼問題來了——為什麼崑崙天工看好桌面端呢?難道只是跟風Claude Cowork嗎?非也非也。智能體時代新的必爭之地:你的電腦桌面一切的答案在於:這一輪由“多智能體”掀起的創新熱潮,其戰火已經不可避免地燒向了一個最直觀、也最關鍵的超級入口——全球億萬使用者的電腦桌面。“多智能體”有多火,相信身處AI風暴中的大家也有所體會。一個很明顯的感受是,還沒等到過年,這個概念就已隱隱有提前預定2026年度熱詞的跡象。理由呢有兩點:一是才剛開年,中國外都不乏各種被大眾熱議追捧的產品(如Claude Cowork);二是從國外巨頭所釋放的訊號來看,進軍該領域幾乎已經算得上明牌了。年初,微軟董事長兼CEO納德拉在達沃斯經濟論壇上公開表示:AI競爭的下半場,企業的關鍵不是要找“那個是最厲害的模型”,而是知道如何“編排”AI,讓不同的工具配合解決複雜問題。此言一出,MAS(多智能體協作)成AI勝負手的觀點可謂深入人心。與此同時,Google丟出的一份報告也為這一說法增添了更多信服力。通過對全球3466位企業決策者的調研,他們在《AI Agent Trends 2026》中明確指出——2026年最為深刻的職場變革,並非效率的提升,而是以員工為核心的工作模式重構,其核心邏輯在於從“指令式”向“意圖式”的工作革命。就是說,以後基本都是“人給AI當主管”,各種專業智能體分工幹活兒。而且這種理念還得到了輝達CEO黃仁勳的大力支援。早在2025年,他就在各種公開場合表示,AI Agents有望成為下一個機器人等級的兆級產業,並且表示特別看好Swarm/Collective Intelligence(叢集/集體智能)的發展前景。被如此多大佬及其背後的科技巨頭同時看好,顯然“多智能體”已經不再是一個停留在研究圈或概念層的技術名詞,而是正處於加速邁向產業化落地的關鍵階段。而在其落地過程中,電腦桌面作為牢牢佔據使用者最長工作時間、承載最完整工作流與資料資產的終極入口,其戰略價值正被重新定義——不再是作業系統的被動介面,而是正在演變為多智能體時代的主戰場(即所謂的“Agent OS”)。這種變化是雙向的:一方面,獲得多智能體加持的桌面正在重塑我們的工作方式;另一方面,這種重塑也讓使用者對桌面的依賴前所未有地加深(畢竟啥都交給它了)。因此可以預見,在智能體時代,桌面作為超級入口的地位非但不會被削弱,反而將變得愈加關鍵。到最後,這場本質為流量入口的爭奪,將在AI時代,尤其是在從單一模型邁向多智能體協作的關鍵轉折期,變得更為激烈。而在這一共識之下,不止矽谷聲音洪亮、動作頻頻,中國也是快速湧現出了一批玩家。不說別的,就拿今天的Skywork桌面版來說,作為中國團隊自主研發的下一代桌面AI,它所展現出的已經不只是“能聊天、會生成”,而是一整套圍繞多智能體協作重新設計的工作範式。而且這套能力並非停留在演示層面,而是直接落在真實工作環境中——甚至還在某些方面比矽谷頂尖的Claude Cowork更快、更便宜。△一切以官方為準所以從這個角度上講,天工Skywork桌面版的出現,其意義遠不止於某款產品的簡單亮相,而更是中國國產AI創新力量的又一次集中展示,只不過賽道換成了端側多智能體。至於它能否成功開啟下一個“DeepSeek時刻”,老實說現在沒人能給出確切答案。 (量子位)