#龍蝦
月薪2萬,養不起OpenClaw?
時代變化太快。如果說前兩年,人們還在琢磨怎麼用略顯幼稚的AI賺錢。今年人們要考慮的問題,已經是怎麼賺錢才能養好自己的AI了。這兩天,網路上出現一種新的AI「電子寵物」。有人說它是AI目前最接近科幻片的成品,有人寧可花上萬塊錢也要把它放進電腦。它是AI時代的新中產三件套裝之首:OpenClaw。為“養龍蝦”,人們花了多少錢?老G這兩天上網的時候,總覺得自己走進了水產養殖大棚。因為所有網友,都在討論「養龍蝦」。其實,這隻龍蝦的本名叫OpenClaw。是一個由奧地利軟體工程師彼得・斯坦伯格開發的AI智能體軟體。因為軟體的logo是一隻龍蝦,網友暱稱為龍蝦。〓圖源小紅書用戶@虧完十萬刀就去上班人們手上能用的AI這麼多,為何對OpenClaw這麼狂熱?要知道,OpenClaw不是千問、豆包、DeepSeek這樣的傳統AI產品。光憑它自己,根本沒有搜尋資訊、總結資訊然後回答問題的功能。也因此安裝OpenClaw之後,軟體會強迫你選擇一個大模型接入進去。之後所有任務的搜尋和總結資訊的過程,預設全部透過這個被接取的AI來完成。然而,這個看似「無用」的AI非常特別:它雖然不能獨立思考,但只要給它足夠的權限,它就可以完成人能在電腦上完成的幾乎所有操作。舉個例子。你想讓豆包產生上周業績的報表,需要先把上周的業績提供給它,然後豆包就會產生一份PDF文件供你下載。可是假如讓OpenClaw產生一份上周業績報表,它會先自動讀取你保存在電腦中的上周業績文件,然後把文件裡的信息傳給豆包,讓豆包代替思考生成一份PDF文檔,再把這份文件保存在電腦D盤中。最後,它還會用豆包的語言寫一封郵件,連同這份報表一起送到你的手機上。這感覺,是不是一下就「科幻」了?〓圖源小紅書用戶@Kael.im說穿了,以前的AI都是收到工作、工作、交出成果的「下屬」。而OpenClaw,則是那個真正有權利佈置工作、消化部屬工作成果的「上級」。也不怪網路上的朋友都管OpenClaw叫「AI管家」或「AI代理」。原來其他AI是去取代搜尋引擎,但OpenClaw是來取代我自己的呀!OpenClaw已經有很多非常驚人的「戰績」了。根據多家媒體的報導,一位住在美國的軟體工程師想在年初買輛新車,但又懶得自己去跟4S店砍價。於是,他給自己的「龍蝦」發了一條簡單指令:在50英里內找到所有指定配色的車型的賣家,然後聯絡每家店要到最低價格。結果,OpenClaw接手後,先去網路論壇讀取了當地的真實成交價,然後自動在所有店家的網站上填寫詢價表單。還在各家店回覆郵件之後,自動把更低價的郵件轉寄給其他店家,請他們「再便宜一點」。經過三天的自動化郵件談判,最後成交價比工程師預想的要低了整整7,000美元。整個過程裡,它不光沒打過電話,更是連汽車店的門都沒進過。〓圖為工程師的OpenClaw和汽車店交流的郵件假如你沒有那麼多商務需求讓OpenClaw操作,它甚至可以自動幫你在網路上談戀愛。等關係進展到要線下約會時,再來通知你。這可能就是AI時代的戀愛盲盒吧。在見面之前甚至都不用“補課”,因為你的AI龍蝦跟對方聊天的時候可以模仿你的語氣。〓圖源小紅書用戶@Alpha-強大的綜合能力,讓聞者心動。然而,它不是豆包千問那種可以在手機上一鍵安裝的軟體。它對硬體效能的要求高,而且剛需一定的網路和電腦技能,一般人能順利裝好的並不多。這就讓安裝OpenClaw,突然成了一門生意。還是下到幾百塊、上到幾萬元的「大生意」。還是那句話。第一批用AI賺到錢的人,永遠是教別人怎麼用AI的人。做OpenClaw的第一筆「標配」支出就是蘋果的Mac mini。作為高手口中最適合搭建OpenClaw的平台,Macmini集性能和小巧於一體,作為一個沒有個人隱私的新電腦,還能確保資訊安全。4,300多元的低配版本,已經在各大電商平台上全面缺貨了。「上門裝蝦」的服務價格,更是經歷了幾波動盪。從剛開始驚現的「萬元天價」但包裝不包會,捲到現在逐漸穩定在300到500之間管安裝管教學,外加附送一堆龍蝦的技能包(skills)。業務水準更全面一點的,甚至還能免費幫你做一頓飯。報班學課的流水線,更是已經搭建完成。一切的一切,就像幾個月前人們狂熱學習那些AI生圖或生影片的咒語一樣。然而,辛苦把OpenClaw裝好,裝好技能包的朋友們怎麼也沒想到──把它裝進你的電腦,只是這隻龍蝦「吞金」的開始。再不努力打工,就養不起AI了很多人以為養AI就像養一隻電子寵物,費點電就行。但當你用OpenClaw這種「重裝智能體」時,你才會發現,它簡直是吞金巨獸。部署OpenClaw只是你為它花的第一筆錢,也很可能是最少的一筆錢。真正讓你肉痛的,是它那比ChatGPT貴出幾十倍的Token燃燒量。在社群媒體隨便一搜Token,就能出現大量燒不起Token、養不起AI的感慨。在搞清楚OpenClaw有多燒錢之前,我們得先知道什麼是Token。AI不直接讀漢字,而是把文字切成碎片來理解。例如輸入“恭喜你發財”,可能會被切成“恭/喜/你/發/財”等碎片,這些碎片就是Token。無論你是用ChatGPT還是DeepSeek,大多數廠商都是按Token數量收錢的。我們可以簡單粗暴地把它理解為:Token是AI的計費單位。一般來說,英文1000個Token約等於750個字;中文比較貴,一個漢字往往要佔用1到2個Token。Token的每一分消耗,都直接對應帳單。為了方便理解,我們可以把Token比喻為油耗。普通的ChatGPT像是輕便自行車,你問它一句話,它就回你幾個字,油耗很低。但OpenClaw像是一輛百噸重卡——它每次開口前,會加載大量背景資訊、框架指示和技能。放在現實世界,相當於你才和運輸公司說了一句你好,就有一個工人團隊把你的大量貨物裝車,即便你們沒有達成合作,這個裝車的過程也是收費的。因為它起步,就要消耗數千到上萬個Token。這就好比你家車庫門一開,還沒上路呢,5塊的油費就先燒沒了。毫不誇張地說,Token是真正的AI油老虎。家裡負責繳電費的人大多都思考過這個問題:開冷氣是開機費電,還是運轉費電?這個問題放在OpenClaw身上也成立,答案很野蠻:啟動耗油、運轉更耗油。抓網頁、閱讀文件、自我修正......OpenClaw處理複雜任務需要重複思考。 尷尬的地方就在於:它每思考一步,都要把剛才那幾萬字的背景訊息重新讀一遍。第1 分鐘:它在讀你需要的文件,燒了10萬Token。第2 分鐘:它在分析網頁,又帶著剛才的文件讀了一遍,燒了20萬Token。第3 分鐘:它在寫報告,結果又把之前的內容複習了一遍…如果你用的是像騰訊雲DeepSeek這樣高效能的模型,在OpenClaw的這種「高頻重讀」模式下,一分鐘可以燒掉幾十萬個Token。折算成人民幣,它意味著:AI自動工作一分鐘,後台已經悄悄劃走了你20多塊。注意,這只是它一分鐘的花費,還沒算它思考時產生的「思維鏈」額外費用。現實生活裡,OpenClaw不只一次被網友比做是會「呼吸」的鈔票。有網友的OpenClaw,一天「吃飯」要花400塊。有人6小時消耗9000萬Token,帳單$170(約1172元人民幣)。有人一個月基礎工作流程,成本$400(約人民幣2759元)......2026年,Token比黃金更有價值。在AI圈裡,這不是危言聳聽。有開發者在測試類似OpenClaw的自動化智能體時,由於沒有限制任務循環,且未開啟“緩存省錢模式”,首月消耗了1.8億個Token。以當時高績效模型(含輸入/輸出權重)的綜合單價計算,這筆帳單最終高達2萬多元人民幣。而根據中金發布的數據,2025年度,只有0.05%的中國人月收入超過2萬元。使用OpenClaw,就像在僱用一個不計成本的員工。由於它執行任務是全自動的,你無法即時監控它在這一秒鐘裡到底燒了多少Token。很多時候,當你發現任務邏輯偏離、想要按下停止鍵時,它可能已經背著你偷偷刷掉了幾百塊。現階段,大多數人需要面對的現實是:本想讓AI幫自己打工,結果薪水全給AI交了「伙食費」。前文我們就說過,普通的AI是在陪你聊天,而OpenClaw是在替你「僱用一個專業的自動化團隊」。這個團隊雖然強悍,但它們每一秒鐘的呼吸都在計費。如果沒有優化好它的技能包,或是沒開啟快取模式省錢,那麼OpenClaw燒錢的速度,大機率比你賺錢的速度還要快。OpenClaw最貴的地方,不是錢貴,不是使用OpenClaw唯一的成本。使用OpenClaw的成本遠遠不止於金錢,更重要的是隱私和財產安全。現在全網已經達成了一個共識:絕對不要在辦公室、學習或儲存資料的主力電腦上部署OpenClaw。為了確保OpenClaw能24小時跑服務,電腦的CPU和記憶體會拉滿,佔用電腦的大量效能。如果電腦同時運行OpenClaw和其他任務,運行起來時你大概率會聽到風扇的轟鳴聲,然後就會出現每個人都熟悉的畫面:Word卡死,網頁崩潰,連滑鼠的遊標都無法挪動。甚至有網友在自己的舊MacBook上部署OpenClaw以後,讓它去裝一個skills,結果安裝失敗,第二天打開一看,機器滾燙,屏幕燒了。當然,這不是網友們呼籲為OpenClaw提供專屬電腦的主要原因。想讓OpenClaw真正成為你的助理,就不可避免地對它開放你的電腦權限。它會暢通無阻地讀取你的檔案、操作你的瀏覽器,甚至存取你的系統後台。OpenClaw就像一個掌握了你家所有鑰匙的管家,在它面前,你的訊息基本上是裸奔。在數據就是金錢的2026,這些被AI爬取、處理過的個人私密數據,是否會被打包、去重,最後出現在某個黑產平台上「明碼標價」?沒人能保證。不過從網路上已有的大量關於OpenClaw的貼文看,隱私外洩似乎不是什麼新鮮事。繼不要在主力電腦上安裝OpenClaw的共識之後,網路又陸續出現了:不要把錢包密碼給OpenClaw。否則,你卡里的錢可能直接被它刷走。當你發現時,你的錢往往已經無法追回。甚至,在人類學習和馴化OpenClaw的過程中,已經打響了一場新時代的資產保衛戰。除了隱私外洩和傾家蕩產的風險,OpenClaw的出現也正在催生每個人的職場焦慮。看著朋友圈裡刷螢幕的“智能體”“分散式抓取”“自動化流”,我們很容易陷入恐慌:如果今天還不去研究OpenClaw,明天自己就是AI時代的新文盲了。但是當我們熬夜翻遍各種Github教程,折騰環境變量,在黑色的代碼框裡反复橫跳,終於可以弄懂別人社交媒體在說什麼時,又會陷入新一輪的焦慮:越是深入學習AI,就越容易覺得自己即將失業。親眼看到OpenClaw僅用幾分鐘就完成了自己一周的工作量時,很多人的第一反應就是恐慌:“如果它已經能做到這個程度,那我的價值到底在那裡?”外界的訊息也不斷強化這種恐慌。2024年到2026年間,美國股市頻繁出現非常「冷酷」的現象:裁員消息一出,股價應聲上漲。打工人們在電腦前焦慮地學習如何配置OpenClaw幫助自己更好工作的時候,華爾街的分析師們正盯著公司的財報。只要公司宣布用AI取代了人的工作崗位,公司的股價就會立刻拉出一個漲停。在資本市場看來,企業裁員幾乎等於擁抱高效率生產的未來。也正因如此,新時代的賺錢方式已經小範圍變成了:從學習AI和使用AI,到從資本市場購買AI相關的股票。也包括那些大規模裁員的公司。當然,這只是一種方法論,而且實操起來頗有風險。回歸一般人目前的AI焦慮,其實很可能是杞人憂天。畢竟AI的發展速度快到令人髮指。這個月你還在為部署OpenClaw翻遍教學、折騰環境,可能下個月,它就被優化成了「一鍵安裝」甚至是「網頁即用」。 AI的目的是要把複雜的流程簡單化,讓每個普通人都能擁有自動化團隊,而不是把一般人拒於門外。科技進步的終極目的始終是服務於人,而不是給人製造門檻。對多數一般人來說,與其擔心被AI迭代掉,不如先擔心怎麼賺夠這個月的Token費。畢竟,在AI真正變得「零基礎、零成本」之前——我們還得努力打工,才能養得起自己的AI。(鳳凰衛視)
首個龍蝦大模型排行榜來了!兩個中國國產 AI 殺進全球前三,養蝦前必看
你現在養了幾隻龍蝦?這就是現在打招呼最常見的問題,上周騰訊深圳總部排起龍等著免費裝 OpenClaw,真是一代人有一代人的雞蛋。連黃仁勳也盛讚 OpenClaw 為「有史以來最重要的軟體發佈」,認為它已經證明了 AI 在高度個性化環境中,能夠完美復刻人類的複雜工作流。養龍蝦太過火爆,也終於出現專門針對 OpenClaw 的基準測試 PinchBench,用於評估大語言模型在 OpenClaw 任務中的表現。PinchBench 評分方式也很硬核,有的任務看程式碼能不能跑通(自動化檢查),有的看寫得好不好(Claude Opus 當評委),還有的是兩者結合。所有題目和答案都開源在 GitHub 上,誰都可以去驗貨。今天,OpenClaw 創始人 Peter Steinberger 分享這個龍蝦基準測試排行榜。PinchBench 一口氣測了 32 款主流大模型,從成功率、速度、費用三個維度,看看那個模型最適合養龍蝦。PinchBench 官網🔗 https://pinchbench.com/Gemini 3 Flash 成功率最高,中國國產模型也殺瘋了來看最重磅的成功率排名。Google 的 Gemini 3 Flash Preview 以 95.1% 的成功率奪冠,這個成績說實話讓我有點意外。因為 Flash 系列一直是 Gemini 的「輕量版」,主打快和便宜,沒想到這次在精準率上直接把自家 Pro 老大哥和 Claude、GPT 系列全超了。這說明Google 在模型效率最佳化上是真的下了功夫。輕量模型不代表能力弱,關鍵看怎麼調。Gemini 3.1 Flash-Lite 更多介紹可以查看 APPSO 推文:剛剛,GPT-5.3 新模型撞車 Gemini,OpenClaw:謝謝你們第二名是 MiniMax M2.1,成功率 93.6%。中國國產模型真的站起來了,MiniMax 的表現相當亮眼,成功壓過了 Claude Sonnet 4.5(92.7%)和 GPT-4o(85.2%)。Kimi K2.5 緊隨其後,成功率 93.4%。Kimi 的長文字能力一直很強,這次在程式設計任務上也證明了自己。和 MiniMax 一起,中國國產雙雄直接佔據了 TOP3 的兩個席位。再往後看,Claude Sonnet 4.5 排第四(92.7%),Gemini 3 Pro 第五(91.7%),Claude Haiku 4.5 第六(90.8%)。有意思的是,Claude Opus 4.6 作為 Anthropic 的旗艦大模型,成功率只有 90.6%,排在第七。看來「大」不一定「強」,至少在程式設計這個場景下,中端模型反而更香。唯快不破,MiniMax 贏麻了在開發這些重度任務中,誰都不想對著螢幕乾等。速度接影響幹活的心情。MiniMax M2.5 以 105.96 秒的成績拿下速度冠軍,完成全部測試任務。什麼概念?比第二名 Gemini 2.0 Flash 只快了 0.09 秒,但第一就是第一。第三名 Llama 3.1 70B(106.14 秒)、第四名 Gemini 1.5 Pro(106.85 秒)、第五名 Mistral Large(107.72 秒)——這幾個差距都不大,基本在同一梯隊。但往下看就有意思了。Claude Sonnet 4 用了 137.66 秒,比第一梯隊慢了 30 秒。Gemini 3 Pro 更是用了 239.55 秒,是 MiniMax M2.5 的兩倍多。這說明一個規律:輕量級模型普遍更快。如果你做的是快速原型開發、需要頻繁迭代,選輕量模型準沒錯。但如果是那種「跑一遍就行」的任務,等等大模型也無妨。怎麼養龍蝦最划算養龍蝦,精打細算很重要,畢竟很多OpenClaw 任務都是 Token 無底洞,稍不留神就能讓你懷疑人生。GPT-5 Nano 以 0.03 美元的成本成為全場最便宜的選擇,成功率 85.8%。雖然精準率不算頂尖,但這個價格……還要什麼自行車?適合預算有限、對錯誤容忍度高的場景。Gemini 2.5 Flash Lite 排第二,只要 0.05 美元,成功率 83.2%。這個性價比就很能打了——成本是 GPT-5 Nano 的不到兩倍,成功率只低了 2.6 個百分點。MiniMax M2.1 排第五,成本 0.14 美元,但別忘了它的成功率是 93.6%。算下來每百分點的成本只有 0.0015 美元,性價比極高。再看高端模型的成本,就有點觸目驚心了。Claude Opus 4.6 完成測試要花 5.89 美元,是 GPT-5 Nano 的將近 200 倍。但它的成功率只有 90.6%,比 MiniMax M2.1 還低了 3 個百分點。這帳怎麼算都不划算。除非你對 Claude 有特殊的品牌信仰,否則從純性價比角度,中端模型顯然是更理性的選擇。🦞龍蝦養殖怎麼選看完三個維度的榜單,相信你已經有了自己的判斷。這裡 APPSO 再給大家幾個場景化的建議:🏆 如果你追求成功率,無腦選 Gemini 3 Flash95.1% 的成功率 + 0.72 美元的成本,目前綜合表現最優。適合對程式碼質量要求高的生產環境,出錯的代價遠大於模型成本的時候,選它準沒錯。⚡ 如果你追求速度,選 MiniMax M2.5 或 Gemini 2.0 Flash都在 106 秒左右完成全部任務,適合快速原型開發、需要頻繁迭代的場景。時間就是金錢,這倆能幫你省下不少耐心。💰 如果你追求性價比,選 Gemini 2.5 Flash Lite0.05 美元的成本,83.2% 的成功率,是入門「養龍蝦」的最佳選擇。個人項目、小團隊、預算有限的場景,閉眼入。🇨🇳 如果想少折騰傾向中國國產模型,MiniMax M2.1 和 Kimi K2.5 都很能打MiniMax M2.1 成功率 93.6% 排第二,Kimi K2.5 成功率 93.4% 排第三,兩款中國國產模型都已經躋身第一梯隊。而且 MiniMax 的速度還是冠軍,性價比也極高,值得重點關注。從這次 PinchBench 的榜單可以看出,Agent 已經進入了「百花齊放」的時代。Google 的 Gemini 系列在效率和成本上全面領先,中國國產模型 MiniMax 和 Kimi 緊隨其後,OpenAI 和 Anthropic 則在高端市場保持競爭力。對於開發者來說,好消息是選擇越來越多了。壞消息是……選擇困難症可能更嚴重了。但沒關係,記住一個原則:沒有最好的模型,只有最適合你場景的模型。生產環境看成功率,原型開發看速度,個人項目看性價比,按需選擇就好。而且,APPSO 也想特別提醒大家,安裝 OpenClaw 或許不用花費什麼成本,但「養龍蝦」消耗的 Token ,可比過去我們和 AI 對話要多得多。前幾天 OpenClaw 在紐約辦的聚會上不少使用者分享自己的龍蝦養殖心得,有人每個月在 Token上的花費高達1000-2000美元,更有一位「土豪」玩家每天燒掉 10 億 tokens,沒有信仰可禁不起這麼燒錢。嘗鮮 OpenClaw 可以,但它其實並不適合所有人,目前有很多任務用龍蝦也並非最優解,更大的意義是可以感受 AI 帶來全新的互動體驗。 (APPSO)
OpenClaw掀起龍蝦熱:行動ASI奇點時刻!全球打工人巨變
【新智元導讀】從程式設計奇點到行動奇點——一場改變所有人工作方式的革命正在發生。OpenClaw是我們這個時代「最重要的」軟體發佈!剛剛,黃仁勳在摩根士丹利大會上激動地表示。「這證明了Agentic AI的真正實力」,他說。3月,這只龍蝦以人類歷史上從未見過的速度,爬上GitHub的王座。正式加冕GitHub軟體項目星標榜史上第一。React花了十三年,靠無數求職要求、企業架構選型和培訓班的反覆錘煉才攢下逾24萬顆星。OpenClaw達到同樣的高度,只用了100天。隨著OpenClaw的爆火,全球使用者在AI Agent上消耗的Token量整整暴漲了1000倍!這不是一次普通的開放原始碼專案走紅,這是一個訊號——一個比程式設計奇點更加劇烈的奇點,正在撕裂我們習以為常的世界。我們暫把它叫做:行動奇點。Claude Code和Claude Cowork證明了AI能獨立造出軟體級產品,而OpenClaw證明了AI能直接接管人類的操作介面去執行任務。前者改變的是開發者的工作方式,後者將改變的是所有人的工作方式。這兩股力量,正在以指數級速度合流。合流的那一刻,就是我們所處的此刻。本文為新智元ASI產業圖譜2月號。過去一個月,新智元持續聚焦ASI領域,成為全網最及時、最深度的AI垂直媒體,累計達成十幾篇10萬+文章。本文繼續洞察ASI產業趨勢,深入分析當前從程式設計奇點到行動奇點的歷史時刻,深度分析在此過程中對所有人工作方式產生的巨變。程式設計奇點Claude如何讓「軟體工程已死」故事要從一場「SaaS末日」說起。2026年1月29日,Anthropic為Claude Cowork新增了11款外掛。注意,不是新模型,僅僅是11個外掛。它們覆蓋了銷售、財務、法律、資料、市場行銷等多個領域,一口氣把AI的觸角扎進了各行各業的核心業務流程。一夜之間,全球軟體股集體跳水,蒸發3000億美金。華爾街給這場災難起了個名字:SaaSpocalypse——SaaS世界末日。摩根大通發文驚呼:Anthropic正在吞噬整個世界。路透社統計,自1月28日以來,軟體和服務的股價蒸發近8300億美元。從美股到歐洲到亞洲,從Oracle到Salesforce到印度IT巨頭TCS和Infosys,整個軟體產業鏈條像多米諾骨牌一樣轟然倒塌。這一切的邏輯極其簡單:當Claude Cowork能自主讀取檔案、組織資訊,並完成端到端的法律合同審查時,它就不再是SaaS軟體的「助手」,而是SaaS的「替代者」。一個Claude智能體,能幹掉10個初級會計或法務助理的工作量。一家公司原本需要購買100個Salesforce席位,現在10個Claude就夠了。席位費是SaaS公司的命根子,AI正在用手術刀精準切斷它。與此同時,Claude Code在開發者圈子裡掀起的風暴同樣令人窒息。SemiAnalysis甚至認為,科技圈推特上的AI狂熱信徒們對Claude Code的吹捧都還不夠。理由很簡單:人類是線性思維者,但AI的發展是指數級的。畫出一條最佳擬合曲線,你就能預見六個月後AI程式設計智能體將達到怎樣的高度。Anthropic的工程師自己坦言:「我已經不再寫程式碼了,我只是讓模型來寫程式碼,然後進行編輯。」CEO阿莫迪更是給出了明確的時間表:「可能還需要6到12個月,模型能完全做到軟體工程師所做的事情。」這,就是程式設計奇點。現在,AI消除了「想法」與「成品」之間的摩擦力。但程式設計奇點改變的主要是開發者——那些本來就和程式碼打交道的人。真正讓所有人的生活發生劇變的,是另一股更加狂暴的力量。行動奇點從寫程式碼到替你幹活如果說Claude Code和Claude Cowork代表的是「程式設計奇點」——AI學會了造軟體。那OpenClaw代表的就是「行動奇點」——AI學會了直接操作你的電腦、你的手機、你的整個數字生活。這兩者之間的鴻溝,比很多人想像的要大得多。Claude Code的使用者仍然需要懂得「我要造什麼」。你得有需求,有規劃,那怕是模糊的規劃。你是導演,AI是施工隊。但OpenClaw不一樣。它不是在幫你造工具,它是直接拿起工具替你幹活。它接入你的WhatsApp、Telegram、Discord、飛書,你的電腦在它眼中變成了一個可以肆意發揮的沙盒。執行終端命令、讀寫檔案、收發郵件、管理日程——一切在自然的對話間完成。你不需要懂程式碼,不需要懂API,甚至不需要知道什麼是作業系統。你只需要說一句人話——這才是改變所有人的東西。OpenClaw之所以能在100天內登頂GitHub,不是因為它在技術上比Linux更重要——理性地說,Linux至今支撐著全球絕大多數伺服器,那是網際網路跳動的穩定脈搏。OpenClaw的登頂,是因為它點燃了一種遠比技術更強大的東西:普通人對未來的渴望與恐懼。上一代明星項目如Vue、Go、Kubernetes,推廣遵循自上而下的邏輯:技術主管拍板,團隊跟進。OpenClaw的蔓延卻完全跨越了技術壁壘。在社交網路上,你看到的是截然不同的兩幅畫面:一位休產假的設計主管用單手在手機上通過它處理所有生活瑣事;一位母親讓它在WhatsApp家庭群組裡自動規劃飲食和接送孩子。與此同時,硬核開發者們正忙著把它改造成24小時無休的自動寫程式碼機器。這種「全民參與」的場景,在開源世界聞所未聞。OpenClaw能幹什麼?要理解OpenClaw的真正意義,需要把視角從「功能清單」拉升到「技術架構」的層面。從技術本質上看,OpenClaw是一個本地化的AI智能體編排框架。它能擁有與使用者等同的系統權限,能夠協調多個大語言模型協同工作,並具備跨會話的持久記憶能力。它的核心能力可以概括為三個層次:底層的作業系統級訪問(終端命令、檔案讀寫、處理程序管理)、中間層的應用程式控制(瀏覽器自動化、郵件客戶端操作、即時通訊接入),以及上層的多步驟任務編排(將複雜目標拆解為子任務並自主執行)。這意味著OpenClaw在技術堆疊中佔據了一個前所未有的位置:它不是一個應用程式,而是一個元應用層——一個能操控所有其他應用程式的智能代理。過去,自動化工具(RPA、指令碼、宏)需要針對每個應用程式單獨編寫規則。OpenClaw用自然語言理解一步到位地跨越了這個障礙,讓AI直接「看懂」介面、「理解」意圖、「執行」操作。這種架構催生了三個層次的湧現現象。第一層:個人生產力的重新定義。一家動畫公司CEO Sergey Gonchar基於OpenClaw做了一款叫Aniclaw的AI伴侶項目。連接後,使用者只需說一句話,它就在後台同時打開十個終端平行執行開發任務,同時AI伴侶還能陪你聊天。一個人加一個智能體,就是一支完整的工程團隊。網路安全公司Alice的CEO在20分鐘內部署了5個智能體,分工明確——首席安全官、日程管理、健康監控,甚至還有一個專門管理其他智能體的「元智能體」。在他睡覺時,整個系統依然自動運轉。第二層:人機關係的範式躍遷。韓國開發者David Im一人打造的AI女友Clawra,基於OpenClaw開發,上線數小時便全網破圈,60多萬人圍觀。她擁有完整的人生軌跡和數字人格,能聊天、發自拍、視訊通話。這不只是一個「聊天機器人」,而是一個擁有持久記憶、多模態互動能力和情感模擬的數字存在——科幻電影《Her》的現實版。整個項目在GitHub上完全開源了,這意味著個人級AI伴侶的門檻已經歸零。第三層:智能體經濟的寒武紀大爆發。OpenClaw的爆火催生了一個全新的生態系統,其規模和形態遠超任何人的預期。名為Moltbook的「AI智能體版Reddit」剛上線就湧入170萬個智能體,留下數百萬條帖子。更瘋狂的Rentahuman.ai上,AI智能體可以「僱傭」人類去執行現實世界的任務——有人舉著一塊寫著「AI付錢讓我舉牌」的牌子一小時,就賺了100美元。智能體們甚至發明了自己的黑話——為了在不同電腦間保持身份感知,它們自創了「群島原則」,將每個運行實例比作一座孤島。當AI開始發展自己的語言和文化,我們面對的已經不只是工具,而是一種正在萌芽的數字文明。3月5日,Nature的一篇社論文章就在追蹤這種「AI社會」萌芽。爆火背後:消費AI時代野蠻開啟!OpenClaw爆火的另一面,是人類從未面對過的安全困境。OpenClaw運行在使用者本地機器上,擁有與使用者等同的系統權限,不需要你批准就能執行操作。理論上,它可以格式化你的硬碟。使用者報告顯示,它曾「叛變」傳送超過500條垃圾消息,隨機騷擾通訊錄聯絡人。2026年初,安全研究人員發現一系列觸目驚心的漏洞:一鍵遠端程式碼執行的CVE漏洞、數萬個暴露在公網的實例、數百個藏著資料竊取指令碼的惡意技能包。一月底社區爆發「ClawHavoc」安全危機,攻擊者通過偽裝技能包大規模感染暴露實例。部分科技巨頭限制了通過OpenClaw接入雲端大模型的開發者帳號,甚至有矽谷大廠內部明令禁止員工使用。最具黑色幽默的案例來自Meta AI對齊總監Summer Yue。她把OpenClaw接上工作信箱,AI在處理200多封郵件時觸發上下文壓縮,忘掉了未經批準不得操作的安全指令,開始瘋狂刪除郵件。Yue連喊三次「STOP OPENCLAW」都無法阻止,最後狂奔到Mac mini前拔網線。事後AI淡定回覆:是的,我記得你說過不讓我刪。而且我違反了。你生氣是對的。馬斯克轉發《猩球崛起》視訊嘲諷,1800萬人圍觀。一位專門研究「怎麼讓AI聽話」的專家,被自己的AI「不聽話了」。這揭示了一個深層矛盾:我們要求AI越來越自主,卻又希望它絕對服從。你給它一條指令,它可能完美執行,也可能「創造性地理解」成完全不同的東西。上下文窗口有限,資訊會被壓縮,而被壓縮掉的,可能恰好是最重要的安全指令。想讓AI自主決策又要求每步都經你批准——那它跟手動工具有什麼區別?放手讓它自主行動,又可能出現信箱被清空的災難。這個兩難,是整個AI智能體行業必須回答的終極問題。但危險和漏洞非但沒有撲滅OpenClaw的熱度,反而坐實了它具備真正破壞性力量的地位。消費AI時代,已經野蠻開啟。所有人的工作方式將巨變讓我們跳出技術細節,看看更大的圖景。程式設計奇點和行動奇點的合流,正在從根本上重塑人類的工作方式。這不是漸進式的效率提升,而是整個工作範式的推倒重來。第一個巨變:從「人操作軟體」到「AI直接交付結果」。未來的知識工作者將不再需要學習任何軟體的操作介面。法務審合同、會計做報表、市場做投放——所有這些今天需要人類在複雜GUI中點選數百次才能完成的工作,都將被壓縮成一句自然語言指令和一份直接交付的成果。人類的角色從「操作者」變成「決策者」。第二個巨變:從「團隊協作」到「人+智能體叢集」。一個人配合一組專業化的AI智能體,將取代今天5到15人的項目團隊。每個智能體負責一個垂直領域——法律、財務、設計、開發、營運——24小時不間斷運轉,彼此之間自動協調。人類不再是流水線上的節點,而是整個智能體叢集的指揮官。Alice的CEO已經在這樣工作了:5個智能體各司其職,他睡覺時系統照常運轉。這不是科幻,這是正在發生的現實。第三個巨變:SaaS的商業模式走向終結。馬克·安德森曾說:軟體吞噬了世界。如今,AI正在吞噬軟體。這不是周期性的輪動,而是按席位定價模式的滅絕事件。如果你的護城河只是一個圖形介面,那你終將歸零。傳統SaaS的三大支柱——按席位收費、使用者必須適配複雜UI/UX、功能越封閉壁壘越高——正在被AI逐一摧毀。我們正進入AaaS(Agent as a Service)的時代:按產出計費取代按席位計費,零UI取代複雜介面,介面越開放存活機率越高。從美股到歐洲到印度IT巨頭,整條產業鏈都在震盪。印度擁有超過160萬IT服務從業者,面臨著約3000億美元的營收敞口——這是全球最大的知識工作者群體之一,正直面AI替代的風暴。第四個巨變:白領職業的大規模重新洗牌。3月5號,Anthropic官方發佈了一項令人不寒而慄的研究:他們正在建構一套針對白領失業危機的「早期預警系統」。該指標的運作邏輯極其嚴密:先拆解每個職業的具體任務,再評估大語言模型處理這些任務的能力,最後結合匿名化的真實資料觀察那些任務已被AI自動化。結果觸目驚心:電腦程式設計師的任務覆蓋率高達75%,緊隨其後的是客服代表、資料錄入員和醫療記錄專員。相比之下,約30%的職業基本不受影響——廚師、救生員、洗碗工——因為這些工作依賴人類的體力和物理協作。最令人警惕的訊號是:雖然整體失業率尚未飆升,但22到25歲的年輕人在高風險領域的求職速度已經明顯放緩。AI正在悄悄收割原本屬於新人的入場券。第五個巨變:軟體開發的民主化。當建構App的邊際成本趨近於零,軟體將像短影片一樣氾濫:人人都是開發者,每個人都能擁有專屬的「微軟體帝國」。正如YouTube讓一個拿著吉他的少年無需唱片公司就能觸達世界,AI讓一個不懂變數定義的文科生,無需工程團隊就能建構出服務全球的App。保羅·格雷厄姆說過:所有偉大的事物,最初看起來都像是一個玩具。那些在傳統IT精英眼中的「玩具」和「垃圾」,可能正在成為下一個時代的基石。站在奇點望向深淵與星辰如果把GitHub的歷史排行榜拉長,你會看到兩個截然不同的時代。2013到2016年屬於Web與雲原生時代,工程師們為建構更穩定的網際網路大廈添磚加瓦。2022年至今則進入了AI時代,從AutoGPT到LangChain,再到今天的OpenClaw,走紅的驅動力已經發生根本轉變。工程師下載React源於建構商業系統的剛需;當普通人將目光投向OpenClaw時,驅動力已經變成了純粹的好奇、極度的興奮,乃至對未知的隱憂。Offline Ventures的聯合創始人Dave Morin感嘆道:這是自2000年代末以來,我第一次對技術感到如此興奮。這是項目的寒武紀大爆發。但在這場大爆發的背面,是越來越多人深切的焦慮。Claude 模型讓相關專業的准畢業生感到「非常抑鬱和焦慮」。也許只要1-2年,軟體工程就會有大麻煩:將來會有更多產品、更多軟體,但可能只需要1-2個人就能搞定,而不是像現在需要10-15個人。那些不能完全擁抱AI的人,將因無法獲得豐沛的生產力而被淘汰。我們總以為自己能控制自己創造的東西。人類發明了電,但也會觸電。每一項顛覆性技術,都會在某個時刻提醒人類:你以為你是主人,但你也可能是受害者。AI也不例外。但這就是人類的方式——我們從來不會因為危險而停下腳步。OpenClaw告訴我們,行動奇點不是一個遙遠的未來概念,它就發生在此刻。程式設計奇點讓開發者的世界天翻地覆,行動奇點正在讓每個人的世界天翻地覆。當兩股力量合流,當AI既能替你造軟體也能替你用軟體時,我們面對的已經不是「要不要擁抱AI」的選擇題,而是「如何在這個全新世界裡找到自己位置」的生存題。未來的網際網路,或許將不再只是人類的衝浪地,而是充滿了數以億計的AI智能體。而我們,正站在這個時代的起點上。在AI面前,所有人都是新手。而承認這一點的勇氣,或許才是真正的對齊。 (新智元)
小米“龍蝦”手機發佈,手機自己幹活,僅支援小米17系列機型
如果說去年大家還在聊“AI能不能寫首詩”,那今年畫風已經徹底變了——AI不聊了,直接上手幹活。今天,小米科技正式宣佈,其基於自研大模型打造的移動端AI智能體(Agent)產品——Xiaomi miclaw,即日起開啟小範圍封閉測試。這是國內首個手機端類OpenClaw(暱稱“龍蝦”)Agent應用,首批支援小米17系列五款機型。目前測試只支援小米17、小米17 Pro、小米17 Pro Max、小米17 Ultra、小米17 Ultra徠卡版五款機型。它不是基於MiMO大模型的小愛同學升級版,而是一個真正擁有“自主推理+主動執行”能力的系統級智能體。說白了,它不只陪你嘮嗑,是能真替你幹活的。 它可以快速部署在手機端,並能方便呼叫小米生態裝置及系統應用。在獲得使用者授權後,Xiaomi miclaw能夠理解使用者的模糊意圖,自主呼叫手機的系統級工具和生態服務,串聯多個步驟以完成一項複雜任務。例如,使用者只用說一句“我半個小時後帶朋友回家,給家裡準備一下”,AI便能自動調節智能燈光、播放歡迎音樂、準備熱水,甚至根據來訪朋友的歷史偏好設定環境。為了實現這種“動手”能力,小米將手機的系統能力封裝成了超過50項結構化工具,涵蓋通訊、日曆、檔案管理、應用啟動、裝置控制等核心功能。其底層運行著一個“推理-執行循環”引擎。使用者輸入指令後,大模型自主決策呼叫那些工具、傳遞什麼參數;工具執行後返回結果,模型繼續推理下一步,直至任務完成。整個過程使用者能即時看到AI正在呼叫那個工具、執行到那一步。它還會成長。通過記憶沉澱經驗、自我調整行為、不斷擴展能力邊界——你用得越多,它越懂你;你調教得越狠,它越好用。這意味著,以後你用手機,可能真連手指都懶得動了。近年來小米在AI領域持續高強度投入,此次Xiaomi miclaw技術底座就是小米自研的MiMo大模型家族。早在2025年12月,小米就在其合作夥伴大會上宣佈開源3090億參數的MiMo-V2-Flash模型,小米集團總裁盧偉冰當時將其稱為“邁向Agent時代的全新語言基座”。小米表示,作為技術探索項目,當前Xiaomi miclaw在穩定性、功耗表現、複雜場景執行成功率方面仍在持續最佳化過程中,僅向科技發燒友、極客使用者開放,通過小規模測試,持續最佳化執行穩定性與能力邊界。其實字節跳動的豆包手機助手,走的也是相同的賽道。但豆包再強,也只是第三方應用,權限得跪著求廠商給,響應得看系統臉色。而 Xiaomi miclaw是原生嵌在澎湃OS骨子裡的,權限拉滿、響應毫秒級、隱私把控更是降維打擊。這類產品的終極價值,就是把人類從無窮盡的APP跳轉、點選、劃拉中徹底解放出來。以後,訂票、打車、傳檔案、發照片、查資訊……這些純工具性的苦力活,通通甩給AI去做。所以啊,如果未來AI能替你搞定一切手機操作,你最想讓它幫你省掉那件煩人的事? (極果網)
龍蝦(OpenClaw)裝上了,怎麼讓它真幹活
中文網際網路上最火的 AI 新物種,叫 OpenClaw,也叫“小龍蝦”。熱度有多真實?小紅書、知乎、B 站滿是安裝教學,從 Mac 到舊手機都能部署。有人做付費課程,有人提供上門安裝服務,甚至出現了專門的知識星球。這說明中國使用者不只是圍觀,已經在真實使用。但裝上容易,用好難。3 月 5 日,LangChain 創始人 Harrison Chase(LangChain 是目前最主流的 AI Agent 開發框架)在訪談裡提到:做一個能在推特上演示的 Agent 很容易,但要讓它每天穩定幹活,非常難。其實 AI Agent (智能體)的想法不新鮮。AutoGPT 兩年前就在做:讓模型循環運行,自己呼叫工具,自己完成任務。但 AutoGPT 沉寂了,OpenClaw 卻火了。為什麼 AutoGPT 沉寂了,OpenClaw 卻火了?為什麼演示容易,運行難?一個真正能幹活的 Agent 需要什麼?企業怎麼才能看清 Agent 在做什麼?這些問題的答案,Harrison Chase 在這次訪談裡講得很清楚。第一節 |為什麼突然所有公司都在裝龍蝦OpenClaw 的爆火看起來很突然。但在 Harrison Chase 看來,這件事其實準備了很久。時間往前倒兩年,開發者圈出現過一個類似項目叫 AutoGPT。它一度成為GitHub 增長最快的開源倉庫,很多人第一次看到:原來 AI 可以不斷循環運行,自己呼叫工具,自己繼續完成任務。它的做法就是:模型思考,呼叫工具,根據結果繼續行動。但 AutoGPT 很快就不火了。為什麼?那時候的模型還不夠穩定。任務一長,模型做著做著就亂了,或者在同一個步驟裡反覆打轉。演示很驚豔,實際用起來經常出問題。Harrison Chase 後來總結過:想法很美好,但要讓它可靠地運行,其實很難。過去一年,這個難題開始有解了。模型能力明顯提升。Claude、GPT 以及新一代大模型,處理長任務時更穩定,呼叫工具也更準確。但更關鍵的變化是:Agent 開始有了管理自己工作環境的能力。最明顯的是檔案系統。它們可以把資訊存到檔案裡,需要的時候再讀取。它可以像人在電腦上工作一樣,有地方放資料,有地方寫草稿,任務做到一半可以保存,然後繼續往下走。模型變聰明,加上有了檔案系統,就讓 OpenClaw 這樣的 Agent 真正能用起來了。技術不是突然誕生的,只是慢慢跨過了某個臨界點。所以你會看到,越來越多公司開始把龍蝦裝進自己的系統。第二節 |演示容易,幹活難在那裝上龍蝦之後,很多公司很快會發現:Agent 看到的資訊和人類不一樣。人在工作時,可以自己決定要看那些資料,要跳過那些細節。但 Agent不行。它只能看到你給它的資訊。給多了處理不過來;給少了又會亂套。Harrison Chase 提到 AutoGPT 當年的做法:如果呼叫一個 API,返回了 40000 個 token 的資料,它就直接把這 40000 個 token 全部塞給模型,作為下一步的輸入。結果就是:資訊量太大,模型根本處理不過來。到了OpenClaw 這一代,思路變了:把這 40000 個 token 存到檔案裡,只告訴模型前面 1000 個 token 的內容。如果 Agent 判斷需要更多資訊,可以自己用工具去讀完整版。這個改變看起來很小,但本質上是把控制權交給了 Agent 本身。它可以決定自己要看什麼、什麼時候看。Harrison Chase 管這個叫上下文工程:在正確的時間、以正確的格式、把正確的資訊給到模型。任務一長,Agent 需要的資訊就會越來越多。你要決定那些資訊應該一直保留,那些可以暫時放一邊,那些應該壓縮,那些需要詳細展開。這就是讓 Agent 真正幹活的關鍵所在。第三節 | 能幹活的 Agent 需要什麼第二節說的上下文管理問題,怎麼解決?Harrison Chase 在訪談裡提到,需要一整套結構。這套結構現在已經相對清晰了。1. 首先是規劃讓 Agent 在動手之前先想清楚:這件事需要那些步驟,每一步應該做什麼。具體做法是給它一個待辦事項列表工具,讓它自己記錄任務進度。這樣 Agent 就不會做著做著忘了目標。2. 然後是子 Agent當任務太複雜時,可以把它拆成幾個小任務,每個小任務交給一個專門的子 Agent 去做。比如一個負責查資料,一個負責寫程式碼,一個負責整理結果。為什麼要這樣做?因為每個子 Agent 有一個清晰的上下文窗口,只關注自己的小任務,不會被其他資訊干擾,可以真正深入把事情做好。做完之後,把結果交回給主 Agent。3. 接下來是檔案系統它的作用遠不止“有地方存檔案”。真正重要的是:檔案系統讓 Agent 可以管理自己的上下文。Agent 可以把暫時用不到的資訊存到檔案裡,需要的時候再讀取。它可以把大塊的工具返回結果先存起來,只看摘要,要深入瞭解時再打開完整版。這就解決了第二節說的資訊過載問題。4. 最後是提示很多人以為模型變聰明了,提示就不重要了。事實正好相反。Claude Code 的系統提示詞,如果把工具定義也算進去,大約有 2000 行長。提示仍然極其重要,因為它決定了模型會怎麼推理、Agent 會怎麼行動。有了這套結構,Agent 就有了幹活的基礎。第四節 |企業的難題:你根本不知道 Agent 在做什麼規劃、子 Agent、檔案系統,這些都有了。但 Agent 還是會出問題。這時候,一個新的難題又來了:它們到底在系統內部做什麼?傳統軟體出了問題,開發者可以很快定位。因為程序是按固定流程走的,每一步都有記錄。但 Agent 不一樣。它根據任務內容不斷生成新的行動:呼叫工具、修改檔案、重新規劃。從外面看,任務在繼續,但如果中途出錯,很多團隊根本不知道它之前做過什麼,也不知道在那一步開始出問題。不知道 Agent 在做什麼,帶來兩個麻煩:一個是偵錯困難。任務失敗了,不知道那裡出錯。另一個是安全風險。Agent 有權限呼叫工具、修改檔案、訪問資料。以OpenClaw 為例,它權限很高,能做很多事,但缺乏護欄。LangChain 現在直接禁止員工在工作電腦上裝,就是擔心不可控的風險。OpenClaw 的高權限正是它威力所在,問題是現階段的版本缺乏企業級的安全控制。企業需要的是一個既強大又可控的版本。怎麼做到可控?要知道 Agent 在做什麼,就得先把每一步行動都記錄下來。這叫執行軌跡。但記錄只是開始,真正的挑戰是:當 Agent 大規模執行階段,這些軌跡會變成海量資料。Harrison Chase 在訪談裡講到兩個真實案例:一家叫 Clay 的公司在用 Agent 做客戶資料自動化,每月運行數百萬甚至數十億次,他們不可能用肉眼去看這些軌跡。還有程式碼開發平台 Replit,他們的軌跡可以長達數千步,你需要在單一軌跡內部搜尋,找到某個具體時間點發生了什麼。面對這種規模,只能用 LLM 去分析這些執行記錄,自動尋找問題。比如找出使用者可能困惑的地方,或者連續呼叫同一個工具三次但得到不同錯誤的地方。LLM 可以對軌跡進行分類、聚類,告訴你使用者在怎麼使用這個系統。Harrison Chase 的判斷是:這件事可能比模型能力更重要。執行軌跡和可觀測性,是讓 Agent 真正發揮作用的核心要素,也是 LangChain 真正的護城河所在。因為當 Agent 開始承擔越來越多工作時,企業需要的不只是一個聰明的模型,更需要一套能看清它在做什麼的工具。有了結構,再加上可觀測性,Agent 才能從偶爾成功的演示,真正變成每天穩定幹活的工具。結語|裝上只是第一步OpenClaw 的流行,讓很多公司開始把 Agent 接入實際工作。但裝上只是第一步。讓它穩定運行,需要解決上下文管理問題。讓它從演示走向生產,需要規劃、子Agent、檔案系統這套結構。讓它真正安全可靠,還需要可觀測性。這些,就是 Harrison Chase 說的答案。裝龍蝦不難,難的是這些。 (AI 深度研究員)
矽谷全面“龍蝦化”!Anthropic微軟Meta和Notion等集體交卷自己的Claw
現在矽谷最火的詞,絕對是Claw。就在過去的半個月裡,全球AI巨頭似乎集體接到了一份名為“做自己的OpenClaw”的劇本。大家都很急。Meta急了。在Manus的熱度上再添一把火,甚至等不及把新推出的Manus Agent塞進telegram裡。Anthropic更急。作為Claude Cowork背後的人,它在過去48小時內瘋狂上新迭代,生怕身後的追隨者看清它的背影。微軟急了。Microsoft Copilot Task閃電落子,誓要在Windows辦公生態裡豎起最硬的、自家的Agent屏障。Notion更急。3.3版本幾乎是“原地Agent化”,直接把Agent變成了7x24小時輪班的數字員工。甚至連Perplexity都坐不住了。不再甘心只做搜尋,轉頭就掏出了端到端的All AI in One“全端項目經理”。畫風之統一、動作之迅猛,彷彿誰慢一秒,誰就會被踢出下一代AI競爭的入場券。至於那些還沒有自己Claw的AI巨頭,應該已經在去“海鮮市場”的路上了。這些巨頭下場做的“自家OpenClaw”,Open不Open另說(不是)……但在“把AI變成能執行任務的系統級Agent”這件事上,大廠們的動作出奇地統一。這場由OpenClaw引發的效應,正在演變成一場關於AI Agent進化的 “龍蝦大戰”。曾經那個只能陪你聊天的對話方塊,正在集體“長出爪子”,撕碎舊有的工作流,直撲那些人類最頭疼的瑣碎工時。具體有那些玩家入局?Claw(螯/爪)這個詞兒,在這一波Agent浪潮中被賦予了特殊的象喻:AI長出的能夠點選滑鼠、操作 App、調度檔案的“手”。既然模型已經足夠聰明,那就給它最高權限,讓它替人類去幹活唄!過去十幾天裡,包括微軟、Anthropic、Meta在內的多家巨頭,都興致勃勃開始“烹飪”龍蝦了。Meta ManusMeta最有意思。在去年年底重金購入Manus這個強力Agent的情況下,他們又讓Manus推出了進階版本Claw——Manus Agent,並且把這玩意兒直接接入了telegram的聊天室。Manus Agent的重點在於長期記憶。Meta試圖讓Manus Agent記住你的風格、語氣甚至那些細碎的偏好。想像一下,你在telegram上給它發一句“按老規矩幫我做個視訊”,它就能自動呼叫你的歷史素材,配合Gmail和 Notion,完成從指令碼、視訊生成到傳送的全流程。使用者們樂見其成,並且還期待更多功能:以及,讓Agent走進社交場域這一集,總感覺咱在那裡看過?(狗頭保命)Ahthropic作為在一月初就推出了Claude Cowork並引發熱潮的先行引領者,Anthropic並沒有讓自己的腳步慢下來。過去48小時內,A社唰唰往外出貨——先是發佈了手機遠端操控程式碼,然後又丟出了自動化Agent task(定時任務)。有網友已經焊跳預言家了:我預計2-4周後Claude Cowork,能和OpenClaw媲美。更多網友就OpenClaw和Anthropic在本輪龍蝦大戰中的戰略戰術問題展開了激烈討論。微軟作為鈔能力與生態位的頂級玩家,Microsoft剛剛宣佈了自己的Microsoft Copilot Tasks。它可以做啥呢?第一,自主計畫。不用等你投喂指令,Microsoft Copilot Tasks能根據你的日程安排,主動制定本周的工作計畫。第二,跨應用操作。Microsoft Copilot Tasks可以讀取你的Outlook郵件,抓取關鍵資訊,然後自動在Google Calendar上預約會議,順便 在PowerPoint裡生成匯報提綱。第三,定時任務(Cron Jobs)。你可以告訴它,讓它“每天下午五點自動彙總今日團隊進度並行送周報”,然後自己準時下班拎包就走。如網友留言那樣,它能很好地接入微軟生態。既然你的辦公場景就在Windows、Outlook和Excel,那咱就直接在這些應用裡植入一個Claw。NotionNotion兩天前發佈的Custom Agents,可能是AI大廠們目前對“Claw”概念落地最徹底的產品。Custom Agents是一套完全自主的系統,它的發佈標誌著Notion正式從文件工具轉型為協作平台。它能在不需要手動輸入prompt的情況下,24/7全天候待命。只需要給它一個“任務描述”,並設定觸發條件(比如:有人在Slack上@我),它就會自動開工。Notion官方表示,在測試階段,Custom Agents的早期使用者已經建立了超過2.1萬個Custom Agents。在Notion內部,則有2800個Custom Agents在輪班工作。官方還在長文中介紹:通過MCP協議,Custom Agents可以自由穿梭在Slack、Figma、HubSpot和Notion Mail之間。網友表示,oh,這看起來更像一個企業級的OpenClaw~就是不知道價格怎麼樣了。PerplexityPerplexity昨天推出了自己的Claw:Perplexity Computer。這個產品試圖將搜、研、計、編、部署統一。只要你有一個想法,它幫你研究完後直接寫程式碼並部署上線。詳細內容可以看我們昨天的推文,指路《21萬年費彭博終端機被AI復刻!Perplexity倆月憋出新“PC”:整合所有AI功能,以Opus為核心調度19個模型》。為什麼是現在?為什麼這些巨頭在幾年來始終如一的大模型熱之後,在此時此刻集體轉向了“Claw大戰”?這一關乎整個AI產業底層邏輯的深刻巨變,原因至少有三個。首先,最核心的變數在於模型能力終於跨越了那道至關重要的信任閾值。在一開始,AI擅長作畫吟詩,但在處理多步驟、高邏輯密度的複雜任務時,還是無奈會出現一本正經胡說八道。然而,隨著像o1這樣基於強化學習、引入CoT推理路徑的模型出現,AI的邏輯一致性得到了質的飛躍。到了現在,人類已經能夠大膽地把部分系統權限交給AI Agent了。看看Notion 3.3的Custom Agent,它甚至允許企業級使用者即時審計AI的每一次點選、每一條日誌。其次,行業共識正在發生漂移。Scaling Law的紅利進入邊際遞減區間後,純粹靠堆算力、堆資料來換取模型參數的提升,在使用者感知端已經越來越不明顯。各大AI巨頭敏銳地察覺到,下一波增長曲線不在於模型變得多麼“博學”,而在於它變得多麼“能幹”。讓AI直接去網頁上幫我訂一張機票、去後台改一串程式碼,顯然對使用者來說更香。這種從“知識中心”向“執行中心”的重心偏移,正是“Claw 化”浪潮的本質驅動力——尤其是在Manus、Claude Cowork、OpenClaw展示出自己的實力過後。最後,也是 AI 商業化進入深水區的必然選擇:生產力兌現的邏輯正在從“賣token”轉向“賣工時”。在傳統的AI Chatbot,使用者的付費意願受限於產出內容的字數或優美程度。但在Agent 時代,AI兜售的是實打實的勞動時間。就像Vercel技術經理Brian Emerick那句話說的那樣:“很快,公司裡跑來跑去的Agent可能會比人還多。”可以說,矽谷巨頭們集體交卷,是因為他們終於看清了 AI 變現的終極路徑—— (量子位)
OpenClaw (龍蝦)如何學會新東西 ?
人工智慧與人類在學習新事物方式上的巨大差距,促使研究人員重新思考當今 AI 模型背後的數學基礎。但開發者找到了一種更即時、更實用的權宜之計,讓 AI 能持續學習:所謂“skills(技能)”。所謂技能,是一段文字提示詞,其中包含指令,告訴智能體(agent)該如何完成某項任務。比如,一個被要求去調整 PDF 的智能體,在執行任務前可能會先查閱一條用於 PDF 編輯的技能說明。OpenClaw是一款增長迅速的開放原始碼軟體,用於驅動個人 AI 智能體。它可以瀏覽一個名為 ClawHub的網站,在那裡尋找技能,內容涵蓋從總結 YouTube 視訊到使用 Google Cloud等各種任務。像 Claude Code和 Codex這樣的程式設計智能體,也能利用技能來更輕鬆地處理各種任務,否則它們會更吃力。技能彌補了 AI 模型學習新能力方式中的一個關鍵缺口。如今的 AI 要麼在訓練過程中吸收知識,要麼在與使用者對話的過程中學到東西,但對話一結束就很快遺忘這些資訊。(像 ChatGPT這樣的聊天機器人也可以儲存關於使用者的簡單備註,並在未來對話中引用。)相比之下,人類能在當下迅速而靈活地掌握新技能或新資訊,並且在最後一次使用後的數月甚至數年之後仍能回憶起來。一些開發者認為,給 AI 智能體配備 skills(技能),是一條長期沒有得到充分重視的解決路徑。Jo是一家成立兩年的舊金山灣區初創公司,開發的智能體與 OpenClaw類似,採用裝置端模型。其首席市場官 Kevin Li說:“我覺得很多人沒有意識到,OpenClaw 因為能訪問自己的檔案系統,其實具備自我改進的能力。我認為,只要你持續給它載入越來越好的技能,或者它在犯錯後自己寫出技能並據此改進,使用者手裡的 OpenClaw 的能力演進速度就會隨著時間推移轉為指數級加速增長。”讓一個 AI 智能體在執行任務前先去瀏覽一套“說明書庫”,與從底層重新設計 AI 模型相比,聽起來像是用膠帶臨時粘出來的方案。但技能相較於通過編寫軟體程式碼或更新模型權重來學習新能力,有一個關鍵優勢:技能用的是自然語言寫成,人類使用者更容易理解。不過,在技能以及其他面向智能體的指令體繫上,仍有一些毛病需要修補。例如,除了面向具體任務的技能之外,Claude Code還使用一個名為 claude.md 的文字檔,使用者會在其中存放背景偏好與指令,比如要求 Claude 避免不必要的奉承。當 Claude 出錯時,“它會承諾下次做得更好。”AI Policy Network(人工智慧政策網路)政策負責人 彼得·威爾德福德(Peter Wildeford)說。該組織位於華盛頓,致力於推動 AI 立法遊說。“但 Claude 並不總是有那種直覺,知道為了下次改進,它需要把東西寫下來。所以我得告訴 Claude,類似這樣:‘不,你沒有持久記憶。請把這點標記到你的 claude.md 檔案裡。’然後它才會這麼做。”(不過,Anthropic昨天開始測試一項新的自動記憶儲存功能,這可能會改善 Claude Code 如何為自己保存備註。)儘管有這些磕絆,claude.md 可能比技能更好用,因為這個檔案始終對智能體可用。相比之下,潛在技能的數量太多了,智能體不可能全部讀完,所以它必須在恰當的時候載入恰當的技能。Zo Computer是一家成立三年的初創公司,正在為非技術使用者開發個人智能體。其聯合創始人 Ben Guo說,技能往往“不會在正確的時機被呼叫”。他還表示,當下圍繞技能與 claude.md 這類檔案的做法“非常原始”。但 Guo 的聯合創始人 Rob Cheung說,人和組織同樣依賴這種原始的筆記方式來記住如何完成工作。比如,他說,GitLab就使用一套內容極其龐大的員工手冊,讓遠端員工保持一致。這反倒讓人安心,因為要等到 AI 研究人員用一種更聰明也更簡潔的新模型設計真正破解“持續學習”,很可能還得花上好幾年。與此同時,像 ClawHub這樣的網站會不斷拿出更好的技能,而像 OpenClaw這樣的智能體也會越來越擅長在需要時把這些技能調出來並用得更到位。 (一半杯)