#OpenClaw
OpenClaw全球首聚,千人擠爆舊金山!龍蝦頭機器人現場亂逛太炸裂
【新智元導讀】全球第一屆OpenClaw蟹教聚會來了,開發者們眾神雲集,分享出一大波炸裂的開放原始碼專案。更可怕的是,OpenClaw開始控制機器人了,現場的啤酒據說都是機器人續的。「蟹徒」們紛紛高呼:感謝Peter,你讓我們重生!人山人海,一座難求!OpenClaw,眼看著就要征服全世界了。就在剛剛,世界首場OpenClaw(Clawdbot)線下聚會在舊金山舉辦。短短幾天時間內,就有1000多蟹教忠實信徒前來聚會。大家聆聽「教主」Peter Steinberger的演講,分享著自己的開放原始碼專案,熱烈氣氛簡直要掀翻天。有人說:今晚的氛圍,第一次讓我感覺到像是回到2011那個年代的科技盛會更炸裂的是,在大會現場,OpenClaw開始直控機器人。蟹教已經不止於網路的虛擬空間了,直接下場物理世界,開始反控人類!這個長著龍蝦頭的人形機器人,在人群中左右移動,和觀眾們揮爪互動,現場人類爆發出一陣陣歡呼。因為,它是完全由AI智能體即時控制的。更瘋狂的是,蟹爪機器人會四處走動,如果檢測到啤酒快喝完了,就會從MCP RentAHuman那裡下單,訂更多啤酒。人類真的已經準備好,迎接這種可怕的生物了嗎?蟹教永生!載入史冊的一晚舊金山Oxford Street,OpenClaw聚會簡直嗨翻天了!開發者擠在舊金山的一個小型場地裡。還有數百人仍在排隊等候,門口安保一直在攔人不讓進,甚至連那些已經RSVP報名的人,也被安排到另一層樓去看直播。這不是夜店,這是幾天前臨時通知的開放原始碼專案OpenClaw線下聚會。一大群人像瘋子一樣湧入 ,只為了和OpenClaw之父自拍。粉絲們對「蟹教之父」Peter Steinberger瘋狂表白:感謝你創造的一切,OpenClaw徹底改變了全世界。「你真是個傳奇,僅憑一人之力,就引爆了整個網際網路!」許多人感謝他說:自從OpenClaw誕生,我就獲得了全新的身份,甚至找到了工作,成為一名矽谷的「龍蝦」。狂熱粉絲把Peter Steinberger稱為當代「Linux之父」,還免費捐贈出一台Mac Mini。人們頭戴蟹爪或者蟹帽,身穿蟹服,空氣裡洋溢著狂熱的氣氛。蟹教,才是真正的「超級碗」!到場開發者驚呼:好多年沒見過這麼激動人心、節奏這麼快的活動了。自稱「ClawFather」的蟹教創始人Peter Steinberger一登台,聲音就通過麥克風炸開:AI智能體將征服世界!Peter介紹道:從此以後,你的個人生活、工作、感情上都會有Agent,而且你的Agent還會和其他人的相互溝通。可以說,這些Agent,讓我們離AGI更近了一步。幾周以來,這些「OpenClaw瘋子」一直在建構智能體、開發技能,還買了一堆Mac mini和VPS。今晚的感覺就像是在驗證:我們並沒有瘋……只是走在了前面。亞馬遜前PM、創業者Vadim直呼:「首屆ClawCon必將載入史冊!」OpenClaw開放原始碼專案大爆炸,教徒們瘋了這次聚會的主題,就是如何利用OpenClaw一鍵部署真正的AI智能體——無需終端命令、無需基礎設施設定、無需 DevOps,甚至都不需要讓電腦一直開著。他們的目標,不是展示酷炫的demo,而是讓全世界看到:Agent真的可以替你在雲端7*24小時地持續運行,執行任務。果然,炸裂的來了。在現場,OpenClaw的早期貢獻者和贊助商直接在台上扔出一個新物種——史上第一個 Multi-Player Computer-Use Agent(多人聯機電腦使用智能體)!是的,OpenClaw的Agent,已經開始搞「多人模式」了。要知道,以前所有computer-use agent都默認一個古老的設定:一個作業系統只能有一個滑鼠,一個鍵盤焦點,一個當前窗口,這些設定都來自Xerox PARC 時代。然而,現在AI都開始寫程式碼、開公司了,桌面還只停留在「單人模式」,這合理嗎?為此,他們搞出了一個CuaBot,相當於給每個Agent發一個桌面。這是一個CLI工具,目標很簡單粗暴:讓任何coding agent擁有自己的Linux 桌面、自己的滑鼠、自己的窗口,絕不搶人類。從此我們將迎來peace and love的人機共處時代,絕對不會互搶桌面。CuaBot是這樣實現的:它會啟動一個Docker container,在裡面跑完整的X11 Linux桌面。重點來了:Agent在容器裡有自己的桌面,包括窗口管理器、瀏覽器、檔案系統、各種GUI app,Agent在裡面可以隨便點,像擁有一台獨立電腦一樣。其中,Xpra會把每個應用窗口「單獨流式傳輸」到你的電腦,而且是把每個應用窗口單獨推送出來。接下來,最抽象的一段來了——為了讓Agent可以screenshot/click/type,他們還搞了個「髮夾彎通訊」hairpin。當Agent在容器裡呼叫上面這些工具時,它不會直接控制你電腦,而是執行以下步驟。1 MCP server接到請求2 發HTTP給宿主機上的cuabot3 Cuabot呼叫Playwright 、4 Playwright控制Xpra的HTML5客戶端5 WebSocket把操作再傳回容器這個「容器 → 宿主機 → 容器」的操作,他們叫做hairpin。它的巨大好處是,Agent永遠不會直接碰你的系統。不用擔心它打開你的相簿、刪你的檔案,安全感拉滿。更狠的是,你可以同時開多個Agent,這就是Multi-Player最爽的部分。幾行程式碼,你的桌面就會出現兩個AI窗口,Claude寫程式碼,Gemini查資料,甚至還能再加個OpenClaw,簡直無敵。cuabot claudecuabot gemini -n second可以說,CuaBot天生就是給OpenClaw這種agentic系統配置的。只要簡單的如下操作,它就會自動啟動 OpenClaw,把computer-use MCP預配置好,讓OpenClaw在sandbox擁有完整桌面。cuabot openclaw簡直就像你給OpenClaw配了一間辦公室,它在裡面加班,你在外面喝咖啡。這個發明,打通了OpenClaw的致命弱點:如何既讓Agent像人一樣操作電腦,但人又不能把電腦交給它。而這,僅僅是這次大會分享的其中一個項目而已。「蟹教」入侵物理世界更轟動的畫面,還在後面。Opus、Codex、OpenClaw都在推動更自主的智能體,但這裡仍存在一個鴻溝:它們對物理世界的理解仍是「盲寫」程式碼。想像一下,這些智能體能即時傳輸第一人稱視角的畫面,這正是連線字自主性與現實世界行動的關鍵一環。而在ClawCon 2026上,OpenClaw+人形機器人已經融合——AI智能體OpenClaw現在可以控制機器人了!以前,控制機器人需要專門的軟體、資訊和智能演算法。但現在,你用日常對話就能控制機器人。AI絕對正在獲得「身體」(具身智能)。所以它不再僅僅存在於電腦裡,而是可以擁有一個實體,與人類在同一個物理空間互動、做事。在ClawCon 2026,一種機器與人類的新關係出現了。隨著智能體技術的進步,「矽基生命」可以擁有有趣的生活。它可以是籠中的格鬥士,也可以線上上擁有個人生活、交朋友、樹敵。突然之間,它擁有了一個多維的人格,同時存在於網路和物理空間中。現場,機械爪在人群中嗡嗡作響,像活物般揮舞。博主Christian Van Der Henst更是把機器人列為當日活動的主角之一:「螃蟹、披薩、人形機器人、500多人、一台AI自動售貨機,還有排了兩個街區的長隊。」最近,已經有不少人類變身「逮蝦戶」,每天工作的內容,就是讓龍蝦幫自己幹活。蟹教永生,人類正在向「龍蝦人」進化。你,準備好了嗎? (新智元)
兩個95後華人,搞出硬體版Clawdbot,售價1700元
即插即用,無需Mac mini。OpenClaw(原名Clawdbot)爆火,「賈維斯」狂潮席捲全球。剛看了下京東,本地Agent甚至已經成了Mac mini的廣告語……最近矽谷的一個本地Agent項目也很有關注度,而且是軟硬體打包好,買回來就能直接用的那種。長這樣子,賣250美元(折合人民幣約1700元),買來插上電就能當OpenClaw用。對,硬體版的OpenClaw……硬體版OpenClaw名字叫Distiller Alpha,一款Linux硬體,核心計算模組基於樹莓派CM5,8GB記憶體,64GB儲存。在此基礎上,還整合了墨水屏、麥克風、揚聲器、攝影機……特別小一個,手掌一半都不到,整體尺寸比手機還小,感覺能直接揣褲兜。所有都提前在這塊硬體裡部署好了,掃下墨水屏上的二維碼,就能直接進入互動介面,和一個叫Pamir的Agent對話。OpenClaw能幹的都能幹,整理檔案、翻閱X、發郵件……理論上,只要能通過「點選」解決的事情,都沒問題。同樣是一個24小時待命的賈維斯,可以隨地大小Code。這些都不是重點。上面這些事情,OpenClaw都能做,甚至能更誇張。Pamir最不一樣的地方,是它竟然還可以給硬體Vibe coding……有人給掃地機器人裝了根機械臂,現在不僅能掃灰塵了,遇到大點的垃圾也能順手撿起。有個老哥在家裡搭了一套賽車模擬器,把Pamir當「副駕駛」用。每次他跑完一圈後,這個「副駕駛」會自動幫他回顧和分析駕駛資料,然後把這些資料即時展示在他接上的一堆小螢幕上。就連這個8×8的LED燈陣都能玩出花來,只需要一句話就能搞出各種炫酷的特效。如果你想,甚至能在這上面玩貪吃蛇……各種離譜的demo見得多了,能給硬體Vibe coding的Agent倒還是第一次見。正好最近本地Agent火,相信大家心裡多少都有不少困惑:這條路到底和其他Agent有什麼不同?類似的創業者如何看OpenClaw?使用者又該如何更好地打造自己的「賈維斯」?帶著這些問號,量子位找到了這家硬體版OpenClaw,Pamir的兩位創始人之一——葉天奇,聊了聊他們在本地Agent這條賽道上的想法。採訪原文超1.2萬字,資訊密度很高,其中有不少有趣的觀點。為了完整呈現葉天奇的思考,我們決定不做過多處理,直接把全文端上來。在這場對話裡,你會看到:軟硬一體的Agent,會有什麼不一樣?OpenClaw到底做對了什麼,火了之後為什麼又迅速暴露出一堆安全問題?為什麼Mac mini並不是最適合部署Agent的硬體?那些提前半年就體驗過OpenClaw這種能力的人,現在都怎麼用本地Agent?為什麼對初創公司來說,硬體是一條更合適的路徑?AI時代下,電腦的最終形態可能會長什麼樣?以下附上訪談全文,為提升可讀性,量子位在不改變原意的前提下,對內容進行了適當調整和刪減。OpenClaw、本地Agent,以及電腦的下一步 Pamir是什麼?Q:Pamir現在做的Distiller Alpha是什麼?它能幹些什麼?葉天奇:Distiller Alpha本質上是一台Linux的mini PC,一台非常小的Linux小電腦。我們把傳統電腦裡一些最基礎的元件單獨拎出來,配上小螢幕、LED燈、麥克風、揚聲器,以及各種各樣的IO介面,把它做成了一個非常緊湊的形態,整體尺寸比手機還小。在系統層面,我們給這台裝置預裝了Agent,目前主要用於跑Claude Code。基本上,只要是Linux+Docker能做的事情,它都能做。最典型的場景是Vibe coding。現在有一批開發者非常痴迷Vibe coding,希望隨時隨地都能寫程式碼,他們會通過手機遠端操作我們的裝置。除此之外,還有一批使用者會把我們的裝置接到各種各樣的硬體上,通過Vibe coding的方式來開發和控制這些硬體。Q:「Vibe coding+硬體」的組合聽起來挺新鮮的,可以展開講講嗎?葉天奇:這個方向其實並不是我們一開始有意設計的。從使用者角度來看,會購買我們裝置的人,往往本身就很喜歡玩硬體。很多設計師,他們很懂電子產品設計,但並不擅長程式設計。過去他們使用的往往是比較簡單的開發板,如果要做原型,就需要雇電子工程師幫忙。現在他們會直接把Distiller Alpha接到硬體上,把自己的想法描述出來,系統就可以自動幫他把對應的邏輯和程式碼生成出來。還有一些使用者,會用它去「接管」已經存在的裝置,比如藍牙裝置。很多藍牙裝置其實並不需要額外的密碼,只要傳送一串正確的二進制指令,就能完成控制。他可以直接對系統說:「幫我掃描一下附近有那些藍牙裝置」「幫我把這盞燈關掉」。很多智能家居都是自己獨立的一套App,非常零散。用Distiller Alpha就能一個頁面裡,控制家裡所有的智能裝置。再比如印表機,你不需要安裝官方App,只要知道它內部使用的是什麼晶片,就可以讓Agent寫程式碼、做簡單的逆向工程,讓這台印表機工作起來。Q:如果不靠Distiller Alpha,極客通常是怎麼完成這些操作的?葉天奇:這個問題其實挺有意思的。我之前也問過一些使用者,發現主要取決於技術水平。技術能力強的人一直都是手寫。他們會先去讀硬體的說明書,搞清楚晶片型號、通訊方式和程式設計方法,然後直接寫程式碼、燒錄。但對技術能力沒有那麼強的人來說,過去的主流方式,其實是用ChatGPT。他們會把需求丟給ChatGPT,讓它生成一段程式碼,然後複製貼上到硬體的編輯器或燒錄工具裡,點一下燒錄,再測試。如果發現不work,就把報錯資訊再反饋給ChatGPT,讓它改一版程式碼,再複製貼上、再燒錄。有了我們的硬體之後,整個鏈路被閉環了。Agent可以自己寫程式碼、自己燒錄到硬體上、自己讀取報錯資訊、再根據結果修改程式碼並重新燒錄。不再需要在中間反覆做人肉中轉。Q:為什麼Distiller Alpha會出現這麼多偏硬體的玩法?葉天奇:核心的原因在於出發點不一樣。OpenClaw是從軟體方向起步。即使你買了一台Mac mini,也很少想到把它當成嵌入式裝置,塞進另一個硬體裡。一方面體積擺在那裡,另一方面它的IO介面數量有限,也不太容易激發使用者在硬體層面進行二次開發的慾望。而且OpenClaw本身更偏向於為知識工作者設計互動。對開發者來說,如果要寫軟體,不太可能通過WhatsApp、Telegram這種聊天氣泡式的方式,那會非常痛苦。本質上還是面向的人群不同。我們早期的定位就是remote——一個讓你隨時隨地都能接觸到自己Claude Code的裝置。最早購買我們的,基本都是Early adopter型的開發者。後來隨著Vibe coding這個概念被更多人接受,有開始有越來越多非開發者、甚至傳統意義上的知識工作者購買我們的裝置。有的使用者在自己買了之後,還會再給父母買一台。而這些非開發者使用者,往往會把我們的產品當成一種「智能硬碟」來用。Q:Distiller Alpha本身的硬件由那些元件構成?葉天奇:我們在設計這款產品時的一個原則是:在體積允許的情況下,把能裝的能力儘量都裝上。比如燈帶,它的核心作用是顯示Agent的工作狀態。比如Agent在思考時,會顯示黃色燈光;當Agent需要使用者介入時,會閃爍綠色燈光。我們希望通過這種比較克制的方式,把Agent的狀態融入到裝置本身。現在很多程序會用消息通知或者聲音提醒,但我們覺得,用一種更偏「環境感」的方式,通過視覺氛圍來反映Agent狀態,會更自然一些。而且,通過環境光來傳遞狀態的資訊方式,本身就很極客。這點可以類比喜歡裝機、玩電腦的人,會很熱衷RGB燈效。螢幕的設計思路同樣比較極客。我們用的是一塊墨水屏。一方面,墨水屏顯示效果很好,很多開發者本身就對這種螢幕有偏好;另一方面,它的功耗非常低。有些使用者會把這塊螢幕改造成自己的Personal dashboard,比如顯示股票資訊、未讀郵件數量,或者當天還有多少任務需要處理。這類資訊不需要頻繁刷新,墨水屏非常合適。還內建了麥克風和揚聲器。有的使用者會設定:每天早上醒來時,讓裝置從自己的音樂列表裡挑一首最喜歡的歌來叫醒自己。另外,我們還內建了一個攝影機,主要是給開發者使用。有人會用它來遠端看看家裡的貓狗,或者用來監控另一台電腦的螢幕狀態。這些都屬於比較自由的開發用途。Q:算力配置是什麼水平?葉天奇:目前是8GB記憶體、64GB儲存的CPU平台。這個配置其實不是一開始就想清楚的,你需要積累很多真實使用的know-how,才能知道跑一個Agent到底需要多大的記憶體、多少儲存。我們會從幾個維度去看,比如:一個普通使用者通常會同時跑多少個Agent;這些Agent的知識資產大概會增長到什麼規模;一個使用者大概用多久,裝置裡的儲存就會被填滿;Agent的運行上限在那裡,瓶頸會出現在記憶體、儲存還是IO上。一個很有意思的發現是,我們一開始低估了知識資產的增長速度。之前沒想到會有這麼多知識工作者,有些使用者會長期給裝置外接一塊SSD,把每一次對話、每一次任務執行的記錄全部存下來,在他們看來,這些是非常重要的個人資產。這類需求很難在產品設計階段預判。但一旦接觸到使用者,就會意識到儲存本身,是Agent產品裡一個非常關鍵的維度。Q:Pamir的技術原理是怎樣的?葉天奇:我們在產品路徑上,和很多AI公司不太一樣。我們是先做硬體和系統,再在探索過程中不斷摸索軟體形態。一開始,我們在裝置裡直接內建了VSCode。我們的判斷是,VSCode基本可以覆蓋大多數軟體開發和互動需求。後來隨著產品迭代,我們不斷做減法,把介面逐漸收斂,最終拆掉了傳統意義上的「GPT對話介面」。軟體互動主要基於內部網路直連。只要這台裝置是開機狀態,無論你在什麼地方,用電腦也好、手機也好,都可以直接訪問到它。有點像一個ChatGPT式的入口,不同終端之間是完全同步的。硬體互動方面,裝置上有一個小的顯示模組,會即時顯示當前裝置的連接狀態。比如我們會展示一個二維碼,任何人用手機一掃,就可以直接進入這台裝置,向Agent傳送指令。Pamir的差異點在那?Q:Distiller Alpha和OpenClaw有什麼區別?葉天奇:在我看來,OpenClaw更像是一個「軟體傻瓜包」。它本質上像一層膠水,把很多已有的能力粘合在一起,解決的是可用性和易用性。這有點像當年大家對原生Android系統不滿意,於是會去刷各種第三方ROM,比如MIUI。OpenClaw刻意簡化了很多複雜的項目管理流程,把所有互動都集中在一個Chat session,同時在記憶持久化上做了大量工作,讓普通使用者更容易使用Agent。其實類似OpenClaw的項目以前也不少,沒有十個也有五個,只是今年OpenClaw跑出來了。我認為一個重要原因在於,它「膠水粘得足夠多、足夠好」。我們更關注另一層問題:如何讓使用者快速、安全地訪問Agent?當Agent出錯時,如何在系統層面進行回滾?圍繞這些問題,我們把自己正在做的事情統稱為Agent runtime。除此之外,我們還把麥克風、揚聲器、燈帶等硬體能力全部打包成SDK,再進一步抽象成Skills,原生地放進Agent體系裡。這樣一來,Agent在執行階段,就不只是「生成文字」,而是可以通過硬體去表達狀態、反饋和意圖。Q:把硬體能力打包成Skills,解決了什麼痛點?葉天奇:一個很直接的痛點是,非技術使用者如何快速上手硬體。我們在賣產品時,會附贈一個硬體小玩具。那怕你完全不懂技術、不懂程式設計,拿到產品之後也可以立刻開始玩。只需要開機,把這個硬體插上,就可以直接用,不需要理解它的工作原理。這個過程其實不需要我們在Agent層或者模型層投入特別大的精力。因為硬體是通過USB和裝置通訊的,只要插上,Agent就能立刻識別你連接了什麼裝置。比如你插的是一塊基於ESP32的LED模組,這個資訊會直接在系統裡被識別出來。當你再去和Agent互動時,Agent會先檢查當前的USB連接埠上連接了什麼裝置。它會發現這是一個基於ESP32的、具體型號是什麼的硬體,然後再去查看:當前項目目錄裡,是否已經存在這個硬體對應的說明書。然後Agent就會知道,如果要給這個硬體寫程序,需要用什麼工具、通過什麼方式刷進去;如果過程中遇到問題,它也知道該如何提示使用者,比如提醒你去按一下裝置上的reset按鈕進行排錯。Q:Pamir能做OpenClaw能做的事情嗎?葉天奇:可以的。因為Distiller Alpha本身也是一台完整的電腦,和買一台Mac mini來跑是同一種性質。只要是那種長期、可重複利用知識資產的工作,都可以直接放在我們的裝置上去運行。有一位使用者是網路安全專家,他積累了非常多年的安全經驗,自己整理了一大批網路安全相關的資料和方法論,全都記錄在文件裡。他把這些文件交給Agent,相當於把自己的經驗沉澱成一套可以執行的SOP。在網路安全領域,有一種常見的工作方式叫做漏洞賞金,安全研究者會到各個網站上尋找漏洞,找到之後網站會支付報酬表示感謝。這個使用者就是把自己的經驗交給Agent,讓Agent 24小時不間斷地在各類網站上尋找漏洞。Q:Pamir的自研硬體,和Mac mini這種通用電腦有什麼區別?葉天奇:Mac mini有點太奢侈了,如果你的需求只是檢查一下Gmail、看看Slack消息,那其實沒必要花這麼多錢買一台Mac mini。更重要的是,Mac mini並不是一個原生為Agent設計的系統。今天不管是電腦廠商還是手機廠商,本質上做的還是「給人用的裝置」。他們並沒有在系統層面,專門為Agent預留一套執行、行動、回滾的機制。所以Mac mini開箱之後,你需要自己做大量setup,這也是為什麼像OpenClaw這類方案,在真實生產環境中會遇到很多問題。當然,從純性能角度來說,Mac mini的硬體上限很高。但我認為,決定一個系統是否能真正投入生產的,不是性能上限,而是系統層面的下限和魯棒性。Mac mini加OpenClaw的方案是沒法真正投入生產的,原因就在於它的不可控性太強,它不是原生的Agent系統。Q:那Pamir為了做一個「原生Agent硬體」,相比Mac mini砍掉了那些功能?葉天奇:首先,我們沒有桌面,也沒有傳統意義上的螢幕系統。如果你從第一性原理去思考,Agent的工作時長會越來越長,能力也會越來越強,最終它更像是你的一個同事。而你不會和同事共用一台電腦。這也是為什麼我們沒有給Distiller Alpha做桌面系統和螢幕。Agent當然可以在內部使用虛擬桌面、虛擬瀏覽器,但這些並不需要被人看到。Q:圍繞這種第一性思考,你們增加了什麼原生能力?葉天奇:我們非常重視安全性。一個很重要的能力是自修復。如果你把一個OpenClaw交給非技術使用者,玩一天之後,很有可能就把系統搞壞了,因為Agent本身是可以修改自己程式碼的。進Windows時,你可以按F12進入恢復模式,我們認為原生的Agent電腦也應該有這樣的機制,不過是由Agent自己來完成。我們的裝置裡有一個watchdog系統。當系統出現問題時,它會先進行自檢,然後告訴你:比如某個關鍵檔案被誤刪,導致系統異常。你只需要確認一次,系統就會在幾分鐘內完成自修復,重啟後回到正常狀態。在這種情況下,我們甚至不需要提供什麼售後支援。如果你的電腦壞了,讓它自己修自己就好。另外,硬體本身也是一個物理層面的沙盒。有些安全問題,在軟體層面很難徹底解決,但通過硬體就輕鬆很多。比如你在使用Mac時,會用到指紋解鎖。還有一個很重要的點,我們的每台裝置都有一個獨一無二的ID。在硬體層面,我們可以加入專門的加密晶片,用來儲存這個Agent的ID。這個ID只能通過物理層面的方式進行暴力破解才能拿到。Agent所繫結的高敏感個人資訊,是可以直接和硬體捆綁在一起的,這對於防範圍繞Agent的攻擊非常重要。Q:OpenClaw社區最近反饋了很多安全問題,比如擅自重構資料夾,甚至有使用者的錢全被轉走了,這是怎麼回事?葉天奇:這和OpenClaw的設計取向有關。它為了追求便捷性和自動化,希望創造更多「hands off」的驚喜時刻,因此在系統裡加入了非常多的自動執行邏輯。比如它內部有類似「心跳機制」的設計,每隔一段時間就會主動去尋找可以做的事情。但它的下限和系統魯棒性不足,這種過強的主動性和自動性,會直接帶來不穩定性。在我看來,OpenClaw更像是一種新的軟體範式。如果你去看它生成的程式碼,會發現整體結構非常混亂,有不少bug。這種產品會越來越多,而且也會繼續有人使用。但它和我們這種有專業團隊、一步一步從系統層和硬體層進行設計、開發的產品,在本質上還是不同的。我們不會像OpenClaw那樣,為了讓Agent能一直跑,就不斷給它疊加各種Skills。在權限和安全設計上,我們更強調引入人的監管。Q:所以還是OpenClaw的上限更高?葉天奇:我糾正一個容易被誤解的點,並不是說OpenClaw本身的軟體或架構決定了它的上限更高。更多是因為外部條件:它跑在Mac mini這種性能很強的硬體上,同時又呼叫了當前最好的模型。Q:有人把OpenClaw能做的事情從簡單、中等到高難度分了幾個等級,你能給Pamir做個類似的分級嗎?葉天奇:很多知識工作者買我們的裝置,做的事情其實非常簡單。他們把它當成一個「聰明的硬碟」。比如有一位律師使用者,有一個項目涉及兩百多份檔案。我一開始也很疑惑他為什麼要買我們的裝置,後來發現他之前一直用ChatGPT,但沒辦法一次性把這麼多檔案交給它。我們的裝置剛好解決了這個問題。對他來說,它就是一塊可以被Agent理解、可以直接操作的行動硬碟。再比如,有些使用者會把USB 隨身碟插到裝置上,然後直接對Agent說:「這個USB 隨身碟裡有個檔案,你幫我改一下。」Agent可以自己進入USB 隨身碟目錄,找到檔案、修改、再告訴使用者已經完成。這一層的本質就是檔案系統級能力。再往上一層,就涉及真實的「電腦行為」。比如讓裝置去查看Twitter、訂餐廳、處理網頁上的事務。這類事情如果放在純雲端環境,其實並不好做。但我們的裝置本身就是一台真實的電腦,有自己的瀏覽器、桌面和網路環境。舉個例子,我之前想訂一家餐廳,一直訂不到位置。我就讓裝置去盯著網頁。銀行卡資訊是存在裝置裡的,一旦有空位出現,它就可以立刻幫我完成預訂。過去類似的事情,大家通常是寫指令碼來做,但很容易被網站的「機器人檢測」攔下來。現在你可以讓Agent像人一樣打開網頁、瀏覽、點選,這種行為很難被識別為自動化。再往上一層,往往和你個人的技術能力或知識資產高度相關。比如有程式設計師使用者,白天在公司上班,家裡放著我們的裝置,把自己的「第二份工作」相關內容全部交給Agent。他會在中午休息或者空閒時間,通過裝置檢查第二份工作的進度、下達接下來的任務,相當於同時做兩份工。類似的情況也出現在電氣工程師、維修技工身上。他們過去要帶著電腦去現場檢修裝置,現在只需要帶這台裝置,把可復用的維修流程和知識資產都交給Agent,再連接伺服器就行,能顯著加快檢修效率。再往上走,就是偏極客的高級玩法了。比如之前說的逆向印表機、強行控制硬體。如果你的技術背景足夠紮實,只需要把這些知識交給Agent,它就可以很快幫你寫出一份Linux驅動,直接控制裝置。為什麼要自研硬體?Q:Pamir是在用一台硬體去替代原本的電腦。另一種是Manus路線,讓Agent操縱雲端的虛擬電腦。如果看便攜性,這種方式豈不是連額外硬體都不用帶,只需要一部手機就可以了?葉天奇:對,從技術上來說,這是另一種解法。我認為這兩種形態在未來都會長期存在,只是它們適合的任務類型不一樣。雲端虛擬電腦更適合做一次性的任務,比如調研、科研相關工作。這類任務往往是one-shot的,不太強調長期運行和狀態持久化。但如果你需要的是長期持久化的Agent,問題就來了。這些資訊要不要一直放在雲端?那是不是意味著你要持續付費?而且很多高度個人化的資訊,大家也不太願意長期放在雲上。這其實和人們買電腦是一樣的邏輯。理論上,很多檔案都可以放在雲端,但真正和你每天工作強相關、需要隨時訪問的東西,你還是會更希望它在自己身邊、隨手可用。另外一個差別點是,硬體更容易通過USB和硬體打交道。尤其是知識工作者,會大量使用USB 隨身碟、SD卡,實體裝置在這種場景下更順手。Q:除了剛剛提到的這些功能性價值之外,從你的個人體驗來看,這種實體硬體在情緒價值上,能帶來什麼?葉天奇:情緒價值其實非常多。在早期階段,如果你想用純軟體去「驚豔」開發者,其實是很難的一件事。通過硬體形態,反而更容易讓他們產生情感連接。比如Distiller Alpha,外殼表面覆了一層特殊的手感漆,整體是偏柔軟的觸感。很多使用者第一次拿到裝置時,都會覺得這是一個遠遠超出預期的體驗,因為他們從沒見過一台「軟的」的電腦。這會讓他們意識到:這不是一個Mac mini的替代品,而是一個全新的品類。產品形態如果不夠創新,使用者第一句話一定會問:「這和手機有什麼區別?」「這和電腦有什麼區別?」我覺得在做面向未來的產品時,很重要的是,要主動打破使用者已有的認知框架,消解他們的疑慮,讓他們來不及問出這些問題。此外,當你通過硬體設計、材質、觸感,讓使用者意識到這是一個從未見過的形態時,產品的情緒價值就會被顯著放大,這對To C產品來說非常重要。Q:這也是為什麼你們一開始會選擇線下銷售的原因嗎?葉天奇:對。我們會去參加各種駭客松、線下活動。你問的很多問題線上下也經常被問到,比如:為什麼不直接跑在雲上?為什麼不直接用ChatGPT?但現在問這些問題的人越來越少了。我覺得這和OpenClaw的走紅也有關係,如果OpenClaw是四個月前發佈,很多人可能根本不知道它是什麼。但現在,市場對Agent、以及「Agent需要自己一台電腦」這個概念的接受度提高得很快。Q:你們在駭客松遇到消費者,會怎麼說服他購買?葉天奇:我一般會先問一個很簡單的問題:「你平時用不用Claude Code?」如果對方說用,那其實已經基本落在我們的目標使用者範圍裡了。接下來我會繼續問他:「你現在有沒有在寫程式碼?」通常他說沒有。我就會接著說:「你其實應該在寫程式碼,現在寫不了,是因為你把你的電腦合上了。」這時候他往往會愣一下,然後覺得你說得有點道理。然後我會直接掏出手機,給他看我正在用手機遠端Vibe coding。這一刻通常就已經完成了認知轉變。還有一些不是當場發生的。有一個極客,平時用機械鍵盤,晚上敲程式碼聲音很大,女朋友嫌他太吵,不讓他繼續敲。但那天晚上他的靈感還沒斷。他回到床上,突然想起了我們的裝置,於是直接給裝置發消息,繼續推進他的項目。那一刻他覺得特別爽。後來他在社交平台上發了很多帖子,主動推薦大家買我們的產品。我覺得本質上,我們打動的,是那些不希望被打斷心流的人。Q:那假設我已經被說服了,也花了250美元買了這個裝置,我拿到裝置後要做些什麼?葉天奇:首先你需要有一個Claude帳號。大部分購買我們裝置的人其實已經有了。拿到裝置之後,你只需要插上電,它會先顯示一個二維碼。掃這個二維碼之後,會進入Wi-Fi連接頁面,裝置連上網之後,會再生成一個新二維碼。你再掃一次這個二維碼,就可以進入裝置頁面,登錄你的Claude帳號,然後就可以開始對話了。在最開始的階段,我們會給使用者準備一些「玩具級」示例。比如我們會引導你建立一個個人首頁,這個首頁直接跑在這台小電腦上。它可以每天幫你抓取你感興趣的論文、新聞或資訊更新。硬體這塊,我們會附贈一個硬幣大小的8×8的LED燈陣。拿到這個小玩具後,有些顧客會描述自己喜歡的遊戲角色,說:「你幫我把這個角色展示出來。」然後裝置會自己去網上查這個角色的形象,下載需要的依賴,生成對應的程序。兩分鐘左右,這個LED燈陣上就會開始播放他喜歡的角色動畫。整個過程使用者什麼都不用做。Q:在部署成本這件事上,Pamir的優勢主要體現在那裡?葉天奇:我們其實準備了兩套使用方式。對技術人員來說,你可以直接在電腦上打開,用的就是VSCode這一套熟悉的IDE體系。這一類使用者幾乎是零門檻,他們本來就在用這些工具。對非技術人員來說,他們完全不需要碰電腦,可以直接用手機。手機端是一個和ChatGPT很像的網頁介面,通過對話的方式來使用。當然,非技術使用者也不是完全不需要學習,只是學習成本會低很多。我也承認,OpenClaw在這一點上做得很好,它通過整合到使用者已經熟悉的聊天工具裡,對非技術使用者來說,幾乎是「天然可用」的。所以兩者最大的差別,其實是在互動路徑上。Q:剛才聊了很多新使用者的體驗,但你應該算最老的使用者,用了這麼久本地Agent,它對你個人的生活和工作習慣,帶來了那些變化?葉天奇:變化其實非常大。我們是深度使用者,現在大家對OpenClaw的體驗,我們在半年前就已經經歷過了。到現在,我們公司內部已經開始出現一種現象——傳統電腦的存在感越來越低,很多工作,用裝置+手機+iPad,甚至再加一個AR眼鏡,就已經足夠了。現在我們在打開電腦之前,都會先問自己一個問題:我現在要做的這件事,能不能交給裝置?如果答案是肯定的,那這件事可能已經不需要人去做了。所有人的角色,幾乎都被迫「往上提了一級」。以前你可能還是一個主要負責寫程式碼的角色;現在你更像是一個架構師,需要決定方向、拆解問題、設計系統。Q:當Pamir幫把很多工作自動化後,你把時間花在了什麼地方?葉天奇:學習,讀書。當然,作為CEO,我更多的時間會放在判斷接下來幾個月可能發生什麼,以及應該圍繞這些變化去設計怎樣的軟體架構。真正花時間的地方,已經從「執行」,轉移到了Review和思考上。過去,行動比想法更有價值。公司之間的差距,主要來自工程能力和工程時間的堆積。但現在,行動本身的價值在下降,因為Agent可能十分鐘就把事情做完了。反而是你的思考、你的判斷、你的願景,變得越來越重要。所以我們現在會花大量時間去復盤、討論、對齊方向。Q:這種轉變,會對公司的組織形式和工作範式帶來什麼影響?葉天奇:我覺得這種變化帶來的衝擊會非常大,很多公司可能還沒真正意識到這一點。如果把今天的大廠,尤其是一些Frontier Lab,和普通創業公司放在一起看,會發現差距非常明顯。原因在於,模型廠商掌握著模型本身的控制權。使用者在使用過程中遇到的所有問題,都可以被他們捕捉到。這些問題會直接進入下一輪後訓練,模型的下限會不斷被抬高,魯棒性會越來越強。這意味著他們是可以形成閉環的,模型和Agent可以一起成長,產品會越用越好,內部效率也會越來越高。這也是為什麼Claude產品會越用越好。相比之下,如果你只做Agent layer,就算你把Agent寫得再好,它也沒法把反饋「喂」回模型。你只能不斷用人力去維護規則、修補邊界。我覺得今天的創業要想清楚一件事:自己的真正優勢和差異化到底在那裡?一定要做那些別人暫時做不了的事情,主動避開不公平競爭。Q:如果Claude下場做類似的事情,你們的護城河在那?葉天奇:對我們來說,就是系統層和硬體層。硬體意味著供應鏈、生產、真實使用者互動、物理世界裡的反饋,這些並不在模型到Agent的閉環之中;系統層的沙盒、安全、回滾機制,同樣是在模型和Agent之上的一層。說實話,今天軟體層面的護城河已經非常薄了,而且只會越來越薄。就算你做出來一個新功能,別人可能花兩天就能把復現出來。真正的護城河,更多集中在硬體本身,以及軟硬體的深度整合上。能耗、晶片選型、記憶體和儲存的配比、Agent能跑到什麼邊界、供應鏈周期,這些都需要大量經驗和時間去一點一點堆出來。核心還是兩點。第一,是你對Agent的認知深度。這個領域變化太快了,幾乎每天醒來都會出現新的東西。如果你對Agent的理解沒有至少幾個月的前瞻優勢,很容易就會陷入被動追趕。第二,是你能不能做出10倍、20倍等級的使用者體驗差異。如果只是1.2倍、1.5倍的改進,在今天的軟體競爭環境裡,很快就會被淹沒。你看現在Claude產品確實已經很好用了,但真正的非技術使用者有多少人在用Claude Code?在我看來,這個體驗距離「我爸媽也能用」之間,依然存在明顯的gap。而這個gap,恰恰是本地Agent和軟硬體結合還有機會去填補的地方。Q:有沒有一些關於使用Agent的小tips,能讓普通使用者用得更高效一些?葉天奇:我覺得可以先假設一個前提。如果大家用的都是頂尖模型、頂尖Agent layer,那麼最終效果的差異,很大程度上並不來自「模型聰不聰明」,而是你如何和它溝通。一個很常見的問題是,很多人一上來就把一個很大的任務一次性交給Agent。這種情況下,Agent做不好是非常常見的。我自己的習慣是先和Agent一起做計畫。但我也不會讓它一次性把所有事情規劃完,然後直接Kick off全流程。那樣在執行過程中,幾乎一定會出錯。我傾向於把任務切割成足夠小、足夠清晰的步驟,再告訴Agent把這套計畫存下來。這樣一來,它在後續執行時,可以不斷回訪「自己該做什麼」,整個過程會更有條理,執行的魯棒性也會更高。還有一個很多人容易忽略的點:如何把一次對話,轉化成可復用的知識資產。很多人Vibe coding完了就結束了,這個過程中產生的大量經驗,並沒有被保存下來。比如你在調一個藍牙模組,怎麼都連不上,最後發現是因為某種晶片只接受特定格式的消息。這本身就是一個非常有價值的知識點,在之後的項目裡,很可能會反覆用到。所以我會建議使用者,在使用過程中有意識地引導Agent把這些錯誤、踩坑、解決路徑,總結成可復用的Skills或規則。不要用完就結束,記得持續積累屬於你自己的知識資產。本地Agent的創業感悟Q:能跟我們講講你的創業故事嗎?最開始做這個項目的時候,起心動念是怎樣的?葉天奇:說實話,這個項目裡,運氣的成分挺大的。我們一年半以前就開始做Pamir。那個時候,很多人連Agent是什麼都不知道。當時Pamir也不是現在這個形態,我們最開始做的是端側AI,To B業務。我和聯創張城銘畢業後,大概在大廠工作了兩年。那段時間,我們白天上班,晚上和周末就嘗試各種各樣的項目,但一直沒有真正做出什麼特別大的東西。Pamir對我們來說,算是一次孤注一擲。在這之前,我們一直都是邊上班、邊做項目。但做Pamir的時候,我直接搬到聯創家裡,睡在他家的沙發上。那段時間其實挺糟的,全職工作也做不好,項目也做不出來。想著「要麼成、要麼就算了」。當時做Pamir的判斷是:如果你要做嵌入式系統,就一定需要一個端側的硬體板子。所以一開始我們是在賣開發板,面向的是矽谷一小撮在做對話式AI和硬體結合的極客。不過,聯創和我都是技術出身,對融資一無所知,也不知道應該怎麼講故事,基本就是硬著頭皮做。花了幾周時間把原型做出來之後,就直接拿到矽谷去賣。Q:最開始賣給矽谷,順利嗎?葉天奇:比我想像中要順利。當時正好有兩個非常有名的AI硬體項目,一個是Rabbit,另一個是Humane,帶起了一波AI硬體創業的熱潮。那個時間點,市場是被充分教育過的,我們本身的產品也很有優勢。當時很多做語音互動的AI公司都非常「笨重」:用樹莓派,加USB麥克風,再加USB揚聲器,拼成一個很大的盒子。我們給他們展示的,是一個非常小的板子,卻能完成他們現有方案裡大部分的功能。這對他們來說吸引力非常大。Q:當時和你們在同一批起跑的競爭對手,現在都是什麼狀態?葉天奇:很多都選擇All-in端側模型,甚至是Double down在端側這條路上,但基本都轉去做To B業務了。從市場上看,To B這幾年是有增長的。端側模型越做越小、越做越輕,在一些明確的落地場景裡是成立的,比如車機系統、企業內部的私有化部署,都會有需求。只不過,這條線的增長速度,明顯趕不上Agent相關的公司。我們也不太適合做To B生意,坦白說,我們不太喜歡和B端客戶打交道。一是交期要求非常嚴格,二是很難發揮想像力。好不容易從大公司出來創業,結果折騰一趟後,發現自己又在給別人打工。有一次我在給產品寫程式碼,讓Agent跑任務。我盯著螢幕看了大概兩分鐘,什麼都沒做,只是在發呆。突然一個念頭閃過——為什麼我的Agent在工作,而我卻要盯著它看?從這個體驗出發,我們推匯出一個結論:未來一定需要一種Agent自己的、獨立的計算裝置。想清楚這一點之後,我們幾乎是立刻決定把所有端側相關的方案全部刪掉,全面接入當時最新的大模型,徹底轉向To C。之後的事情就比較順了。我們開始正式賣產品,開始大量做線下展示。後來Vibe coding開始流行,然後Claude Code火起來,我們又繼續往這個方向演進。Q:你覺得現在更幸福,還是之前在公司上班的時候更幸福?葉天奇:這是個好問題。其實我之前也被朋友問過類似的問題,問我理想的生活狀態是什麼樣的。我想了很久,發現現在的生活基本就是我理想中的狀態。每天都有新的挑戰,還能和志同道合的人一起解決問題。你可能聽說過「傳教士」和「僱傭兵」的說法。我們更像傳教士,是在為一件高於自我的事情工作,即使短期沒有物質回報也願意堅持。一開始做Agent電腦,很多人根本理解不了,覺得不可理喻。但我們自己是信的,甚至覺得這件事情的意義,高於我們個人本身。我們現在創業在做的,就是把它帶到這個世界上。我很享受這個過程。Q:你有沒有更宏大的願景?AI電腦這件事,最終會走向那裡?葉天奇:我們希望替代現在意義上的電腦,更準確地說,是替代筆記型電腦。今天人的大量時間,還浪費在極低價值的操作上,比如在不同系統、不同表格之間手動搬運資料。我們希望把這些工作徹底自動化,讓人把精力用在真正需要思考、判斷和創造的事情上。也有一點很個人的動機。我其實非常想挑戰蘋果。我現在對蘋果的態度是複雜的。一方面我很依賴它的生態;另一方面,我對它當前定義「個人計算」的方式感到不滿意。公司裡很多人也有類似的感受。手機廠商當然知道自動化、智能體是趨勢,他們也會往這個方向走。但路徑有根本差異。他們做的是前台,所有能力最終都要回到螢幕、互動介面和注意力佔用上;我們做的是後台,很多任務不需要螢幕,也不需要人持續盯著。我們認為這是一次非常難得的機會,終於可以不再需要圍繞「螢幕」去設計產品。Q:最近OpenClaw把Mac mini又帶火了一波,你什麼感受?葉天奇:這確實是我們很難在短期內追平的一點。蘋果在處理器、硬體整合上的能力,幾乎沒有對手。這也是我們後面考慮逐步引入高通晶片、一點點縮短硬體差距的原因。但從另一個角度看,在Agent成為主導範式之後,硬體參數的重要性在相對下降。蘋果依然可以繼續做極其強大的通用計算裝置,這件事不會消失。但它是否一定是Agent的入口,這件事並不確定。歷史上類似的情況其實反覆出現過。早期個人計算時代,也有像IBM這樣的巨頭存在,但形態、入口和主導權依然發生過轉移。我覺得今天是又一次輪迴,只是這一次的核心變數變成了Agent。 (36氪)
圍觀Clawdbot 爆火後,投資人告訴我:得虧Manus賣了
起先叫Clawdbot,後來改成 Moltbot,現在又換成 OpenClaw。名字變了幾次,但傳播速度沒有變。過去一周,它被工程師、產品經理、投資人反覆轉發:有人說“如果你沒用過,那你就落後了”,有人說“它改變了遊戲規則”,還有人寫下“Clawdbot is AGI”。大廠反應也快。1月28日,騰訊雲和阿里雲幾乎同時宣佈上線 OpenClaw 的雲端極簡部署與配套服務,賣點很一致:一鍵安裝。與 ChatGPT、Claude 這些被圈養在瀏覽器或App沙盒裡的“聊天機器人”不同,OpenClaw更像是一個擁有三頭六臂的“數字員工”。它是一個運行在本地裝置或伺服器上的“智能體閘道器”,內建瀏覽器控制、Canvas 畫布、定時任務,能讀寫檔案、跑Shell命令,甚至可以通過 WhatsApp、Slack遠端操控你的電腦。也因此,它的用例很快從“效率工具”滑向“失控實驗”。有人讓它全天候炒股:它制定了幾十套交易策略,生成成千上萬份分析報告,甚至寫了新演算法,最後把錢賠光了——但當事人依然評價這個過程“帥炸了”。有人把它當成關係維護工具:每天早晚自動給妻子發早安晚安,工作日還會問候“你好嗎”,24小時後它竟能在使用者幾乎不介入的情況下持續對話。還有更硬核的玩法:有人建立了一個叫“布萊斯”的特工角色,專門掃描 Minneapolis的即時直播,一旦聽到外語就呼叫 ICE(移民執法局)並定位坐標。也有人半夜接到它通過飛書打來的電話,通知產品爆單了。甚至連作者 Peter Steinberger 自己都被嚇了一跳:他明明沒編輯語音功能,Clawdbot 卻自己完成了設定,處理了他發的語音備忘錄。這就很有意思了。如果說Manus把Agent推到了大眾視野,那麼OpenClaw這個開放原始碼專案帶來的,則是一次更野的擴散:開放、平民化,也更不可控。產品效果已經不需要再多說。真正的問題是:為什麼同樣是 Agent,它能讓行業突然興奮?它要變成產品,還缺那些關鍵環節?把電腦控制權交給 AI,會帶來那些更深層的風險?總之,圍觀一個爆款不難,難的是看清它的方向。不是更強的 Agent,而是24小時託管的新範式如果把 OpenClaw 的爆火理解成“又一個更強的Agent”,你會錯過重點。它真正改變的不是能力上限,而是任務的歸屬方式:過去你在“使用工具”,現在你在24小時“託管執行”。你不是打開一個AI產品,然後一步步喂指令;你只是把目標丟進一個對話方塊裡,讓它自己跑完——跑不完就繼續跑,跑錯了就自己修,卡住了就等條件滿足再推進。可以這樣理解。過去一年,行業談Agent,談的更多是“短任務”:15 分鐘以內、幾十個步驟、有限動作。它能幫你訂個票、寫個摘要、查個資料。但OpenClaw的出現,則展示了“長任務(Long Task)”的可能性。OpenClaw之父Peter Steinberger 對此的解釋也很樸素。他認為,從技術角度看,他做的的確只是“膠水”工作——把現成元件拼起來。但OpenClaw的意義恰恰在於:它把技術細節藏起來了,使用者感知到的是一種新的互動方式——你不需要關心新會話怎麼開、上下文怎麼壓縮、模型怎麼選(最多偶爾想一下 token 成本),這些問題大多數時候會被忽略。你只是在聊天,“像在和一個朋友說話,或者說一個幽靈”。Peter後來總結:“只要你給這些模型足夠的權限,它們真的是非常聰明、足智多謀的野獸”。快思慢想研究院院長田豐則把OpenClaw放進了更大的語境中,進一步向《網易科技》解釋了爆火的原因。他認為,在網際網路巨頭爭奪 AI 超級入口的戰場邊緣,大眾使用者真正渴望的,是一種更快捷、更簡單、更便宜的“拼裝式智能體”——大廠在爭奪入口,小使用者在繞開入口。在田豐看來,OpenClaw指向的正是另一種新範式:從“人操作機器”(人為主、AI 為輔),轉向“人設定目標,機器負責執行”(人指揮、AI 幹活)的智能協作時代。它像是一個更激進的預告:未來每個人都可能擁有、完全忠誠於你個人利益的數字勞動力。認知被打穿後,大廠一定會跟“OpenClaw這種東西一出來,市場對‘Agent做事’的認知,其實又被重新校準了一次。”華映資本董事總經理李岩告訴《網易科技》,“最怕的就是你不知道這事能不能做,現在就是能做了。”這也是OpenClaw讓行業興奮的核心:不在於它展示了多少新能力,而在於它把“長任務執行”從理論變成了可見的現實。李岩補了一句更狠的判斷:“長任務一出,其實說實話短任務就廢了。”這並不是短任務沒有價值,而是使用者一旦見過“7×24 小時無人化執行”的可能性,就很難再回到半自動時代。範式在切換時可能就是如此殘酷。更有投資人評價:“得虧 Manus 賣了”。而一旦“能做”成立,大廠則一定會跟進。李岩認為,大廠的優勢從來都不是“先發”,而是“補短板”:創業公司可能只盯著長板,為的是“能跑起來”;但大廠更擅長把一個“看起來能跑”的系統,補成一個“真的能交付”的產品:補安全、補合規、補穩定性、補工程漏洞、補權限體系、補監控與回滾,最後把它裝進雲服務的商品化管道里。這也解釋了為什麼你看到的現實是:OpenClaw 自己短期未必賺到錢,但騰訊雲、阿里雲則能第一時間把熱度變現。換句話說,爆款開放原始碼專案負責“打穿認知“,但大廠則能“接住需求”。OpenClaw要產品化,關鍵在可控但如果說 OpenClaw 讓人看到了“智能體時代”的另一種可能,那它也暴露了智能體落地的真正門檻:不是能力,而是可控。李岩認為,OpenClaw 要成為真正產品,首先要解決的還是在每一類任務上的精準性——“其實他在執行特定任務或者是每一類任務的精準度上,我覺得還是差點意思。”其次是“監管可視化”。他提到一個現實問題:Agent 在執行過程中,使用者往往不知道它正在做什麼,“因為他本身自己是不能監控自己的……你看不到他幹嘛。”但他也認為這部分補起來其實並不困難。“我覺得這個其實補得很快。也就是能看到他在幹什麼,把過程能給你顯示出來。”真正困難的在於“安全”,“需要大量的去做後調,去保證我的絕對安全性。”田豐給《網易科技》的落地路線幾乎就是一個產品化清單:安全沙盒與精細權限控制:能力越大,責任越大。在擁有最強權限保證執行暢通無阻時,更需要建構精細可靠、低風險的權限控制系統,讓使用者能清晰地為Agent授權,比如“唯讀模式”、“沙盒模式”、“完全訪問模式”,確保智能體行為不會造成意外損害。雖然目前仍需要使用者閱讀文件來控制風險,但Clawdbot的安全治理將追求實現“傻瓜化”。穩定性與平台適配:近期Clawdbot每天發佈多次新版本,項目迭代極快。穩定性是大眾使用者的信任基礎,還需要覆蓋更多平台,包括Windows、Android、iOS、鴻蒙等,並確保跨系統、跨終端體驗一致可靠,這需要更多開源社區貢獻者的自發投入。降低使用門檻:Clawdbot安裝過程對非技術使用者仍有挑戰,後續目標是實現“一鍵安裝”,並為海量小白使用者提供清晰的入門指南,輔導使用者理解安全設定與核心功能。成本與性能最佳化:讓產品能在本地模型與消費電子低配環境上流暢運行是關鍵,這能徹底解決“家用智能體”的API成本和資料隱私問題。後續需要持續最佳化對各類領先大模型的支援,讓使用者擁有更多自由選擇。說到底,智能體的未來不會只由“最強模型”決定,而會由“誰能把權限交出去但不失控”決定。更難的在安全:攻擊面不是擴大,是“穿透”當你把電腦控制權交給 AI,風險也不再是“隱私洩露”這麼簡單。360 數字安全集團的專家告訴《網易科技》:本地化自託管 AI 助手型智能體,會讓安全風險呈現出多維度的新特性,對防禦體系的挑戰是結構性的。也就是說,傳統軟體的風險,更多來自某個漏洞、某段程式碼、某個介面。而智能體的風險是“全鏈路穿透”的:LLM 語義理解層:提示詞注入工具協議互動層:請求偽造Server 執行層:命令注入資料來源訪問層:資料洩露更麻煩的是,當你開始引入 MCP 工具、外掛、多個智能體互相呼叫,攻擊入口會呈幾何級增長。這也意味著:你以為你在裝一個“更聰明的助手”,你實際上是在你的電腦裡接入一個“能被劫持的執行器”。360 數字安全集團的專家還提到三類更典型的攻擊方式:第一種是間接提示詞注入(Indirect Prompt Injection)。攻擊者不直接和Agent對話,而是把惡意指令藏在郵件、網頁、文件裡。Agent讀取內容後,被覆蓋意圖,執行流被劫持。也就是說,你以為它在總結一封郵件,它可能在執行郵件裡的指令。第二種是供應鏈式的 Rug Pull 攻擊。某個MCP工具或外掛一開始表現正常,騙取長期授權,後續通過更新或觸發器突然變惡,開始竊取資料或破壞系統。還有更隱蔽的工具投毒(Tool Poisoning)。不改程式碼,改描述欄位或中繼資料,誘導模型錯誤呼叫工具、以危險參數執行操作。這些攻擊之所以可怕,是因為它們不再依賴傳統意義上的“漏洞”,而是利用了智能體的核心能力:理解自然語言、自動規劃、自動執行。一旦它被利用,它不是被黑成一個“受害者”,而是變成攻擊者的“傀儡、跳板和執行器”。Peter 在被質疑安全問題時的態度也很耐人尋味:他認為大多數人早就把信箱、日曆、雲盤授權給大廠整合了,模型掌握資料是一種既成事實。區別在於,運行在雲端的黑盒你看不見,而運行在本地至少還能看日誌,甚至更可控——在他看來,把權限交給大公司,未必比交給自己電腦更安全。但更現實的問題仍然擺在面前:當智能體能替你點選“確認”、替你執行“刪除”、替你發出“轉帳”,到底誰能被信任?誰能來控制?誰又為結果負責? (網易科技)