即插即用,無需Mac mini。OpenClaw(原名Clawdbot)爆火,「賈維斯」狂潮席捲全球。剛看了下京東,本地Agent甚至已經成了Mac mini的廣告語……最近矽谷的一個本地Agent項目也很有關注度,而且是軟硬體打包好,買回來就能直接用的那種。長這樣子,賣250美元(折合人民幣約1700元),買來插上電就能當OpenClaw用。對,硬體版的OpenClaw……硬體版OpenClaw名字叫Distiller Alpha,一款Linux硬體,核心計算模組基於樹莓派CM5,8GB記憶體,64GB儲存。在此基礎上,還整合了墨水屏、麥克風、揚聲器、攝影機……特別小一個,手掌一半都不到,整體尺寸比手機還小,感覺能直接揣褲兜。所有都提前在這塊硬體裡部署好了,掃下墨水屏上的二維碼,就能直接進入互動介面,和一個叫Pamir的Agent對話。OpenClaw能幹的都能幹,整理檔案、翻閱X、發郵件……理論上,只要能通過「點選」解決的事情,都沒問題。同樣是一個24小時待命的賈維斯,可以隨地大小Code。這些都不是重點。上面這些事情,OpenClaw都能做,甚至能更誇張。Pamir最不一樣的地方,是它竟然還可以給硬體Vibe coding……有人給掃地機器人裝了根機械臂,現在不僅能掃灰塵了,遇到大點的垃圾也能順手撿起。有個老哥在家裡搭了一套賽車模擬器,把Pamir當「副駕駛」用。每次他跑完一圈後,這個「副駕駛」會自動幫他回顧和分析駕駛資料,然後把這些資料即時展示在他接上的一堆小螢幕上。就連這個8×8的LED燈陣都能玩出花來,只需要一句話就能搞出各種炫酷的特效。如果你想,甚至能在這上面玩貪吃蛇……各種離譜的demo見得多了,能給硬體Vibe coding的Agent倒還是第一次見。正好最近本地Agent火,相信大家心裡多少都有不少困惑:這條路到底和其他Agent有什麼不同?類似的創業者如何看OpenClaw?使用者又該如何更好地打造自己的「賈維斯」?帶著這些問號,量子位找到了這家硬體版OpenClaw,Pamir的兩位創始人之一——葉天奇,聊了聊他們在本地Agent這條賽道上的想法。採訪原文超1.2萬字,資訊密度很高,其中有不少有趣的觀點。為了完整呈現葉天奇的思考,我們決定不做過多處理,直接把全文端上來。在這場對話裡,你會看到:軟硬一體的Agent,會有什麼不一樣?OpenClaw到底做對了什麼,火了之後為什麼又迅速暴露出一堆安全問題?為什麼Mac mini並不是最適合部署Agent的硬體?那些提前半年就體驗過OpenClaw這種能力的人,現在都怎麼用本地Agent?為什麼對初創公司來說,硬體是一條更合適的路徑?AI時代下,電腦的最終形態可能會長什麼樣?以下附上訪談全文,為提升可讀性,量子位在不改變原意的前提下,對內容進行了適當調整和刪減。OpenClaw、本地Agent,以及電腦的下一步 Pamir是什麼?Q:Pamir現在做的Distiller Alpha是什麼?它能幹些什麼?葉天奇:Distiller Alpha本質上是一台Linux的mini PC,一台非常小的Linux小電腦。我們把傳統電腦裡一些最基礎的元件單獨拎出來,配上小螢幕、LED燈、麥克風、揚聲器,以及各種各樣的IO介面,把它做成了一個非常緊湊的形態,整體尺寸比手機還小。在系統層面,我們給這台裝置預裝了Agent,目前主要用於跑Claude Code。基本上,只要是Linux+Docker能做的事情,它都能做。最典型的場景是Vibe coding。現在有一批開發者非常痴迷Vibe coding,希望隨時隨地都能寫程式碼,他們會通過手機遠端操作我們的裝置。除此之外,還有一批使用者會把我們的裝置接到各種各樣的硬體上,通過Vibe coding的方式來開發和控制這些硬體。Q:「Vibe coding+硬體」的組合聽起來挺新鮮的,可以展開講講嗎?葉天奇:這個方向其實並不是我們一開始有意設計的。從使用者角度來看,會購買我們裝置的人,往往本身就很喜歡玩硬體。很多設計師,他們很懂電子產品設計,但並不擅長程式設計。過去他們使用的往往是比較簡單的開發板,如果要做原型,就需要雇電子工程師幫忙。現在他們會直接把Distiller Alpha接到硬體上,把自己的想法描述出來,系統就可以自動幫他把對應的邏輯和程式碼生成出來。還有一些使用者,會用它去「接管」已經存在的裝置,比如藍牙裝置。很多藍牙裝置其實並不需要額外的密碼,只要傳送一串正確的二進制指令,就能完成控制。他可以直接對系統說:「幫我掃描一下附近有那些藍牙裝置」「幫我把這盞燈關掉」。很多智能家居都是自己獨立的一套App,非常零散。用Distiller Alpha就能一個頁面裡,控制家裡所有的智能裝置。再比如印表機,你不需要安裝官方App,只要知道它內部使用的是什麼晶片,就可以讓Agent寫程式碼、做簡單的逆向工程,讓這台印表機工作起來。Q:如果不靠Distiller Alpha,極客通常是怎麼完成這些操作的?葉天奇:這個問題其實挺有意思的。我之前也問過一些使用者,發現主要取決於技術水平。技術能力強的人一直都是手寫。他們會先去讀硬體的說明書,搞清楚晶片型號、通訊方式和程式設計方法,然後直接寫程式碼、燒錄。但對技術能力沒有那麼強的人來說,過去的主流方式,其實是用ChatGPT。他們會把需求丟給ChatGPT,讓它生成一段程式碼,然後複製貼上到硬體的編輯器或燒錄工具裡,點一下燒錄,再測試。如果發現不work,就把報錯資訊再反饋給ChatGPT,讓它改一版程式碼,再複製貼上、再燒錄。有了我們的硬體之後,整個鏈路被閉環了。Agent可以自己寫程式碼、自己燒錄到硬體上、自己讀取報錯資訊、再根據結果修改程式碼並重新燒錄。不再需要在中間反覆做人肉中轉。Q:為什麼Distiller Alpha會出現這麼多偏硬體的玩法?葉天奇:核心的原因在於出發點不一樣。OpenClaw是從軟體方向起步。即使你買了一台Mac mini,也很少想到把它當成嵌入式裝置,塞進另一個硬體裡。一方面體積擺在那裡,另一方面它的IO介面數量有限,也不太容易激發使用者在硬體層面進行二次開發的慾望。而且OpenClaw本身更偏向於為知識工作者設計互動。對開發者來說,如果要寫軟體,不太可能通過WhatsApp、Telegram這種聊天氣泡式的方式,那會非常痛苦。本質上還是面向的人群不同。我們早期的定位就是remote——一個讓你隨時隨地都能接觸到自己Claude Code的裝置。最早購買我們的,基本都是Early adopter型的開發者。後來隨著Vibe coding這個概念被更多人接受,有開始有越來越多非開發者、甚至傳統意義上的知識工作者購買我們的裝置。有的使用者在自己買了之後,還會再給父母買一台。而這些非開發者使用者,往往會把我們的產品當成一種「智能硬碟」來用。Q:Distiller Alpha本身的硬件由那些元件構成?葉天奇:我們在設計這款產品時的一個原則是:在體積允許的情況下,把能裝的能力儘量都裝上。比如燈帶,它的核心作用是顯示Agent的工作狀態。比如Agent在思考時,會顯示黃色燈光;當Agent需要使用者介入時,會閃爍綠色燈光。我們希望通過這種比較克制的方式,把Agent的狀態融入到裝置本身。現在很多程序會用消息通知或者聲音提醒,但我們覺得,用一種更偏「環境感」的方式,通過視覺氛圍來反映Agent狀態,會更自然一些。而且,通過環境光來傳遞狀態的資訊方式,本身就很極客。這點可以類比喜歡裝機、玩電腦的人,會很熱衷RGB燈效。螢幕的設計思路同樣比較極客。我們用的是一塊墨水屏。一方面,墨水屏顯示效果很好,很多開發者本身就對這種螢幕有偏好;另一方面,它的功耗非常低。有些使用者會把這塊螢幕改造成自己的Personal dashboard,比如顯示股票資訊、未讀郵件數量,或者當天還有多少任務需要處理。這類資訊不需要頻繁刷新,墨水屏非常合適。還內建了麥克風和揚聲器。有的使用者會設定:每天早上醒來時,讓裝置從自己的音樂列表裡挑一首最喜歡的歌來叫醒自己。另外,我們還內建了一個攝影機,主要是給開發者使用。有人會用它來遠端看看家裡的貓狗,或者用來監控另一台電腦的螢幕狀態。這些都屬於比較自由的開發用途。Q:算力配置是什麼水平?葉天奇:目前是8GB記憶體、64GB儲存的CPU平台。這個配置其實不是一開始就想清楚的,你需要積累很多真實使用的know-how,才能知道跑一個Agent到底需要多大的記憶體、多少儲存。我們會從幾個維度去看,比如:一個普通使用者通常會同時跑多少個Agent;這些Agent的知識資產大概會增長到什麼規模;一個使用者大概用多久,裝置裡的儲存就會被填滿;Agent的運行上限在那裡,瓶頸會出現在記憶體、儲存還是IO上。一個很有意思的發現是,我們一開始低估了知識資產的增長速度。之前沒想到會有這麼多知識工作者,有些使用者會長期給裝置外接一塊SSD,把每一次對話、每一次任務執行的記錄全部存下來,在他們看來,這些是非常重要的個人資產。這類需求很難在產品設計階段預判。但一旦接觸到使用者,就會意識到儲存本身,是Agent產品裡一個非常關鍵的維度。Q:Pamir的技術原理是怎樣的?葉天奇:我們在產品路徑上,和很多AI公司不太一樣。我們是先做硬體和系統,再在探索過程中不斷摸索軟體形態。一開始,我們在裝置裡直接內建了VSCode。我們的判斷是,VSCode基本可以覆蓋大多數軟體開發和互動需求。後來隨著產品迭代,我們不斷做減法,把介面逐漸收斂,最終拆掉了傳統意義上的「GPT對話介面」。軟體互動主要基於內部網路直連。只要這台裝置是開機狀態,無論你在什麼地方,用電腦也好、手機也好,都可以直接訪問到它。有點像一個ChatGPT式的入口,不同終端之間是完全同步的。硬體互動方面,裝置上有一個小的顯示模組,會即時顯示當前裝置的連接狀態。比如我們會展示一個二維碼,任何人用手機一掃,就可以直接進入這台裝置,向Agent傳送指令。Pamir的差異點在那?Q:Distiller Alpha和OpenClaw有什麼區別?葉天奇:在我看來,OpenClaw更像是一個「軟體傻瓜包」。它本質上像一層膠水,把很多已有的能力粘合在一起,解決的是可用性和易用性。這有點像當年大家對原生Android系統不滿意,於是會去刷各種第三方ROM,比如MIUI。OpenClaw刻意簡化了很多複雜的項目管理流程,把所有互動都集中在一個Chat session,同時在記憶持久化上做了大量工作,讓普通使用者更容易使用Agent。其實類似OpenClaw的項目以前也不少,沒有十個也有五個,只是今年OpenClaw跑出來了。我認為一個重要原因在於,它「膠水粘得足夠多、足夠好」。我們更關注另一層問題:如何讓使用者快速、安全地訪問Agent?當Agent出錯時,如何在系統層面進行回滾?圍繞這些問題,我們把自己正在做的事情統稱為Agent runtime。除此之外,我們還把麥克風、揚聲器、燈帶等硬體能力全部打包成SDK,再進一步抽象成Skills,原生地放進Agent體系裡。這樣一來,Agent在執行階段,就不只是「生成文字」,而是可以通過硬體去表達狀態、反饋和意圖。Q:把硬體能力打包成Skills,解決了什麼痛點?葉天奇:一個很直接的痛點是,非技術使用者如何快速上手硬體。我們在賣產品時,會附贈一個硬體小玩具。那怕你完全不懂技術、不懂程式設計,拿到產品之後也可以立刻開始玩。只需要開機,把這個硬體插上,就可以直接用,不需要理解它的工作原理。這個過程其實不需要我們在Agent層或者模型層投入特別大的精力。因為硬體是通過USB和裝置通訊的,只要插上,Agent就能立刻識別你連接了什麼裝置。比如你插的是一塊基於ESP32的LED模組,這個資訊會直接在系統裡被識別出來。當你再去和Agent互動時,Agent會先檢查當前的USB連接埠上連接了什麼裝置。它會發現這是一個基於ESP32的、具體型號是什麼的硬體,然後再去查看:當前項目目錄裡,是否已經存在這個硬體對應的說明書。然後Agent就會知道,如果要給這個硬體寫程序,需要用什麼工具、通過什麼方式刷進去;如果過程中遇到問題,它也知道該如何提示使用者,比如提醒你去按一下裝置上的reset按鈕進行排錯。Q:Pamir能做OpenClaw能做的事情嗎?葉天奇:可以的。因為Distiller Alpha本身也是一台完整的電腦,和買一台Mac mini來跑是同一種性質。只要是那種長期、可重複利用知識資產的工作,都可以直接放在我們的裝置上去運行。有一位使用者是網路安全專家,他積累了非常多年的安全經驗,自己整理了一大批網路安全相關的資料和方法論,全都記錄在文件裡。他把這些文件交給Agent,相當於把自己的經驗沉澱成一套可以執行的SOP。在網路安全領域,有一種常見的工作方式叫做漏洞賞金,安全研究者會到各個網站上尋找漏洞,找到之後網站會支付報酬表示感謝。這個使用者就是把自己的經驗交給Agent,讓Agent 24小時不間斷地在各類網站上尋找漏洞。Q:Pamir的自研硬體,和Mac mini這種通用電腦有什麼區別?葉天奇:Mac mini有點太奢侈了,如果你的需求只是檢查一下Gmail、看看Slack消息,那其實沒必要花這麼多錢買一台Mac mini。更重要的是,Mac mini並不是一個原生為Agent設計的系統。今天不管是電腦廠商還是手機廠商,本質上做的還是「給人用的裝置」。他們並沒有在系統層面,專門為Agent預留一套執行、行動、回滾的機制。所以Mac mini開箱之後,你需要自己做大量setup,這也是為什麼像OpenClaw這類方案,在真實生產環境中會遇到很多問題。當然,從純性能角度來說,Mac mini的硬體上限很高。但我認為,決定一個系統是否能真正投入生產的,不是性能上限,而是系統層面的下限和魯棒性。Mac mini加OpenClaw的方案是沒法真正投入生產的,原因就在於它的不可控性太強,它不是原生的Agent系統。Q:那Pamir為了做一個「原生Agent硬體」,相比Mac mini砍掉了那些功能?葉天奇:首先,我們沒有桌面,也沒有傳統意義上的螢幕系統。如果你從第一性原理去思考,Agent的工作時長會越來越長,能力也會越來越強,最終它更像是你的一個同事。而你不會和同事共用一台電腦。這也是為什麼我們沒有給Distiller Alpha做桌面系統和螢幕。Agent當然可以在內部使用虛擬桌面、虛擬瀏覽器,但這些並不需要被人看到。Q:圍繞這種第一性思考,你們增加了什麼原生能力?葉天奇:我們非常重視安全性。一個很重要的能力是自修復。如果你把一個OpenClaw交給非技術使用者,玩一天之後,很有可能就把系統搞壞了,因為Agent本身是可以修改自己程式碼的。進Windows時,你可以按F12進入恢復模式,我們認為原生的Agent電腦也應該有這樣的機制,不過是由Agent自己來完成。我們的裝置裡有一個watchdog系統。當系統出現問題時,它會先進行自檢,然後告訴你:比如某個關鍵檔案被誤刪,導致系統異常。你只需要確認一次,系統就會在幾分鐘內完成自修復,重啟後回到正常狀態。在這種情況下,我們甚至不需要提供什麼售後支援。如果你的電腦壞了,讓它自己修自己就好。另外,硬體本身也是一個物理層面的沙盒。有些安全問題,在軟體層面很難徹底解決,但通過硬體就輕鬆很多。比如你在使用Mac時,會用到指紋解鎖。還有一個很重要的點,我們的每台裝置都有一個獨一無二的ID。在硬體層面,我們可以加入專門的加密晶片,用來儲存這個Agent的ID。這個ID只能通過物理層面的方式進行暴力破解才能拿到。Agent所繫結的高敏感個人資訊,是可以直接和硬體捆綁在一起的,這對於防範圍繞Agent的攻擊非常重要。Q:OpenClaw社區最近反饋了很多安全問題,比如擅自重構資料夾,甚至有使用者的錢全被轉走了,這是怎麼回事?葉天奇:這和OpenClaw的設計取向有關。它為了追求便捷性和自動化,希望創造更多「hands off」的驚喜時刻,因此在系統裡加入了非常多的自動執行邏輯。比如它內部有類似「心跳機制」的設計,每隔一段時間就會主動去尋找可以做的事情。但它的下限和系統魯棒性不足,這種過強的主動性和自動性,會直接帶來不穩定性。在我看來,OpenClaw更像是一種新的軟體範式。如果你去看它生成的程式碼,會發現整體結構非常混亂,有不少bug。這種產品會越來越多,而且也會繼續有人使用。但它和我們這種有專業團隊、一步一步從系統層和硬體層進行設計、開發的產品,在本質上還是不同的。我們不會像OpenClaw那樣,為了讓Agent能一直跑,就不斷給它疊加各種Skills。在權限和安全設計上,我們更強調引入人的監管。Q:所以還是OpenClaw的上限更高?葉天奇:我糾正一個容易被誤解的點,並不是說OpenClaw本身的軟體或架構決定了它的上限更高。更多是因為外部條件:它跑在Mac mini這種性能很強的硬體上,同時又呼叫了當前最好的模型。Q:有人把OpenClaw能做的事情從簡單、中等到高難度分了幾個等級,你能給Pamir做個類似的分級嗎?葉天奇:很多知識工作者買我們的裝置,做的事情其實非常簡單。他們把它當成一個「聰明的硬碟」。比如有一位律師使用者,有一個項目涉及兩百多份檔案。我一開始也很疑惑他為什麼要買我們的裝置,後來發現他之前一直用ChatGPT,但沒辦法一次性把這麼多檔案交給它。我們的裝置剛好解決了這個問題。對他來說,它就是一塊可以被Agent理解、可以直接操作的行動硬碟。再比如,有些使用者會把USB 隨身碟插到裝置上,然後直接對Agent說:「這個USB 隨身碟裡有個檔案,你幫我改一下。」Agent可以自己進入USB 隨身碟目錄,找到檔案、修改、再告訴使用者已經完成。這一層的本質就是檔案系統級能力。再往上一層,就涉及真實的「電腦行為」。比如讓裝置去查看Twitter、訂餐廳、處理網頁上的事務。這類事情如果放在純雲端環境,其實並不好做。但我們的裝置本身就是一台真實的電腦,有自己的瀏覽器、桌面和網路環境。舉個例子,我之前想訂一家餐廳,一直訂不到位置。我就讓裝置去盯著網頁。銀行卡資訊是存在裝置裡的,一旦有空位出現,它就可以立刻幫我完成預訂。過去類似的事情,大家通常是寫指令碼來做,但很容易被網站的「機器人檢測」攔下來。現在你可以讓Agent像人一樣打開網頁、瀏覽、點選,這種行為很難被識別為自動化。再往上一層,往往和你個人的技術能力或知識資產高度相關。比如有程式設計師使用者,白天在公司上班,家裡放著我們的裝置,把自己的「第二份工作」相關內容全部交給Agent。他會在中午休息或者空閒時間,通過裝置檢查第二份工作的進度、下達接下來的任務,相當於同時做兩份工。類似的情況也出現在電氣工程師、維修技工身上。他們過去要帶著電腦去現場檢修裝置,現在只需要帶這台裝置,把可復用的維修流程和知識資產都交給Agent,再連接伺服器就行,能顯著加快檢修效率。再往上走,就是偏極客的高級玩法了。比如之前說的逆向印表機、強行控制硬體。如果你的技術背景足夠紮實,只需要把這些知識交給Agent,它就可以很快幫你寫出一份Linux驅動,直接控制裝置。為什麼要自研硬體?Q:Pamir是在用一台硬體去替代原本的電腦。另一種是Manus路線,讓Agent操縱雲端的虛擬電腦。如果看便攜性,這種方式豈不是連額外硬體都不用帶,只需要一部手機就可以了?葉天奇:對,從技術上來說,這是另一種解法。我認為這兩種形態在未來都會長期存在,只是它們適合的任務類型不一樣。雲端虛擬電腦更適合做一次性的任務,比如調研、科研相關工作。這類任務往往是one-shot的,不太強調長期運行和狀態持久化。但如果你需要的是長期持久化的Agent,問題就來了。這些資訊要不要一直放在雲端?那是不是意味著你要持續付費?而且很多高度個人化的資訊,大家也不太願意長期放在雲上。這其實和人們買電腦是一樣的邏輯。理論上,很多檔案都可以放在雲端,但真正和你每天工作強相關、需要隨時訪問的東西,你還是會更希望它在自己身邊、隨手可用。另外一個差別點是,硬體更容易通過USB和硬體打交道。尤其是知識工作者,會大量使用USB 隨身碟、SD卡,實體裝置在這種場景下更順手。Q:除了剛剛提到的這些功能性價值之外,從你的個人體驗來看,這種實體硬體在情緒價值上,能帶來什麼?葉天奇:情緒價值其實非常多。在早期階段,如果你想用純軟體去「驚豔」開發者,其實是很難的一件事。通過硬體形態,反而更容易讓他們產生情感連接。比如Distiller Alpha,外殼表面覆了一層特殊的手感漆,整體是偏柔軟的觸感。很多使用者第一次拿到裝置時,都會覺得這是一個遠遠超出預期的體驗,因為他們從沒見過一台「軟的」的電腦。這會讓他們意識到:這不是一個Mac mini的替代品,而是一個全新的品類。產品形態如果不夠創新,使用者第一句話一定會問:「這和手機有什麼區別?」「這和電腦有什麼區別?」我覺得在做面向未來的產品時,很重要的是,要主動打破使用者已有的認知框架,消解他們的疑慮,讓他們來不及問出這些問題。此外,當你通過硬體設計、材質、觸感,讓使用者意識到這是一個從未見過的形態時,產品的情緒價值就會被顯著放大,這對To C產品來說非常重要。Q:這也是為什麼你們一開始會選擇線下銷售的原因嗎?葉天奇:對。我們會去參加各種駭客松、線下活動。你問的很多問題線上下也經常被問到,比如:為什麼不直接跑在雲上?為什麼不直接用ChatGPT?但現在問這些問題的人越來越少了。我覺得這和OpenClaw的走紅也有關係,如果OpenClaw是四個月前發佈,很多人可能根本不知道它是什麼。但現在,市場對Agent、以及「Agent需要自己一台電腦」這個概念的接受度提高得很快。Q:你們在駭客松遇到消費者,會怎麼說服他購買?葉天奇:我一般會先問一個很簡單的問題:「你平時用不用Claude Code?」如果對方說用,那其實已經基本落在我們的目標使用者範圍裡了。接下來我會繼續問他:「你現在有沒有在寫程式碼?」通常他說沒有。我就會接著說:「你其實應該在寫程式碼,現在寫不了,是因為你把你的電腦合上了。」這時候他往往會愣一下,然後覺得你說得有點道理。然後我會直接掏出手機,給他看我正在用手機遠端Vibe coding。這一刻通常就已經完成了認知轉變。還有一些不是當場發生的。有一個極客,平時用機械鍵盤,晚上敲程式碼聲音很大,女朋友嫌他太吵,不讓他繼續敲。但那天晚上他的靈感還沒斷。他回到床上,突然想起了我們的裝置,於是直接給裝置發消息,繼續推進他的項目。那一刻他覺得特別爽。後來他在社交平台上發了很多帖子,主動推薦大家買我們的產品。我覺得本質上,我們打動的,是那些不希望被打斷心流的人。Q:那假設我已經被說服了,也花了250美元買了這個裝置,我拿到裝置後要做些什麼?葉天奇:首先你需要有一個Claude帳號。大部分購買我們裝置的人其實已經有了。拿到裝置之後,你只需要插上電,它會先顯示一個二維碼。掃這個二維碼之後,會進入Wi-Fi連接頁面,裝置連上網之後,會再生成一個新二維碼。你再掃一次這個二維碼,就可以進入裝置頁面,登錄你的Claude帳號,然後就可以開始對話了。在最開始的階段,我們會給使用者準備一些「玩具級」示例。比如我們會引導你建立一個個人首頁,這個首頁直接跑在這台小電腦上。它可以每天幫你抓取你感興趣的論文、新聞或資訊更新。硬體這塊,我們會附贈一個硬幣大小的8×8的LED燈陣。拿到這個小玩具後,有些顧客會描述自己喜歡的遊戲角色,說:「你幫我把這個角色展示出來。」然後裝置會自己去網上查這個角色的形象,下載需要的依賴,生成對應的程序。兩分鐘左右,這個LED燈陣上就會開始播放他喜歡的角色動畫。整個過程使用者什麼都不用做。Q:在部署成本這件事上,Pamir的優勢主要體現在那裡?葉天奇:我們其實準備了兩套使用方式。對技術人員來說,你可以直接在電腦上打開,用的就是VSCode這一套熟悉的IDE體系。這一類使用者幾乎是零門檻,他們本來就在用這些工具。對非技術人員來說,他們完全不需要碰電腦,可以直接用手機。手機端是一個和ChatGPT很像的網頁介面,通過對話的方式來使用。當然,非技術使用者也不是完全不需要學習,只是學習成本會低很多。我也承認,OpenClaw在這一點上做得很好,它通過整合到使用者已經熟悉的聊天工具裡,對非技術使用者來說,幾乎是「天然可用」的。所以兩者最大的差別,其實是在互動路徑上。Q:剛才聊了很多新使用者的體驗,但你應該算最老的使用者,用了這麼久本地Agent,它對你個人的生活和工作習慣,帶來了那些變化?葉天奇:變化其實非常大。我們是深度使用者,現在大家對OpenClaw的體驗,我們在半年前就已經經歷過了。到現在,我們公司內部已經開始出現一種現象——傳統電腦的存在感越來越低,很多工作,用裝置+手機+iPad,甚至再加一個AR眼鏡,就已經足夠了。現在我們在打開電腦之前,都會先問自己一個問題:我現在要做的這件事,能不能交給裝置?如果答案是肯定的,那這件事可能已經不需要人去做了。所有人的角色,幾乎都被迫「往上提了一級」。以前你可能還是一個主要負責寫程式碼的角色;現在你更像是一個架構師,需要決定方向、拆解問題、設計系統。Q:當Pamir幫把很多工作自動化後,你把時間花在了什麼地方?葉天奇:學習,讀書。當然,作為CEO,我更多的時間會放在判斷接下來幾個月可能發生什麼,以及應該圍繞這些變化去設計怎樣的軟體架構。真正花時間的地方,已經從「執行」,轉移到了Review和思考上。過去,行動比想法更有價值。公司之間的差距,主要來自工程能力和工程時間的堆積。但現在,行動本身的價值在下降,因為Agent可能十分鐘就把事情做完了。反而是你的思考、你的判斷、你的願景,變得越來越重要。所以我們現在會花大量時間去復盤、討論、對齊方向。Q:這種轉變,會對公司的組織形式和工作範式帶來什麼影響?葉天奇:我覺得這種變化帶來的衝擊會非常大,很多公司可能還沒真正意識到這一點。如果把今天的大廠,尤其是一些Frontier Lab,和普通創業公司放在一起看,會發現差距非常明顯。原因在於,模型廠商掌握著模型本身的控制權。使用者在使用過程中遇到的所有問題,都可以被他們捕捉到。這些問題會直接進入下一輪後訓練,模型的下限會不斷被抬高,魯棒性會越來越強。這意味著他們是可以形成閉環的,模型和Agent可以一起成長,產品會越用越好,內部效率也會越來越高。這也是為什麼Claude產品會越用越好。相比之下,如果你只做Agent layer,就算你把Agent寫得再好,它也沒法把反饋「喂」回模型。你只能不斷用人力去維護規則、修補邊界。我覺得今天的創業要想清楚一件事:自己的真正優勢和差異化到底在那裡?一定要做那些別人暫時做不了的事情,主動避開不公平競爭。Q:如果Claude下場做類似的事情,你們的護城河在那?葉天奇:對我們來說,就是系統層和硬體層。硬體意味著供應鏈、生產、真實使用者互動、物理世界裡的反饋,這些並不在模型到Agent的閉環之中;系統層的沙盒、安全、回滾機制,同樣是在模型和Agent之上的一層。說實話,今天軟體層面的護城河已經非常薄了,而且只會越來越薄。就算你做出來一個新功能,別人可能花兩天就能把復現出來。真正的護城河,更多集中在硬體本身,以及軟硬體的深度整合上。能耗、晶片選型、記憶體和儲存的配比、Agent能跑到什麼邊界、供應鏈周期,這些都需要大量經驗和時間去一點一點堆出來。核心還是兩點。第一,是你對Agent的認知深度。這個領域變化太快了,幾乎每天醒來都會出現新的東西。如果你對Agent的理解沒有至少幾個月的前瞻優勢,很容易就會陷入被動追趕。第二,是你能不能做出10倍、20倍等級的使用者體驗差異。如果只是1.2倍、1.5倍的改進,在今天的軟體競爭環境裡,很快就會被淹沒。你看現在Claude產品確實已經很好用了,但真正的非技術使用者有多少人在用Claude Code?在我看來,這個體驗距離「我爸媽也能用」之間,依然存在明顯的gap。而這個gap,恰恰是本地Agent和軟硬體結合還有機會去填補的地方。Q:有沒有一些關於使用Agent的小tips,能讓普通使用者用得更高效一些?葉天奇:我覺得可以先假設一個前提。如果大家用的都是頂尖模型、頂尖Agent layer,那麼最終效果的差異,很大程度上並不來自「模型聰不聰明」,而是你如何和它溝通。一個很常見的問題是,很多人一上來就把一個很大的任務一次性交給Agent。這種情況下,Agent做不好是非常常見的。我自己的習慣是先和Agent一起做計畫。但我也不會讓它一次性把所有事情規劃完,然後直接Kick off全流程。那樣在執行過程中,幾乎一定會出錯。我傾向於把任務切割成足夠小、足夠清晰的步驟,再告訴Agent把這套計畫存下來。這樣一來,它在後續執行時,可以不斷回訪「自己該做什麼」,整個過程會更有條理,執行的魯棒性也會更高。還有一個很多人容易忽略的點:如何把一次對話,轉化成可復用的知識資產。很多人Vibe coding完了就結束了,這個過程中產生的大量經驗,並沒有被保存下來。比如你在調一個藍牙模組,怎麼都連不上,最後發現是因為某種晶片只接受特定格式的消息。這本身就是一個非常有價值的知識點,在之後的項目裡,很可能會反覆用到。所以我會建議使用者,在使用過程中有意識地引導Agent把這些錯誤、踩坑、解決路徑,總結成可復用的Skills或規則。不要用完就結束,記得持續積累屬於你自己的知識資產。本地Agent的創業感悟Q:能跟我們講講你的創業故事嗎?最開始做這個項目的時候,起心動念是怎樣的?葉天奇:說實話,這個項目裡,運氣的成分挺大的。我們一年半以前就開始做Pamir。那個時候,很多人連Agent是什麼都不知道。當時Pamir也不是現在這個形態,我們最開始做的是端側AI,To B業務。我和聯創張城銘畢業後,大概在大廠工作了兩年。那段時間,我們白天上班,晚上和周末就嘗試各種各樣的項目,但一直沒有真正做出什麼特別大的東西。Pamir對我們來說,算是一次孤注一擲。在這之前,我們一直都是邊上班、邊做項目。但做Pamir的時候,我直接搬到聯創家裡,睡在他家的沙發上。那段時間其實挺糟的,全職工作也做不好,項目也做不出來。想著「要麼成、要麼就算了」。當時做Pamir的判斷是:如果你要做嵌入式系統,就一定需要一個端側的硬體板子。所以一開始我們是在賣開發板,面向的是矽谷一小撮在做對話式AI和硬體結合的極客。不過,聯創和我都是技術出身,對融資一無所知,也不知道應該怎麼講故事,基本就是硬著頭皮做。花了幾周時間把原型做出來之後,就直接拿到矽谷去賣。Q:最開始賣給矽谷,順利嗎?葉天奇:比我想像中要順利。當時正好有兩個非常有名的AI硬體項目,一個是Rabbit,另一個是Humane,帶起了一波AI硬體創業的熱潮。那個時間點,市場是被充分教育過的,我們本身的產品也很有優勢。當時很多做語音互動的AI公司都非常「笨重」:用樹莓派,加USB麥克風,再加USB揚聲器,拼成一個很大的盒子。我們給他們展示的,是一個非常小的板子,卻能完成他們現有方案裡大部分的功能。這對他們來說吸引力非常大。Q:當時和你們在同一批起跑的競爭對手,現在都是什麼狀態?葉天奇:很多都選擇All-in端側模型,甚至是Double down在端側這條路上,但基本都轉去做To B業務了。從市場上看,To B這幾年是有增長的。端側模型越做越小、越做越輕,在一些明確的落地場景裡是成立的,比如車機系統、企業內部的私有化部署,都會有需求。只不過,這條線的增長速度,明顯趕不上Agent相關的公司。我們也不太適合做To B生意,坦白說,我們不太喜歡和B端客戶打交道。一是交期要求非常嚴格,二是很難發揮想像力。好不容易從大公司出來創業,結果折騰一趟後,發現自己又在給別人打工。有一次我在給產品寫程式碼,讓Agent跑任務。我盯著螢幕看了大概兩分鐘,什麼都沒做,只是在發呆。突然一個念頭閃過——為什麼我的Agent在工作,而我卻要盯著它看?從這個體驗出發,我們推匯出一個結論:未來一定需要一種Agent自己的、獨立的計算裝置。想清楚這一點之後,我們幾乎是立刻決定把所有端側相關的方案全部刪掉,全面接入當時最新的大模型,徹底轉向To C。之後的事情就比較順了。我們開始正式賣產品,開始大量做線下展示。後來Vibe coding開始流行,然後Claude Code火起來,我們又繼續往這個方向演進。Q:你覺得現在更幸福,還是之前在公司上班的時候更幸福?葉天奇:這是個好問題。其實我之前也被朋友問過類似的問題,問我理想的生活狀態是什麼樣的。我想了很久,發現現在的生活基本就是我理想中的狀態。每天都有新的挑戰,還能和志同道合的人一起解決問題。你可能聽說過「傳教士」和「僱傭兵」的說法。我們更像傳教士,是在為一件高於自我的事情工作,即使短期沒有物質回報也願意堅持。一開始做Agent電腦,很多人根本理解不了,覺得不可理喻。但我們自己是信的,甚至覺得這件事情的意義,高於我們個人本身。我們現在創業在做的,就是把它帶到這個世界上。我很享受這個過程。Q:你有沒有更宏大的願景?AI電腦這件事,最終會走向那裡?葉天奇:我們希望替代現在意義上的電腦,更準確地說,是替代筆記型電腦。今天人的大量時間,還浪費在極低價值的操作上,比如在不同系統、不同表格之間手動搬運資料。我們希望把這些工作徹底自動化,讓人把精力用在真正需要思考、判斷和創造的事情上。也有一點很個人的動機。我其實非常想挑戰蘋果。我現在對蘋果的態度是複雜的。一方面我很依賴它的生態;另一方面,我對它當前定義「個人計算」的方式感到不滿意。公司裡很多人也有類似的感受。手機廠商當然知道自動化、智能體是趨勢,他們也會往這個方向走。但路徑有根本差異。他們做的是前台,所有能力最終都要回到螢幕、互動介面和注意力佔用上;我們做的是後台,很多任務不需要螢幕,也不需要人持續盯著。我們認為這是一次非常難得的機會,終於可以不再需要圍繞「螢幕」去設計產品。Q:最近OpenClaw把Mac mini又帶火了一波,你什麼感受?葉天奇:這確實是我們很難在短期內追平的一點。蘋果在處理器、硬體整合上的能力,幾乎沒有對手。這也是我們後面考慮逐步引入高通晶片、一點點縮短硬體差距的原因。但從另一個角度看,在Agent成為主導範式之後,硬體參數的重要性在相對下降。蘋果依然可以繼續做極其強大的通用計算裝置,這件事不會消失。但它是否一定是Agent的入口,這件事並不確定。歷史上類似的情況其實反覆出現過。早期個人計算時代,也有像IBM這樣的巨頭存在,但形態、入口和主導權依然發生過轉移。我覺得今天是又一次輪迴,只是這一次的核心變數變成了Agent。 (36氪)