OpenClaw (龍蝦)如何學會新東西 ?

人工智慧與人類在學習新事物方式上的巨大差距,促使研究人員重新思考當今 AI 模型背後的數學基礎。

但開發者找到了一種更即時、更實用的權宜之計,讓 AI 能持續學習:所謂“skills(技能)”。

所謂技能,是一段文字提示詞,其中包含指令,告訴智能體(agent)該如何完成某項任務。比如,一個被要求去調整 PDF 的智能體,在執行任務前可能會先查閱一條用於 PDF 編輯的技能說明。

OpenClaw是一款增長迅速的開放原始碼軟體,用於驅動個人 AI 智能體。它可以瀏覽一個名為 ClawHub的網站,在那裡尋找技能,內容涵蓋從總結 YouTube 視訊到使用 Google Cloud等各種任務。

像 Claude Code和 Codex這樣的程式設計智能體,也能利用技能來更輕鬆地處理各種任務,否則它們會更吃力。

技能彌補了 AI 模型學習新能力方式中的一個關鍵缺口。如今的 AI 要麼在訓練過程中吸收知識,要麼在與使用者對話的過程中學到東西,但對話一結束就很快遺忘這些資訊。(像 ChatGPT這樣的聊天機器人也可以儲存關於使用者的簡單備註,並在未來對話中引用。)

相比之下,人類能在當下迅速而靈活地掌握新技能或新資訊,並且在最後一次使用後的數月甚至數年之後仍能回憶起來。

一些開發者認為,給 AI 智能體配備 skills(技能),是一條長期沒有得到充分重視的解決路徑。

Jo是一家成立兩年的舊金山灣區初創公司,開發的智能體與 OpenClaw類似,採用裝置端模型。其首席市場官 Kevin Li說:“我覺得很多人沒有意識到,OpenClaw 因為能訪問自己的檔案系統,其實具備自我改進的能力。我認為,只要你持續給它載入越來越好的技能,或者它在犯錯後自己寫出技能並據此改進,使用者手裡的 OpenClaw 的能力演進速度就會隨著時間推移轉為指數級加速增長。”

讓一個 AI 智能體在執行任務前先去瀏覽一套“說明書庫”,與從底層重新設計 AI 模型相比,聽起來像是用膠帶臨時粘出來的方案。但技能相較於通過編寫軟體程式碼或更新模型權重來學習新能力,有一個關鍵優勢:技能用的是自然語言寫成,人類使用者更容易理解。

不過,在技能以及其他面向智能體的指令體繫上,仍有一些毛病需要修補。

例如,除了面向具體任務的技能之外,Claude Code還使用一個名為 claude.md 的文字檔,使用者會在其中存放背景偏好與指令,比如要求 Claude 避免不必要的奉承。

當 Claude 出錯時,“它會承諾下次做得更好。”AI Policy Network(人工智慧政策網路)政策負責人 彼得·威爾德福德(Peter Wildeford)說。該組織位於華盛頓,致力於推動 AI 立法遊說。“但 Claude 並不總是有那種直覺,知道為了下次改進,它需要把東西寫下來。所以我得告訴 Claude,類似這樣:‘不,你沒有持久記憶。請把這點標記到你的 claude.md 檔案裡。’然後它才會這麼做。”(不過,Anthropic昨天開始測試一項新的自動記憶儲存功能,這可能會改善 Claude Code 如何為自己保存備註。)

儘管有這些磕絆,claude.md 可能比技能更好用,因為這個檔案始終對智能體可用。相比之下,潛在技能的數量太多了,智能體不可能全部讀完,所以它必須在恰當的時候載入恰當的技能。

Zo Computer是一家成立三年的初創公司,正在為非技術使用者開發個人智能體。其聯合創始人 Ben Guo說,技能往往“不會在正確的時機被呼叫”。他還表示,當下圍繞技能與 claude.md 這類檔案的做法“非常原始”。

但 Guo 的聯合創始人 Rob Cheung說,人和組織同樣依賴這種原始的筆記方式來記住如何完成工作。比如,他說,GitLab就使用一套內容極其龐大的員工手冊,讓遠端員工保持一致。

這反倒讓人安心,因為要等到 AI 研究人員用一種更聰明也更簡潔的新模型設計真正破解“持續學習”,很可能還得花上好幾年。與此同時,像 ClawHub這樣的網站會不斷拿出更好的技能,而像 OpenClaw這樣的智能體也會越來越擅長在需要時把這些技能調出來並用得更到位。 (一半杯)