誰懂啊家人們??
Agent時代,大公司都在把“燒多少token”當KPI了,本小小員工還深陷另一個泥沼:
聰明的模型用不起,便宜的模型不夠聰明。
想找一個又能打又不貴、還能在主流Agent環境裡即插即用的模型?過去基本沒有。
然而就在剛剛,我發現有一位國產玩家,悄悄打破了這個“不可能三角”。
其新發佈的Agent模型,性能已經站到全球第一梯隊——甭管對面是開源還是閉源,凡是你能叫得上名字的頂尖選手,它都能與之掰一掰手腕。
而且價格確實驚到我了,只有主流頂尖模型的一半甚至更低。
更關鍵的是,模型深度適配了OpenClaw、Claude Code、Hermes、Nanobot等主流Agent框架,還相容OpenAI介面。開發者幾乎不用改架構和程式碼,很多時候換個baseURL和API Key就能直接跑。
說了這麼多,想必你已十分好奇來者何人了?⊙.☉
答案這就揭曉:崑崙萬維。具體模型則是SkyClaw-v1.0及其輕量版SkyClaw-v1.0-lite。
悄咪咪透露,兩款模型現在都限時免費開放。
不過我還是好奇,同一款模型憑什麼能同時做到聰明、便宜、好用?這不得狠狠扒一扒。
發佈了什麼?一次性上新兩個Agent模型
要搞懂崑崙萬維SkyClaw系列模型為什麼能打,得先理解一個很多人忽略的區別。
現在市面上大多數模型的Agent能力,本質上是後天加的buff——先訓一個通用大模型,再套一層工具呼叫的殼。
省事確實省事,但由於模型本身並不是按“完成任務”來訓練的,而是按“生成語言”來訓練的,所以簡單任務還行,一複雜就容易掉鏈子。
而SkyClaw走的是完全不同的路。從訓練的第一天起,它的目標就不是聊天,而是幹活。工具怎麼調、參數怎麼傳、多步任務怎麼拆解和執行,這些能力不是後天補課補出來的,是從“娘胎”裡帶的。
這個起點上的差異,直接決定了後面的上限。
實際上,行業裡已經有不少玩家意識到這個問題,開始從“通用模型+工具殼”轉向專門為Agent場景設計的模型。
而崑崙萬維這次發佈的SkyClaw-v1.0和SkyClaw-v1.0-lite,正是這條新路線的產物。
兩款模型,一重一輕,各有分工。
先說旗艦版SkyClaw-v1.0,吃複雜任務的主力。
它針對OpenClaw相關任務做了深度最佳化,適用於企業級的多步驟、強工具依賴場景。
在Claw相關任務上,據瞭解SkyClaw-v1.0已經可以和Claude Opus 4.6這個等級的閉源頂流模型正面過招。
能和Opus 4.6相提並論,我實在忍不住先去官網翻了幾個demo,一看還真繃不住了。
一眼掃過去,SkyClaw-v1.0是真愛玩遊戲(bushi,頁面上全是它生成的各種“經典款”。
隨手打開水管工馬里奧,結果我直接通過電腦鍵盤就這麼玩起來了——
前進、後退、跳高拿金幣,全程絲滑不卡頓。
覺得遊戲只是炫技?再來一個正經幹活的。
看看這個金融終端的完成度,頂部滾全球指數,左邊是頻道導航,中間新聞流帶著來源和關聯股票,右邊自選股帶迷你K線圖,連突發新聞彈窗都做了。
這種多個模組聯動的介面,以前前端團隊至少搞好幾天,而SkyClaw-v1.0很快就自己搞定了。
當然,這些行情資料是模型自己模擬生成的,不是真實資料。
但這反而是重點。SkyClaw-v1.0干的活是從零搭架子——介面、元件、互動邏輯,一次性把程式碼給你寫完。開發者只需要接上真實資料,就能讓頁面真正跑起來。
從馬里奧到金融終端,從娛樂到生產力,複雜度差了好幾個量級,而SkyClaw-v1.0都能一口氣吃下來。
或許這就是傳說中的,原生Agent模型和通用模型順手做Agent之間的差距。
再說輕量版SkyClaw-v1.0-lite,Agent核心能力沒打折,但速度更快、價格更便宜。
它面向的是高頻、成本敏感的場景,比如批次API呼叫、輕量級自動化流程。
發現沒,自從模型進入Agent時代後,大部分玩家在推主力模型時都會附帶一個輕量版,這也很好理解,就像前段時間Snapchat前機器學習工程師說的那樣:
如果你用AI開發時,始終默認使用成本最高的模型來完成每一項任務,那麼你80%的工作都是在浪費錢。
經常用Agent跑任務的人,估計都對此深表認同。
有了這兩個模型,一個負責性能天花板,一個負責守成本底線,是誰又被AI穩穩地接住了(doge)。
不過說實話,這款模型更讓我心動的,還是它的價格。
SkyClaw-v1.0輸入0.5元/百萬tokens,輸出4元/百萬tokens;輕量版輸入僅0.3元,輸出2元。
悄悄對比了一下,這個價格僅為主流頂尖模型的一半甚至更低。
而且發佈期還疊加了限時免費,對,你沒看錯,免費。
更離譜的是後手——試用期結束後,崑崙萬維計畫逐步開源每個模型版本。
性能夠到了閉源頂流,價格砍到了行業腰部,後面還有開源兜底。
這套組合拳打完,我只想說一句:這是要把Agent模型的落地門檻狠狠打下來啊。
怎麼上手?就這麼開箱即用
到這裡,本“既要又要黨”已經心中大致有譜了,接下來只幹一件事:
自己跑一把,畢竟是騾子是馬總得要拉出來遛遛。
怎麼試呢?總結起來目前有兩條路:
最快的方式,就是直接去天工Skywork平台(tiangong.cn)。SkyClaw-v1.0已經在5月22日接入了天工Skywork,不用裝任何東西,不用配環境,瀏覽器打開就能用。
而且現在正值限時特惠,價格超低,感覺很適合想先試試Agent能力再決定是否深度接入的人。
想深度整合的,那就走API(API目前免費中)。免費註冊一個APIFree帳號,拿到API Key就能呼叫,介面相容OpenAI格式,支援流式輸出、工具呼叫、多輪對話。對已經在用OpenAI介面的開發者來說,基本就是換個baseURL和model名的事。
(P.S. APIFree是崑崙萬維自家的模型聚合平台,支援呼叫國內外多種主流模型。)
話不多說,我這就選兩個比較典型的Agent場景跑一跑。
第一個我想試試給自己“養”一隻電子桌寵,既能打工還能陪我摸魚那種。需求大概是這樣的:
一隻小貓,能在螢幕上隨機溜躂,點選會說打工人語錄,右鍵能切工作模式和摸魚模式,工作模式帶番茄鐘倒計時,還要有喝水提醒、遠眺提醒、拉伸提醒這些健康功能。
只見提完需求後,SkyClaw-v1.0就直接在Skywork平台裡開幹了,等我刷完短影片回來,發現它已經把整套原始碼檔案全部生成完畢。
再一看成品,小貓是SVG漸變繪製的,粉色身體、三角形耳朵、大眼睛,還挺可愛。
右鍵打開Focus Mode面板,番茄鐘支援25/45/60分鐘三檔,下面是任務清單和健康提醒模組。倒計時結束後小貓自動切到摸魚模式,彈出氣泡:我不是在摸魚,我是在給公司省電……
當然,為了快速看效果,我先讓它生成了HTML版本,瀏覽器打開就能玩。如果想做成真正的原生桌寵,還可以繼續讓它生成Electron打包方案,終端跑幾行命令就能變成常駐工作列的桌面應用。
而更讓我驚喜的是,做完之後它主動彈出了一個IM連接面板,支援Skywork App、飛書、Slack、Discord、Telegram等七種聊天工具直連。
也就是說,後續如果做進一步的開發對接,這只小貓理論上可以直接在我日常使用的聊天窗口裡和我互動。
好,摸魚測完了,老規矩再來個正經的。
我們編輯部每周都有例會,其中一項就是總結上周的AI趨勢。
為了避免會前還在抓耳撓腮,這次我打算弄一個AI行業周報自動生成系統。需求很簡單也很貪心:
自動抓取過去一周的AI熱點,按主題分類,提煉趨勢訊號,最後生成一份可互動的周報頁面。
結果你猜怎麼著?這事兒還真讓SkyClaw-v1.0幹成了。
前端就不用多說了,UI和功能佈局一目瞭然。
關鍵是後端,看了SkyClaw-v1.0的工作過程才發現,它不光用FastAPI搭了一套完整API,還自己整出了一條資訊處理流水線。
前面從RSS、GitHub、HuggingFace、網頁四個管道自動抓資料,中間做清洗、分類和趨勢分析,後面自動生成周報,最後用SQLite存起來。
而我核心要的,就是那個周報Tab頁——頂部三句話總結本周趨勢,中間是一些值得關注的類股,最後是按分類展開的詳細報告。
我試了下,分類中的每條連結都可以打開並跳轉,這說明資料是真實抓取的,不是模擬生成的。
當然最讓我心動的依舊是最後一步。做完之後,它提示我可以把這個系統設定為定時任務,比如每周一早晨自動運行抓取和分析指令碼,生成最新一期周報。
兩個任務跑下來,一個感覺特別明顯:SkyClaw-v1.0已經不是那種需要你一步步喂指令的模型了。
桌寵那個,從理解需求、寫程式碼到打包,全自己搞定,甚至還主動推薦了IM直連的方式。
周報那個更狠,直接給了一套完整的產品原型——後端、資料庫、資訊抓取、分析、前端面板全都有,理論上還能定時自動運行。
而且有一個細節必須提一下,如今Agent時代都講究可復用的工作流,SkyClaw-v1.0這一點也做得很好,像上面那個周報系統,它就會彈窗提醒你要不要設定成Skill。
從開發到復用,能看到崑崙萬維已經有意在Agent模型中建構完整的工作流閉環。
再疊加前面說的價格,說白了就一句:
SkyClaw-v1.0已經能用,而且真用得起了。
怎麼做到的?原生為Agent設計的訓練範式
至於SkyClaw-v1.0模型到底怎麼做到的?
崑崙萬維這次也沒藏著掖著,項目首頁上直接清晰列出了幾點理由:
總結起來就是,不靠堆參數,靠針對Agent核心痛點進行系統性最佳化。
最典型的就是工具呼叫,現在很多模型聊天挺聰明,但一到真幹活就開始掉鏈子——
參數傳錯、步驟漏掉、格式寫崩,一個失誤後面全亂套。
SkyClaw-v1.0就想了,既然Agent天天要調工具,那乾脆從訓練階段就把模型泡在Agent環境裡。
於是它在mid-training階段就塞進了大量複雜Agent任務,讓模型從底層開始適應“呼叫工具”這件事,而不是後面再臨時補課。後面再用針對OpenClaw任務的高品質資料繼續強化,多步驟工具呼叫的穩定性一下就上來了。
但Agent還有另一個經典問題:聊著聊著就“失憶”。
一說到記憶問題,很多人可能下意識認為“把上下文窗口做大就好了”。
確實,SkyClaw-v1.0也沒落下這一點,直接把上下文拉到了前沿玩家的百萬級水準。
但重點其實不只是“窗口夠大”,而是它在強化學習階段直接扔進真實Agent環境裡反覆訓練,讓模型學會在超長任務鏈裡穩住狀態。
說白了,不是實驗室裡刷benchmark,而是真拿去幹活練出來的。
還有一點也挺關鍵。
很多Agent模型在自己熟悉的框架裡猛得不行,一換環境立刻拉胯。
於是SkyClaw-v1.0乾脆在訓練階段就把OpenClaw、Claude Code、Hermes、Nanobot這些主流環境全覆蓋了,相當於提前做了一遍“大規模適配”,開發者不用被某個框架綁死。
當然,最關鍵、可能也是最容易被忽略的一點是:崑崙萬維沒把模型做成一個巨無霸。
過去想要頂級Agent能力,默認就得接受大參數、高成本、慢推理這套組合。而SkyClaw-v1.0換了個方向,不是把參數往上堆,而是把訓練流程做成Agent專項特訓,在更小的參數量上把能力頂上去。
參數小了,推理自然快,成本自然低,這也是它價格能打到主流一半的底層邏輯。
所以回頭再看,真正拉開差距的,可能早就不只是參數規模了。
一個模型從第一天開始,到底有沒有圍著Agent場景去訓練,很多時候才決定了它最終能不能真正幹活。
起點不同,終點自然不同。
Agent落地的“不可能三角”,被國產玩家打破了
老實說,SkyClaw-v1.0系列模型的出現,剛好踩在一個很微妙的節點上。
Agent賽道喊了一整年,大家都知道這是方向,但真正能用、用得起、還好接入的模型,一直沒幾個。
而它填補的,恰恰是高性能Agent能力與低成本落地之間長期空著的那塊地。
而且它還不是突然冒出來的。
早在今年2月,崑崙萬維就上線了SkyClaw產品,基於開源架構OpenClaw重構,做的是全天候雲端AI助理。
隨後的3月,它又在GitHub和Clawhub鋪了首批6個官方Skill:PPT、文件、表格、設計、搜尋、音樂,基本把辦公場景的核心環節覆蓋了。
現在SkyClaw-v1.0一出,回頭看這條線就很清楚了:
先搭平台,再鋪Skill生態,最後把底層模型的性能和成本一併解決。
就像我在實測中感受到的那樣,做完桌寵它問你要不要存成Skill,做完周報它提醒你設成定時任務,崑崙萬維瞄準的顯然不只是一個模型,而是一整套Agent工作生態。
這背後的邏輯其實也不難理解,因為一個顯而易見的大趨勢是——
生產力正在從單一工具時代,邁向可持續運轉的AI工作流時代。
單個模型再強,如果沒有平台承接、沒有Skill沉澱、沒有工作流串聯,能力就是一次性的,而一次性顯然不是這個時代大家所追求的。
其實回看崑崙萬維這幾年做的事,有一條線挺清晰的:把AI技術儘可能帶給更多人。
先不說早期開源和價格下壓那些大動作,你注意到一個產品細節沒?
天工Skywork上不只有自家模型,Claude、GPT這些也能直接用;APIFree更乾脆,直接做成模型聚合平台,國內外主流模型一個帳號全搞定。
說實話,這種做法在行業頭部玩家裡的確不多見。畢竟大部分平台,本質上還是希望把使用者圈在自己生態裡。
而這次SkyClaw-v1.0,某種程度上走的也是同一條路。
限時免費、價格直接壓到主流一半、繼續鋪Skill和工作流生態,說到底都是在讓Agent能力真正走出實驗室。
因為只有當價格開始降下來、工作流開始普及,頂級Agent能力才不會只是大廠內部才能長期“消費”的東西。
從高端實驗到全民落地,至少崑崙萬維先給大家打開了一扇門。 (量子位)
