剛剛,中國國產Agent模型闖入全球第一梯隊!限時免費

誰懂啊家人們??

Agent時代,大公司都在把“燒多少token”當KPI了,本小小員工還深陷另一個泥沼:

聰明的模型用不起,便宜的模型不夠聰明

想找一個又能打又不貴、還能在主流Agent環境裡即插即用的模型?過去基本沒有。

然而就在剛剛,我發現有一位國產玩家,悄悄打破了這個“不可能三角”

其新發佈的Agent模型,性能已經站到全球第一梯隊——甭管對面是開源還是閉源,凡是你能叫得上名字的頂尖選手,它都能與之掰一掰手腕。

而且價格確實驚到我了,只有主流頂尖模型的一半甚至更低。

更關鍵的是,模型深度適配了OpenClaw、Claude Code、Hermes、Nanobot等主流Agent框架,還相容OpenAI介面。開發者幾乎不用改架構和程式碼,很多時候換個baseURL和API Key就能直接跑。

說了這麼多,想必你已十分好奇來者何人了?⊙.☉

答案這就揭曉:崑崙萬維。具體模型則是SkyClaw-v1.0及其輕量版SkyClaw-v1.0-lite。

悄咪咪透露,兩款模型現在都限時免費開放

不過我還是好奇,同一款模型憑什麼能同時做到聰明、便宜、好用?這不得狠狠扒一扒。

發佈了什麼?一次性上新兩個Agent模型

要搞懂崑崙萬維SkyClaw系列模型為什麼能打,得先理解一個很多人忽略的區別。

現在市面上大多數模型的Agent能力,本質上是後天加的buff——先訓一個通用大模型,再套一層工具呼叫的殼。

省事確實省事,但由於模型本身並不是按“完成任務”來訓練的,而是按“生成語言”來訓練的,所以簡單任務還行,一複雜就容易掉鏈子。

而SkyClaw走的是完全不同的路。從訓練的第一天起,它的目標就不是聊天,而是幹活。工具怎麼調、參數怎麼傳、多步任務怎麼拆解和執行,這些能力不是後天補課補出來的,是從“娘胎”裡帶的。

這個起點上的差異,直接決定了後面的上限

實際上,行業裡已經有不少玩家意識到這個問題,開始從“通用模型+工具殼”轉向專門為Agent場景設計的模型。

而崑崙萬維這次發佈的SkyClaw-v1.0和SkyClaw-v1.0-lite,正是這條新路線的產物。

兩款模型,一重一輕,各有分工。

先說旗艦版SkyClaw-v1.0,吃複雜任務的主力

它針對OpenClaw相關任務做了深度最佳化,適用於企業級的多步驟、強工具依賴場景。

在Claw相關任務上,據瞭解SkyClaw-v1.0已經可以和Claude Opus 4.6這個等級的閉源頂流模型正面過招。

能和Opus 4.6相提並論,我實在忍不住先去官網翻了幾個demo,一看還真繃不住了。

一眼掃過去,SkyClaw-v1.0是真愛玩遊戲(bushi,頁面上全是它生成的各種“經典款”。

隨手打開水管工馬里奧,結果我直接通過電腦鍵盤就這麼玩起來了——

前進、後退、跳高拿金幣,全程絲滑不卡頓。

覺得遊戲只是炫技?再來一個正經幹活的。

看看這個金融終端的完成度,頂部滾全球指數,左邊是頻道導航,中間新聞流帶著來源和關聯股票,右邊自選股帶迷你K線圖,連突發新聞彈窗都做了。

這種多個模組聯動的介面,以前前端團隊至少搞好幾天,而SkyClaw-v1.0很快就自己搞定了。

當然,這些行情資料是模型自己模擬生成的,不是真實資料。

但這反而是重點。SkyClaw-v1.0干的活是從零搭架子——介面、元件、互動邏輯,一次性把程式碼給你寫完。開發者只需要接上真實資料,就能讓頁面真正跑起來。

從馬里奧到金融終端,從娛樂到生產力,複雜度差了好幾個量級,而SkyClaw-v1.0都能一口氣吃下來。

或許這就是傳說中的,原生Agent模型和通用模型順手做Agent之間的差距。

再說輕量版SkyClaw-v1.0-lite,Agent核心能力沒打折,但速度更快、價格更便宜

它面向的是高頻、成本敏感的場景,比如批次API呼叫、輕量級自動化流程。

發現沒,自從模型進入Agent時代後,大部分玩家在推主力模型時都會附帶一個輕量版,這也很好理解,就像前段時間Snapchat前機器學習工程師說的那樣:

如果你用AI開發時,始終默認使用成本最高的模型來完成每一項任務,那麼你80%的工作都是在浪費錢。

經常用Agent跑任務的人,估計都對此深表認同。

有了這兩個模型,一個負責性能天花板,一個負責守成本底線,是誰又被AI穩穩地接住了(doge)。

不過說實話,這款模型更讓我心動的,還是它的價格。

SkyClaw-v1.0輸入0.5元/百萬tokens,輸出4元/百萬tokens;輕量版輸入僅0.3元,輸出2元

悄悄對比了一下,這個價格僅為主流頂尖模型的一半甚至更低。

而且發佈期還疊加了限時免費,對,你沒看錯,免費。

更離譜的是後手——試用期結束後,崑崙萬維計畫逐步開源每個模型版本

性能夠到了閉源頂流,價格砍到了行業腰部,後面還有開源兜底。

這套組合拳打完,我只想說一句:這是要把Agent模型的落地門檻狠狠打下來啊。

怎麼上手?就這麼開箱即用

到這裡,本“既要又要黨”已經心中大致有譜了,接下來只幹一件事:

自己跑一把,畢竟是騾子是馬總得要拉出來遛遛。

怎麼試呢?總結起來目前有兩條路:

最快的方式,就是直接去天工Skywork平台(tiangong.cn)。SkyClaw-v1.0已經在5月22日接入了天工Skywork,不用裝任何東西,不用配環境,瀏覽器打開就能用。

而且現在正值限時特惠,價格超低,感覺很適合想先試試Agent能力再決定是否深度接入的人。

想深度整合的,那就走API(API目前免費中)免費註冊一個APIFree帳號,拿到API Key就能呼叫,介面相容OpenAI格式,支援流式輸出、工具呼叫、多輪對話。對已經在用OpenAI介面的開發者來說,基本就是換個baseURL和model名的事。

(P.S. APIFree是崑崙萬維自家的模型聚合平台,支援呼叫國內外多種主流模型。)

話不多說,我這就選兩個比較典型的Agent場景跑一跑。

第一個我想試試給自己“養”一隻電子桌寵,既能打工還能陪我摸魚那種。需求大概是這樣的:

一隻小貓,能在螢幕上隨機溜躂,點選會說打工人語錄,右鍵能切工作模式和摸魚模式,工作模式帶番茄鐘倒計時,還要有喝水提醒、遠眺提醒、拉伸提醒這些健康功能。

只見提完需求後,SkyClaw-v1.0就直接在Skywork平台裡開幹了,等我刷完短影片回來,發現它已經把整套原始碼檔案全部生成完畢。

再一看成品,小貓是SVG漸變繪製的,粉色身體、三角形耳朵、大眼睛,還挺可愛。

右鍵打開Focus Mode面板,番茄鐘支援25/45/60分鐘三檔,下面是任務清單和健康提醒模組。倒計時結束後小貓自動切到摸魚模式,彈出氣泡:我不是在摸魚,我是在給公司省電……

當然,為了快速看效果,我先讓它生成了HTML版本,瀏覽器打開就能玩。如果想做成真正的原生桌寵,還可以繼續讓它生成Electron打包方案,終端跑幾行命令就能變成常駐工作列的桌面應用。

而更讓我驚喜的是,做完之後它主動彈出了一個IM連接面板,支援Skywork App、飛書、Slack、Discord、Telegram等七種聊天工具直連。

也就是說,後續如果做進一步的開發對接,這只小貓理論上可以直接在我日常使用的聊天窗口裡和我互動。

好,摸魚測完了,老規矩再來個正經的。

我們編輯部每周都有例會,其中一項就是總結上周的AI趨勢。

為了避免會前還在抓耳撓腮,這次我打算弄一個AI行業周報自動生成系統。需求很簡單也很貪心:

自動抓取過去一周的AI熱點,按主題分類,提煉趨勢訊號,最後生成一份可互動的周報頁面。

結果你猜怎麼著?這事兒還真讓SkyClaw-v1.0幹成了。

前端就不用多說了,UI和功能佈局一目瞭然。

關鍵是後端,看了SkyClaw-v1.0的工作過程才發現,它不光用FastAPI搭了一套完整API,還自己整出了一條資訊處理流水線。

前面從RSS、GitHub、HuggingFace、網頁四個管道自動抓資料,中間做清洗、分類和趨勢分析,後面自動生成周報,最後用SQLite存起來。

而我核心要的,就是那個周報Tab頁——頂部三句話總結本周趨勢,中間是一些值得關注的類股,最後是按分類展開的詳細報告。

我試了下,分類中的每條連結都可以打開並跳轉,這說明資料是真實抓取的,不是模擬生成的。

當然最讓我心動的依舊是最後一步。做完之後,它提示我可以把這個系統設定為定時任務,比如每周一早晨自動運行抓取和分析指令碼,生成最新一期周報。

兩個任務跑下來,一個感覺特別明顯:SkyClaw-v1.0已經不是那種需要你一步步喂指令的模型了。

桌寵那個,從理解需求、寫程式碼到打包,全自己搞定,甚至還主動推薦了IM直連的方式。

周報那個更狠,直接給了一套完整的產品原型——後端、資料庫、資訊抓取、分析、前端面板全都有,理論上還能定時自動運行。

而且有一個細節必須提一下,如今Agent時代都講究可復用的工作流,SkyClaw-v1.0這一點也做得很好,像上面那個周報系統,它就會彈窗提醒你要不要設定成Skill

從開發到復用,能看到崑崙萬維已經有意在Agent模型中建構完整的工作流閉環。

再疊加前面說的價格,說白了就一句:

SkyClaw-v1.0已經能用,而且真用得起了。

怎麼做到的?原生為Agent設計的訓練範式

至於SkyClaw-v1.0模型到底怎麼做到的?

崑崙萬維這次也沒藏著掖著,項目首頁上直接清晰列出了幾點理由:

總結起來就是,不靠堆參數,靠針對Agent核心痛點進行系統性最佳化

最典型的就是工具呼叫,現在很多模型聊天挺聰明,但一到真幹活就開始掉鏈子——

參數傳錯、步驟漏掉、格式寫崩,一個失誤後面全亂套。

SkyClaw-v1.0就想了,既然Agent天天要調工具,那乾脆從訓練階段就把模型泡在Agent環境裡

於是它在mid-training階段就塞進了大量複雜Agent任務,讓模型從底層開始適應“呼叫工具”這件事,而不是後面再臨時補課。後面再用針對OpenClaw任務的高品質資料繼續強化,多步驟工具呼叫的穩定性一下就上來了。

但Agent還有另一個經典問題:聊著聊著就“失憶”

一說到記憶問題,很多人可能下意識認為“把上下文窗口做大就好了”。

確實,SkyClaw-v1.0也沒落下這一點,直接把上下文拉到了前沿玩家的百萬級水準。

但重點其實不只是“窗口夠大”,而是它在強化學習階段直接扔進真實Agent環境裡反覆訓練,讓模型學會在超長任務鏈裡穩住狀態。

說白了,不是實驗室裡刷benchmark,而是真拿去幹活練出來的。

還有一點也挺關鍵。

很多Agent模型在自己熟悉的框架裡猛得不行,一換環境立刻拉胯

於是SkyClaw-v1.0乾脆在訓練階段就把OpenClaw、Claude Code、Hermes、Nanobot這些主流環境全覆蓋了,相當於提前做了一遍“大規模適配”,開發者不用被某個框架綁死。

當然,最關鍵、可能也是最容易被忽略的一點是:崑崙萬維沒把模型做成一個巨無霸

過去想要頂級Agent能力,默認就得接受大參數、高成本、慢推理這套組合。而SkyClaw-v1.0換了個方向,不是把參數往上堆,而是把訓練流程做成Agent專項特訓,在更小的參數量上把能力頂上去。

參數小了,推理自然快,成本自然低,這也是它價格能打到主流一半的底層邏輯。

所以回頭再看,真正拉開差距的,可能早就不只是參數規模了。

一個模型從第一天開始,到底有沒有圍著Agent場景去訓練,很多時候才決定了它最終能不能真正幹活

起點不同,終點自然不同。

Agent落地的“不可能三角”,被國產玩家打破了

老實說,SkyClaw-v1.0系列模型的出現,剛好踩在一個很微妙的節點上。

Agent賽道喊了一整年,大家都知道這是方向,但真正能用、用得起、還好接入的模型,一直沒幾個。

而它填補的,恰恰是高性能Agent能力與低成本落地之間長期空著的那塊地

而且它還不是突然冒出來的。

早在今年2月,崑崙萬維就上線了SkyClaw產品,基於開源架構OpenClaw重構,做的是全天候雲端AI助理。

隨後的3月,它又在GitHub和Clawhub鋪了首批6個官方Skill:PPT、文件、表格、設計、搜尋、音樂,基本把辦公場景的核心環節覆蓋了。

現在SkyClaw-v1.0一出,回頭看這條線就很清楚了:

先搭平台,再鋪Skill生態,最後把底層模型的性能和成本一併解決。

就像我在實測中感受到的那樣,做完桌寵它問你要不要存成Skill,做完周報它提醒你設成定時任務,崑崙萬維瞄準的顯然不只是一個模型,而是一整套Agent工作生態。

這背後的邏輯其實也不難理解,因為一個顯而易見的大趨勢是——

生產力正在從單一工具時代,邁向可持續運轉的AI工作流時代

單個模型再強,如果沒有平台承接、沒有Skill沉澱、沒有工作流串聯,能力就是一次性的,而一次性顯然不是這個時代大家所追求的。

其實回看崑崙萬維這幾年做的事,有一條線挺清晰的:把AI技術儘可能帶給更多人

先不說早期開源和價格下壓那些大動作,你注意到一個產品細節沒?

天工Skywork上不只有自家模型,Claude、GPT這些也能直接用;APIFree更乾脆,直接做成模型聚合平台,國內外主流模型一個帳號全搞定。

說實話,這種做法在行業頭部玩家裡的確不多見。畢竟大部分平台,本質上還是希望把使用者圈在自己生態裡。

而這次SkyClaw-v1.0,某種程度上走的也是同一條路

限時免費、價格直接壓到主流一半、繼續鋪Skill和工作流生態,說到底都是在讓Agent能力真正走出實驗室。

因為只有當價格開始降下來、工作流開始普及,頂級Agent能力才不會只是大廠內部才能長期“消費”的東西。

從高端實驗到全民落地,至少崑崙萬維先給大家打開了一扇門。 (量子位)