這幾年,美國一直對中國實施算力封鎖,但是如果你稍微關注下AI圈,就會發現一個越來越明顯的變化:中國的大模型,已經不是追趕著的姿態,而是直接捲進了第一梯隊。就說這周吧,中國三家公司DeepSeek,千問,Kimi,好像約好了似的,集體發佈了自己的大模型,並且都沖上了Twitter的榜單。其中Kimi更是突出,大模型競技場LMArena放榜,Kimi K2.5程式碼能力全球開源第一,總榜前三,僅次於Claude和Gemini。在Artificial Analysis榜單中,Kimi 2.5則是全球開源第一,總排名第五:我也去試用了一下,印象最深的有兩點:1. 視覺能力提升明顯,更有美感了。2. 從單一Agent進化成了Agent團隊。01. 強悍的視覺能力專業設計師說實話,大多數 AI 生成的網頁,看一眼就能認出來,配色土,佈局僵硬,互動也沒啥感覺。但是這個Kimi 2.5感覺就完全不同了,它的背後好像有個設計師,在輔助程式設計師做設計,做出來的產品很有美感。Kimi 2.5不但在寫程式碼,它順手把設計這件事也給包了。我嘗試用它生成一個天壇的介紹:基於嚴謹的歷史資料與建築學資訊檢索,生成一張現代中式極簡風格的視覺插圖,系統性闡釋北京天壇的每一個建築與儀式細節。插圖需要清晰呈現天壇的空間層級、象徵幾何、結構構成與祭祀功能,包括但不限於:祈年殿、圜丘壇、皇穹宇、整體中軸佈局,以及“天圓地方”等宇宙觀象徵體系。最終請將結果以HTML 頁面的形式呈現,適合在現代瀏覽器中直接查看。最終它給我生成了一個這樣的網站,對比之前AI生成的典型中國紅,大黑體,這個極簡審美顯得非常優雅,不落俗套。為了展示大模型的視覺能力,現在很流行讓它們生成一個包含蠟燭燃燒網頁來做對比測試,從下面的視訊可以清楚地看出,Kimi K2.5生成的動效最好,最為精細,那一滴滴往下掉的蠟油都展示出來了:像素級視覺在之前我給大家介紹過一些AI工具,可以從圖片生成網頁,但是Kimi2.5又往前行了一大步,支援從視訊生成網站!我上傳了一個瀏覽Computer History Museum網站的視訊,其中點選了網站導覽列的兩個菜單,並且點開了其中一篇文章的詳情。然後給Kimi 2.5下指令:幫我精確復刻這個視訊中的網站Kimi 開始分析視訊,迅速就發現了這個網站的含義:然後建立Todo任務列表,準備開始工作。稍等了一會兒,網站就“復刻”成功,不僅開發完成,Kimi還直接幫我做了部署!看看這效果,幾乎和原網站一模一樣:如果覺得那個地方想修改,可以進入編輯模式,直接圈選,然後讓Kimi修改: 把這個按鈕改成藍色這對Kimi來說是小菜一碟,很快就搞定了:02. 強大的“叢集”Agent現在很多的大模型產品都不僅僅是Chat,而是升級成了Agent來幫助使用者做事情。Kimi 2.5除了支援單個Agent,還有個更厲害的“叢集模式”,它可以瞬間拆解任務,協調多個Agent平行執行,執行效率一下子就飆升了。這個拆解和組織的過程完全是AI自主的,並沒有預設的範本,根據任務的需要,Kimi 2.5可以同時部署多達100個子代理,跨越1500個協調工具呼叫,相比單代理系統可將執行時間縮短4.5倍。內部評估顯示Agent叢集可將端到端執行階段間減少80%,同時支援更複雜的長周期工作負載。開發者報告稱K2.5輔助的工作流可在幾秒鐘內完成以前需要幾分鐘的任務。比如:我讓它針對當前的教育問題,找6個教育專家做個辯論:如今大學生就業形勢越來越嚴峻,“知識改變命運”這句話已經不如20年前那麼有效,有吸引力了。現在有兩種觀點:1.好崗位越來越少,所以應該更加努力地學習,爭取考上更好的大學,這樣才能獲得這些有限的好崗位,中學生應該像之前那樣,瘋狂熬夜,刷題,上補習班,內卷,考上好高中,好大學,才有可能找到好工作2.既然大學生就業這麼難,好大學的就業也這麼難,那不用那麼內捲了,考試成績一般就行,現在要發掘自己真正的愛好,重點發展自己的興趣,在一個狹窄的領域超越大部分人,這樣才能在未來獲得成功。幫我找6個頂級的教育家(最好有長期的教學經驗),分為兩組,第一組持有觀點1,第二組持有觀點2,進行辯論,最後輸出一個彙總的觀點你看它建立了6個Agent,分配了任務,獨立進行各自的研究。最後給出“辯論”的結論:Kimi的“蜂群”可不僅僅是做辯論,它是一個天然的批次處理的神器!你還可以用它批次搜尋,一次性調研 100 家上市公司;批次下載,打包下載 100 篇相關領域的學術論文;批次生圖,生成 100 張風格統一的素材圖,都非常方便。03. 開放原始碼的Kimi Code我第一次接觸到運行在命令列(CLI)裡的 AI 時,其實是很疑惑的: 這玩意兒到底能幹嘛?為何不用AI IDE?真正用了一段時間發現,命令列中的AI有著獨特的價值。它不是在小範圍內進行程式碼生成,而是更關注整個項目結構、模組邊界、依賴約束等,更適合進行項目級的掃描、理解、規劃,然後進行大範圍、工程級的修改。例如我現在正在學習SQLite的原始碼,我對Kimi Code提出了這樣需求:請解釋 SELECT 語句從 parser 到 btree 尋找的完整呼叫鏈你看Kimi Code做出的分析就非常漂亮,不但有流程圖,並且配合這程式碼進行了詳細的講解,對於理解Select語句的執行非常有用。當然,如果你實在是不適應這種CLI中的AI,也可以把Kimi Code無縫整合到 VSCode、Cursor、JetBrains 和 Zed 等主流編輯器中。你可能要問了,現在市面上類似的工具不少,Kimi Code的優勢在那兒?其實,CLI中的AI工具主要分為兩類(1)以Claude Code 為代表,收費、閉源,它就像五星酒店,服務很好,但是你沒有房產證。你使用它必須得一直和它繫結(2)開放原始碼的項目,需要你得來回折騰,像自己蓋房子,費時費力。Kimi Code正好結合了兩者的優勢,既有Kimi官方提供的頂級模型,開箱即用,又完全開源,可以隨意魔改。在性能方面,Kimi Code的表現也非常突出,全球開源第一,總榜前三,和Claude非常接近,成本更低。Kimi Code 還有一個獨門絕技,在命令列中直接讀取視訊,然後生成程式碼。相比其他工具需要使用額外的MCP Server、只能處理靜態圖片,這個功能可以說領先不少。04. 總結整體體驗下來,我的最大感受就是:Kimi 2.5 不僅僅在視覺能力方面非常突出,更是重新定義了AI的使用方式。Kimi 2.5的視覺能力,已經不只是“能看圖”,而是能真正看懂連續的行為和意圖,生成極具美感的介面。它的Agent,也不再是陪你聊天,而是能把一個目標拆開,自己去幹活,幹完再把結果交回來。而Kimi Code的出現,則讓這些能力真正落到了工程場景裡。強烈建議大家去試試這個新版本,感受下AI技術帶來的震撼:https://www.kimi.com/ (碼農翻身)