#楊植麟 | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#楊植麟

7位頂尖AI科學家，回到中國

姚順雨 Shunyu Yao · 1998年生 · 安徽合肥 27歲，他直接向騰訊總裁匯報。 2015·17歲　高考704分，安徽理科第3，進清華姚班

Kimi楊植麟《人民日報》發表署名文章

月之暗面Kimi創始人兼CEO楊植麟在《人民日報》刊文 5月11日，月之暗面Kimi創始人兼首席執行長楊植麟在人民日報刊文，題為《讓中國大模型成為全球創新的基座（“咖”說科技）》。以下為全文：最近，“智能體”和“詞元”成為人們時常聊起的話題。看似小眾的人工智慧開放原始碼專案，正在催生全新業態模式和市場機遇。這輪技術熱潮中，中國國產大模型技術突飛猛進、應用不斷拓展，不僅為智能經濟發展注入活力，也逐漸成為全球創新的基座。

Kimi逆襲！再融資20億美元，估值破200億美元

半年估值翻逾四倍，融資超39億美元，Kimi超越MiniMax與智譜，成為大模型創業融資最多的公司。據《晚點 LatePost》消息，Kimi （月之暗面）即將完成新一輪 20 億美元融資，投後估值突破 200 億美元。本輪融資由美團龍珠領投，中國移動、CPE（源峰資本）等參投，其中僅龍珠就出手超 2 億美元。今年 1 月和 2 月，Kimi 剛密集完成 3 輪融資，分別融了 5 億美元、 7 億美元和 7 億美元。算上這筆最新融資，不到半年裡，Kimi 融資超 39 億美元，成為大模型創業公司中累計融資最多的公司。 2026年4月20日，Kimi K2.6正式發佈並開源。

汕頭小夥造大模型，衝破1300億

一路狂奔，頻拿融資。楊植麟，又融到一筆錢。 5月7日，有消息稱，其創立的月之暗面，完成新一輪20億美元融資，投後估值突破200億美元，合人民幣超過1300億元。本輪融資由美團龍珠領投，水木資本、中國移動、CPE源峰等參投。

梁文鋒和楊植麟的默契：AGI不是終點，定義規則才是

484天的沉默，換來一場1.6兆參數的爆發。4月24日，DeepSeek V4-Pro正式發佈，總參數1.6兆、百萬token上下文、首次將華為昇騰與輝達GPU並列寫進硬體驗證清單。而就在4天前，與DeepSeek相距僅1.4公里的月之暗面剛開源了Kimi K2.6，SWE-Bench Pro得分58.6，首次讓國產開源模型站上全球程式碼評測之巔。兩家公司在五天內連發兩款兆級模型，這不是巧合，是海淀區知春路上兩個男人——梁文鋒與楊植麟，長達一年半的默契共振終於公開化。先說一個被大多數媒體忽略的真相：DeepSeek和Kimi的"技術撞車"，恰恰是開源生態最理想的進化方式。2025年初，DeepSeek在V3中推出的MLA多頭潛在注意力機制，Kimi直接沿用；2025年7月，Kimi在兆參數K2中率先規模化驗證自研Muon二階最佳化器，訓練成本降低50%以上，而這次DeepSeek V4的技術報告裡，也跟進採用了Muon。表面上看是路線同質化，實際上這是兩家公司在兆參數無人區裡的"交叉驗證"。你探一步，我確認一步，共同把國產大模型的技術水位抬到全球第一梯隊。它們是在互相兜底。這種默契，比單打獨鬥更難得。更關鍵的是，DeepSeek V4的發佈證明了一件事：中國AI已經具備了"晶片-模型-系統"全端自主的能力。技術報告裡那行關於昇騰950的備註，很多人讀出了"算力受限"的焦慮，但我讀出了另一種訊號：DeepSeek敢於在發佈當天就把國產晶片的適配進度寫進官方文件，這意味著"芯模協同"不再是PPT概念，而是正在發生的工程現實。下半年昇騰950超節點批次上市後，V4-Pro的價格會大幅下調，到時候國產模型的性價比優勢將進一步放大。當然，挑戰也是真實存在。DeepSeek近300人的研發團隊中，已有10位核心成員標註"已離職"，包括初代LLM核心作者王炳宣、R1核心研究員郭達雅等，分別流向騰訊、字節跳動。人才流失倒逼DeepSeek打破"零融資"的執念，融前估值已達3000億人民幣，計畫增資500億，50億起投。騰訊、阿里正在爭搶入局。但換個角度看，這恰恰說明DeepSeek的技術實力已經強到讓大廠無法忽視。挖不走整個團隊，就挖核心骨幹；投不了整個公司，就搶份額入局。這裡有一個反常識的判斷：DeepSeek和Kimi越是被資本追捧，中國AI的"去中心化"生態反而越穩固。梁文鋒曾拒絕所有外部投資，擔心喪失決策權；楊植麟去年12月還在內部信裡說"短期內不著急上市"。智譜和MiniMax在港股上市後的暴漲並沒有讓這兩家公司跟風IPO，而是選擇了更靈活的一級市場融資。有意思的是，當國內為DeepSeek和Kimi的融資歡呼時，美國那邊Anthropic的ARR已經突破300億美元，15個月翻了30倍，正式超越OpenAI的240億美元。OpenAI剛完成1220億美元融資，估值8520億美元。相比之下，中國大模型的融資額"顯得小情小調"。但體量差距背後，是商業模式的代際差異。Anthropic 80%收入來自企業端，30萬家企業客戶，財富十強裡八家在用Claude。而DeepSeek至今堅持模型全部開源，C端產品免費。這不是不會賺錢，是主動選擇用開源換生態。Kimi雖然月活使用者從巔峰期的3600萬回落至1000-1500萬，但海外API收入四個月翻了四倍。Cursor套殼Kimi事件更讓全球開發者意識到：中國開源模型的性能已經不輸閉源旗艦。中國大模型公司不是在重複網際網路時代的"燒錢換規模"劇本，而是在走一條更硬核的路：先用技術實力打開全球市場，再用生態粘性鎖定長期價值。歷史正在寫下新的註腳。當DeepSeek把昇騰寫進技術報告，當Kimi的模型ID出現在Cursor的API呼叫裡，當馬斯克親自轉發評價"Impressive work from Kimi"。這些訊號都在指向同一個趨勢：中國AI不再只是"本土童話"，而是全球開源生態的規則制定者之一。朱嘯虎去年說"大模型已經變成水電煤，沒有超額利潤"。目前來看，他錯了一半：大模型確實在變成基礎設施，但超額利潤沒有消失，只是從閉源壟斷轉移到了開源生態的規模化營運。DeepSeek和Kimi的估值飆漲，本質上不是泡沫，是資本對"開源即權力"這一新範式的提前下注。DeepSeek和Kimi的"知春路雙雄"敘事，不是精緻的本土童話，而是正在發生的全球級技術事件。它們的結局也不只有兩種：被資本收編，或在獨立與規模之間找到平衡。還有第三種可能，用開源生態的廣度，避險閉源壟斷的深度，最終在全球AI格局中佔據不可替代的位置。AGI不是終點，定義規則才是。 (識焗)

不是算力，不是電力，這才是中美AI競爭的終極變數

近日，英國《經濟學人》發表題為《中國正贏得人工智慧人才競賽》的文章，指出中國正在全球AI人才競逐中，逐步擴大對西方國家的領先優勢，為贏得AI競爭增加更多可能。西方媒體並非第一次有這類言論和預期，事實上，他們說得都對。相比算力，電力而言，人才，才是贏得AI競爭的終極籌碼，而中國正建立自己的領先優勢。《經濟學人》那篇文章拋出了一個判斷：在中美競爭中，中國“贏得”AI人才戰的方式是：留住增量，吸引更多存量回流。先看增量。文章援引了卡內基國際和平基金會的一份報告：2019年，全球頂尖的AI會議NeurIPS上，華裔研究者的比例是29%，已經超過了美國本土的20%；到了2022年，這個數字接近一半；而來自中國機構的作者佔比，從2019年的11%猛漲到28%——雖然還落後於美國的42%，但升勢已十分顯著。與此同時，中美之間的緊張關係也在悄悄改變年輕人的選擇。STEM專業的中國學生，前往美國讀博的機率降了大約15%，畢業後留在美國的機率又降了4%。過去，最頂尖的中國AI研究者大多把“去美國”當成理所當然的下一步；現在，越來越多人開始把目光留在中國。種種跡象指向同一個結論：美國正在失去吸引下一代的能力，進而在人才增量上出於被動。再看存量。黃仁勳說過一句很直白的話：“美國絕對有可能在AI上落後於中國，因為人才在變。”所謂人才在變，核心是流向在變，是美國的頂尖AI人才正在流往或回到中國。2025年3月，齊國君回到中國。他在美國工作了十幾年，先後在IBM研究中心、華為美國研究中心、OPPO西雅圖研究中心任職，履歷漂亮得像教科書；回國後，他全職加入杭州西湖大學，帶著一支近20人的團隊，組建了“MAPLE實驗室”。差不多同一時候，純外籍的Alex Lamb也前往中國。這位前微軟研究院高級研究員，師從圖靈獎得主Yoshua Bengio，在亞馬遜、Google Brain和微軟研究院都留下過足跡。他宣佈加入清華大學人工智慧學院，成為了一名助理教授。頂尖學者的回流只是冰山的一角，更密集的變化發生在產業界。姚順雨，前OpenAI研究員，加入騰訊成為其史上最年輕的首席AI科學家；吳永輝，前GoogleDeepMind研究副總裁，去了字節跳動；潘欣，前Google大腦研究員，加入了美團……再往前推兩年，楊植麟從卡內基梅隆大學博士畢業後，沒有留在美國，而是回到中國創辦了月之暗面。如今，成立不過三年的月之暗面已是估值超過180億美元的世界級獨角獸，其大模型也被不少美國初創公司改採用。▲月之暗面在過去一年迅速完成多輪融資，受到頭部基金、網際網路巨頭與產業資本的密集下注。圖源：VCG值得注意的是，所有這些回流，都不遠遠不是“為國效力”的口號在驅動，而是最樸素的理由——選擇更好的發展環境與空間。越來越多的頂尖AI研究者發現，“在中國”就是最好的職業路徑。中國擁有發展科創的巨大政策支援，也有一批頭部公司和頂尖高校，算力不缺，資料全面，工程體系完整，更重要的是，有大量可落地的應用場景。而且，中國公司，包括中國資本現在也都捨得為頂級人才投入，給錢、給空間，乃至給權力。不少人在矽谷可能是“螺絲釘”，但回到中國就能獨當一面，當負責人。最重要的是，中國不斷湧現的成功案例，大大增加了對美國矽谷人才的吸引力。過去幾年，中國湧現出一批10億美金，百億美金的AI初創公司，它用真金白銀告訴全球優秀人才，這裡是實現夢想的理想殿堂。如今，談中國的科創人才優勢，核心的核心，還在於自身強大的教育體系。自改革開放，尤其鄧小平提出科技是第一生產力以來，中國的理工科教育就一直備受重視。國家不斷出台政策支援理工科人才培養，民間也曾長期有著“學好數理化，走遍天下都不怕”的理工崇拜。這些的積累，為中國造就了一個領先全球的AI人才底座。現在，中國不但擁有全球最大的高等教育體系，每年培養以千萬計的大學學子，而且還約有四成的大學生攻讀STEM專業，這個比例幾乎是美國的兩倍。早在“人工智慧”這個詞還沒流行起來的時候，這片土地就已經為它儲備了最龐大的人才池。當AI的浪潮真的拍過來時，中國的這一優勢立刻湧出了驚人的勢能。到今天，中國已有80多所高校設立了AI學院，僅2025年一年，就有包括人大、北理工、西北工大在內的二十多所名校加入這個行列。五年間，AI專業新增了406個布點，在所有本科專業中增量最大。其中，清華在2025年擴招了150名本科生，全部進入新成立的通識書院，眼下已有117門課程、147個班級在嘗試AI賦能教學；而在另一頭，深圳技術大學這樣的地方院校，則選擇與華為、騰訊、百度聯手，把課堂無限延伸，讓實習直通產業。從頂尖名校到普通院校，中國搭起了一座人才培養金字塔——塔尖培養能“開天闢地”的領軍人才，塔身和底座則源源不斷地輸送應用型人才。教育端的播種，持續在產業端開花結果。2025年，中國企業發佈了超過300款AI產品，遍佈醫療、教育、物流。其中，其中，DeepSeek以不到150人的研發團隊、十分之一的成本，打造出可與GPT-4“掰手腕“的大模型。但DeepSeek最讓人感慨的不是技術本身，而是這支隊伍的底色——核心研發團隊平均年齡僅28歲。創始人梁文鋒曾坦言：“目前在人工智慧領域，前50名頂尖人才可能都不在中國，但也許我們能自己打造這樣的人。”這句話像一枚石子投進湖面，漣漪很快擴散到了招聘市場。據一家頭部AI獵頭透露，當下各家都在爭搶“C9”院校的高端人才。一位清華大學電腦系的博士畢業後，同時收到了華為“天才少年”項目、某大模型創業公司以及海外網際網路巨頭的Offer，最終他選擇了那家中國創業公司，年薪過百萬。這並非個例。脈脈資料顯示，2025年中國AI崗位的招聘量一年漲了十倍，平均月薪超過六萬，一半以上的應屆AI崗月薪破五萬。大模型演算法工程師的起薪，已經超過了不少傳統行業老專家的天花板。市場的熱度，反過來推動著教育繼續擴張——人才培養、產業吸納、再反哺教育，一個完整的閉環悄然成形。而在這套系統的底層，是國家的力量在穩穩托舉。2025年8月，國務院印發了《關於深入實施“人工智慧+”行動的意見》，明確提出到2030年，人工智慧要全面賦能高品質發展；同月，八部門聯合發文，提出要“超常規”建構領軍人才培養的新模式。政策支援不僅是檔案上的表態。2024年，中國的研發經費超過了3.6兆元，投入強度2.68%，已經超過歐盟的平均水平；2025年中央科技預算接近4000億元，同比增長一成，重點投向人工智慧、積體電路這些關鍵戰場。同時，人社部也在去年發佈了42個新工種——生成式人工智慧系統測試員是其中之一，同時頒布了73個國家職業標準，為AI賽道上的年輕人畫出了清晰的成長路線圖。教育、產業、政策，三股力量交織在一起，讓中國的AI人才培養不再是一個個孤立的點，而是一張綿密、可持續的網。當世界還在爭論“去那兒搶人”的時候，中國已經默默搭好了“自己造人”的底座。這場人才戰，贏得的不只是眼前，更是未來十年。人才培養的底座越築越厚實，但遠沒到高枕無憂的時候。這場人才戰的敘事裡，依然藏著幾道繞不過去的坎。首先，眾多頂尖人才還漂在海外。卡內基基金會追蹤了100位在2019年NeurIPS上亮相的中國籍研究者，六年後再看，87%的人還留在美國機構裡。▲2019–2025年，頂尖中國籍AI研究人員的職業路徑註：國家隸屬關係基於研究人員目前所在機構的總部所在地來源：保爾森基金會與卡內基國際和平研究院“回流”確實在發生，但還只是“涓涓細流”，星星之火。美國為什麼能留住他們？一來，它從基礎研究到技術轉化再到產業應用的鏈條，已經打磨得足夠成熟；二來，中國與西方頂尖創新生態之間，還橫著一條看得見的“鴻溝”。諾獎、圖靈獎的突破，至今仍然高度集中在西方。中科院院士唐本忠點破了一個尷尬的事實：“中國在AI領域擅長‘從1到10’的最佳化升級和‘從10到100’的規模擴張，但在‘從0到1’的原創突破上步履維艱。”他進一步拆解了根源——我們太推崇實用主義了，科研工作總盯著短期的成果和落地的應用，卻忘了基礎研究和原創探索才是一切的根。其次，本土人才的供需矛盾突出，AI產業的人才缺口依然巨大。2025年，AI技術類崗位的需求比前一年漲了四成。而另一邊，真正能駕馭垂直領域大模型訓練和最佳化的人，供需比已經掉到了0.3左右。高性能計算工程師更誇張——0.15，相當於七個崗位搶一個人。再者，美國政策的不確定性，既是機遇，也是變數。簽證收緊、經費削減、對華裔學者的懷疑氣氛，在一定程度上推動了美國AI人才向中國流動。2025財年，H-1B簽證的中國留學生中籤率跌到了11.7%。Meta、亞馬遜這樣的科技巨頭，已經宣佈不再為部分崗位的留學生提供擔保；那些研究半導體材料、AI演算法最佳化的學生，如果研究方向被貼上“受控技術”的標籤，連簽證都可能拿不到；美國眾議院甚至還提出議案，打算限制中國人在美國從事AI和機器學習相關的職業。這些變化，都在讓年輕一代重新思考“要不要出去”。▲北京的招生會上，中國赴美留學生人數近年來有所下降圖源：紐約時報但問題的另一面是：這類因素極不穩定。政策會隨著選舉、隨著地緣政治的風向來回搖擺，不能把它當成可以長期依賴的變數。AI競爭，表面是算力之爭、模型之爭，乃至電力之爭，但真正的底層卻是教育體系、產業結構與人口結構的長期較量，人才，才是贏得競爭的終極變數。人才之戰，不是一場百米衝刺，而是一場漫長的馬拉松。曾經，中國不但本土優秀人才有限，而且優秀人才大規模外流。如今，中國不但本土優秀人才湧現，而且還迎來外流人才的回流。趨勢已經逆轉，但要真正長期形成超越優勢，還任重道遠。當下，或許只是這場競賽的起點。 (華商韜略)

這一次，梁文鋒和楊植麟隔空握手

真是熱鬧的一周。周一，Kimi剛發完Kimi K2.6；周五，萬眾矚目的DeepSeek V4就來了。這種感覺很熟悉。過去一年，這兩家公司不是前後腳發模型，就是前後腳發技術論文，不是你把市場熱度點著了，就是我把技術討論接過去了。更早之前，說起中國開源模型，幾乎條件反射地想到DeepSeek。尤其是DeepSeek發佈R1之後，這家公司不僅憑一己之力改寫了全球市場對中國AI的印象，而且喚醒了其他中國的AI創業團隊的“信心”。於是，我們看到，更多的中國AI創業團隊開始做出非常競爭力的模型，帶來非常有影響力的技術研究成果。2025年7月，被《自然》雜誌稱為“又一個DeepSeek時刻”的Kimi K2模型，在底層架構上首次大規模驗證了二階最佳化器 Muon，同時採用了 DeepSeek驗證過的 MLA注意力機制。到了2026年4月，DeepSeek V4在架構上也跟進 Kimi K2採用 Muon最佳化器，取代過去已經使用了10年的Adam最佳化器。這可能是開源最大的價值：讓中國公司共享技術，加速追趕美國的閉源巨頭。它們是中國目前唯二，總參數超過兆、已權重公開的中國模型。也是最有國際影響力的中國AI模型代表。全球市值最高的輝達公司在展示下一代晶片性能時，用的模型正是來自 DeepSeek 和Kimi。不僅如此，他們也都在挑戰深度學習網路的底層架構，DeepSeek有mHC殘差連接，Kimi有引發矽谷核心技術圈討論的“注意力殘差”。A雖然說DeepSeek V4和Kimi K2.6在同一周發佈，但其實兩個模型各有技術側重點。V4的核心突破在於百萬上下文的成本重構，它通過全新的混合注意力機制，將單token推理的計算量壓縮到V3.2的27%，KV Cache降至10%。這套方案結合了壓縮稀疏注意力和重度壓縮注意力，讓百萬級上下文從技術演示變成了可以普及的基礎設施。V4同時針對agent場景做了專項最佳化，後訓練階段把agent作為獨立方向單獨訓練，工具呼叫格式從JSON換成帶特殊token的XML結構，跨輪次推理痕跡在工具呼叫場景下完整保留。DeepSeek還自建了名為DSec的沙箱平台，單叢集可並行管理數十萬個沙箱實例，用來支撐agent強化學習訓練和評測。K2.6的方向則更偏向長程編碼和agent叢集。它在Kimi Code Bench內部評測中得分68.2，比K2.5的57.4提升約20%。最高可支援300個子agent平行完成4000個協作步驟。B2025年2月，Kimi 發佈 Moonlight系列模型，首次將二階最佳化器Muon應用於480億參數的大模型，驗證了新一代最佳化器的效果。2025年4月，Kimi-VL模型發佈，在Moonlight模型的技術上，引入MoonViT視覺編碼器，為之後的多模態理解模型打下基礎。2025年7月，Kimi首次將Muon最佳化器擴展到兆參數的規模，推出 K2 開源模型。2025年10月，Kimi發佈Kimi Linear，這是Kimi提出的一種線性注意力架構，核心目標是在保住長上下文能力的同時，把大模型處理超長文字的計算和視訊記憶體成本降下來。這說明楊植麟已經不滿足於只做模型了，他想對模型的底層架構動手。隨後，Kimi發佈並開源支援圖片和視訊理解的兆參數模型Kimi K2.5。2026年3月，Kimi發佈注意力殘差的論文，繼續對Transformer的底層結構下手。這篇論文在X上收穫了馬斯克本人的稱讚。在然後就到了前幾天的K2.6，這是一個圍繞長周期編碼、agent執行、工程任務能力的模型。從產品定位的演變可以看出，Kimi正在從消費級對話產品往生產力工具轉型。2026年3月，楊植麟在輝達GTC大會上發表演講，系統介紹Kimi技術路線，他用三個關鍵詞概括Kimi的Scaling策略：Token效率、長上下文、agent叢集。他表示，要推動大模型智能上限的持續突破，必須對最佳化器、注意力機制及殘差連接等底層基石進行重構。當前的Scaling已經不再是單純的資源堆砌，而是要在計算效率、長程記憶和自動化協作上同時尋找規模效應。一家公司最怕的是，只有媒體在討論你，開發者卻不用你。但Kimi不一樣，無論是在OpenRouter上還是絕大多數agent工具的默認介面裡， K2.5和K2.6都是主流選項。截止發稿，Kimi和DeepSeek都出現在OpenRouter的TOP3模型裡，在AA的榜單上，K2.6甚至暫時佔得先機。而在K2.6這裡，模型繼續強化agent、長任務、編碼能力，也是同一個訊號。楊植麟真正押注的，就是生產力場景。這也是Kimi這一年最關鍵的變化。它不再只是告訴使用者“我能幫你讀更長的檔案”，而是在回答更底層的問題，模型怎樣才能在更長時間、更複雜任務、更高工具呼叫密度下保持穩定？長上下文解決的是記憶和資訊承載；線性注意力解決的是成本和擴展性；agent叢集解決的是複雜任務拆解；程式設計能力解決的是模型的理解和執行。它們看起來是幾條不同產品線，其實背後指向同一個方向，Kimi想把Kimi從一個好用的聊天窗口，變成可以承接真實工作的基礎模型。4月，楊植麟受邀參加總理主持的經濟形勢專家和企業家座談會，作為唯一的大模型創業者代表發言。這個1993年出生的年輕人，成為座談會上最年輕的參會者。一個月前，他剛在2026中關村論壇年會全體會議上發表演講，系統闡述了中國AI團隊如何通過底層架構的“推倒重建”，打破沿用十年的行業技術標準。顯然，Kimi已經從一家創業公司，變成了代表中國AI技術路線的符號之一。Kimi這一年的成長路徑，和DeepSeek的路徑有明顯差異。兩家公司的技術選擇不同，但也正因如此，才讓中國開源模型有了更多可能性。C過去我們寫這兩家公司，容易寫成“誰的模型好”、“誰才是下一個OpenAI”。但這其實是個誤區。DeepSeek和Kimi，不該被簡單理解成“誰贏誰輸”。它們更像中國開源模型對外競爭的兩條腿。不存在誰取代誰，而是應該互相刺激互相促進。DeepSeek和Kimi相繼證明了一件事，做前沿模型不一定需要無限的資源，關鍵在於演算法創新和工程最佳化。它們在模型演算法、工程效率、開源路線和降低推理成本上的貢獻，仍然是中國AI過去一年最重要的技術事件之一。它們彼此競爭，但也彼此抬高了中國開源模型的上限。真正重要的不是它們誰先到終點，而是它們把中國模型的競爭維度拆開了。過去我們評價一家模型公司，很容易只看榜單、參數、價格、發佈會聲量。但模型公司真正的護城河，已經不再是“模型聰不聰明”、“模型性能如何”這些事了。現在圍繞模型的敘事，是它能不能形成一整套技術路線。DeepSeek把第一件事做得很徹底。它讓外界看到，中國公司可以用更高的工程效率，把模型訓練和推理成本打下來，可以把技術報告寫到足夠透明，可以把權重開放到足夠激進。它建立的是一種開源信任。開發者願意研究它、復現它、部署它，是因為它不只是給了一個API，而是把模型背後的方法論也拿了出來。Kimi補上的是另一塊。Kimi最早被使用者記住，是因為長文字和聊天產品，但K2.6之後，它講的已經不是一個更會聊天的助手，而是模型如何進入真實工作流。長程編碼、Agent叢集、工具呼叫、長周期任務，這些能力沒有“霸榜”那麼直觀，但它們決定模型能不能從“被試用”走向“被依賴”。如果說DeepSeek解決的是模型夠不夠強、夠不夠便宜、夠不夠開放的問題，Kimi更關心的是模型能不能真的替人完成複雜任務。所以這兩家公司放在一起看，意義反而更大。作為觀察者和使用者，我們肯定希望都存在，這樣產業才能發展。中國AI真正值得興奮的，不是終於出了一個DeepSeek。而是在DeepSeek的帶動下，Kimi們依然能靠自己成長為一座座大山。這說明中國AI公司已經開始在不同維度上找到自己的位置，不再是簡單模仿，是真正的在探索自己獨有的那條技術路線。DeepSeek和Kimi的技術互相賦能，也說明了一件事，開源生態的價值在於協作。現在的問題不是DeepSeek和Kimi誰更強，而是它們能不能繼續保持這種競爭關係，繼續在技術上互相刺激。中國開源模型要真正在全球站穩腳跟，需要的不是一家獨大，而是多家公司在不同方向上都做到世界級水平。DeepSeek和Kimi的存在，讓這個可能性變得更大。 (字母榜)

中國AI四小龍，全部去見了總理

不是百度，不是阿里，不是騰訊。總理的座談會上，中國AI創業江湖的"四小龍"終於湊齊了一桌。從2024年3月到2026年4月，智譜AI、DeepSeek梁文鋒、MiniMax閆俊傑、月之暗面楊植麟，先後坐到了總理對面。四個男人，覆蓋了80後、85後、90後三個世代；廣東潮汕與湛江，河南商丘縣城，浙江杭州錢塘江畔，串聯起中國AI最生猛的草根逆襲史。他們帶著各自的"技術圖騰"：一個逆勢漲價，一個開源封神，一個不信天才，一個搖滾反叛。這是中國AI獨有的故事。智譜AI 清華土著第一家受邀的是智譜AI。2024年3月，調研新質生產力座談會，第一個出場的AI公司就是它。張鵬，標準的清華"土著"，清華電腦系本碩博連讀，在清華園待了近十年，連創業都是清華老師唐傑帶的隊。圈內人都說，他身上那股"技術原教旨主義"的勁兒，很清華。2026年1月，智譜AI在香港上市，成為"大模型第一股"。張鵬有一句很狠的話："智能上界決定了定價權。"當所有人在價格戰裡殺紅了眼，比誰更便宜時，他逆勢漲價。邏輯很簡單：只有把模型能力做到極致，才有資格定價格，而不是靠燒錢補貼換市場。這種底氣來自智譜的"技術護城河"，自研的GLM架構，不走尋常路，而是用"自回歸填空"的原創設計。2026年發佈的GLM-5採用超大規模MoE架構，在國產晶片上跑出了比雙卡叢集還強的性能。智譜的CodeGeeX程式碼大模型，在程式設計圈程式設計師裡的口碑，被稱為"國產Copilot最強平替"。張鵬相信，AGI不是炒概念，而是一行程式碼一行程式碼摳出來的工程問題。梁文鋒全球AI都意外第二家，DeepSeek。2025年1月20日，政府工作報告座談會，梁文鋒第四個發言。鏡頭裡的他，眼神平靜得像一潭深水。1985年，梁文鋒出生在廣東湛江吳川，一個連五線城市都算不上的地方，父親是當地小學老師。2002年，17歲的他以吳川一中"高考狀元"的成績考入浙江大學電子資訊工程專業。2008年全球金融危機，在浙大讀研的梁文鋒嗅到了機會。他拉著同學，用機器學習探索全自動量化交易。2015年，30歲的梁文鋒創立幻方量化。6年後，管理規模突破千億，躋身中國"量化四大天王"。但外界不知道的是，2019年，他豪擲2億元搭建“螢火一號”，搭載1100塊消費級顯示卡；2021年，又砸10億元建“螢火二號”，搭載萬張輝達A100"。別人炒股賺錢買房，他炒股賺錢買顯示卡。2023年，梁文鋒帶著這些"計算軍火"殺入大模型戰場。2025年，DeepSeek-R1橫空出世，用557萬美元的訓練成本（僅為GPT-4的零頭），干翻了矽谷的一眾巨頭。Meta、微軟連夜研究他的技術路線。他最著名的一句話是："中國AI和美國真實的gap，是原創和模仿的差距。"這句話，成了中國AI行業反攻的起點。梁文鋒極其低調，卻在2022年以"一隻平凡的小豬"名義，向慈善機構捐款1.38億元。閆俊傑不相信天才第三家，MiniMax。2026年1月，討論"十五五"規劃的座談會上，閆俊傑坐在對面。1989年，閆俊傑出生在河南商丘的一個縣城，高中在縣城中學度過。。2006年考入東南大學數學學院，隨後進入中科院自動化所碩博連讀（2015年博士畢業於中國科學院自動化所模式識別國家重點實驗室），並在清華大學電腦系從事博士後研究。2014年，25歲的閆俊傑在百度深度學習研究院實習。那是中國AI的"黃埔軍校"，他在這裡第一次直觀感受到大規模算力的顛覆性價值。據說，他一個人就用掉了百度當時三分之一的GPU算力做實驗，還拿下了百度獎學金。轉折發生在2021年春節。閆俊傑回河南老家，外公說想寫一本回憶錄，但不會打字，也沒辦法組織語言。這個做了十年AI的博士突然意識到：他做的技術，對一個想寫回憶錄的老人來說，一點用都沒有。那一刻，他決定要做"普通人能用上的AI"。2021年底，離職創立MiniMax。閆俊傑有一句座右銘："AI不是神秘黑盒，而是可用第一性原理解析的工程問題。AGI是科學，不是魔法。"他旗幟鮮明地反對"天才論"，認為大模型領域貢獻前50的人，可能沒一個在中國公司工作，中國公司要做的就是"聚攏一批素質優秀的人，做一個成長型組織"。四小龍裡，MiniMax是唯一放棄盲目追求"超級模型"的，專攻Agent和程式設計。他們的M2系列，被稱為"國產Claude平替"，最新M2.7實現了"模型自己訓練自己"的AI進化。更驚人的是成本，MiniMax用OpenAI約1%的研發投入（累計4.5億美元），實現了全模態技術全球領先，團隊385人，平均年齡29歲，70%收入來自海外。2026年3月，MiniMax市值突破3800億港元，超越了曾經的"導師"百度。在MiniMax內部，閆俊傑有一個花名叫“IO”，既是電腦語言的輸入輸出，也是DOTA裡那個專職輔助隊友的英雄。這很符合他的自我定位：“成功是體系和組織的勝利，不是個人的勝利。”他曾評價自己“可能只是二流研究者”，但堅信二流研究者加上一流組織，能打敗一流研究者的單打獨鬥。楊植麟 "Token經濟學"第四家，月之暗面。2026年4月10日，經濟形勢座談會，楊植麟作為科技企業家出席。1993年，楊植麟出生在廣東汕頭。這是四小龍裡唯一的90後，潮汕人。他的成長史像一部青春電影：高中時零程式設計基礎，被選拔進資訊學奧賽培訓班，拿下廣東一等獎，保送清華。但他放棄保送，以667分的高考成績成為汕頭市理科狀元，考入清華熱能工程系。大二轉專業進入電腦系，師從唐傑教授。在清華，他還是搖滾樂隊Splay的鼓手和詞曲作者，曾晉級清華校園歌手大賽原創決賽。他坦言，選擇電腦專業，是因為村上春樹的一篇小說，讓他對"深夜寫程式碼讓科技落地"的角色印象深刻。2015年，他進入卡內基梅隆大學（CMU），師從蘋果AI負責人Ruslan Salakhutdinov和Google首席科學家William Cohen。4年時間，他完成了通常需要6年的博士課程，提出的Transformer-XL與XLNet模型，成為自然語言處理領域的里程碑，至今被引用上萬次。他參與過Google Gemini、Google Bard、盤古NLP、悟道等大模型的研發。2023年創業，公司名"月之暗面"（Moonshot AI）來自他崇拜的搖滾樂隊Pink Floyd的專輯《The Dark Side of the Moon》。楊植麟最廣為人知的觀點是："Token消耗在未來可能將直接意味著GDP產出。"誰消耗的Token越多，誰的經濟就越活躍。在AI Agent時代，這就是新的GDP演算法。技術路線上，楊植麟是"長文字"和"原生多模態"的堅定信徒。2026年發佈的Kimi K2.5，上下文窗口擴展到200K，並引入了Linear注意力架構和Attention Residuals（注意力殘差），讓馬斯克都直呼"令人印象深刻"。他提出了"智能體叢集"（Agent Swarms）的概念，認為未來的智能將從單智能體向動態生成的叢集進化。2026年3月，月之暗面完成新一輪融資，投前估值180億美元（約1300億人民幣），帳上現金儲備超過100億元。但楊植麟說，"短期內不著急上市"。小結一個時代的註腳。你看這四個人：一個清華土著，一個浙大天才，一個縣城做題家，一個潮汕搖滾青年。46歲，40歲，36歲，33歲。當有的AI公司還在套殼做大模型、卷流量、應付AI考試時，這四個人，正在卷"智能上界"、卷"原創架構"、卷"國產算力"、卷"全球化"。張鵬說："智能上界決定定價權。" 梁文鋒說："中國AI不能永遠跟隨。" 閆俊傑說："AGI是科學，不是魔法。" 楊植麟說："Token消耗就是GDP。"四句話，四個技術哲學，四種商業路徑。為什麼選擇見他們，而不是見網際網路巨頭？中國AI，正在從"應用創新"轉向"硬核創新"，從"跟隨者"轉向"規則制定者"。四小龍全部到位，中國AI的牌桌，重新發牌了。 (奇偶工作室)