#kimi
Kimi完成5億美元融資,海外收入大漲
12月31日,踩著2025年的尾巴,中國大模型初創公司月之暗面(Kimi)傳來最新融資消息:完成5億美元C輪融資(約合35億人民幣),阿里、騰訊、王慧文等投資方均超額認購,投後估值約43億美元。同在今日,Kimi創始人、CEO楊植麟發佈內部信,披露公司發展狀況:技術層面,2025年是Kimi充滿突破的一年,K2和K2 Thinking的發佈標誌著公司在AGl道路上走出重要一步;商業層面,Kimi C端9-11月,海外和國內付費使用者數平均MoM(平均月度環比增長)增長超過170%。同時,K2 Thinking的發佈也顯著帶動了API收入的增加,9-11月海外API收入增長4倍。楊植麟表示,2026年Kimi會成為一個“與眾不同”和“不被定義”的LLM(大語言模型)。不管是別人沒敢押注的技術無人區,還是需要一點偏執的審美堅持,相信有更多Kimi-defined的創新能對人類文明加速發展產生獨特貢獻。這種獨特性是Kimi存在的最大意義。目標是超越前沿公司Kimi早期以“長文字處理” 為核心突破口,是首個支援20萬字輸入的AI助手產品。2025年以來,Kimi K2系列開源模型的推出是公司的重要節點。2025年7月,Kimi K2 模型發佈後,被英國自然雜誌稱為“另一個DeepSeek時刻”。2025年11月,Kimi發佈開源長思考模型 Kimi K2 Thinking,核心創新交錯推理與工具呼叫,支援 200-300 步連續工具呼叫,在 Humanitys Last Exam(HLE,人類最後考試)達 44.9%,超過頂尖閉源模型GPT-5和Claude Sonnet4.楊植麟表示,K2和K2 Thinking的發佈標誌著Kimi在AGl道路上走出重要一步——中國首個兆參數基座模型,第一個開放原始碼的Agentic Model,在最核心benchmark例如HLE上超越OpenAl取得sota,獨具特色的創意寫作風格得到全球使用者喜愛,第一次成功使用二階最佳化器做大規模訓練,K2系列模型讓Kimi從中國走向了世界,在矽谷以及更廣泛的全球技術圈產生了重大影響力,登上twitter全球熱搜,得到Nvidia創始人、All-In Podcast主播、Anthropic聯合創始人、Perplexity創始人、a16z創始人、Vercel創始人、諾獎得主等知名技術領袖的高度評價。sota指人工智慧與機器學習領域中,在特定任務或基準測試裡當前最先進、性能最高的技術、方法或模型,核心是超越現有標準、建立新的性能標竿。矽谷頂尖創業加速器 Founders Space 創始人史蒂文・霍夫曼(Steven S. Hoffman)也對記者表示,Kimi新的Agentic模型非常強大。K2之後,K3已經在路上。楊植麟表示,接下來公司最重要的目標是超越Anthropic等前沿公司成為世界領先的AGI公司。2026年,K3模型將通過技術改進和進一步Scaling,提升等效FLOPs至少一個數量級,在預訓練水平上追平世界前沿模型;垂直整合模型訓練和agent產品taste,讓K3成為更“與眾不同”的模型,讓使用者體驗到全新的,其他模型沒有定義過的能力。同時在產品和商業化上聚焦agent,不以絕對使用者數量為目標,持續追求智能上限,創造更大的生產力價值,營收規模實現數量級增長。商業化實現倍速增長性能提高的同時,行業持續關注Kimi在商業化領域的動態。此次,楊植麟披露稱,技術的突破也為產品的爆發和商業上的飛速進展奠定基礎。Kimi產品從5月開始高頻推出新的agent功能,發佈了 Researcher、OK Computer、PPT、KimiCode等新品,功能日漸強大。借助K2模型的sota表現,C端商業化指數增長9-11月,海外和國內付費使用者數平均MoM增長超過170%,9-11月海外API收入增長4倍。據記者瞭解,Kimi商業模式主要由C端訂閱付費與B端API呼叫兩部分組成,而Kimi API 的工具呼叫能力在金融研報等需要數百步才能完成的複雜任務上具備優勢,已經成為多家國內金融研報AI工具的默認內建模型。得益於技術上的突破,Kimi近期完成了5億美元C輪融資且大幅超募,當前現金持有量超過100億元。相比於二級市場,楊植麟判斷公司還可以從一級市場募集更大量資金。他稱,公司B/C輪融資金額已超過絕大部分IPO募資及上市公司的定向增發。所以Kimi短期不著急上市,未來計畫將上市作為手段來加速AGI,擇時而動,主動權掌握在自己手中。本輪融資完成後,楊植麟表示,融資資金將用於更加激進地擴增顯示卡,加速K3模型的訓練和研發。部分資金也將用於2026年的激勵計畫和期權回購計畫。2025年,基於sota結果產出,調薪、期權獎勵、現金獎勵等各種激勵措施累計324人次。2026年春節之前會確定K2 Thinking及後續模型和產品發佈的獎勵方案並行放。2026年公司的平均激勵預計是2025年的200%,同時計畫大幅上調期權回購額度。“這是一個喧囂的時代,”楊植麟稱,但對他來講,Kimi的起點很簡單——單純的好奇,好奇AGI的上限在那,好奇心中的理想模型是什麼樣,好奇想要的模型能力怎麼做出來。這份好奇帶來的快樂是很真實。當團隊熬夜做的agent功能終於上線,當每天醒來打開tensorboard(TensorFlow 官方配套的可視化工具)看到驚為天人的訓練曲線。“我們共享了這些寶貴的接近真相的過程,也相信這種簡單的快樂能讓我們在喧囂中穿越周期。”楊植麟表示。 (第一財經)
錢燒了,人跑了……曾經風光的Kimi,一年後淪為了二線?
2025年歲末的AI賽道,正呈現出冰火兩重天的鮮明局面。一邊,是智譜、MiniMax相繼通過港交所聆訊,全力衝刺“AI大模型第一股”;而另一邊,是同為“AI六小虎”的月之暗面,正因使用者周活及行業排名的下滑,深陷輿情漩渦中。據Quest Mobile最新報告,近期月之暗面Kimi產品的周活躍使用者數已經跌至450萬,其排名也由一年前的第二降至第七,被豆包、DeepSeek、元寶、螞蟻阿福、阿里千問等擠到身後。另據七麥資料,今年4月份至今,Kimi整體下載量出現了大幅度下滑,且長期維持在較低水平。在這背後,技術壁壘的薄弱和“燒錢換增長”模式的失效,或許成為其下載量及日活下滑的主要原因。有人工智慧行業投資人在與《BUG》欄目溝通中指出,月之暗面眼下最大的問題在於:“它有的(產品或技術),別人都有,但它卻不是最好的。”下載量、活躍使用者雙降2024年初,月之暗面憑藉旗下Kimi智能助手出色的長文字處理能力,迅速引發全網熱議,隨後順利斬獲阿里超10億美元巨額投資,一度成為國內最被看好的“AI明星”創企。在獲得阿里等機構的巨額融資後,月之暗面行銷層面的動作也變得“瘋狂”。資料顯示,其單月廣告投放金額最高時接近2億元,一度在B站等平台形成“刷屏”之勢。而這種“撒錢”式的行銷戰術,也在去年10月左右將Kimi月活使用者規模推到了3600萬以上。高速增長之下,因聯合創始人張予彤與金沙江創投主管合夥人朱嘯虎之間“利益衝突”導致的公司治理內務,以及豆包等大廠派玩家迅速反撲帶來的外部競爭擠壓,月之暗面Kimi的技術光環開始褪色,市場地位也開始下滑。據QuestMobile近日發佈的《2025下半年AI應用互動革新與生態落地報告》,在最新統計周期(2025.12.08-12.14)內,國內AI原生App周活躍使用者排名中,豆包以15520萬、DeepSeek以8156萬、元寶以2084萬位居前三,螞蟻阿福、阿里千問分列第四、五位,而去年還排名第二的月之暗面Kimi,則滑落至第七名,周活躍使用者僅450萬,淪為二線大模型產品。而在此之前,同為QuestMobile發佈的《2025年三季度AI應用價值榜》資料顯示,Kimi智能助手的月活躍使用者規模,也從2025年第二季度的1407.2萬,下降至第三季度的992.6萬,環比下降約30%。《BUG》欄目通過七麥資料查詢發現,在下載量方面,在經歷了今年2月份的高速增長後,今年4月份以來,Kimi整體下載量也出現了大幅度下滑,且長期維持在較低水平。“燒錢”模式失效下載量與使用者活躍度雙雙下滑背後,技術領先優勢不再和“燒錢換增長”模式的失效,成為最為主要的原因。2024年,Kimi憑藉“長文字處理”這一殺手鐧技術建構起階段性領先優勢,在百萬字合同解析、長篇研報解讀等領域精準切中專業人士痛點,使其快速成為資本追捧的“AI新貴”。然而,這一技術很快被字節、阿里等頭部大廠迅速突破並超越,直接削弱了kimi賴以稱道的“長文字處理”優勢。AI行業投資人李揚(化名)在與《BUG》欄目溝通中直言:“長文字處理在技術圈並不罕見,大家想做就能做。最開始只有Kimi去突破的主要原因,是因為長文字對算力消耗極大,成本太高了,沒有合適的場景,大家都不願意做”。當憑藉“長文字處理”建構起的技術壁壘被攻破,能推動Kimi使用者增長的,唯有“燒錢引流”或打造新的“技術差異壁壘”。但從過去一年的情況來看,Kimi雖然通過發佈K2等最新模型短暫建立過領先技術優勢,但很快就被OpenAI、Google以及DeepSeek、阿里、智譜等玩家迅速抹平甚至超越,技術層面的領先優勢無法長期保持。而在“燒錢引流”這條道路上,DeepSeek憑藉技術突破帶來的“7天使用者破億”爆發式增長故事,直接宣告了AI應用“燒錢換增長”模式的低效與難以持續。李揚透露,在投流激進的時候,Kimi每獲取一個使用者的成本約在10元左右,如果算上拉新後使用者問答或體驗長文字處理等產生的算力成本,每個使用者的綜合獲客成本大約在12-13元間,如果每天新增20萬使用者,Kimi一天就得燒掉約250萬元,“如果這些使用者無法轉化為付費使用者,長期虧損就是必然結果”。從如今周活躍使用者僅有450萬、行業排名跌至第七的情況來看,Kimi早期砸錢高價引流獲取到的使用者,已有大量流失或“休眠”。與之相對應的是,鮮有投流獲客的DeepSeek,如今仍有8156萬周活躍使用者,且已經頂替了此前Kimi佔據的行業“第二”位置。李揚直截了當地說,“月之暗面時下最為尷尬的情況在於它有的(產品或技術能力),別人都有,而且它還不是最好。”它,進退兩難當技術的差異化優勢不再,燒錢換增長的模式也不再行之有效。面對豆包、元寶、千問等大廠派AI的瘋狂圍剿,以及智譜、MiniMax等“AI大模型六小虎”的追趕擠壓。月之暗面時下的處境,也正變得越來越尷尬。《BUG》欄目注意到,在商業模式上,目前月之暗面C端主要通過推進Kimi智能助手打賞、訂閱收費,而B端主要通過大模型API呼叫進行收費。但在C端收費模式上,目前Kimi收費項中基本所有的功能,通過豆包、夸克、千問、靈光等產品均可免費獲得。這意味著,在國內使用者付費意識薄弱且存在大量同類可替代產品的情況下,只要大廠一天不收費,Kimi的付費使用者就難以長期留存,流失也就在所難免。而在B端收費模式上,除API呼叫外,目前月之暗面在定製化開發、大客戶合作推進等方面的進展,部分要弱於字節、阿里等大廠,較智譜等創企也存在些許差距。在行行AI董事長李明順看來,在全球範圍內,伴隨scaling law 見頂,AI大模型能力瓶頸越來越明顯,整個行業已經進入“明牌”階段。在這一階段,大廠比小廠將有著更強的優勢,創業者更應該做的是找到細分的強場景領域,去做AI應用的全流程閉環產品,而不是做大而全的產品。但從月之暗面所做的產品形態來看,無論C端還是B端產品,其與頭部網際網路大廠存在較高重合度,不似百川智能及早聚焦醫療,也不似智譜開始有意發力B端、G端業務,更不似零一萬物放棄兆參數大模型及早擁抱DeepSeek等廠商。一位資深AI從業者在與《BUG》欄目溝通中直言,月之暗面當前的處境,屬於明顯的“進退兩難”。進,做大模型,想實現創新提升卻不容易;退,去做應用,又會“犧牲”高估值。而這一境遇,也對應了整個AI創業群體的共同處境,一方面,要志存高遠去搏更大的機會,但如果缺乏充分的市場戰略認知,吃虧在所難免。在他看來,或許月之暗面該及早地避開巨頭已經盯上的主航道,轉而選擇更加垂直、聚焦的場景,做出更多有特色的功能,或者是更早地進行全球化,進入更為廣闊的全球市場。 (新浪科技)
揭秘楊植麟,技術理想主義的孤島還是燈塔
很多個“楊植麟”,組成了月之暗面。圖片來源|視覺中國“在月之暗面(以下簡稱‘月暗’),天才也是分三六九等的。”月暗前員工宋凱對《中國企業家》說。用公司的說法是,“Kimi無閒人”。宋凱將月暗的文化概括為“和諧的暴躁”,技術大佬之間溝通直率,也充滿壓力。他們“坦白、激烈、高效”,會當面批評同事,也會把建議無情斃掉。交鋒中,“你這個傻X”照樣會從天才的嘴裡冒出來。十幾分鐘後,一切又能像沒發生過。但他認為在月暗“別人‘噴’你,都是有理由的”。令人厭惡的“摘桃子”現象不可能出現。這裡人效比極高,“大廠裡三五十人團隊干的事,在Kimi可能就兩個人做”。雖然大模型公司往往天才“扎堆”,但月暗仍有獨樹一幟的氣質。“(他們)文化更統一、人員更精簡、追求更純粹。”一位接近月暗的投資人對《中國企業家》說。2024年底,楊植麟曾因Kimi的激進投流以及與投資人朱嘯虎的官司,被推到風口浪尖。2025年初,月暗的新模型又被DeepSeek-R1打亂了發佈節奏。上半年,月暗一度淡出公眾視野,Kimi的C端月活也不斷下滑。據QuestMobile資料,截至2025年9月,豆包MAU突破1.72億,DeepSeek為1.45億,Kimi的MAU僅為967萬。但到7月,Kimi-K2模型的推出,讓人們重新見到了楊植麟的技術底牌。K2在編碼、Agent、數學推理任務均表現驚豔,更在各類基準性能測試上拿下SOTA成績。9月開始直到11月,Kimi又相繼發佈Agent模式“OK Computer”;混合線性注意力架構Kimi Linear;月暗的首個推理模型K2 Thinking——這些產品因各自的技術原創性,獲得了業內好評。美國知名企業家、矽谷投資人查馬斯表示,已將大量工作從Grok遷到Kimi K2。美國《自然》雜誌用“又一個DeepSeek時刻”來形容K2的表現。月暗絕地反攻如何完成?上半年,“大模型六小虎”的核心團隊發生不同程度的動盪,但月暗的聯創與技術梯隊整體穩定。雖然叫停投流,選擇在“模型即產品”上孤注一擲,讓月暗增加了商業化未知數;但在投資人眼中,楊植麟對AGI的偏執,仍讓其成為被追逐的標的。近日媒體獲悉,月之暗面正在進行新一輪融資,規模大約在6億美元,投前估值約38億美元。前述投資人對《中國企業家》證實了月暗新融資“即將關閉”的說法。“他們去年從阿里拿到了很多現金,但在算力、人才消耗上,每年的花費還在10億~20億元等級。”“全球現在可以提供底座能力的廠商越來越少,大家都在收斂,技術寡頭會更有機會贏得超額利潤的未來。團隊有技術理想主義,對衝擊AGI更加堅定。雖然他們有過商業化的波折,仍然是很稀缺的資產。”01 聚焦絕對性能回頭看,DeepSeek-R1的上線,既給月暗帶去了壓力,也是其重新聚焦技術長板的分水嶺——R1上線前,Kimi還沉浸在投流大法中。據《中國企業家》瞭解,Kimi的投流由張予彤主導,員工將她形容為精力極其旺盛,好像“永動機”。2024年10月、11月,Kimi的月均廣告投放金額超過2億元。彼時抖音已開始全力扶植豆包,向Kimi封鎖管道。Kimi只好猛攻B站,把CPA(使用者轉化人均成本)報價從年初的30元拉到了50元。“那時網際網路流量越來越貴,Kimi有趁著品牌紅利期,佔領先發優勢的考慮。”前述投資人對月暗去年的商業化衝刺表示理解。但DeepSeek-R1未用任何行銷,便成為國民應用的表現,讓楊植麟警醒。2025年2月中旬,他親自叫停投放,將目光聚焦於基礎演算法和模型能力的升級與突破。本來Kimi-K2計畫在2025年上半年發佈,路線也跟DeepSeek的強化學習一致,但被R1意外“截胡”後,楊植麟將模型最佳化目標更多對準了Agentic能力。經過近半年攻堅,月暗用連續發佈一系列模型和突破技術,重回大模型牌桌。2025年7月11日,月暗發佈Kimi-K2“超大架構”模型,參數高達1T。目前,全球有實力研發1T參數的大模型公司屈指可數:除了海外的OpenAI、Google,僅有阿里的Qwen3-Max、螞蟻集團發佈的百靈大模型Ling-1T,達到了兆參數。9月底,月暗灰度測試Kimi的Agent模式“OK Computer”。10月31日,月暗開源混合線性注意力架構Kimi Linear。依靠在混合線性注意力上的重要突破,該架構對算力成本實現了極大程度的降低,並能在短上下文、長上下文、強化學習擴展機制等場景中,超越同梯隊全注意力機制模型的表現。簡而言之,能讓使用者“花小錢,辦大事”。曾在混合線性注意力這條路上試水的公司不止月暗。MiniMax的M1模型、通義千問都曾在這條路線上摸索。參與月暗技術論文創作的MIT在讀博士楊松琳在採訪中表示:MiniMax的M2模型或由於對“多跳推理”的測試不足,又退回了全注意力機制。而月暗完成了突破,核心在於對線性注意力模組Kimi Delta Attention(KDA)的設計,在每3層KDA中,插入1層全注意力層;並通過更細粒度的門控機制,更有效地利用了有限狀態下的RNN(循環神經網路)記憶體。從而確保性能不掉點的情況下,最大程度節省算力。相比月暗,DeepSeek採用的是“稀疏注意力機制”。近期,DeepSeek也為行業提供了一種新思路——OCR路線研究(純像素輸入模型),把文字渲染成圖片,用視覺模態當壓縮媒介。有趣的是,月暗的研究員對DeepSeek的設計不以為然。“我個人覺得有點太刻意了。我更傾向繼續在特徵空間(Feature Space)裡下功夫,去找到更通用,並且與具體模態無關(Modality-agnostic)的方法,來提升模型效率。”11月11日,月之暗面聯合創始人吳育昕在社交媒體平台Reddit的有問必答(AMA)活動上,如此評價DeepSeek。11月6日,月暗又發佈了K2系列的首個推理模型Thinking。相比於海外OpenAI動輒數千萬美元的投入,該模型訓練成本據傳僅為460萬美元。在技術層面,Kimi K2 Thinking最引人注目的是在後訓練階段加入了“量化感知”,對MoE元件應用進行INT4權重量化,而非大多數產品使用的FP4精度。這一技術創新除了提升生成速度之外,對推理硬體的相容性更強,對輝達低端GPU和國產加速計算晶片,也更加友好。雖然對460萬美元這個數字,楊植麟和兩位聯合創始人都下場闢謠:訓練成本很難量化,其中很大一部分用於研究和實驗。但INT4的創新帶來的成本最佳化,是顯而易見的。月暗表示:該模型是在有限數量的H800 GPU上訓練而來,他們“把每一張卡都利用到了極致”。“最近日本客戶對月暗的產品關注和美譽度很高。他們的技術一直維持在高水平,且持續發佈,價格又足夠便宜,已經形成了很好的品牌調性。”前述投資人說。02 i人公司、i人模型蟄伏半年,月暗為何可以衝出重圍?這由模型行業的人才特性決定。“這是個高精尖科技領域,堆人是沒有用的。沒有一個天才帶隊,來多少高級人才都沒用。”今年6月,Meta在矽谷開出了“1億美元”年薪,瘋狂挖角OpenAI的員工。但短短幾個月,被挖走的人又紛紛離開Meta,讓挖角變成了一場鬧劇。“Meta超級智能實驗室號稱有3000人,但多數都是做輔助工作。核心團隊就44個人,真正能主導技術路線的,應該只有幾個人。”一位大模型投資人對《中國企業家》談道。與網際網路、電商等不同,人工智慧的高級人才不會單純被“鈔能力”打動。越頂尖的專家,越需要願景和志同道合的團隊。這也讓科技領袖的學術號召力、師門傳承,在模型公司的人才招攬中變得格外重要。對月暗來說,最寶貴的資產便是楊植麟本人。他畢業於清華大學電腦系,獲得卡內基梅隆大學電腦博士學位,師從蘋果公司現任AI負責人Ruslan Salakhutdinov。在清華大學求學期間,楊植麟便是一位學術風雲人物,拿遍了國內外各類獎項。他後來也曾在清華任職講師,“楊(植麟)老師的《自然語言處理(NLP)》課在學生中很有名。”一位清華姚班的畢業生告訴《中國企業家》。學術成績之外,楊植麟對AGI的追求,也被視為“追求技術理想”的代表。“他非常有號召力,如果覺得清華某個實驗室的研究課題好,會把實驗室‘連鍋端’到月暗。”宋凱說。天才的聚集,讓月暗保持著簡潔、高效的組織文化。“大家開會前先把文件對齊,每人只說幾句話,大家就散了。”當然,簡潔也因為大模型創業容不得“摸魚”。“除了演算法之外,底層基座、前後期資料的每一個環節,如果誰掉了鏈子,會很明確地感覺出來,一個人就可以拉崩整條供應鏈。”“有些模型創業公司除了技術文化,已經開始有商業化、增長,乃至官僚的幾種文化混雜,但月暗的文化還是比較純粹。”前述投資人說。這也讓月暗對於員工和技術“大神”,有相當的容忍度。例如,Kimi的關鍵人物之一蘇劍林,在內部被稱為“蘇神”。他提出的RoPE(旋轉位置編碼),以簡潔的數學形式解決了Transformer在處理長序列時的位置資訊問題,既保持了計算效率,又實現了更好的外推能力,如今已是絕大多數大語言模型的標配技術之一。因此,“蘇神”也是月暗裡唯一可以居家辦公的員工。考慮到研發人員多為“i人”,月暗還專門設計了一個點菜機器人。員工們將周圍的外賣分類到“難吃”“一般”“可以吃”“好吃”等,由機器人幫員工決定中午吃什麼。月暗文化的特別之處還在於,楊植麟並不是個“書呆子”。他在清華讀書期間,便和聯合創始人、演算法負責人周昕宇一起組過搖滾樂隊。如今月暗的會議室,也以各種知名樂隊命名。創始人的趣味投射到產品中,也讓Kimi與市場的效率產品相比,更具極客和文藝的風味。科技博主“海拉魯程式設計客”認為,K2的產品頁面設計極簡,“國內大模型廠商開始在頁面加入推薦產品,但K2仍然克制。”對於競爭對手,月暗有其獨立的價值觀判斷。海拉魯談到月之暗面的相關職位描述,面試問題之一是:“請說出Claude Code為什麼不如OpenAI的Codex。”當多數技術人員更推崇Claude Code的極致效應時,月暗的觀點與海拉魯的判斷一樣:“在程式設計能力上,Claude是一個很懂技術的產品經理,但Codex是一個真正的軟體工程師。”有使用者表示,K2在輸出答案時“絕不諂媚”的特點讓他們覺得有趣。“問K2 Thinking我帥還是吳彥祖帥?”K2 Thinking會有理有據地,將“為何吳彥祖帥”的推理過程展示出來。這種不拍馬屁的人格,是月暗團隊刻意設計。為此,團隊在預訓練階段編碼了先驗知識(Priors),又在後訓練(Post-training)階段為其增添了獨特的“風味”(Flavor)。為了確保K2的智能“上限”,月暗在大模型追求效率之時,也反其道行之。許多使用者反映:K2-Thinking思考很慢,有時比同類產品甚至要慢5~10倍。月暗對此解釋:目前版本優先確保性能和精準性,在推理階段更細緻、更耗時。“我們故意保留了更長的思考路徑,犧牲了些速度,是為了讓模型能真正完成複雜推理。”雖然未來,團隊有可能會最佳化“令牌效率”(token-efficiency),讓 Kimi “想得少一點,答得快一點”。03 商業化仍是難題“往山頂,我們又走了一段距離。”K2發佈後,楊植麟對著媒體回顧了他這一年的感受時總結道。2024年曾與月暗齊頭並進的“大模型六小虎”,MiniMax和階躍星辰抓緊多模態;智譜紮根本土,走to B/to G的路線;百川智能和零一萬物減少了基礎模型迭代,專注於場景落地。越來越多公司放棄了對基座模型的追求,行業不需要那麼多“基座”也成為共識。對手在減少、賽道在集中,競爭卻沒有變得更容易。攀登技術高峰的同時,更殘酷的商業化命題擺在眼前。如何活下去,楊植麟也在尋找答案。2024年月暗投流掀起軒然大波,也證明楊植麟並非不問世事的天真極客。2024年6月,月暗決定:要用巨量投入,快速獲得市場,佔領使用者心智。據《中國企業家》瞭解,彼時月暗覆蓋了大量管道,“管道商的資料也五花八門”。在瘋狂砸錢、衝刺資料的背景下,月暗在2024年9月前後,使用量明顯領先對手。同時,公司內部也爆發出了大規模的管道商欺詐事件。很多人給月暗送“假料”,讓楊植麟蒙受了巨額損失。到2024年12月,月暗一度準備啟動面向專業使用者的會員結合API呼叫的商業化計畫,與更優質的機構和個人合作。但彼時,朱嘯虎對月暗發起訴訟,將計畫打斷。今年2月,DeepSeek-R1上線後,讓月暗痛下決心,砍掉了“幾乎70%的投流”。楊植麟也從騰訊挖來了付強任技術副總裁,負責增長開發,“教團隊如何用系統、體系化方法做增長”。只保留最基礎的行銷後,月暗更聚焦在極客群體中的影響力。據悉,K2模型發佈時,月暗未如過去一般高頻直播,而是選擇更多在社區營運,讓技術研發團隊在即刻、知乎、小紅書上分享觀點。不過這些並不意味著,月暗破解了商業化難題。一方面,Kimi模型龐大,固然架構創新、技術最佳化可以降低部署成本,但客戶的儲存、傳輸成本仍然不低。另一方面,放棄投流後,Kimi的C端量級還在與大廠拉開距離。2025年9月,Kimi開啟了會員付費訂閱,將Kimi-reseahcher、OK Computer等能力打包分層,設定了49 元/月、99 元/月、199元/月三檔付費模式。但外界認為,Kimi按照請求次數來計費的方法顯得“性價比不高”。對此,月暗回應:這符合他們的後端成本結構,也表示將考慮改進(比如按提問或按字數計費)。與大廠纏鬥,畢竟是一場非對稱戰爭,“這是創業公司很難完成的事。”投資人士告訴《中國企業家》。智譜AI近半年完成了多輪融資,估值已達到400億元。MiniMax不久前也剛完成一筆3億美元融資,估值達到300億元。月暗融資後,是否將發起IPO計畫,楊植麟還有一些時間思考。當下,他的做法是,先用技術突破獲得資本市場認可,同時繼續向AGI行進。目前,月暗已經在思考用“模型訓模型”的可行性。8月,楊植麟在採訪中談到,希望K2能參與到K3的開發。而K3是否會突破語言大模型進入多模態?月暗給出的答案是:公司已在研究K2的VL(視覺-語言)版本。 (中國企業家雜誌)
中國兩部門發文,DeepSeek、Kimi、豆包等或將入圍
一批平台即將成為你的個人資訊“守門人”。11月22日,中國國家網際網路資訊辦公室、公安部發佈《大型網路平台個人資訊保護規定(徵求意見稿)》(以下簡稱“徵求意見稿”),明確了對大型網路平台的認定標準,以及應履行的個人資訊保護義務。根據徵求意見稿,除卻阿里、騰訊、螞蟻、字節跳動、百度、微博、小紅書等網際網路平台,DeepSeek、MiniMax、Kimi等迅速增長的AI公司,以及OPPO、vivo、榮耀等智能終端廠商,不少使用者規模也滿足徵求意見稿中的“使用者超5千萬或月活超1千萬”等條件,同樣可能進入大型網路平台的序列。“能力越大、責任越大”,這一原則貫穿了數字經濟監管始終。該徵求意見稿與9月份發佈的《大型網路平台設立個人資訊保護監督委員會規定》一脈相承,均可被視為個人資訊保護法第58條“守門人條款”以及《網路資料安全管理條例》對大型平台規定的配套檔案。配套檔案的規定,待正式版本發佈後,將對上述平台的個人資訊保護合規帶來重要影響。AI新貴進入大型平台監管射程?4年前,個人資訊保護法正式實施。其中第58條創設了“守門人”制度:對於提供重要網際網路平台服務、擁有巨大使用者數量的企業,要求承擔更高的個人資訊保護義務。2024年9月30日發佈的《網路資料安全管理條例》中,進一步對大型網路平台做了額外的要求。但在實踐過程中,“守門人”企業應如何搭建制度體系,如何披露個人資訊保護社會責任報告等,一直沒有明確答案。今年,隨著配套檔案陸續進入徵求意見階段,答案似乎逐漸明朗。此次發佈的徵求意見稿中,明確提出:對大型網路平台的認定,主要考慮以下因素:(一)註冊使用者5000萬以上或者月活躍使用者1000萬以上;(二)提供重要網路服務或者經營範圍涵蓋多個類型業務;(三)掌握處理的資料一旦被洩露、篡改、損毀,對國家安全、經濟運行、國計民生等具有重要影響;(四)中國國家網信部門、國務院公安部門規定的其他情形。根據上述要求,騰訊、螞蟻、阿里、字節跳動、拼多多、美團、京東、百度、高德、快手、小米、順豐、滴滴、微博、小紅書、中國銀行、攜程、網易等傳統的網際網路平台自然在列;近幾年風頭正勁的AI公司,比如DeepSeek、MiniMax、Kimi、360奈米也滿足上述條件;積極佈局AI智能終端廠商們,如OPPO、vivo、榮耀,其AI助手的月活數均破億,也進入監管射程之內。不過,很多AI公司的產品主要以聊天機器人為主,是否符合涵蓋多個類型業務,又如何定義“提供重要網路服務”等,一位頭部AI公司法務向我們坦言:“確實存在很多解釋空間和爭議”。徵求意見稿中提到,國家網信部門會同國務院公安部門等有關部門制定發佈大型網路平台目錄並動態更新。屆時,一切將明晰。明確個人資訊保護工作機構在組織架構方面,徵求意見稿中明確,大型平台應該指定個人資訊保護負責人,並公開個人資訊保護負責人的聯絡方式;還要明確個人資訊保護工作機構。這意味著,大型平台需要在公司內部組建專門的“個保團隊”。職責包括:制定實施內部個人資訊保護管理制度、操作規程以及個人資訊安全事件應急預案;明確專人負責未成年人個人資訊保護工作;以及每年編制發佈個人資訊保護社會責任報告等。事實上,關於社會責任報告的落實情況此前已暴露出短板。早在2022年與2023年,21世紀經濟報導商業秩序工作室/南財合規科技研究院曾連續推出《“守門人”個人資訊保護社會責任測評報告》,測評選取了上述傳統的大型網際網路平台為對象。連續兩年的測評發現,仍有多家企業並未發佈專門個人資訊保護社會報告。即便將ESG報告、企業總體社會責任報告等對外披露的內容都囊括在內,總體來看,平台對個人資訊保護的年度總結和披露內容仍非常簡略。(詳情見:重磅:南財發佈“守門人”個人資訊保護社會責任測評報告2.0)因此,如若正式法律文字中保留對社會責任報告的明確要求,大型平台如何補齊這一合規短板,還有待觀察。此外,徵求意見稿還要求,大型平台應該在中華人民共和國境內營運中收集和產生的個人資訊儲存在資料中心。並且,大型平台應當按照國家有關規定自行或者委託第三方專業機構開展個人資訊保護合規審計、風險評估等活動,並對發現的問題進行整改。鼓勵大型網路平台服務提供者優先選擇通過認證的第三方專業機構。獨立監督機構落地困難重重?上述提到,此次發佈的徵求意見稿與9月份發佈的《大型網路平台設立個人資訊保護監督委員會規定(徵求意見稿)》(以下簡稱規定徵求意見稿)均為個人資訊保護法的配套檔案。4年前,個人資訊保護法實施時,58條的守門人條款作為明星條款備受關注。其中最關鍵的一項要求則是: 成立主要由外部成員組成的獨立機構對個人資訊保護情況進行監督。此前,國內相關法律法規中尚未出現過類似提法,甚至在隱私保護最為嚴格的歐洲,都未有過針對企業個人資訊保護設立外部獨立監督機構的先例。中國人民大學教授張新寶曾在接受21記者採訪時解釋,獨立監督機構是大型網際網路企業公司治理的重要組成部分,是一個創新的制度,主要通過引入外部成員對企業的個人資訊保護情況進行監督,確保企業在個人資訊保護方面合規運行。不過,大型平台如何設立獨立監督機構,又如何運行?多年來沒有解法。我們在2022年、2023年連續兩年測評中發現,對於獨立監督機構,大部分平台企業選擇了“按兵不動”,只有少數幾家開始探索。(詳情見《個人資訊保護法》頒布一年後 中國網際網路大廠仍難以進入“守門人”角色?)9月份發佈的規定徵求意見稿中做了明確的要求。在人員配置上,個人資訊保護監督委員會成員人數應與大型網路平台業務規模、使用者數量等相匹配,一般不得少於7人,外部成員佔比不低於三分之二。職責範圍方面,監督委員會重點監督:個人資訊保護合規制度體系建設情況;平台或產品個人資訊保護規則制修訂情況;敏感個人資訊保護情況;個人資訊保護影響評估開展情況;向境外提供個人資訊合規情況;利用個人資訊進行自動化決策等情況等。並且,監督委員會應當建立與大型網路平台使用者常態化溝通機制,聽取使用者意見建議,回應使用者關切。至少每三個月召開一次定期會議,就大型網路平台個人資訊保護監督事項進行審議,並作出監督意見。在責任承擔方面,監督委員會成員在履行職責過程中發現大型網路平台個人資訊處理活動存在風險或違法違規收集處理個人資訊等問題的,應當向監督委員會和大型網路平台服務提供者提出書面建議。監督委員會和大型網路平台服務提供者未處理的,或成員對處理結果有異議的,成員應當向所在地省級網信部門報告。如果,監督委員會履行職責不到位,導致大型網路平台出現重大個人資訊安全事件的,或嚴重違反個人資訊保護相關法律法規的,省級以上網信部門應當要求大型網路平台服務提供者解散監督委員會,重新成立監督委員會。不過,有業內專家反映,規定徵求意見稿中對監督委員會的要求較高,尤其是該監督委員會主要由外部專家組成,課以太多的責任與義務,可能會損傷外部專家的積極性,“畢竟外部監督只是打輔助的”。 (21世紀經濟報導)
Kimi的估值為什麼不到OpenAI的1%?
最近,月之暗面推出的Kimi K2 Thinking 性能全面壓過 GPT-5,第一次把中國模型推上全球榜首。不久,小鵬汽車發佈了IRON機器人,以逼真的步態復刻了人類的行走姿勢。而且幾乎每個季度,中國的高科技公司們都會發佈階段性的技術成果。但地球另一端,OpenAI 的估值突破了 5000 億美元,特斯拉的市值也超過1.34兆美元。不論是Kimi 還是小鵬,估值都只有他們的百分之一。一個越來越尖銳的問題擺在檯面上:為什麼我們的企業與美國企業之間始終存在一個難以解釋的估值差距?即使在一些關鍵評測上,中國技術已經領先。即使在商業化的路徑上,中國企業並未落後。即使在資金成本上,中國企業更低。但如此懸殊的估值差距依然沒有明顯收斂。這種差距或許不是市場的誤判,而是兩種估值體系、兩種資金結構與兩種產業歷史之間的結構性鴻溝。不過隨著中國企業持續從向海外溢出,估值差收斂可能來得比想像中更快。01. Kimi估值不到OpenAI的1%到底是中國企業被低估了,還是美國企業被高估?這是在Kimi和小鵬發佈了最新產品之後,朋友圈的幾位創業者同時發出的疑問。資料展現了他們的疑惑:OpeanAI在今年10月的估值已達5000億美元。而月之暗面的估值或在33億美元50億美元之間,不到其1%。Tesla的市值1.34兆美元,而小鵬汽車的市值1900億港元,大約為其1.8%。如果你說月之暗面、小鵬,仍是OpenAI和特斯拉的“隨從”,遠不能與之相比。那我們再看看宇樹科技與Figure AI的差異。宇樹科技不論是其技術能力與商業化進度,都是無可爭議的全球第一梯隊。但它的估值僅有120億人民幣,而Figure AI最新一輪估值高達390億美元,約合人民幣2700億元,也就是說宇樹的估值只有Figure AI的4.4%。真格基金合夥人戴雨森在8月份的一次交流中就說,以Kimi為代表的中國AI創業團隊的價值在被低估。“外界太容易在很早期就下結論……但實際上,他們的主觀能動性和突破空間遠遠被低估了。”可見,這類感嘆並非個例,已經是一種在投資圈內反覆出現的普遍情緒。不僅國內投資人會發出這樣的感嘆,海外質疑也開始多了起來:為什麼中國AI企業能夠在資金成本如此低廉的情況下,做出與美國同行相同水平的產品和技術?要回答這個問題。關鍵不在於解答中國企業是不是被低估,而是找到為什麼被低估的原因。至少從技術上而言,這樣懸殊的估值差距不應該出現。Kimi K2 Thinking在多項核心評測中全面超越OpenAI的GPT-5、Anthropic的Claude 4.5等閉源模型。獨立評測平台Artificial Analysis將其列為全球第一。因此,技術能力本身顯然不足以解釋估值鴻溝。商業化路徑也不是根本差異。比如豆包、Kimi、元寶等都上線了電商業務。同樣的,今年10月中旬,OpenAI也宣佈與零售巨頭沃爾瑪達成合作,使用者未來可通過和Chat-GPT聊天直接購買沃爾瑪商品。既然技術與商業模式都不能解釋差距,那麼真正的分野就只能從估值方式本身找答案。02. 如何給AI大模型公司估值中美投資人,到底是按照什麼給AI估值的?2023年底,國內某機構給出了AI大模型公司的估值方法。當時OpenAI正在與投資人討論股票出售,估值在800—900 億美元區間。該機構分析說,預估OpenAI的穩態年利潤30億美元/年,以SaaS的業務模式,給到30倍PE,那麼估值就在900億左右。然後又以OpenAI為天花板,按照市場體量差異、終局市佔率差距、穩態淨利率差距等係數進行調整,得出中國第一梯隊的大模型公司的估值或在600億人民幣左右。我覺得這家機構對大模型估值邏輯,能夠說明兩個問題:第一,即使到今年,OpenAI也沒有實現穩態年利潤30億美元,資料顯示,OpenAI在2025年上半年營收約43億美元,淨虧損135億美元。但是OpenAI的估值從900億美元左右迅速飆升至5000億美元,這意味著美國市場採用的根本不是“PE估值”這一套,而是完全不同的敘事框架。第二,但在中國市場,大模型公司的估值則在200億-600億之間,可見給國內大模型公司的估值,恰恰正是按照這家機構的邏輯進行估值的。這正是兩個市場不同的估值邏輯。在中國市場,對AI公司的估值,是按照落地效率+產業化兌現速度來定價;而在美國資本市場,對AI公司的估值邏輯,是按照未來可能控制AI基礎層範式來定價。一個面向當前現金流,一個面向未來系統權力。所以,真正影響資本定價巨大差異的,既不是技術實力,也不是商業化模式,而是上述不同的估值體系。再進一步,OpenAI的估值錨點,是基礎模型與AI平台級控制權的爭奪。市場對它的預期,是建構AI世界的作業系統。這一點不僅是其演算法領先,也在於與傳統巨頭的生態繫結。其商業模式是向全世界的使用者,抽取“AI稅”。而一旦能夠抽“稅”,估值自然具備平台級資產的溢價。而以Kimi為代表的中國AI公司就大不一樣了。其估值錨點在於應用層和產品體驗,市場對其的預期並非作業系統,而是AI助手。商業模式自然也不是“稅”,而是廣告、流量與B端的大客戶。兩廂比較,一個是AI的作業系統,另一個是AI產品。兩者對應的不是同一種資本語言。類似的估值體系也表現在小鵬與特斯拉上。從產品形態上看,兩家企業都是新能源汽車和機器人公司。但是資本市場把特斯拉看做是通用機器人的產業革命,木頭姐更定義特斯拉是“地球上最大的AI項目”。而國內資本市場只把小鵬看做是一家製造業公司,即使率先推出了IRON機器人,也只被看做是車廠延伸出的智能硬體新業務。一個是全球最大AI,另一個僅為車企新業務,兩者的估值高下立現。這種估值體繫上的差異,還體現在對高端人才收購上。你很難想像一個頂尖大學畢業的25歲的年輕人,竟然能夠拿到5000萬美金以上的薪酬包。這筆人力成本的帳,在中國市場是算不過來的。但在美國投資界有獨特的演算法:“如果我能把賺一兆美元的機率提高1%,那就值100億美元。”——即便這可能是一種不能兌現的演算法,但美國資本願意相信這樣的敘事。正如紅杉資本David Cahn說的,這是矽谷的“生態系統的焦慮症”。何為生態系統?就是一種對AI世界的定義權。它不僅是單一產品或技術,而是一套被廣泛採用的技術和商業模式組合,說白了就是標準的制定權,“我這麼做,你也必須按照我的方式來做”。所以,美國投資者並不關心 OpenAI 短期內是否掙錢,而關心它是否能成為 AI 世界的“生態系統”。美國資本對OpenAI的高估值,本質上是對這種“定義權”的押注。而現金流只在它的估值體系的邊緣。03. 不同的LP 不同的產業歷史而估值體系差異的背後,實質上是LP結構差異。PitchBook 前不久發佈的一篇報告Sovereign AI: The Trillion-Dollar Frontier.《主權人工智慧:兆美元前沿》,報告披露了全球主權財富基金對AI的投資資料。資料顯示,今年 1 月至 8 月,全球主權財富基金參與了總價值 464 億美元的 AI 風險投資交易,其中 433 億美元(超過 93%)流向了美國的初創公司。比如,阿布扎比主權財富基金旗下的資產管理機構Mubadala Capital領投了Crusoe。馬斯克的xAI,則得到了阿曼和卡達的主權財富基金支援。這些主權財富基金通常偏好能長期掌控技術秩序的公司,而不是短期能掙現金流的公司。除了主權財富基金外,養老基金、大學捐贈基金、產業資本等長期資本也是其重要的出資人。也就是說,美國AI創業公司背後的資本結構天然是“全球化+長周期”而國內資金量少得多。投中嘉川CVSource資料顯示,今年(截至11月15日)國內AI產業,累計融資金額約為480億人民幣,這包括了市場化VC/PE、國資機構、產業資本。其資金規模更小、期限更短、退出壓力更強,自然更偏好現金流可見性高的公司。但資金屬性只是表層原因,更深層的差異來自——歷史上誰曾掌握過“範式定義權”。答案是:在過去半個世紀,美國企業連續三次定義科技範式,這讓美國市場形成了“押注定義者而不是追隨者”的長期主義。比如第一次由微軟完成的PC革命。1981年,IBM 採用微軟 DOS 作為 PC 系統,第一次把“計算入口”交給微軟。1985年,微軟發布Windows系統,確立了圖形介面的交付標準。1995年,微軟發布Windows95,為全世界的個人電腦,建構了統一的交付平台。再加上推出的office系列產品,微軟最終定義了個人的網際網路生活與全球商業的辦公方式。第二次是由Google建立的內容革命。創業之初,靠著 PageRank 演算法,Google迅速成為網際網路使用者獲取資訊的起點,改變了使用者使用網際網路的習慣。2010 年以後,隨著智慧型手機普及、YouTube迅速增長、Chrome成全球最強瀏覽器,Google最終完成了對入口層的全面佔領。資訊不再自發傳播,而是“按Google的方式”被組織、排序、傳遞。第三次由蘋果創造的移動生活革命。原本手機只是“通訊裝置”,由諾基亞、黑莓、摩托羅拉統治。2007年發佈的iPhone則重新定義了“手機是什麼”。2008 年的 App Store又把手機從硬體產品變成一個“生態系統”,所有開發者必須遵循它的規則、介面和稽核流程。從此,蘋果掌握了移動網際網路時代的“入口權”和“生態秩序”。這三次定義,強化了美國投資人對於平台級技術的長期主義信仰。所以,全球資金對OpenAI們的追逐,正是延續了這一種信仰的“歷史慣性”。04. 中國企業創造半次勝利那麼中國企業呢?到目前為止,中國企業只完成了半次對世界的定義,那就是新能源。太陽能、新能源汽車、動力電池,這三大領域,其產能、價格和材料體系均由中國主導。中國企業是供應鏈上的規則制定者。舉個例子,在太陽能產業中,中國在矽料—電池片—元件—製造能力上的規模與成本優勢,形成了產業等級的“成本曲線定義權”。在技術上,不論是PERC ,還是TOPCon 、HJT,這些新技術的迭代節奏全部由中國企業決定。在動力電池行業,其磷酸鐵鋰、矽碳負極、電解液、隔膜等各個環節,都由中國企業把控。韓國市場分析機構SNE Research的資料顯示,今年上半年,中國動力電池企業在全球市場的佔有率持續提升,6家中國企業(寧德時代、比亞迪、中創新航、國軒高科、億緯鋰能、蜂巢能源)的市佔率合計達到68.9%。即使其他國家試圖削弱中國企業和供應商的影響力,也不得不遵循中國的價格體系和產能曲線。特斯拉當年必須依靠中國的供應鏈才得以起死回生;而歐洲老牌公司雷諾汽車也在2024年將新能源汽車的研發中心設在了上海。可見,中國企業不是單一技術領先,而是生態化的系統性的領先。站在一級市場的角度,我們認為新能源投資也標誌著人民幣基金的成熟。寧德時代就是里程碑,它是人民幣基金投出的第一家具有世界影響力的兆級企業。寧德的早期投資者,君聯資本葛新宇曾說,新能源是中國歷史上第一次為世界貢獻的工業語言。正說明了中國企業在這一領域擁有的範式定義權。但中國在新能源上並非完全具備軟體定義能力,所以只能說是“半次定義”。新能源汽車的作業系統,智能駕駛的城市標準,分佈式能源的調度與分配,這些軟性層面的標準和規則,依然在角逐之中。而AI的發展水平,無疑也深刻影響著這些軟體層面的競爭格局。05. AI的故事會按照既定劇情發展嗎?所以從產業發展的歷程上看,中美AI企業的估值差距,表面上看是模型強弱的差距,是LP屬性上的差距,但根本上是“美國企業定義了世界3次”與“中國企業定義了世界半次”之間的歷史差距。而現在AI產業上的競爭,正是進行中的又一次定義權之爭。這場競爭的起點,是誰的模型更加強大,但競爭的終點,在於誰能夠決定“人類未來應該如何使用AI”。這不止是性能競爭,更是系統的競爭。輝達、OpenAI和微軟等美國企業之間的合縱連橫,正是形成這一系統閉環的縮影。但歷史慣性並不意味著未來必然重演。紅杉資本David Cahn說,過去所有的壟斷,都是靜悄悄完成的。不論微軟,還是Google,早年間投資界對他們的預期,都遠遠小於後續的發展。他們當今的全球權力,是所有人的意外。但是今天,AI卻是擺在明面上的事。整個資本市場幾乎都在押注AI,不論是標普500,還是私募股權,全球資本都指向了單一方向。所以,會不會出現這樣的情形:當所有人都認為一件事會發生的時候,這件事就不會發生,或者不會按照預期的模樣發生?這或許是可能的。最近矽谷的一個新趨勢,就是投資那些由頂尖科學家組成“Neolabs ”(新生代實驗室),背後的邏輯便是對OpenAI、Anthropic 等高度成熟的大公司們的懷疑——5000億估值的企業已經過於龐大,在技術路徑上是否已經陷入了某種慣性?那麼在主流之外又有沒有新的可能?所以,競爭尚未落定。至少到目前為止,沒有那個模型能主導一切。特別是在中國開源模型的衝擊下,應用端公司和個人仍然有很多選擇。最近中美模型的下載量資料被刷屏了:2023年11月,美國模型在全球下載量中佔比超過60%,中國模型僅有25%。到2025年9月,中國模型新增下載量佔比已上升至約65%,而美國模型份額下降至30%左右。截至2025年10月,中國開源模型累計下載量達到約5.5億次,而美國模型為4.75億次。下載量上升說明中國模型可用性提升,這削弱了美國模型的先發優勢,增加了未來估值收斂的可能性。另一個在矽谷流傳但沒有核實的資料是,80%的AI創業公司都在用中國開源模型。這些資料都意味著,中國模型的可用性正在被海外市場驗證,這為後續更深層競爭打開了空間。所以,回到中美AI企業估值差距這一話題。OpenAI 的估值並不只來自模型能力,而來自其被視為主導下一代互動範式、工作方式和軟體形態的可能性。而中國AI範式也在競爭之中,如果它能持續從中國向外溢出,讓海外市場開始認為中國模式也能“制定標準”。那麼估值差收斂可能來得比想像中更快。這會發生在什麼時候?如今矽谷的AI泡沫的形成已經成為共識。人們開始質疑美國企業過於高估了。也許更清晰的未來,在這一輪泡沫消化(或破滅)之後就能看到。 (超越 J Curve)
用 460 萬美元追上 GPT-5?Kimi 團隊首次回應一切,楊植麟也來了
上周 Kimi K2 Thinking 發佈,開源模型打敗 OpenAI 和 Anthropic,讓它社交媒體捲起不小的聲浪,網友們都在說它厲害,我們也實測了一波,在智能體、程式碼和寫作能力上確實進步明顯。剛剛 Kimi 團隊,甚至創始人楊植麟也來了,他們在 Reddit 上舉辦了一場資訊量爆炸的 AMA(有問必答)活動。Kimi 團隊三位聯創,楊植麟、周昕宇、吳育昕參與回答面對社區的犀利提問,Kimi 不僅透露了下一代模型 K3 的線索、核心技術 KDA 的細節,還毫不避諱地談論了 460 萬的成本,以及與 OpenAI 在訓練成本、產品哲學上的巨大差異。460 萬美元這個數字不是官方的數字,具體的訓練成本很難量化到多少錢K3 什麼時候來,是看奧特曼的兆美中繼資料中心什麼時候建成K3 的技術將會繼續沿用,當前效果顯著的 KDA 注意力機制視覺模型還需要我們去採集更多的資料,但目前已經在做了……我們為你整理了這場 AMA 中最值得關注的幾個核心焦點,來看看這家現在算是國產開源老大的 AI 實驗室,是如何看待他們的模型,和未來 AI 的發展。叫板 OpenAI,「我們有自己的節奏」在這場 AMA 中,火藥味最足的部分,大概就是 Kimi 團隊對 OpenAI 的隔空回應。最大的噱頭之一:K3 什麼時候來?Kimi 團隊的回答非常巧妙:「在奧特曼的兆美中繼資料中心建成之前。」很明顯這一方面是幽默,因為沒有人知道 OpenAI 到底什麼時候才能建成那個資料中心,另一方面似乎也在回應外界對於 Kimi 能用更少資源追趕 GPT-5 的讚歎。當有網友貼臉開大,直接問 Kimi 怎麼看 OpenAI 要花這麼多錢在訓練上時,Kimi 坦言:「我們也不知道,只有奧特曼自己才知道」,並強硬地補充道,「我們有自己的方式和節奏。」這種自己的節奏,首先體現在產品哲學上。當被問到是否會像 OpenAI 一樣發佈 AI 瀏覽器時,團隊直言 No:我們不需要建立另一個 chromium 包裝器(瀏覽器套殼),來建構更好的模型。他們強調,目前的工作還是專注於模型訓練,能力的體現會通過大模型助手來完成。在訓練成本和硬體上,Kimi 也展現了精打細算的一面。社區好奇 K2 的訓練成本是否真的是傳聞中的 460 萬美元,Kimi 澄清了這個數字並不精準,但表示大部分的錢都是花在研究和實驗上,很難具體量化。至於硬體,Kimi 承認他們使用的是 H800 GPU 和 Infiniband,雖然「不如美國的頂級 GPU 好,而且數量上也不佔優勢」,但他們充分利用了每一張卡。模型的個性與 AI 的垃圾味一個好的模型,不僅要有智商,還要有個性。很多使用者喜歡 Kimi K2 Instruct 的風格,認為它「比較少的諂媚,同時又像散文一樣,有洞察力且獨特」。Kimi 解釋說,這是「預訓練(提供知識)+ 後訓練(增添風味)」共同作用的結果。不同的強化學習配方(即獎勵模型的不同選擇)會得到不同的風格,而他們也會有意的把模型設計為更不諂媚。大語言模型情商評估排名,圖片來源:https://eqbench.com/creative_writing.html但與此同時,也有使用者直言 Kimi K2 Thinking 的寫作風格太「AI Slop 垃圾」,無論寫什麼話題,風格都太過於積極和正面,導致讀起來 AI 味就是很重。他還舉例子說,要 Kimi 寫一些很暴力很對抗的內容時,它還是把整體的風格往積極正面那邊去靠近。Kimi 團隊的回答非常坦誠,他們承認這是大語言模型的常見問題,也提到現階段的強化學習,就是會刻意地放大這種風格。這種使用者體感與測試資料的矛盾,也體現在對 Benchmark(跑分)的質疑上。有網友尖銳地提問,Kimi K2 Thinking 是不是專門針對 HLE 等跑分進行了訓練,才會取得如此高分?畢竟這麼高的分數,好像和他實際使用中的智能不太匹配。對此,Kimi 團隊解釋說,他們在改進自主推理方面取得了一些微小的進展,這剛好讓 K2 Thinking 在 HLE 上得分很高。但他們也坦誠了努力的方向,要進一步提升通用能力,以便在更多實際應用場景中和跑分一樣聰明。網友還說,你看馬斯克的 Grok 因為做了很多 NSFW (非工作安全) 的工作,生成圖片和視訊;Kimi 完全可以利用自己的寫作優勢,讓它完成一些 NSFW 的寫作,一定能為 Kimi 帶來很多的使用者。Kimi 只能笑而不語,說這是一個很好的建議。未來是否會支援 NSFW 內容,可能還需要找到一些年齡驗證的方法,也需要進一步做好模型的對齊工作。很明顯,現階段 Kimi 是不可能支援 NSFW。核心技術揭秘:KDA、長推理與多模態作為一家被稱為「開源先鋒實驗室」的公司,而 Reddit 本身就是也是一個非常龐大和活躍的技術社區,Kimi 也在這次的 AMA 中,分享了大量的技術細節。10 月底,Kimi 在《Kimi Linear: An Expressive, Efficient Attention Architecture》的論文,詳細介紹了一種新型混合線性注意力架構 Kimi Linear,其核心正是 Kimi Delta Attention (KDA)。KDA 演算法實現,論文連結:https://arxiv.org/pdf/2510.26692通俗來說,注意力(Attention)就是 AI 在思考時,決定應該重點關注上下文那些詞語的機制。和常見的完全注意力和線性注意力不同,KDA (Kimi Delta Attention),是一種更智能、更高效的注意力機制。在這次 AMA 活動中,Kimi 也多次提到,KDA 在長序列強化學習場景中展現了性能提升,並且 KDA 相關的想法很可能在 K3 中應用。但 Kimi 也坦言,技術是有取捨的。對大多數大模型任務來說,目前混合注意力的主要目的是節省計算成本,並不是為了更好的推理;在長輸入和長輸出任務上,完全注意力的表現依然是更好的。那麼,Kimi K2 Thinking 是如何做到超長推理鏈的呢,最多 300 個工具的思考和呼叫,還有網友認為甚至比 GPT-5 Pro 還要好?Kimi Linear 模型結構Kimi 認為這取決於訓練方式,他們傾向於使用相對更多的思考 token 以獲得最佳結果。此外,K2 Thinking 也原生支援 INT4,這也進一步加速了推理過程。我們在之前的 Kimi K2 Thinking 文章中也分享了 INT4 的量化訓練技術,這是一種高效的量化技術(INT4 QAT),Kimi 沒有訓練完再壓縮,而是在訓練過程中,就保持了低精度運算模型。這能帶來兩個巨大的優勢,一個是推理速度的提升,一個是長鏈條的推理,不會因為訓練完再進行的壓縮量化,而造成邏輯崩潰。最後,關於外界期待的視覺語言能力,Kimi 明確表示:目前正在完成這項工作。之所以先發佈純文字模型,是因為視覺語言模型的資料獲取,還有訓練,都需要非常多的時間,團隊的資源有限,只能優先選擇一個方向。生態、成本與開放的未來對於開發者和普通使用者關心的問題,Kimi 團隊也一一作答。為什麼之前能處理 1M 上下文的模型消失了?Kimi 的回答言簡意賅:「成本太高了。」而對於 256K 上下文在處理大型程式碼庫時依然不夠用的問題,團隊表示未來會計畫增加上下文長度。在 API 定價上,有開發者質疑為何按「呼叫次數」而非 token 收費。對使用 Claude Code 等其他智能體工具進行程式設計的使用者來說,基於 API 請求次數的計費方式,是最不可控且最不透明的。在傳送提示之前,使用者根本無法明確工具將發起多少次 API 呼叫,或者任務將持續多長時間。Kimi 會員計畫Kimi 解釋說,我們用 API 呼叫,是為了讓使用者更清楚的知道費用是怎麼消耗的,同時符合他們團隊的成本規劃,但他們也鬆口表示會看看是否有更好的計算方法。當有網友提到自己公司不允許使用其他聊天助手時,Kimi 藉機表達了他們的核心理念:我們擁抱開源,因為我們相信通用人工智慧應該是一個帶來團結而不是分裂的追求。而對於那個終極問題——AGI 什麼時候到來?Kimi 認為 AGI 很難定義,但人們已經開始感受到這種 AGI 的氛圍,更強大的模型也即將到來。和去年瘋狂打廣告行銷的 Kimi 不同,在這場 AMA 裡,楊植麟和團隊成員的回答;確實能讓人感受到在國產開源,逐漸佔據全球大語言模型開源市場的背景下,Kimi 也更加有底氣,更明確了自己的節奏。而這個節奏很明顯,就是在這場燒錢、甚至卷太空的 AI 競賽中,繼續走開放原始碼的路,才能推動技術往前走。 (APPSO)
小成本DeepSeek和Kimi,正攻破奧特曼的「算力護城河」
2025年前盛行的閉源+重資本範式正被DeepSeek-R1與月之暗面Kimi K2 Thinking改寫,二者以數百萬美元成本、開源權重,憑MoE與MuonClip等最佳化,在SWE-Bench與BrowseComp等基準追平或超越GPT-5,並以更低API價格與本地部署撬動市場預期,促使行業從砸錢堆料轉向以架構創新與穩定訓練為核心的高效路線。2025年以前,AI界盛行著一種信念:只有閉源、巨額投入和瘋狂堆算力才能打造最強大的模型。OpenAI作為這一思路的旗手,不僅將模型訓練秘而不宣,更與合作夥伴繪製了高達1.4兆美元的基礎設施藍圖。八年內燒掉1.4兆美元來建構資料中心,被視作確保領先的唯一途徑。在這種思維下,OpenAI旗艦模型的研發成本節節攀升:據報導,訓練GPT-4就花費了約1億美元。閉源+重資本模式一度令人信服,OpenAI因此獲得了天價估值和洶湧資本支援。然而,這一「用錢砸出智能」的神話,正隨著一系列意料之外的挑戰而動搖。信念的第一次動搖DeepSeek-R1橫空出世今年年初,一家彼時名不見經傳的中國初創公司深度求索掀起了巨浪。它發佈的DeepSeek-R1模型不僅開源,而且號稱性能可與OpenAI頂級模型比肩。更令人瞠目的是,DeepSeek宣稱訓練這款模型只花了約560萬美元,連舊金山一套像樣的房子都買不起。這個成本數字相比業內普遍認為的「燒錢」等級相差懸殊,僅為Meta開發Llama模型成本的約十分之一。事實證明,這並非誇誇其談。DeepSeek-R1發佈後一周內,DeepSeek App下載量迅猛攀升,一舉超越ChatGPT,登頂美國蘋果App Store免費榜。一款開源AI應用在美國使用者中的受歡迎程度超過了OpenAI的王牌產品,這一幕令業界震驚。DeepSeek以微薄成本實現高性能,直接質疑了開發AI必須投入天量資金和算力的傳統觀念。華爾街對此反應劇烈,微軟和Google股價應聲下挫,而AI晶片巨頭輝達的市值甚至蒸發了約17%,相當於約6000億美元。資本市場用腳投票,開始重新審視AI賽道的投入產出模型:燒錢打造封閉模型的路線,或許並非高枕無憂的康莊大道。開源低成本路線的核彈Kimi K2 Thinking震撼登場DeepSeek年初點燃的星星之火尚未平息,中國另一家初創公司月之暗面在年末投下了一枚震撼彈。本周,月之暗面發佈了最新的開源巨模型Kimi K2 Thinking(以下簡稱K2 Thinking),以開源身份在多個關鍵基準上追平甚至超越了OpenAI的旗艦GPT-5。要知道,GPT-5可是閉源巨頭最先進的成果之一,而K2 Thinking僅用幾百萬美元訓練,卻在高難度推理和編碼測試上正面較量並拔得頭籌。K2 Thinking在綜合程式設計挑戰「SWE-Bench Verified」上取得了71.3%的通過率,略高於GPT-5的成績,甚至在複雜網頁搜尋推理任務BrowseComp上,以60.2%對54.9%的得分大幅領先GPT-5。這些數字宣示了一個歷史拐點:開源模型與頂級閉源模型之間性能鴻溝的實質性塌陷。K2 Thinking的問世標誌著開源免費模型在高端推理和編碼能力上與封閉系統平起平坐,這一點在過去幾乎難以想像。而實現這一壯舉,月之暗面投入的算力成本據傳約為460萬美元,比起OpenAI宏圖中的兆投入,幾乎可忽略不計。一邊是幾百萬美元造就的開放奇蹟,另一邊是幻想燒錢兆的巨無霸帝國,鮮明對比令人不禁懷疑:AI行業過去堅持的大投入邏輯,難道真的站不住腳了?技術路徑的勝利巧用架構勝過砸錢堆料K2 Thinking並非魔法橫空出世,而是技術路線差異帶來的成本逆襲。傳統的GPT-5這類閉源模型採用的是「通用大腦」式架構,每個參數對每個輸入都會發動運算,因而模型越大推理開銷越驚人。K2 Thinking則採用混合專家架構,將龐大模型劃分為384個專長各異的專家模組。每次僅有8個專家(外加1個通用專家)被啟動參與計算,相當於只動用320億參數來解決特定問題。換言之,K2-Thinking擁有一個「萬智百寶箱」,每個token只呼叫其中不到3.5%的智力,卻能享受近似兆參數的知識儲備。這一架構設計讓K2 Thinking在推理時既聰明又節省:「大而不笨重」。架構最佳化帶來的成本效率提升達百倍之多,令人歎為觀止。更關鍵的是,月之暗面研發了名為「MuonClip」的自訂最佳化器,在訓練過程中自動穩壓梯度,成功杜絕了超大模型常見的梯度爆炸和損失發散問題。Kimi-K2在長達15.5兆token的訓練中實現了「零訓練崩潰」,無需人為中途干預重啟,這意味著即使資金裝置相對有限的團隊也能可靠地訓練超大模型。DeepSeek也在工程上強調「強化學習後訓練」等高效策略,使得小團隊得以攀登AI高峰。這些技術路徑上的創新,等於是用聰明才智破解了過去只有砸錢才能解決的難題。曾經只有巨頭燒錢才能鋪就的康莊大道,如今民間高手另闢蹊徑,用技術巧思抄了近路。開源風暴的經濟學衝擊當技術壁壘被攻克,開源路線在經濟層面的優勢便愈發凸顯。K2 Thinking的模型權重可在相應許可證條款下自由下載部署。這與OpenAI等閉源模式形成鮮明對比,它們的模型被封藏於雲端,只能通過昂貴API租用它們的大腦。以K2 Thinking為例,其官方提供的API價格是每百萬輸入token收費4元(命中快取時更低至1元)、輸出token16元。相比之下,OpenAI的GPT-5 API價格約為每百萬輸入token收1.25美元(約9元),輸出token高達10美元(約71元)。換算下來,同樣百萬token的處理,K2 Thinking的費用僅為GPT-5的十分之一不到。對開發者和企業而言,這無疑極具誘惑力,更何況K2完全可以本地部署,不願付API費的話,大可以自建服務。正因如此,我們已看到市場正在迅速響應:越來越多AI工具和平台開始整合K2 Thinking模型,許多開發者在社區分享如何用K2 Thinking微調自訂應用。DeepSeek-R1發佈後,其MIT開源權重更是被無數開源社區下載、魔改,用於各種外掛和研究項目。甚至政府機構和大型企業也開始重新考慮,與其斥資購買封閉模型的算力配額,不如採用開源模型作為基礎,掌控自主可控的AI能力——尤其當這些開源模型已經足夠好且成本低廉。這種用腳投票的風向轉變,不僅出現在技術圈,更在資本圈引發連鎖反應:OpenAI此前天價的資料中心投資承諾,正面對質疑和壓力。OpenAI高管甚至在公共場合暗示需要政府貸款支援,事後又忙不迭出來「滅火」澄清不尋求政府背書,以平息外界對其燒錢計畫的擔憂。當巨頭為融資「續命」四處遊說時,開源對手們正用實際成績證明,也許根本不需要那麼多錢,也能把事情辦成。行業敘事的改寫與泡沫的冷卻DeepSeek和Kimi K2 Thinking帶來的並非單純的「追趕」,而更像是一場對舊路線的證偽。過去,封閉巨頭們的護城河建立在一種假設之上:只有不斷投入數量級增長的資金和算力,才能保持模型性能的領先。這一假設曾讓OpenAI們在資本市場上如日中天,甚至形成了某種估值泡沫,AI公司和底層晶片廠商的價值被無限推高,因為所有人相信燒錢會帶來奇蹟。然而當開源挑戰者以區區百萬量級美元達到同類水準,這個故事的結局便不再那麼線性。事實證明,「性能領先的最後20%」或許並非大多數使用者真正需要的,尤其如果為此要付出十倍乃至百倍的價格。從普通消費者到中小企業,更青睞的是「夠用+便宜」的實惠。OpenAI等公司無疑依然握有行業頂尖的研究人才和技術積累,但他們再難宣稱自己的路線是「唯一正確且必不可少」的。行業敘事正在轉向:與其痴迷於砸錢堆出更大模型,不如在架構創新和工程穩定性上下功夫,以換取成本效率和開放生態。投資者也日趨清醒,過去見誰談AI就砸錢的狂熱減退了許多,現在更關注實際效能和商業可行性。最危險的對手,不是那個跟你拼燒錢的人,而是那個證明根本不需要燒那麼多錢的人。 (新智元)