#智譜AI
中國AI四小龍,全部去見了總理
不是百度,不是阿里,不是騰訊。總理的座談會上,中國AI創業江湖的"四小龍"終於湊齊了一桌。從2024年3月到2026年4月,智譜AI、DeepSeek梁文鋒、MiniMax閆俊傑、月之暗面楊植麟,先後坐到了總理對面。四個男人,覆蓋了80後、85後、90後三個世代;廣東潮汕與湛江,河南商丘縣城,浙江杭州錢塘江畔,串聯起中國AI最生猛的草根逆襲史。他們帶著各自的"技術圖騰":一個逆勢漲價,一個開源封神,一個不信天才,一個搖滾反叛。這是中國AI獨有的故事。智譜AI 清華土著第一家受邀的是智譜AI。2024年3月,調研新質生產力座談會,第一個出場的AI公司就是它。張鵬,標準的清華"土著",清華電腦系本碩博連讀,在清華園待了近十年,連創業都是清華老師唐傑帶的隊。圈內人都說,他身上那股"技術原教旨主義"的勁兒,很清華。2026年1月,智譜AI在香港上市,成為"大模型第一股"。張鵬有一句很狠的話:"智能上界決定了定價權。"當所有人在價格戰裡殺紅了眼,比誰更便宜時,他逆勢漲價。邏輯很簡單:只有把模型能力做到極致,才有資格定價格,而不是靠燒錢補貼換市場。這種底氣來自智譜的"技術護城河",自研的GLM架構,不走尋常路,而是用"自回歸填空"的原創設計。2026年發佈的GLM-5採用超大規模MoE架構,在國產晶片上跑出了比雙卡叢集還強的性能。智譜的CodeGeeX程式碼大模型,在程式設計圈程式設計師裡的口碑,被稱為"國產Copilot最強平替"。張鵬相信,AGI不是炒概念,而是一行程式碼一行程式碼摳出來的工程問題。梁文鋒 全球AI都意外第二家,DeepSeek。2025年1月20日,政府工作報告座談會,梁文鋒第四個發言。鏡頭裡的他,眼神平靜得像一潭深水。1985年,梁文鋒出生在廣東湛江吳川,一個連五線城市都算不上的地方,父親是當地小學老師。2002年,17歲的他以吳川一中"高考狀元"的成績考入浙江大學電子資訊工程專業。2008年全球金融危機,在浙大讀研的梁文鋒嗅到了機會。他拉著同學,用機器學習探索全自動量化交易。2015年,30歲的梁文鋒創立幻方量化。6年後,管理規模突破千億,躋身中國"量化四大天王"。但外界不知道的是,2019年,他豪擲2億元搭建“螢火一號”,搭載1100塊消費級顯示卡;2021年,又砸10億元建“螢火二號”,搭載萬張輝達A100"。別人炒股賺錢買房,他炒股賺錢買顯示卡。2023年,梁文鋒帶著這些"計算軍火"殺入大模型戰場。2025年,DeepSeek-R1橫空出世,用557萬美元的訓練成本(僅為GPT-4的零頭),干翻了矽谷的一眾巨頭。Meta、微軟連夜研究他的技術路線。他最著名的一句話是:"中國AI和美國真實的gap,是原創和模仿的差距。"這句話,成了中國AI行業反攻的起點。梁文鋒極其低調,卻在2022年以"一隻平凡的小豬"名義,向慈善機構捐款1.38億元。閆俊傑 不相信天才第三家,MiniMax。2026年1月,討論"十五五"規劃的座談會上,閆俊傑坐在對面。1989年,閆俊傑出生在河南商丘的一個縣城,高中在縣城中學度過。。2006年考入東南大學數學學院,隨後進入中科院自動化所碩博連讀(2015年博士畢業於中國科學院自動化所模式識別國家重點實驗室),並在清華大學電腦系從事博士後研究。2014年,25歲的閆俊傑在百度深度學習研究院實習。那是中國AI的"黃埔軍校",他在這裡第一次直觀感受到大規模算力的顛覆性價值。據說,他一個人就用掉了百度當時三分之一的GPU算力做實驗,還拿下了百度獎學金。轉折發生在2021年春節。閆俊傑回河南老家,外公說想寫一本回憶錄,但不會打字,也沒辦法組織語言。這個做了十年AI的博士突然意識到:他做的技術,對一個想寫回憶錄的老人來說,一點用都沒有。那一刻,他決定要做"普通人能用上的AI"。2021年底,離職創立MiniMax。閆俊傑有一句座右銘:"AI不是神秘黑盒,而是可用第一性原理解析的工程問題。AGI是科學,不是魔法。"他旗幟鮮明地反對"天才論",認為大模型領域貢獻前50的人,可能沒一個在中國公司工作,中國公司要做的就是"聚攏一批素質優秀的人,做一個成長型組織"。四小龍裡,MiniMax是唯一放棄盲目追求"超級模型"的,專攻Agent和程式設計。他們的M2系列,被稱為"國產Claude平替",最新M2.7實現了"模型自己訓練自己"的AI進化。更驚人的是成本,MiniMax用OpenAI約1%的研發投入(累計4.5億美元),實現了全模態技術全球領先,團隊385人,平均年齡29歲,70%收入來自海外。2026年3月,MiniMax市值突破3800億港元,超越了曾經的"導師"百度。在MiniMax內部,閆俊傑有一個花名叫“IO”,既是電腦語言的輸入輸出,也是DOTA裡那個專職輔助隊友的英雄。這很符合他的自我定位:“成功是體系和組織的勝利,不是個人的勝利。”他曾評價自己“可能只是二流研究者”,但堅信二流研究者加上一流組織,能打敗一流研究者的單打獨鬥。楊植麟 "Token經濟學"第四家,月之暗面。2026年4月10日,經濟形勢座談會,楊植麟作為科技企業家出席。1993年,楊植麟出生在廣東汕頭。這是四小龍裡唯一的90後,潮汕人。他的成長史像一部青春電影:高中時零程式設計基礎,被選拔進資訊學奧賽培訓班,拿下廣東一等獎,保送清華。但他放棄保送,以667分的高考成績成為汕頭市理科狀元,考入清華熱能工程系。大二轉專業進入電腦系,師從唐傑教授。在清華,他還是搖滾樂隊Splay的鼓手和詞曲作者,曾晉級清華校園歌手大賽原創決賽。他坦言,選擇電腦專業,是因為村上春樹的一篇小說,讓他對"深夜寫程式碼讓科技落地"的角色印象深刻。2015年,他進入卡內基梅隆大學(CMU),師從蘋果AI負責人Ruslan Salakhutdinov和Google首席科學家William Cohen。4年時間,他完成了通常需要6年的博士課程,提出的Transformer-XL與XLNet模型,成為自然語言處理領域的里程碑,至今被引用上萬次。他參與過Google Gemini、Google Bard、盤古NLP、悟道等大模型的研發。2023年創業,公司名"月之暗面"(Moonshot AI)來自他崇拜的搖滾樂隊Pink Floyd的專輯《The Dark Side of the Moon》。楊植麟最廣為人知的觀點是:"Token消耗在未來可能將直接意味著GDP產出。"誰消耗的Token越多,誰的經濟就越活躍。在AI Agent時代,這就是新的GDP演算法。技術路線上,楊植麟是"長文字"和"原生多模態"的堅定信徒。2026年發佈的Kimi K2.5,上下文窗口擴展到200K,並引入了Linear注意力架構和Attention Residuals(注意力殘差),讓馬斯克都直呼"令人印象深刻"。他提出了"智能體叢集"(Agent Swarms)的概念,認為未來的智能將從單智能體向動態生成的叢集進化。2026年3月,月之暗面完成新一輪融資,投前估值180億美元(約1300億人民幣),帳上現金儲備超過100億元。但楊植麟說,"短期內不著急上市"。小結一個時代的註腳。你看這四個人:一個清華土著,一個浙大天才,一個縣城做題家,一個潮汕搖滾青年。46歲,40歲,36歲,33歲。當有的AI公司還在套殼做大模型、卷流量、應付AI考試時,這四個人,正在卷"智能上界"、卷"原創架構"、卷"國產算力"、卷"全球化"。張鵬說:"智能上界決定定價權。" 梁文鋒說:"中國AI不能永遠跟隨。" 閆俊傑說:"AGI是科學,不是魔法。" 楊植麟說:"Token消耗就是GDP。"四句話,四個技術哲學,四種商業路徑。為什麼選擇見他們,而不是見網際網路巨頭?中國AI,正在從"應用創新"轉向"硬核創新",從"跟隨者"轉向"規則制定者"。四小龍全部到位,中國AI的牌桌,重新發牌了。 (奇偶工作室)
不到24小時登頂全球第一!首個全程使用華為AI晶片訓練的大模型來了
近日,智譜AI最新發佈的多模態大模型GLM-Image,在開源不到24小時內,力壓群雄,登頂全球最大開源社區Hugging Face的Trending榜單。關鍵的是,這個模型,從訓練到推理,全程都是跑在華為昇騰AI晶片上的。智譜特別指出,GLM-Image實現了基於昇騰Atlas 800T A2裝置和昇思MindSpore AI框架的全流程訓練及推理適配,實際訓練性能足以達到相應計算裝置的匯報性能上限,驗證了在國產算力上訓練出SOTA模型的可行性。大白話來說就是GLM-Image從資料處理、訓練到推理全過程均基於華為國產晶片,主要依託 昇騰Atlas 800T A2伺服器及昇思MindSpore AI框架,從頭到尾都是純國產,沒有使用輝達等國外硬體。昇騰Atlas 800T A2是一整套面向大模型訓練與推理的AI伺服器系統。是基於昇騰910處理器和鯤鵬920 CPU建構的高性能訓練伺服器。單機通常整合8顆AI處理器,能提供高達2.56 PFLOPS的驚人算力。這在處理多模態模型(如圖像+文字)的海量計算任務時,提供了強大的底氣。昇思MindSpore是華為自研的深度學習AI框架,不僅能跑在雲端(訓練伺服器),還能無縫銜接到手機終端、邊緣裝置,實現“一次開發,到處運行”。在多項國際權威測試中,GLM-Image展現了恐怖的統治力。特別是在CVTG-2K(複雜視覺文字生成) 和LongText-Bench(長文字渲染)榜單中,都拿下了開源模型全球第一。最令人驚喜的是它的文字尤其擅長漢字生成任務。 過去,在圖片中精準渲染漢字一直是AI的噩夢。但 GLM-Image在海報設計、長文字排版、甚至複雜的科普示意圖中,都能寫出工整、精準、有設計感的漢字。GLM-Image的登頂不僅是智譜AI的勝利,也是中國AI產業的里程碑:它證明了國產晶片+國產框架的組合也能夠訓練出世界一流的模型。這在全球算力供應緊張的背景下,為中國AI企業提供了一條技術獨立、風險可控的路徑。實現了算力自主。從此,中國大模型研發正式進入了全端自主、自給自足的新紀元。也向世界宣告,離開特定的外部依賴,我們用自己的晶片,也能訓練出世界第一的模型。 (科技圈觀察)
平均每個月虧3億!從智譜招股書,我看到了大模型競爭的殘酷現實
中國大模型第一股終於來了!12月19日,港交所官網顯示,北京大模型企業智譜已通過港交所聆訊,並揭露招股書檔案,正式衝刺港股「大模型第一股」。作為國外大模型領域最炙手可熱的公司,智譜的商業化堪稱「神速」。過去三年,公司收入分別為0.57億元、1.25億元、3.12億元。以收入計算,截至2024年,智譜是中國最大型的獨立通用大模型開發商、中國第二大整體通用大模型開發人員。但收入光鮮背後,也隱藏著大模型競爭最殘酷的一面:過去三年,公司經調整淨虧損分別為0.97億、6.21億以及24.66億元,成長了20倍以上。到了2025年,光是上半年智譜的虧損就高達17.52億元。算下來,平均每個月要虧接近3億。而截至2025年6月,智譜的現金及現金等價物只剩下了25.52億元。以每個月虧損接近3億來算,智譜的現金流只能支撐9個月左右。這或許也是智譜急於上市的原因。某種程度上說,智譜的招股書不只是一次融資資料的揭露,更像是一份產業切片,第一次將中國大模型公司最真實的處境展現在了我們面前。/ 01 / 營收全國第二,過去兩年復合成長130%,從營收成長看,智譜的商業化進度不可謂不快。2022年收入,智譜還只有0.57億元。到2024 年,已成長到3.1億元,復合年增長率超過130%。 2025 年上半年更是狂飆,短短6個月就入帳 1.9 億元,較去年同期成長325%。別小看這個資料,根據智譜招股書的說法,這個規模已經是國內第二大的模型廠商,市佔率達6.6%。結合招股書中以字母代稱的可比公司訊息,矽基君可以較為明確地判斷,A 至D 分別對應科大訊飛、阿里、商湯和百度,也就是說,智譜在收入規模上僅次於科大訊飛。支撐這一成長的,是一套以MaaS 為核心的商業模式。與其說智譜在“賣模型”,不如說它在交付一整套工程化的大模型能力體系。其核心邏輯不在模型參數本身,而是如何讓模型能力穩定地進入真實業務環境。在模型層面,智譜提供了涵蓋語言、多模態、智能體和程式碼等方向的模型矩陣。根據招股書披露,其模型能力不僅涵蓋語言和多模態視訊,還延伸至程式碼模型、GUI 智能體和電腦應用層面,覆蓋廣度明顯高於其他競爭對手。值得一提的是,這裡E、F公司分別指的是OpenAI和Google,這也從側面說明了智譜試圖對標的能力邊界。這些不同規模、不同能力重點的模型,統一納入同一平台。客戶和開發者無需從零判斷技術路線,而是可以直接根據業務需求,在現有模型組合中選擇合適方案。在應用層面,智譜並未把模型當作孤立的API 來販賣,而是圍繞真實業務流程進行設計。具體來說,平台內建的智能體工作區,提供了面向具體場景的範本和解決方案,客戶可以根據具體需求通過模型微調、增量訓練和提示工程,對智能體進行快速定製,而無需建構完整的開發系統。在基礎設施層面,智譜與算力合作夥伴共同設計和適配底層架構,使平台在運算、網路、訓練通訊和推理加速等環節形成統一能力。這套架構支援從約15 億到2300 億參數規模的模型運行,並能夠實現跨雲端、跨晶片的大規模即時部署。同時,這些模型能力也支援配手機、電腦等個人裝置。如果用一句話概括,智譜做的無非就兩件事:一方面負責“造大腦”,另一方面提供讓大腦在現實系統中運行的“腳手架”,也就是智能體與工程體系。在商業交付上,智譜主要透過兩種方式變現:在地化部署和雲端服務。其中,「在地化部署」是智譜最重要的收入來源,營收佔超過80%。在地化部署本質上是一種高度客制化的交付模式。什麼意思呢?中國的銀行、央企、大型製造工廠,往往對資料安全極為敏感,不願意把核心資料傳到公有雲。智譜AI 就把大模型“打包”,直接部署到客戶自己的伺服器裡,幫他們在其內部環境中建構私有的AI大腦和AI工具。這種模式雖然“重”,但客戶付費能力強。2024年,雖然在地化部署的客戶只有123家,遠低於雲端部署的5,457家,但其收入卻佔了公司總營收的84.5%。在合作開展前,智譜會先從資料基礎與應用情境兩方面評估顧客需求​​,包括模型微調與增量訓練所需的資料條件,以及資料安全與合規要求,並據此明確模型將落地於單一或多情境應用,確定對應的模型規模與複雜度。在此基礎上,智譜會制定客制化服務方案,選擇雲端或在地化部署路徑,並透過模型微調、增量訓練和提示工程完成模型自訂。模型上線後,公司再根據客戶回饋,不斷最佳化模型效能。總的來說,智譜試圖在B端建構了一套可落地且規模化複製的商業邏輯:透過真實業務場景的持續使用,形成模型最佳化與應用擴展相互推動的正向循環,從而逐步強化MaaS 平台的競爭力。/ 02 / 平均一個月燒3億,競爭壓力大如果說收入成長展示的是智譜的“速度”,那在招股書裡更刺眼的,其實是另一條曲線——虧損。雖然智譜的收入成長夠快,但還是架不住虧損比成長跑得更快。2022年,公司經調整淨虧損只有0.97億,還不到1個億。到了2023年,調整淨虧損迅速成長到了6.21億元,漲了500%多。更誇張的是,到了去年這數字乾脆成長到了24.66億元。也就是說,在兩年時間裡,智譜的虧損幅度從不到1個億,成長到了24.66億元,成長了超過20倍。到了2025年,光是上半年智譜的虧損就高達17.52億元。算下來,平均每個月要虧接近3億。這無疑大大消耗了智譜的現金流。要知道,截至2025年6月,智譜的現金及現金等價物只剩下了25.52億元。以每個月虧損接近3億來算,智譜的現金流只能支撐9個月左右。這下大家明白智譜為什麼要急著上市了吧。大模型競爭的慘烈以及強度之高,即使是在一級市場已經拿了16輪融資錢的智譜也抗不住了。而這大幅增加的虧損,最主要的來源就是研發費用。2022年,該公司的研發費用為0.84億元,到了2023和2024年,這一數字迅速增長到5.29億元和21.95億元。拆解開來看,這個21.95億的支出絕大部分都用來支付算力了。其中,算力花了15.53億元,佔了總研發支出的70%。對於研發費用的成長,智譜在招股書裡的解釋是:“主要由於我們自2024年初起戰略性加大研發投入,用於加速新一代旗艦級基座模型及多模態智能體的開發與迭代,相應帶動計算服務費用上升。”在矽基君看來,更接近現實的背景是,競爭環境的急劇變化。2025 年初,DeepSeek R1 的快速崛起,對整個模型產業形成了明顯衝擊。幾乎所有主流模型廠商都被迫提速迭代。在R1 發佈不到三個月的時間裡,智譜一口氣開源了6款核心模型。如此高密度的模型發佈,本質上意味著算力、資料和工程資源的集中投入,而這些成本幾乎都會直接反映在研發支出中。除了研發支出,智譜在行銷費用上也花了不少錢。2022-2024年,該公司的行銷費用從1514萬增長到了3.87億元,其中用於廣告和行銷開支的費用就高達2.37億。如果拋開競爭壓力的話,智譜的毛利率其實不算低。2022-2024年,智譜的毛利率分別為54.6%、64.6%及56.3%。這在專案製為收入大頭的公司裡並不多見,尤其還在如此激烈的競爭之下。公司也正在嘗試透過定價策略來改善結構:一方面,根據使用量、效能需求和進階功能,最佳化分層定價,引入更具彈性的方案,以擴大客戶基礎,並對高資源消耗模型設定使用限制,引導高需求客戶選擇高價值方案;另一方面,與高價值客戶協商客制化定價,使價格更能反映客戶獲得的業務價值和服務成本。但相較於定價本身,更根本的問題在於,智譜的商業模式隱含了一個前提:模型能力必須長期維持在產業第一梯隊。而這個前提的成本,正以遠快於收入成長的速度上升。在大模型競爭中,能力領先不再是一次性投入,而是一場持續消耗算力、資本和組織能力的長期戰役。對一家仍處於商業化早期的公司而言,這樣的門檻,已經明顯超越了傳統新創公司的承受區間。這也是目前大模型賽道最殘酷的現實之一。/ 03 / 中國AI落地真實切口:token 消耗激增,付費答案在B端當然,除了具體的業務資料,智譜的招股書裡還透露出幾個更值得關注的產業訊號。第一,AI 的真實價值正在被使用量驗證。一個直接的指標是token 消耗量的變化。 2022 年、2023 年、2024 年12 月以及2025 年6 月,智譜平台的日均token 消耗量分別達到 5 億、21 億、0.2 兆和4.6 兆。短短兩年多時間裡,這項指標幾乎以數量級的速度攀升。無論商業模式如何演進,持續放大的真實呼叫本身,已經說明大模型正在被大量嵌入具體工作和業務流程中。第二,中國AI 的付費重心仍在企業端。招股書資料顯示,2024 年中國大語言模型市場規模約為人民幣53 億元,其中機構客戶貢獻47 億元,個人客戶僅6 億元。展望2030 年,整體市場預計成長至1,011 億元,其中企業級市場規模將達904 億元。這一結構與美國市場形成了鮮明對比。以OpenAI 為例,其當前​​收入中約75% 來自消費者訂閱。這背後反映的不僅是產品形態差異,而是中美兩地在AI商業化路徑上的分化:中國市場更強調組織級效率提升,美國市場則更容易從個人工具切入。第三,智譜再次系統性地揭露了其對AGI 演進路徑的理解。智譜認為,AGI分為以下5個階段:1)在預訓練階段,模型學習理解、生成並使用人類語言進行基本溝通。2)在對齊與推理階段,模型進一步與人類意圖對齊,具備推理與規劃能力,同時提升安全性、降低幻覺,並實現語言能力與影像、視訊、語音及行動能力的協同。3)在自主學習階段,模型透過自我評估、自我反思與沉思機制,從自身的推理過程與行為結果持續改善能力。4)在自我認知階段,模型在較少或無需人工監督的情況下,透過對自身行為和推理結果的持續觀察與分析,逐步形成穩定的內部表徵和決策偏好。5)在意識智能階段,模型能夠對自身內在狀態及外在環境進行更有系統的感知與建模,展現出更高層次的環境理解與自我調節能力。目前,智譜推出的具備反思能力的智能體AutoGLM-Rumination,已進入其定義的「自主學習階段」。/ 04 / 總結回到整體來看,智譜的招股書不只是一次融資材料的揭露,更像是一份產業切片。一方面,它展示了大模型商業化正在加速落地,真實使用量和企業付費意願都在持續放大;另一方面,它也清晰地暴露出這條賽道的殘酷現實——能力領先需要持續、重資本投入,而競爭強度正在迅速抬高門檻。在這樣的環境下,智譜既是受益者,也是承壓者。這或許正是當前中國大模型公司最真實的處境。 (硅基觀察Pro)