#智譜
不到24小時登頂全球第一!首個全程使用華為AI晶片訓練的大模型來了
近日,智譜AI最新發佈的多模態大模型GLM-Image,在開源不到24小時內,力壓群雄,登頂全球最大開源社區Hugging Face的Trending榜單。關鍵的是,這個模型,從訓練到推理,全程都是跑在華為昇騰AI晶片上的。智譜特別指出,GLM-Image實現了基於昇騰Atlas 800T A2裝置和昇思MindSpore AI框架的全流程訓練及推理適配,實際訓練性能足以達到相應計算裝置的匯報性能上限,驗證了在國產算力上訓練出SOTA模型的可行性。大白話來說就是GLM-Image從資料處理、訓練到推理全過程均基於華為國產晶片,主要依託 昇騰Atlas 800T A2伺服器及昇思MindSpore AI框架,從頭到尾都是純國產,沒有使用輝達等國外硬體。昇騰Atlas 800T A2是一整套面向大模型訓練與推理的AI伺服器系統。是基於昇騰910處理器和鯤鵬920 CPU建構的高性能訓練伺服器。單機通常整合8顆AI處理器,能提供高達2.56 PFLOPS的驚人算力。這在處理多模態模型(如圖像+文字)的海量計算任務時,提供了強大的底氣。昇思MindSpore是華為自研的深度學習AI框架,不僅能跑在雲端(訓練伺服器),還能無縫銜接到手機終端、邊緣裝置,實現“一次開發,到處運行”。在多項國際權威測試中,GLM-Image展現了恐怖的統治力。特別是在CVTG-2K(複雜視覺文字生成) 和LongText-Bench(長文字渲染)榜單中,都拿下了開源模型全球第一。最令人驚喜的是它的文字尤其擅長漢字生成任務。 過去,在圖片中精準渲染漢字一直是AI的噩夢。但 GLM-Image在海報設計、長文字排版、甚至複雜的科普示意圖中,都能寫出工整、精準、有設計感的漢字。GLM-Image的登頂不僅是智譜AI的勝利,也是中國AI產業的里程碑:它證明了國產晶片+國產框架的組合也能夠訓練出世界一流的模型。這在全球算力供應緊張的背景下,為中國AI企業提供了一條技術獨立、風險可控的路徑。實現了算力自主。從此,中國大模型研發正式進入了全端自主、自給自足的新紀元。也向世界宣告,離開特定的外部依賴,我們用自己的晶片,也能訓練出世界第一的模型。 (科技圈觀察)
智譜和MiniMax,大模型的兩種“活法”
1月8日,全球大模型第一股智譜正式登陸港交所,另一家大模型獨角獸MiniMax緊隨其後掛牌,短短兩天內的密集上市動作,將中國AI大模型的商業敘事推到了幕前。作為國產大模型的“雙雄”,智譜和MiniMax的上市處理程序一直備受關注。兩家同為“中國AI六小龍”中的佼佼者,上市前估值均在500億港元左右,都刷新了近年AI新股的認購熱度。截至撰稿日,智譜和MiniMax的市值分別約為800億港元和1100億港元,估值差距較上市前進一步拉大。其中,智譜表現得穩打穩紮,而MiniMax則熱度更高。資本市場的熱烈反應固然引人注目,但兩家大模型獨角獸截然不同的戰略基因和商業化路徑,能否為國內大模型行業提供可驗證、可複製的發展範式,才是接下來最大的懸念。1“清華系”花開兩朵作為兩家誕生於ChatGPT爆發前的AI企業,智譜AI CEO張鵬和MiniMax創始人閆俊傑,他們都是堅定的AGI(通用人工智慧)信徒。但黎明前的黑暗總是漫長,要在無人知曉時堅定信念,他們也經歷了更多的“孤獨時刻”。張鵬紮根於清華大學電腦系知識工程實驗室(KEG),該實驗室於2016年推出了科技資訊分析引擎AMiner。2019年,張鵬帶領團隊獨立出來,正式創立了智譜AI。巧合的是,閆俊傑也在清華大學電腦系進行博士後研究。他在博士期間曾是百度AI研究院的實習生,後來加入了商湯科技,從實習生一路升至集團副總裁,曾主導深度學習工具鏈及通用智能技術體系搭建。可以看出,在成為兩家獨角獸企業的創始人之前,張鵬和閆俊傑便已經在各自的領域完成了一定的人工智慧技術積累,讓他們能夠更早地看到AI時代的風口時間的指針來到2021年,彼時人工智慧還是一個在角落裡沉寂的賽道,最火的創業賽道還是連Facebook都要為之更改企業名稱的元宇宙。但在同一年,智譜已經拿下億元A輪融資,正式從“科研實驗室”向“大模型商業化賽道”轉身,並在 2022年8月研發出中國最早的千億大模型之一。2022年,帶著“要讓普通人感受到AI帶來改變”的使命,閆俊傑離開了商湯科技副總裁的位置,並創立了MiniMax,奔著AGI的目標前進。閆俊傑認為,只做特定任務的AI已觸及商業化天花板,而通用人工智慧無需定製,也能形成標準化產品並服務海量使用者,這才是創造規模化價值的終極方向。張鵬的創業理念有著更濃烈的“理想主義”色彩。他坦言,成立智譜的初衷並非單純追求盈利,而是在產業中推進工作,更符合當前人工智慧發展的需求。後面的故事大家也都知道了。2023年初,ChatGPT-4正式發佈,AI大模型很快就成為了普通人也能感知到的技術浪潮。隨後,國內網際網路大廠紛紛推出了自研大模型,月之暗面、零一萬物等大模型初創企業也如雨後春筍般湧現,智譜和MiniMax開始感受到更緊迫的商業化壓力。從這時候開始,智譜和MiniMax逐漸走向了分岔路。作為一家脫胎於清華大學實驗室的企業,“根正苗紅”的智譜背後不乏國資的身影,比如杭州城投、上城資本、珠海華發等。在與國資深度繫結的背景下,智譜也收穫了更多政企客戶以及學術圈客戶,比如為高校等科研單位開發“AI +學術搜尋產品”、與珠海華發合作開發的“智譜+珠海華發空間”項目等。如果說智譜是不折不扣的“學術派”,那麼MiniMax則更像是四處開花的“野戰派”。從融資背景來看,MiniMax背後更多是科技大廠和國際投資者,比如阿里、騰訊、小紅書,以及阿布扎比投資局、韓國未來資產等,它們為MiniMax打開了廣闊的海外市場。閆俊傑更追求大模型的泛化性,他認為,一個強技術的公司不應該是個賣技術的公司,而是一家技術驅動產品的公司,這也決定了MiniMax將更聚焦於C端市場。2To B向左,To C向右背景和資源不同,這兩家AI獨角獸企業的技術路徑和商業化之路也大不相同。智譜選擇了自研不同於OpenAIGPT架構的GLM(通用語言模型)路徑。張鵬曾表示,國產大模型要實現自己的創新,不能照搬世界頂尖水平的技術路徑。GLM架構在處理語言任務時能同時利用前向和後向資訊,在長文字理解、邏輯推理和低幻覺率方面更有優勢。張鵬表示,理論上GLM的訓練效率會比GPT更高。此外,智譜堅持全端自主可控的技術路線,也幫助智譜在政企市場贏得了獨特的信任優勢。根據招股書,智譜已成為中國收入規模最大的獨立大模型廠商之一。2022年至2025年上半年,分別實現營收5740萬元、1.245億元、3.124億元、1.9億元,年複合增長率達到 130%。(圖源:智譜招股書)公司主要通過MaaS(模型即服務)平台提供本地化部署和雲端API服務。2024年,智譜本地化部署收入佔總收入的84.5%,主要面向對資料安全有高要求的政府、金融、能源等機構客戶,為他們提供定製化模型解決方案。(圖源:智譜招股書)聚焦於B端路線的商業模式,為智譜帶來了更穩定、更高毛利率的收入,公司毛利率長期維持在50%以上。但硬幣的另一面,以本地化部署業務為主的商業模式,也帶來了交付周期長、定製化需求高、客戶集中度高、規模化難度大等挑戰,難以支撐長期可持續增長。為了突破這一瓶頸,智譜也在加速向雲端轉型,其雲端部署業務在總收入中的佔比已從2022年的4.5%提升至2024年的15.5%。張鵬表示,希望將API業務的收入佔比提升至一半。不同於智譜做AI時代“算力基建”的商業化路線,MiniMax走出了一條C端產品出海路線。閆俊傑的觀點非常明確,他認為大模型技術再好,也必須要有足夠好的產品能力承接。這種“模型即產品”的理念,頗有字節跳動“APP工廠”打法的味道。但對於起步較晚的MiniMax來說,如何趕上進度才是關鍵。為此,閆俊傑押注的是MoE專家混合模型,可以在不增加太多計算資源的情況下,讓模型變得更加複雜和強大。MiniMax透露,其基於MOE+ Linear Attention推出的新一代模型,與GPT-4o同一代模型相比,處理10萬token時效率可提升2-3倍,並且長度越長,提升越明顯。這一輕量化設計,使MiniMax在高算力消耗的C端市場中更具成本優勢。目前,MiniMax的代表產品包括文生視訊功能的“海螺AI” 、AI情感陪伴應用的“星野/Talkie”等。截至2025年前三季度,MiniMax超七成收入來自海外,C端AI應用貢獻約71%的收入,主要採取“廣告+訂閱+內購”的變現模式。火爆的C端應用也為MiniMax積累了不少使用者,其AI原生產品矩陣平均月活使用者達2760萬,累計使用者超2.12億,僅Talkie/星野一款產品就積累了1.47億使用者。(圖源:MiniMax招股書)過去三年,MiniMax的收入也呈現出爆發式增長,2023年-2025年前三個季度,分別為350萬美元(約為人民幣2464.4萬元)、3050萬美元(約為人民幣2.2億元)和5340萬美元(約為人民幣3.8億元)。(圖源:MiniMax招股書)不過,儘管MiniMax的收入增速遠超智譜,但C端模式的脆弱性也顯而易見,MiniMax的毛利率長期低於智譜,2025年前三季度 ,核心C端業務的毛利率僅有4.7%。對於MiniMax來說,如何突破使用者增長的天花板,不斷提升使用者的付費意願,以及應對海外市場的監管風險,將會成為驗證其“以產品打天下”模式能否跑通的關鍵。3雙雄競速,殊途同歸六年時間的演進,智譜和MiniMax已經進化成為兩個物種,本該一個朝左,一個朝右,成為兩條平行線。然而,兩者幾乎在同一時間向資本市場發起衝擊,又不可避免地被置於同一聚光燈下,面臨一個共同的現實——大模型企業仍在虧損。2022-2024年,智譜的淨虧損分別為1.44億元、7.88億元、29.58億元,2025年上半年虧損23.58億元;同期,MiniMax淨虧損分別為7370萬美元、2.69億美元、4.65億美元。2025年前三季度為5.12億美元。兩者的虧損金額都在持續擴大,且尚不具備自造血能力。對於智譜和MiniMax,燒錢大頭依然是大模型的研發和算力。2024年,智譜的研發投入高達21.95億元,是當年營收的7倍;MiniMax的研發支出也差不多是收入的6倍,兩者70%-80% 的研發投入都花在算力上。此外,MiniMax早期在全球市場的行銷和使用者獲取上也投入巨大。2024年,其銷售與市場費用佔總收入的285%。不過,MiniMax去年的銷售及行銷支出已有下滑,閆俊傑曾公開表示,不願意投入大量金錢在沒有價值的投流上,更傾向於通過產品本身的能力來吸引使用者。因此,儘管智譜和MiniMax都呈現出“高增長、高投入、未盈利”的共同特徵,但講出來的故事不同,資本市場也呈現出不同的態度。從上市前的認購情況來看,MiniMax的熱度明顯高於智譜。上市首日,智譜盤中一度破發,收盤價較116.2港元/股的發行價上漲13.17%;MiniMax收盤價較165港元/股發行價上漲超109%。有關注AI的投資人表示,在中國市場,投資者一般把C端公司的優先順序置於B端公司之上。MiniMax講了一個C端產品故事,使用者規模和商業模式的天花板更高;智譜的增長具備可預測性,爆發速度往往不及C端模式,前者往往更受資本市場青睞。但目前來看,兩家公司都處於上市初期,正針對各自業務短板加速調整與最佳化,當下很難判斷到底那種路徑會更為正確。但可以肯定的是,智譜和MiniMax的上市,為國內大模型企業提供了更清晰的參考範本,也將大模型行業從單純的“技術敘事”推向“商業敘事”。面對國外大模型在技術上的領先優勢,以及國內大廠的飽和式進攻,大模型初創企業想要在牌桌上贏得一席之地,必須在商業模式上找到自己的差異化路徑。技術驅動固然重要,但更重要的,是真正能讓客戶埋單的好產品,而不僅僅是好模型。中國AI獨角獸,必須跨越技術的淺灘,潛入資本的深海,才能錘煉真正的商業內功。所以,上市並非大模型企業的終點,而是一個更充分展示自己的機會和挑戰。在全球投資者的審視之下,無論是智譜還是MiniMax,還是後續更多能夠登上資本舞台的大模型企業,它們都必須回答同一個問題:在燒錢換未來之後,誰能真正活到未來。大模型企業的“子彈”有限,然而,隨著市場不斷拓展,規模優勢也可能轉化為成本壓力。屆時,誰能打造更輕量化的模型,將算力成本壓得更低;誰能用更少的算力完成同樣的任務;誰能率先跑通商業模式,進一步攤分算力成本,都會成為新的競爭焦點。通往AGI的路徑註定漫長,但當下的全球大模型行業,已經不願意只聽“故事”了。 (伯虎財經)
牌桌被掀,中國模型換了一種贏法
AI這場“絕命遊戲”中,IPO是勇士的勛章。AI圈今天的大事,大家都知道了。2026年1月8日,中國AI大模型初創公司智譜,正式在港交所掛牌上市,成為“全球大模型第一股”。一天後,另一家模型公司MiniMax,也將緊隨其後敲鐘。技術變革僅僅席捲三年,站上潮頭,實屬不易。2023年,這些AGI(通用人工智慧)的理想主義者,快速被推至台前。伴隨著高估值、高起點而來的,難免是最為嚴苛的審視和比較。比如2025年初,DeepSeek的異軍突起,促使六小虎中的幾家不得不迅速調整業務、裁撤團隊,才度過了至暗時刻。在厚雪長坡的大模型領域,任何暫時的落後、誤判,都會成為“德不配位”的佐證。即便在順利IPO的當下,比起祝福,帳上的虧損才更是人們的談資。但我們往往忽略了,恰恰是這一群資金不算雄厚、試錯成本卻不低的大模型創業公司,標記了中國大模型處理程序的幾個重要節點。中國首個MoE(混合專家架構)大模型,出自智源“悟道”,首款爆款AI應用Kimi,來自月之暗面。後來,全球首個能操作手機的通用Agent,是智譜發佈的AutoGLM,比後來的豆包手機早了整整14個月;現如今,全球首家IPO的大模型初創企業,也是來自中國的智譜。比起摳招股書上的虧損,如今對前沿創新型行業、對創業者們而言,更有價值的命題在於,分析這幾家中國大模型創業公司如何在競爭殘酷的大模型賽道呈現出強大的生命力,並如何一直在AI馬拉松上領跑。IPO,無論對於智譜和MiniMax,還是對於正在路上的科技創業者而言,都是一個樂觀的訊號——這意味著,創新者不會被時代輕易地拋棄。01. 六小虎重奪榮耀將時間倒回一年前,年初DeepSeek V3、R1的口碑爆發,讓六小虎一度迎來口碑和市場份額的至暗時刻。創新的訓練和推理架構,讓DeepSeek一躍成為國際上知名度最高的中國大模型,為了同開放原始碼的DeepSeek爭取市場聲量,六小虎也不得不忍痛割去閉源的部分利潤,快速跟進。於是,“失意”便成為了常態。脈脈資料顯示,截至2025年7月,41.07%的六小虎員工,將自己的狀態改成了“求職中”。但出乎意料的是,2025下半年以來,在模型研發的突破上,六小虎展現出了遠超預期的爆發力。“基座模型的性能,就是模型廠商的競爭力。”DeepSeek的掀桌,讓模型行業迅速拉齊了這一共識。其中,頗具火藥味的一幕發生在2025年7月。為了爭奪全球開源模型的SOTA的位置,各個玩家都使出了渾身解數。智譜的一名投資人告訴我們,DeepSeek之後的每一次模型迭代,智譜的員工都抱著“背水一戰”的信念,將性能打磨到“最Sharp”。2025年7月28日發佈的GLM-4.5,首發48小時內就一躍沖上Hugging Face的全球熱門榜榜首。同年9月,GLM-4.5在權威模型競技場ChatBot Arena及WebDev Arena全球排行榜中,還穩居全球前五。背水一戰的成果,是行業的良性競爭:旗艦模型的迭代節奏不僅更快,迭代質量還一直保持線上。GLM-4.5發佈僅兩個月後,智譜又交出了在Coding能力上與Anthropic、OpenAI並列第一的GLM-4.6;3個月後,在主流基準測試中,程式碼能力對齊Claude Sonnet 4.5的GLM-4.7,又緊接著開源。12月,在模型綜合能力榜單Artificial Analysis中,GLM-4.7獲得開源模型與國產模型雙料榜首。圖源:Artificial Analysis今天,智譜創立發起人兼首席科學家唐傑發佈內部信,宣佈將很快推出GLM-5。信中表示,在智譜旗艦模型GLM-4.7發佈後,其MaaS ARR年化收入從2000萬增至超5億,10個月獲25倍增幅,與Anthropic指數級增長同頻。另一個反轉的事實是,一度被認為“受到DeepSeek毀滅性打擊”的B端業務,反而在下半年成為了“確定的錢”。即便一舉動搖了B端市場,但DeepSeek的爆火,也變相完成了對企業客戶的市場教育。線性資本董事總經理鄭燦曾在媒體採訪中直言:“DeepSeek的作用,尤其體現在市場教育方面,格外節省了成本。”與此同時,企業客戶也意識到,強調模型能力的同時,B端服務是一套強調模型廠商行業認知、服務能力的體系。這意味著,理解企業的業務,為企業提供基於專業資料的定製化訓練和部署服務是有門檻的。很快,一些B端客戶發現了部署DeepSeek的弊端:幻覺多,在真正理解業務上有短板——半年後,市場對DeepSeek的追捧回歸了理性。相對地,做大了的B端蛋糕,被那些具有成熟服務能力的模型廠商承接了下來。最具代表性的案例,是以大模型API呼叫為主要商業模式的智譜。全球大模型平台OpenReutor的資料顯示,GLM-4.5和GLM-4.6自上線以來,呼叫量穩居全球前10,同時付費流量收入超過所有國產模型之和。更重要的是,大模型在B端的商業化生態,也逐漸擺脫“專做政企市場”“髒活累活”的刻板標籤,變得愈發成熟健康。智譜高級副總裁吳瑋傑在小紅書表示:在智譜的客戶群中,G端客戶不到20%,網際網路佔比50%;同時,公司本地化的毛利率一直保持在60%以上,是傳統公司均值的2倍,帳期也遠低於行業平均水平。在招股書中,我們或許只能看到,2025年上半年,來自本地化部署的收入佔比高達84.8%。但招股書無法顯示的一面是,隨著GLM-4.5等一系列高性能模型的發佈,API呼叫和訂閱,已經逐漸代替本地化部署,成為智譜收入的第一增長曲線。據36氪瞭解,僅智譜MaaS開放平台(bigmodel.cn)中面向開發者的訂閱產品GLM Coding,ARR在上線2個月內,就快速突破了1億元。2025年全年,智譜MaaS同比增速超900%,冪次增長態勢顯著優於海外龍頭同期表現。歸根結底,誰掌握最前沿的技術,誰就掌握了商業遊戲的制定權。02. 從“中國的OpenAI”轉向“世界的中國模型”一年前,以OpenAI為靶點的追趕,是一種常態。直到2024年末,AI資深從業者之間的共識,還是中國大模型與OpenAI差了將近6個月的時間。這也導致,OpenAI任何一次的模型更新和發佈,都會引發中國AI創業者的“被吞噬恐慌”。OpenAI創始人兼CEO Sam Altman曾直言:任何試圖在我們爆炸半徑內建立的初創公司或產品,都會被碾壓。今年開始,一個在模型領域悄然發生的轉變是,成為“中國的OpenAI”或者“中國的Anthropic”,不再作為一種定位或目標,被中國廠商們頻頻提起。中國模型被世界看到,已經是確定性的事實。其中的主力軍,不全然是資源優渥的大廠,而是幾家“續航能力”一度不被看好的六小虎。海外的商業化表現,是中國模型被海外市場認可和接納的側面印證。在兩家“六小虎”最近披露的招股書中可以看到,2025年截至9月30日,MiniMax的境外收入,佔到了總收入的73.1%。受到美國出口管制的智譜,看似在海外最大的北美市場失去了入場機會。但出人意料的是,36氪獲悉,智譜面向開發者的模型業務獲得自全球184個國家的15萬開發者每月付費。這意味著,無論是模型能力,還是性價比和落地場景,中國模型初創公司都有獨特的優勢。先來看一個美國開發者案例。2025年9月,一名來自美國的資料科學家Manpreet Singh發帖,控訴Anthropic旗下的Claude Code能力存在缺陷——早些時候,Anthropic官方也承認,由於推理堆疊的更新問題,Claude Opus 4.1和Opus 4的質量的確有所下降。但相對地,包含Claude Code使用權益的最低訂閱價(Pro方案,不包含Opus 4.1的使用權益),也要每個月17美元(合人民幣約120元)。最後,這名資料科學家轉向使用智譜旗下的模型GLM-4.5。他在部落格中提到,GLM-4.5的Coding性能接近Claude Sonnet 4,但API價格僅為後者的1/7,包含Coding功能的GLM Coding Plan,月費最低僅20元人民幣,價格是Claude Code的1/6。這是中國大模型的高性價比,被世界看見的一個縮影。智譜的模型GLM-4.6,這一年來出現在全球最大推理晶片公司Cerebras,主流AI平台Cline、Kilo、Vercel,以及AI Coding頂流工具Cursor和Windsurf的產品服務、基座模型中。月之暗面的Kimi-K2、MiniMax的模型,近期也上架了亞馬遜雲科技的模型服務平台Bedrock。此前,矽谷基金Social Capita的創始人Chamath Palihapitiya,就公然帶頭“倒戈”中國模型。將大量工作負載轉向Kimi K2後,他評價:“K2的性能確實足夠強,而且說實話,比OpenAI和Anthropic便宜太多了。”用高性價比,重建大模型的定價秩序,只是中國模型的一個側面。中國獨立模型開發廠商的存在,為全球客戶提供多元化的模型選擇、建立健康的商業生態,有至關重要的意義。其中一個典型案例是,2025年初,智譜拿下了某“一帶一路”國家的海外訂單,價值千萬美元。近期馬來西亞宣佈其國家級MaaS平台,基於智譜Z.ai的開源基礎模型建構。知情人士曾告訴36氪,這些訂單的性質,是“國家級主權大模型”的共建——出於國家資料安全的考量,第三方獨立模型廠商,將承擔愈發重要的角色。“在美國或歐洲競爭對手之前,(智譜)將中國的系統和標準鎖定在新興市場。”這股獨立力量的崛起,也引起了OpenAI的重視。2025年6月,OpenAI分析師發現,智譜在多個地區獲得了政府的訂單。他們評價:“智譜展示了一種負責任的、透明的、隨時可審計的中國AI替代方案。”這意味著,中國大模型絕對不是“平替”。正如智譜高級副總裁吳瑋傑所言:“中國開始輸出主權大模型,替國家建構數字主權。”03. 什麼是大模型的長期主義?在這個時間節點,很多人可能忘記了2023年初的景象。彼時技術的黑箱、高昂的成本,都讓大模型創業成為一場“絕命賭局”。美團聯合創始人王慧文最早躬身入局大模型賽道時,曾對36氪“智能湧現”直言:“現在(AI領域)我覺得大家要同舟共濟,別互相拆台。”“勇於踏上這條路的人我都鼓掌,上路的都是勇士。”兩年的時間,滄海桑田。六小虎之中,已經有兩家公司擱置了基座大模型的預訓練,或聚焦業務,往醫療這一垂類領域發力,或開始轉型,做各類行業解決方案。“活下去”,對大多數大模型創業公司而言,成為比“探索智力上限”更重要的命題。帳上的虧損,是這場“絕命賭局”的一個註腳。招股書顯示,智譜和MiniMax,兩家公司在過去三年裡燒了近110億元。其中,將近70%的支出用於模型研發。尤其是智譜,2024年研發投入高達21.95億元,佔當年總支出的約80%。曾有人將大模型之戰,比喻為“看不到終點,也停不下來的征途”。畢竟,每個先進模型的領先窗口,往往只有幾個月;而對於資源並不充沛的初創企業而言,每一次模型訓練,都是燃燒在數萬、數十萬張算力卡上的賭局。但如今,行業中形成的共識是:依然需要有人去做“難而正確”的事。科技行業的殘酷性在於,只有成功的一瞬會被銘記。但在這一瞬背後,創新者的投入是難以計量的。比如,在ChatGPT引爆科技圈的那個冬天之前,OpenAI已經蟄伏了近7年——前期GPT-1、GPT-2等“無名成果”的經驗累積,才造就了GPT-3.5。再比如2025年初一鳴驚人的DeepSeek,如果沒有此前團隊在MLA、新MoE架構、self-play等技術上的一系列創新,就不會有V3和R1的突破——其中的投入,是梁文鋒在訪談中隱隱透露的“與頭部大廠匹配的人才薪資”“不設上限的算力額度”。這也意味著,AI領域的長期主義,是持續創新和投入的定力。在玩家紛紛轉型或退場的當下,留在牌桌上的大模型公司,都是勇士。平心而論,MiniMax和智譜披露的虧損,是AI發展仍處於早期的證明,也是創新所需代價的客觀憑證。如果將110億元,與未來大模型能撬動的千億、兆增強相比,顯然是ROI極高的一筆投入。對於多數行業而言,IPO是一家企業的業務已經進入成熟期的標誌。但放置仍處於發展早期的AI行業,IPO有著更為深遠的意義。隨著近一年來,騰訊、字節、阿里的持續高調入場,大模型初創公司面對的競爭愈發白熱化。但市場仍然需要獨立的第三方開發廠商。事實證明,如今AI領域重要的創新和發佈,大多來自幾家初創企業。無論是海外的OpenAI、Anthropic,還是DeepSeek和留在牌桌上的幾家六小虎們——初創企業更為靈活的組織形態、不被業務慣性拖累的運行模式、更加中立,是大廠無可比擬的優勢。比如智譜此前對外表示,前十大網際網路公司九家都在用他們的模型,幾乎涵蓋所有頭部網際網路大廠的coding平台。IPO對資金籌措的好處是顯而易見的。比如,智譜此次IPO募資規模預計達43億港元——募資的效率,遠超面向一級市場的融資。更重要的是,IPO為中國模型公司,開闢一條通往世界的通道。當下,中國第一梯隊的模型公司,即便技術能力已經達到與國際一流廠商掰手腕的水平,但估值和市場認知度,依然與之相差甚遠。比如,法國AI模型公司Mistral AI的最新估值為140億美元;IPO前,MiniMax的估值約42億美元,智譜估值為243.8億元(約35億美元)。兩者的估值之間,幾乎有3-4倍的差距。上市的好處是顯而易見的:智譜和MiniMax將有望獲得更公允的價值評判,以及更廣泛的國際影響力。IPO後,智譜的市值預計超過500億港元,是此前估值的約2倍。與此同時,在廠商競爭力某種程度上也是人才競爭力的當下,IPO讓初創公司,在國際上有了更響亮的人才號召力。在這一意義上,對繼續攀登AGI高峰的勇士而言,IPO是給長期主義者的獎勵,給創新者的勛章。 (36氪)
成為大模型第一股後,智譜董事長首次發聲:談2513、“燒錢與造血”
1月8日,智譜在香港掛牌交易,股票程式碼後四位是“2513”,諧音是“AI我一生”。智譜首日開盤漲幅 3.27%,報120港元/股,市值528億港元。在智譜本次IPO發行中,香港公開發售獲1159.46倍認購,國際發售獲15.28倍認購。以每股116.20港元的發行價計算,智譜本次IPO募資總額超43億港元(“綠鞋”前)。智譜正式成立於2019年,但是它的故事可以追溯到2006年。那年,清華大學KEG(知識工程實驗室)發佈了一款名為AMiner的科研情報挖掘平台,用人工智慧挖掘科學發展的客觀規律。這個系統覆蓋220個國家和地區,累計訪問量超過1000萬次,成為全球科研人員的重要工具。這套系統最終在2019年走出實驗室,成為智譜AI的技術基因。在2026年的開年,智譜的故事迎來高光時刻。承載著這些技術基因的理工男,用一串數字,承諾“終一生成就AGI夢想”,頂著“全球大模型第一股”的光環,等待著資本市場的現實檢驗。但這註定並非一場輕鬆的加冕禮。從發佈招股書的那一刻起,全世界第一次獲得了可以透明化、全方位審視一家大模型企業的商業模式的機會。在高昂的算力成本壓力下,Token的邊際成本能不能實現網際網路式的規模效應?基座大模型公司賣的到底是具備稀缺性的“智力”,還是變相的“算力轉售”?AI時代的MaaS(模型即服務)會不會陷入SaaS(軟體即服務)曾經遇到的增長困境?巨大的研發投入和當下巨額的虧損,何時才能轉化為正向的商業收益?除了商業意義,智譜的身上在某種程度上也承載了中國AI產業的夢想,被笑稱為“全球AI競賽中的‘中國隊長’”。智譜AI曾經在模型發佈節奏上緊咬OpenAI,在模型的矩陣上,也對標OpenAI的佈局。OpenAI曾在名為《Chinese Progress at the Front》的報告中明確指出,智譜在多個維度取得了顯著進展,並將智譜列為主權AI競爭下的核心對手。上市是一個重要的里程碑,“不管智譜融了多少錢,拿了多少收益,其實都是通往AGI道路上的盤纏。”智譜管理層在對外交流的時候,說過的這句話曾經給行業留下很深的印象。“全球大模型第一股”稱號加身,智譜的的基石投資陣容也十分豪華,包含北京核心國資、頭部保險資金、大型公募基金、明星私募基金和產業投資人。JSC International Investment Fund SPC、JinYi Capital Multi-Strategy Fund SPC、Perseverance Asset Management 等11家基石投資者合計認購29.8億港元。2026年的開年,高光和壓力之下的智譜,也正站在大模型從“技術可用”向“場景好用”轉化的關鍵臨界點,在正式敲鐘之前,智譜董事長劉德兵首次深度講述了智譜如何在未來建構一個可驗證、可持續的商業故事。01AGI長跑,已經到了 L3Q:智譜的程式碼挺有意思的是 2513 ,諧音是 “AI 我一生”?劉德兵:希望是智譜送給所有AGI信仰者的一個彩蛋,在L1到L5的漫長征途中,還是需要這種浪漫主義的信念的。同時,也想告訴世界,我們是長跑的選手,會把一生都投入到“讓機器像人一樣思考,用可信賴的 AI 讓人類更美好”的這個事業中來。Q:從智譜的定義來看,現在AGI到那個階段了?劉德兵:我們目前正處於 L3(第三級)階段。這一階段的核心特徵是智能體(Agent)與自主學習能力的初步顯現。AI 不僅在多個領域實現了“可用”,而且正變得越來越“好用”。雖然距離完全實現像人類一樣思考的 AGI 目標仍有一段距離,但我們正處在這一關鍵的躍遷過程中。Q:智譜已經成為“全球大模型第一股”,未來在這次大考中取得優異成績,背後最關鍵的衡量標尺有那些?劉德兵:IPO 這件事,我們覺得最重要的是對“技術邏輯能否跑通商業邏輯”的實戰檢驗。我們內部復盤時,主要看這三個維度的表現:第一,看收入結構和增長質量。 2024 到 2025 年,智譜的複合增長率達到了 130%。這背後其實是三條線在同時發力:雲端 MaaS、訂閱服務,以及企業本地化部署的需求都在同步釋放。第二,看底層技術到底在什麼位置。 拿測評資料來說,在 Artificial Analysis 的榜單裡,GLM-4.7 拿到了 68 分,目前是國產模型和開源模型裡的第一,全球排在第六。第三,看生態的實際滲透率。 2025 年我們加大了開源力度,特別是像 AutoGLM 這種核心能力的開放。目前智譜開源系列在全球的累計下載量已經超過了 6000 萬次。這個資料對我們來說,意味著模型已經真正進入了開發者的工作流裡。未來也會持續觀測這幾個指標。Q:行業有個半開玩笑的話,大模型的Benchmark已經被“刷廢了”,除了“刷榜”,您覺得還有什麼能看出技術的含金量?劉德兵:但是Benchmark 還是具有參考意義,一個好的基礎模型,Benchmark肯定不會差。但是我們還會考慮更多綜合標準。模型在實際應用中的表現,以及能否長期處於全球開發者的第一線被選擇、被驗證,這個更重要。Q:國際開發者對智譜的模型是怎樣的評價呢?劉德兵:反饋還挺正向的。像程式碼應用 Windsurf,雲平台 Vercel,等都接入了智譜的 GLM 模型 。 在全球大模型呼叫的排行榜 OpenRouter 上,國內模型裡智譜的付費呼叫量是排第一的 。GLM Coding Plan才上線兩個月,全球就有超過 15 萬開發者在付錢用,一年算下來收入(ARR)已經過億了 。Q:這是因為性價比,還是技術含金量?劉德兵:我覺得是綜合考慮,首先技術肯定不能差,起碼要達到一線的水平,然後大家會考慮成本。對於開發者,類似於大模型領域的“票友”,他們更看重模型能力,但是如果商用,更考慮性價比。智譜的價格還是很有優勢的,比如和Claude比較,API呼叫價格差不多只有它的七分之一。Q:在開源社區中,發佈新模型之後,獲得的是自來水流量嗎?還是有體系化的主動營運?劉德兵:更多的還是自來水,我們不會在營運上投入太多的資源。Q:智譜曾經在模型矩陣上全面對標 OpenAI,當時基本上是緊咬其節奏發佈新模型。未來,智譜對於中國市場的差異化路徑是如何考慮的?劉德兵:這是一個非常關鍵的問題。在早期階段,我們確實會全面對標 OpenAI,因為目前AGI 技術路線上,大模型仍是最前沿的範式,而 OpenAI 在這個範式中走在最前面。但未來,我們不會在全球化與中國市場差異化之間做單選題。中國擁有全球最複雜、最密集的真實應用場景,這決定了我們在模型安全、低幻覺率及行業適配能力方面,天然會形成不同於海外公司的技術取向。這種在複雜場景中反覆打磨出來的通用能力,可以構成我們的獨特優勢。另一方面,大模型企業從一開始就必須具備全球視野。AGI 的本質是通用能力,基礎模型不可能只為單一市場而存在。 目前我們能以顯著低於同等級閉源模型的價格,提供接近國際一線水平的程式碼生成(Coding)能力,在成本、效率和工程能力上已經具備國際競爭力。在出海方面,主要是發起並主導了“自主大模型國際共建聯盟”,與東盟及“一帶一路”沿線多個國家合作,共同建設可控的國家級 AI 基礎設施。幫助友好國家打造屬於自己的“數字主權大模型”,目前已在多個國家落地。Q:如何理解“數字主權大模型”?劉德兵:核心邏輯與中國發起的全球 AI 合作倡議一致:強調尊重各國的主權及文化價值觀,在此基礎上推動 AI 普惠全球,讓全人類共享科技革命的紅利。在這一原則下,不僅是輸出模型,而是推動涵蓋模型、算力、資料以及應用在內的全方位解決方案,與友好國家開展深度合作。Q:出海區域也有選擇是嗎?劉德兵:面向全球,現在會優先考慮東盟、一帶一路這樣的合作比較緊密的國家,後續會全球推廣。Q:我們和世界頂尖模型之間的差距是不是已經縮小?劉德兵:最開始我們就說了,AGI 的實現是一場持久的長跑,這個領域仍存在大量技術空白。但我們會發現一個新規律:新模型層出不窮,迭代速度極快。每當一個領先模型問世,它往往只能保持短時間的優勢,很快就會有新的模型實現趕超。目前主流 AI 公司之間的技術水平確實存在差異,但完全沒有出現那種“甩開巨大身位、讓人完全無法追趕”的代差 。在這個過程中,中國大模型企業表現出色,目前已對標國際主流模型,在技術水平上並沒有巨大的差距,始終緊跟世界前沿。當然,我們也感受到了壓力,特別是在算力、資料資源以及資金投入規模上,國外模型擁有更優越的基礎條件。但我們的優勢也很明顯,中國擁有更豐富的應用場景。Q:這種代差的縮小,是不是也從側面證明預訓練模型的技術迭代曲線已經放緩?預訓練的巨大投入,是否還有性價比?劉德兵:這件事其實沒有事實依據,我們看到預訓練依然能帶來顯著的性能提升,近期各頭部公司持續發佈的旗艦模型也印證了這一點。不過,現在與 2023 年那種“百模大戰”式的爆發期不同,市場正在進入一個積累與分化的階段。擅長底層的公司會繼續深耕預訓練,而擅長應用的則轉嚮應用層,這種分化是合理的。但是我們肯定會堅定地地持續投入預訓練。預訓練基座模型決定了智能水平的上限,長期投入的收益是明確的。同時,我們確實也在提升推理側 Scaling(推理側擴展)的優先順序,模型也需要更強的“線上推理”和“慢思考”能力,從而在無監督任務或複雜環境中找到最優解。Q: 您之前多次提到“模型自調節參數”,您認為這屬於一個遙遠的願景,還是在近期(比如 2026 年)就有望看到初步的實現?劉德兵:“自調節參數”是模型演進中至關重要的一步,甚至可以被視為 L4 級智能的核心標誌。目前,很多場景的深度應用仍需要大模型公司的技術人員參與調優,才能達到理想效果。 一旦模型具備了自調節參數的能力,使用者就可以在實際使用中通過不斷的互動和反饋,驅動模型自主迭代。這種自我進化的能力將有可能引發應用的爆發式增長 。但是現在還沒有明確的時間點,但這是智譜目前正在全力以赴攻堅的核心技術之一。02MaaS 在“賣智力”,不是“賣算力”Q:從商業模式來看,MaaS被看作未來智譜重要的增長極嗎?它的本質是賣算力還是賣智力?劉德兵:肯定是,因為它是大模型商業化中邊際成本最低,規模化效應最強的一個路徑。我認為MaaS本質還是賣智力,而不是算力。如果是賣算力的話,那就是以前的雲基礎架構的一個生意,它是一個重資產的回報邏輯。MaaS的核心價值,在於是客戶付錢是為了獲取模型對複雜邏輯的理解推理或決策能力。其實這個很好理解,我覺得就像電力或水一樣。算力更像是水電站等營運裝置,而 AI 能力則是其中流動的“水”和“電”。雖然兩者緊密結合,但水和電本身是獨立於基礎設施之外的核心價值 。這就是我們的核心思考邏輯:AI 能力必須通過 MaaS 這種形式輸出到每一個終端,使它成為未來智能社會最核心的生產要素,而不僅僅是單一的算力資源。Q:但這裡其實涉及兩個挑戰。在大模型時代,生成 Token 存在明確的算力“硬成本”。這導致它的邊際成本遞減可能不會像傳統網際網路或軟體行業那樣顯著。這種商業模式,盈利的難度會不會更大?劉德兵:目前大模型最核心的成本確實是算力。 但從 MaaS(模型即服務)本身的邏輯來看,它的邊際成本其實是很低的,因為它具備像“水流”一樣的流動性,可以實現快速且無限的複製。對於算力成本,隨著國產算力能力的提升,算力晶片的效率不斷提高,每生成 1 個 Token 所需的算力成本正在快速下降。還有一個更終極的思路。當模型架構趨於穩定時,我們可以針對特定模型進行專有最佳化,也就是我們正在推進的“芯算一體”工作。 通過將模型與算力晶片進行深度繫結,有可能帶來成十倍甚至上百倍的成本降低。Q:您覺得MaaS會遇到SaaS時代同樣的挑戰嗎?比如付費習慣差、難規模化等?劉德兵:我認為這兩個其實差異還是很大的的,核心在於,AI 時代“AI”會成為整個裝置基礎設施,它可能會改變很多事情。當 AI 深度介入生產生活並演變為不可或缺的基礎設施時,使用者的付費意願將發生根本性的轉變。這種付費模式很有可能嵌入在具體的應用場景之中,由於業務流量巨大且深度融入日常流程,使用者在付費時的“體感”並不會特別強烈,就好像現在你支付通話費。過去網際網路時,當時很多 SaaS 產品更多停留在應用層面的工具性合作。雖然這些工具對使用者有用,但沒有達到“非買不可”的剛需程度 。這導致大家更傾向於尋找免費替代品,廠商有時候不得已通過“羊毛出在豬身上”的模式來曲折獲利。Q:對於企業來講,現在真的到了“不AI就會落後”的緊迫時刻了嗎?劉德兵:其實直接看當前 AI 應用的增長資料就能感受到這種熱度。目前 AI 已經成為國家層面的核心戰略,不只是 AI 企業,各行各業都在快速考慮引入 AI。很多企業在嘗試後已經感受到了實實在在的紅利。前兩天我關注到中國招投標網的資料,2025年 AI 應用類的招標項目增加了390%左右,也就是 3.9 倍。從我們自己的MaaS來看,使用量也實現了 10 倍的增長 。這是一種“爆發式”的態勢。網際網路、金融和教育領域因為數位化基礎好,跑得非常快 。像能源、製造等更偏傳統的領域也開始發力,相關的應用正在變得越來越多,我們平時接觸到的實際需求也非常廣泛。總的來說,我覺得在各個領域應用 AI 已經是一個板上釘釘的事情,而且這個處理程序只會越來越快。Q:再往後發展,在沒有數位化基礎的行業,是不是智能化的處理程序會放慢?劉德兵:向傳統行業滲透確實需要一個過程,但 AI 有一個非常重要的特點,它和傳統的軟體服務完全不同。以前做軟體,你在一個行業、一個場景下開發了一套系統,想換到另一個場景,基本上得推倒重來。但 AI 最大的能力在於它的泛化性,當我們在某一個行業把模型跑通後,它的核心能力是可以跨行業遷移的。所以,未來 AI 向傳統行業滲透的速度會比大家預想的更快。我們甚至已經在考慮更長遠的“無人產業”,比如無人農業、深海探礦等。這些高風險或高重複性的領域,正是 AI 可以大顯身手、發揮核心價值的地方。Q:對成本比較敏感的小規模企業,付費意願和付費的決策成本會不會更高?劉德兵:其實對於成本敏感的企業,如果從從長遠來講,它更應該會關注 AI,因為 AI 最重要的一個特色就是讓生產生活的效率提升,它和轉換一句話說就是降成本。深度改變行業要投入很多研發成本,但是如果你想在自己的場景中去用,很多時候用一些開源模型,簡單的適配,就有可能產生很好的效果。Q:那應該選擇開源模型還是直接選擇MaaS呢?劉德兵:其實各有優勢。選擇開源模型,最大的好處在於可以進行自主迭代。如果某些開源模型與特定業務場景的適配度很高,企業可以直接部署並進行二次開發。使用 MaaS 平台主要是能隨時享受到技術高速迭代帶來的紅利 。每當發佈新的旗艦模型,都會第一時間接入平台。有些過去在舊模型上表現不夠理想的業務點,往往在切換到新模型後,效果會立竿見影地變好。Q:目前產業級的本地化合作的收入佔比更高,未來一年可以看到MaaS的爆發嗎?劉德兵:產業級的合作,本身能夠帶來比較大的現金流,和以前的軟體定製不太一樣的地方,剛才也提過“通用性”。 我可以在一個場景在一個行業做通,就可以在這個行業裡規模化去用,那它帶來的增益是非常非常大的。另外,我們也會覺得AI 作為未來基礎設施,它不只是像 C 端那種方式去服務我們的生活日常辦公這樣的一些需求。它還有一個很大的作用是在於對我們的生產製造環節都能產生影響,那這個時候其實是需要進入到行業中的,我認為這也是很重要的一個方向。目前而言,我們從商業收入上來講,其實產業端的更大一些。MaaS現在定價其實比較低,先把量漲上去,讓更多的人來用,但是MaaS 的增長是非常非常快的。Q:未來收入的結構是否會變成MaaS佔比更高?劉德兵:從公司本身的發展原則上來講,這兩塊目前是並重的。從趨勢來講,MaaS的增長非常非常快,未來完全有可能到超過本地化,佔比超過 50%甚至更多。Q:“本地化”模式是未來走向規模化增長的必經之路,還是說它只是現階段為了獲取營收和現金流,而不得不走的一段“彎路”?劉德兵:我認為這兩者都有。首先,本地化項目具有極高的實踐價值,像金融、電力、政務等行業,對大模型的要求都是最高,不僅要在理解推理和穩定性上要過關,而且必須滿足安全合規,然後以及可審計、低幻覺等一些硬性要求。當這個模型能夠在這些行業中被反覆驗證的時候,本質上就完成了對通用能力的一個高強度的訓練,然後通過我們解決複雜的業務流的執行難題,也能夠進一步的實現海量終端的普及,帶動開發者的規模化的使用。更重要的是,本地化與規模化之間存在一個正向的迭代循環:通過本地化應用的深度驗證,我們收集到的真實使用者反饋能有效驅動 MaaS(模型即服務)平台及底層基座模型的能力演進。隨著模型能力的增強,它對不同場景的適配和適應能力也會隨之提升。當這種迭代持續進行,原本需要重度定製的需求會逐漸變得標準化,研發難度和成本也會隨之大大降低。所以,本地化並不是一段孤立的“彎路”。03模型即產品,智力水平是衡量模型能力的核心指標Q:以前大家常詬病通用大模型存在同質化問題,但經過這一年的發展,我們看到各家模型已經開始分化出辨識度很高的特點。從智譜的視角來看,未來大模型的產品力主要體現在那些方面?劉德兵:我們一直認為“模型即產品”,目標是讓通用模型能夠適應各種複雜的應用場景 。在這一過程中,衡量模型能力提升的核心指標,始終是智力水平的進化 。這種智力水平的提升,具體體現在模型對人類意圖的深度理解、對複雜場景的精準感知,以及在執行任務時與環境進行高效互動的能力,這些構成了通用模型的核心競爭力 。在這一核心能力之上,我們認為將通用模型與具體行業、或是具備規模化潛力的應用場景相結合,是極具價值的方向。通過在特定領域內進行必要的約束與針對性最佳化,可以讓大模型在實際應用中達到更理想的效果 。Q:您如何看待大模型公司巨額虧損的爭議?劉德兵:虧損主要原因在於巨額的研發投入和購買算力服務。智譜招股書裡面也有詳細的資料披露,拿2025年上半年來說,研發投入為15.947億,報告期內累計研發投入約44億。研發投入主要用於購買算力,在研發投入的佔比為71.8%。但這也是行業常態,國內上市網際網路廠商2025年上半年,資本開支也是維持同比高增趨勢,比如,阿里未來三年計畫投入超3800億元用於雲和AI硬體基礎設施,總額超過去十年總和。所以,算力成本是戰略性虧損的主要原因之一。但是算力成本是持續下降的,這也是大勢所趨。Q:現在整個產業的“AI 濃度”到了什麼程度?從中國市場看,未來的增長斜率是否依然陡峭?劉德兵:我們認為產業界正處於從量變到質變的“臨界點”。如果只把大模型看作一次技術浪潮,它會有巔峰和低谷;但如果視其為一場技術革命,它將開闢前所未有的新空間與新市場。我們堅信 2026 年是 AGI 發展的關鍵一年,後續 AI 的發展會更快,產業中不僅 AI 濃度會持續增加,還會湧現出大量 AI 原生的新應用。Q:大模型從“可用”到“好用”,2026 年需要攻堅那些技術難點?劉德兵:推動模型從 L3 向 L4 進化,提升模型意圖理解能力、自我調整能力,並實現在應用中的自我迭代。在基座模型迭代的同時,通過應用層直接做最佳化。例如增加知識庫、設定業務邏輯等,讓智能體在特定場景下率先“好用”起來。Q:前一段時間,智譜的Auto GLM開源也引起了一波關注,從端側來看,手機會是最先爆發的場景嗎?未來是否會推出硬體裝置?劉德兵:AutoGLM 的開源確實為開發者提供了很大的自由度。他們現在可以在本地部署,完全掌握自己的資料和流程,也可以在雲端即開即用。可以根據具體場景進行二次開發,深度融合到自有的產品中,做出真正能“動手”執行任務的助理。端側模型離客戶和場景更近,是讓 AI 具象化的重要方式。智譜也是國內最早佈局端側模型的大模型廠商之一。我認為手機、智能汽車、智能家居和智能辦公等場景,只要加上 Agent(智能體),都有爆發的可能。至於那個領域最先爆發,這帶有“實驗科學”的色彩。這一輪 AI 的發展不能只靠理論推導,更看重實際執行。只要方向靠譜,投入足夠的資源和人才去攻堅,就有可能實現突破;反之,如果投入不足或淺嘗輒止,再好的機會也可能錯過 。我們的核心戰略始終是定義並提升模型的智能上限 。目前的定位非常明確:我們主要作為底層的技術賦能者,通過與終端硬體廠商合作,將我們的模型能力注入其產品中,從而產生更好的應用效果。我們更傾向於賦能合作夥伴,而不是自己去做硬體終端。Q:大模型領域人才稀缺,智譜最看重那類人才?劉德兵:我認同對大模型企業而言,真正決定上限的不是團隊規模,而是人才密度。智譜目前比較看重三類能力的結合:原創能力: 能在演算法架構層面提出新範式。工程能力: 能將前沿模型穩定、高效地部署到真實複雜的場景中。技術信仰: 具備長期主義,願意圍繞 AGI 這一長遠目標持續投入。Q:會擔心人才流失嗎?全球大廠都在“高價”招徠人才。劉德兵:頂尖人才的競爭一直存在,但智譜核心團隊的穩定性非常高。我們一直覺得留住人才不能靠薪酬,智譜有很純粹的氛圍,團隊的基因是清華知識工程實驗室,一直有一種自由、求真、去層級化的探索氛圍。另外,肯定也有利益共享的機制,比如極具競爭力的薪酬和完善的長期股權激勵計畫。還有為研發人員提供了充足的算力支援,以及從實驗室到使用者的完整反饋閉環。科學家在這裡擁有極高的前沿技術探索權,能夠接觸到最全端的技術體系。Q:五年後,當大家提到智譜的代號“2513”時,您希望人們想到什麼?劉德兵:我們希望“2513”成為 AI 時代普惠智能的代名詞。它不只是一個股票程式碼,更是一個能夠自我進化、充滿人文溫度的 AGI 體系。我們希望五年後,複雜的智力不再是少數人的特權,而是每個人都觸手可及的權利。大家想到 2513,就能想到這是代表中國力量、邁向 AGI 未來的原創技術公司 。 (騰訊科技)
干翻 ChatGPT,市值超蘋果,這就是 AI 圈最大爽文
今天上午,智譜以「全球大模型第一股」的身份登陸港交所主機板,而幾乎前後腳,遠在大洋彼岸的 Google 母公司 Alphabet 股價逆市上漲 2.5%,市值攀升至 3.89 兆美元,這是自 2019 年以來,其市值首次超過蘋果。兩件看似獨立的事,實則指向同一邏輯:AI 催生的行業想像力,最終都要落到到商業價值的兌現上。其中,Google 的反超尤為值得關注——僅用三年時間完成了在 AI 賽道上的逆風翻盤。究其原因,根據外媒多篇報導,我們也可以拆解出 Google 的 AI 三板斧:技術打底、資源合併、商業落地。三步環環相扣,構成了 Google AI 戰略的完整閉環。三年磨一劍,Google  AI 實現逆風翻盤Google 真正的轉機,始於一次關鍵的內部資源整合。而這一切的基礎,早在十多年前就已埋下伏筆。2011 年,Google 成立了 Google Brain 研究部門,由電腦科學家傑夫·迪恩(Jeff Dean)聯合創辦。這個部門研發的神經網路技術,後來成為所有大型語言模型的核心底層支撐,為 Google 的 AI 佈局打下了堅實的技術基礎。數年後,Google 收購了位於倫敦的 AI 研究實驗室 DeepMind。後者正是由國際象棋神童德米斯·哈薩比斯(Demis Hassabis)聯合創立,其開發的 AI 系統在生物分子研究領域取得重大突破,哈薩比斯也因此獲得諾貝爾獎。到了 2023 年初,傑夫·迪恩與德米斯·哈薩比斯牽頭,推動 DeepMind 與 Google Brain 合併,並向董事會提交了「打造公司史上最強 AI 模型」的戰略計畫,明確將多模態技術作為核心發展方向。2023 年底,Google 正式發佈首款 Gemini 模型,這是其資源整合後的首個核心成果,標誌著其多模態 AI 戰略進入落地階段。與 OpenAI 主打文字訓練的 ChatGPT 不同,手握全球充沛資料的 Google,為 Gemini 建構了涵蓋文字、程式碼、音訊、圖像及視訊的多模態訓練體系。這一策略雖然延長了開發周期,且首款 Gemini 在多項核心指標上仍落後於 ChatGPT,但卻為後續 Gemini 3 系列的反超奠定了基礎。謝爾蓋·布林(Sergey Brin)值得一提的是,就在 Google 上下焦頭爛額的時候,已經退休的聯合創始人謝爾蓋·布林,在一次聚會上被 OpenAI 研究員 Daniel Selsam 當面問住了:你為什麼不全職投身 AI?ChatGPT 的發佈難道沒激發你的熱情嗎?作為 Google(現 Alphabet)的聯合創始人之一,謝爾蓋·布林自 2019 年卸任總裁,一直退居幕後,Daniel 的提問讓布林深受觸動,於是決定重返公司一線。儘管如今看來有些英雄主義的馬後炮,但伴隨著布林以「創始人模式」全面回歸,Google 也順勢完成了一次「再創業」式的組織調整。除了直接參與 Gemini 模型的問題排查與技術最佳化。他還推動 Google 完成了一筆價值 27 億美元的收購,將頂尖研究員丹尼爾·德·弗雷塔斯(Daniel De Freitas)與 Transformer 論文作者之一諾姆·沙澤爾(Noam Shazeer)納入麾下。如今,二人已成為 Gemini 項目的核心領導者,大幅提升了團隊的技術攻堅能力。Noam Shazeer更關鍵的是,Google 在硬體層面的前瞻佈局,建構了「軟體+硬體」的全產業鏈優勢,這一點是多數競爭對手難以企及的。早年間,Google 啟動了自主 AI 晶片研發項目。當時團隊預判,未來語音識別、圖像處理等 AI 應用所需的算力,將遠超現有水平。最終研發出的「張量處理單元」(TPU)晶片,不僅算力更強,耗電量還低於傳統 CPU 與 GPU,成本優勢十分顯著。而 Google 最新推出的 AI 晶片「Ironwood」,進一步降低了 AI 模型的運行成本,直接轉化為 Google 在 AI 商業化領域的核心競爭力。一根神秘香蕉,點燃全民 AI 狂歡2025 年,圖片生成模型領域出現了兩次病毒式傳播事件:一次是 ChatGPT 的 AI 吉卜力畫風走紅全網,另一次則是 Google 的 Nano Banana(Gemini 2.5 Flash Image)。後者的意外爆火,徹底扭轉了市場對 Google AI 產品競爭力的認知。而這款產品的名字,背後還有一個小插曲。據報導,當時 Google AI 項目經理娜伊娜·拉伊桑哈尼(Naina Raisinghani)負責將這款模型上傳到大模型競技場 LM Arena 平台。凌晨兩點半的辦公室裡空無一人,她即興組合了兩位朋友給自己的暱稱,最終確定了「Nano Banana」這個名字。這款名字獨特的產品,很快引發了市場熱潮。短短數天內,Nano Banana 就登頂 LMArena 平台性能排行榜,在社交網路上廣泛傳播,其影響力遠超 Google 內部的預期。負責 Gemini 應用及 Google 實驗室的喬希·伍德沃德(Josh Woodward),將 Nano Banana 的發佈定義為「一場成功的災難」。全球使用者在短時間內生成了數百萬甚至數十億張圖像,直接導致 Google 算力告急,最終不得不通過「緊急借用」伺服器時間來緩解壓力。但這場算力危機,恰恰印證了 Nano Banana 的核心吸引力。去年 9 月,搭載 Nano Banana 的 Gemini AI 應用成功登頂蘋果 App Store 下載榜。登頂 2 個月後,Google 順勢推出了迄今為止最強版本的 Gemini 3 系列模型,其多項核心指標超越 ChatGPT,也讓 OpenAI CEO 奧特曼緊急拉響「紅色警報」,親自下令改進 ChatGPT。而根據昨天 SimilarWeb 發佈的最新資料,Gemini 全球網頁端流量份額首次突破 20% 的市場份額,而 ChatGPT 的份額從 2025 年 1 月 86% 暴跌至 64.5%。短短三年間,攻守之勢異也。如今,AI 業務已成為 Google 新的核心增長引擎。其收入結構日趨多元化,涵蓋搜尋廣告增量、面向個人與企業的付費版 Gemini,以及自主研發 AI 晶片的銷售等多個類股。而從輝達市值突破 5 兆美元,到 Google 憑藉 AI 實現市值反超,這些現象都說明 AI 仍是當前科技行業最具想像力的賽道。但賽道上的競爭不僅是技術和產品的比拚,也是人才的爭奪——就在 Google 高歌猛進之際,蘋果正經歷近十年最密集的核心人才「離職潮」。這場離職潮覆蓋了 AI、設計等多個核心業務類股,就連支撐蘋果生態重要一環的 Safari 瀏覽器團隊,也未能倖免。昨晚,The Browser Company 首席執行長喬希·米勒(Josh Miller)便在社交平台高調官宣:蘋果 Safari 瀏覽器首席設計師馬可·特裡維里奧(Marco Triverio)已正式加盟其團隊,預計將負責打磨 Dia 瀏覽器。特裡維里奧曾長期擔任 iOS 與 macOS 版 Safari 的首席設計師,主導了 Safari 隱私控制、標籤頁互動、導航模式等核心功能的設計與最佳化。值得注意的是,另一位 Safari 首席設計師 Charlie Deets,也已更早一步加盟 The Browser Company。當然,若僅因人才流失就看衰蘋果,顯然低估了這家公司的深厚底蘊。它手握全球最穩固的硬體生態,iPhone、Mac 搭建的使用者護城河,至今仍是多數企業難以企及的;充足的現金流,足以支撐它在 AI 賽道耐心佈局、持續投入;更別說蘋果在硬體研發、使用者體驗上的積累,本就是 AI 落地消費端的關鍵籌碼。如果 Google 的翻盤證明了技術積累的價值,那麼蘋果的故事,同樣還沒到蓋棺定論的時候。 (APPSO)
中國AI雙雄的港股競速
1月8日,智譜以120港元的開盤價在港交所上市,市值為528.28億港元。智譜的發行價為每股116.20港元,對應募資總額約43.48億港元,其公開發售部分獲得約1164倍超額認購。而就在明天,MiniMax也將在港交所主機板掛牌。MiniMax發行價格為每股151至165港元,對應募集資金總額38.34億至41.89億,公開發售部分超額認購倍數更是高達1209倍。相隔僅一日,智譜AI與MiniMax接連登陸港交所,以截然不同的基因與路徑,爭奪“中國大模型第一股”之名,也對應出中國AI創業的分化與抉擇。“原生家庭”的差異2002年,張鵬從清華大學電腦系本科畢業,選擇了留校繼續攻讀研究生,也因此,他遇到了同年入系攻讀博士的唐傑。2006年,為了填補國內科技情報分析平台的缺失,張鵬和唐傑依託清華大學知識工程實驗室(KEG),牽頭孵化出了AMiner系統。2018年,AMiner的商業化處理程序加速。同年,以中科院西安光機所背景和擅長科技成果轉化投資而聞名的投資機構——中科創星,將自然語言處理、知識圖譜作為其重點關注的投資方向,第一時間聯絡上了張鵬團隊,提供了公司籌備方面的幫助。2019年6月,AMiner獨立拆分,在清華教授與KEG實驗室支援下成立了新公司智譜AI。中科創星成為了智譜AI第一家外部股東。MiniMax的故事,要從2015年閆俊傑從中科院自動化所博士畢業之後說起。博士期間,閆俊傑曾是百度AI研究院的實習生,參與早期神經網路最佳化項目,接觸並預見了AI從專用任務走向通用模型的技術演進路徑。博士畢業後,閆俊傑加入商湯科技,從演算法實習生起步,因主導深度學習工具鏈建設,及通用智能技術體系搭建,三年內晉陞至副總裁,管理規模達700餘人的核心研發團隊。在其負責期間,商湯麵部識別演算法拿到了行業第一的市場份額。2021年底,商湯衝刺IPO之際,閆俊傑選擇離職創業。促使他離開的,並非職位或待遇,而是對技術路徑的判斷分歧。閆俊傑認為,只做特定任務的AI(如人臉識別、語音識別)已觸及商業化天花板,而通用人工智慧(AGI)才是服務普通人、創造規模化價值的終極方向。2021年春天,閆俊傑與雲啟資本團隊在上海黃浦江畔首次會面。彼時,“大模型”尚未成為行業熱詞,但閆俊傑已明確:若foundation model成立,AI將無需定製,即可服務海量使用者,形成標準化產品。這一判斷獲得雲啟資本的認可,雲啟成為了MiniMax的第一家股東。2022年1月,MiniMax在上海正式成立。張鵬在清華積累的學術基因,與中科創星來自中科院體系的科研基因,使得智譜有了一個“根正苗紅”的學術與科研起點。而閆俊傑博士畢業後投身科技公司,積累一線實戰開發經歷,加上雲啟資本的美元背景,讓MiniMax持有一本“雙幣護照”。也因此,兩家公司對“技術—資本—市場”的理解有差異:智譜是“合規—國資—ToG”帶來的溢價,MiniMax則是“流量—美元—ToC”帶來的機會。兩家公司創始人的起點,決定了公司未來不同的成長之路。“成長補給”的不同起點影響的,是公司能借到的“外力”不同。2019年成立至2025年,智譜AI累計完成8輪融資,累計融資規模83億元人民幣,IPO前估值244億人民幣。進入成長期後,智譜AI的股東團裡除了達晨財智、華控基金、紅杉中國、高瓴創投、順為資本、光合創投、啟明創投、君聯資本等頭部財務VC外,還出現了另外兩類資本的堅定下注。一方面,是美團、阿里巴巴、螞蟻集團、騰訊、學而思、BOSS直聘等產業資本戰略入股,形成“投資+場景”的繫結關係。另一方面,則是被圈內戲稱為地方國資“通訊錄”的國資股東版圖:北京人工智慧產業投資基金、珠海華發集團、杭州城投、中關村科學城、金浦投資、順禧基金、中國信科等國資背景基金批次入場。在本次IPO發行中,智譜引入了更加多元化的基石投資陣容,涵蓋北京國資、頭部保險資金、大型公募基金、明星私募基金、產業投資方等,包括清華大學教育基金、北京金控、泰康人壽、廣發基金、上海高毅、3W Fund、霧淞資本、凌雲光等投資方。基石投資者認購比例高達68.6%。相較而言,MiniMax的投資者中,國資比重就少了很多,取而代之的,是C端流量的戰略協同和國際化資本加碼。MiniMax招股書披露,公司累計完成7輪融資,共計融資15.56億美元(約110.61億人民幣),2025年8月最後一輪融資(Pre-B++輪)投後估值42.404億美元(約302億元人民幣)。閆俊傑的投資人清單中,包括阿里巴巴、米哈游、騰訊、小紅書、金山辦公等產業投資方,持股比例較高,合計持股比例超25%。此外,雲啟資本、明勢創投、IDG資本、高瓴創投、經緯創投、紅杉中國等知名雙幣創投機構,也是從早期便伴隨其成長。值得一提的是,MiniMax的基石投資者更加多元,既有阿里巴巴的持續深度繫結,還有ADIA(阿布扎比投資局)、英國保誠集團旗下Eastspring Investments、韓國未來資產等國際頂級資本的大力加持,匯添富香港、易方達基金等頂級公募基金也紛紛加入,博裕資本、IDG資本、Aspex、泰康人壽等跟進。融資結構的差異,是兩家公司原生基因的對應。智譜以人民幣國資作為壓艙石,換取了ToB/ToG訂單的確定性,也背負了重資產重交付的包袱;MiniMax憑藉全球化資本背書,加強了其在海外市場搏殺的優勢,但不得不直面地緣政治與流量成本的風險。合規vs流量的較量基因寫入的是國資還是美元,已決定了公司的技術路線與業務形態。智譜和MiniMax所選擇的技術路線和商業發展路徑,越來越凸顯各自獨特的風格。智譜的技術核心是,稠密大模型(Dense Model)的國產化全端改造。從GLM-130B到GLM-4系列,智譜採用“全參數啟動”架構,訓練依賴國產神威超算與華為昇騰晶片,混合精度算子也已完成對國產異構計算框架的適配。其技術護城河在工程化適配能力:將模型壓縮、指令微調、演算法封裝成“可信大模型交付包”。招股書顯示,智譜AI的主要收入模式為向客戶提供本地化部署和雲端部署服務。2025年上半年,本地化部署的收入佔總營收的84.8%,中國地區又佔整體本地化部署收入的88.4%。截至2025年12月,智譜系列模型已為超12000家機構客戶、超8000萬台裝置提供支援,客戶包括政府、大型央企,以及三星、小鵬等企業。2023年至2025年,智譜來自政府及大型央企的收入佔比,一直維持在60%左右,前五大客戶貢獻超總營收的40%。客戶採購第一原則,不一定是極致的模型能力,更看重的是,“安全、合規、可控”。這成為智譜擺在桌面上的非技術護城河。然而,本地部署為主的模式,造成了極重的交付成本。有媒體報導稱,智譜的每一單央企或政府客戶,均需6至9個月駐場部署。不過,這也讓智譜收穫了較高的毛利。2025年上半年,智譜本地部署業務的毛利為59.1%,雖不及過去傳統軟體企業70%的毛利水平,但也比自己同賽道競爭者,高出不少。MiniMax自創立起,便押注混合專家(MoE)架構,其M2模型以10B啟動參數承載230B總參數量,通過動態路由與模型量化技術,將單次推理成本壓至Claude 4.5的8%。這一輕量化設計,使星野/Talkie等產品,能在主流GPU叢集高效運行,上線一年內,推理成本下降60%。這家公司的技術護城河,建立在蒸餾與量化效率之上。MoE架構更適用於大規模的C端服務,MiniMax的打法,也更偏向網際網路,核心收入模式為C端訂閱和API收費。MiniMax招股書顯示,公司主要收入來源於Agent應用MiniMax、視覺生成平台海螺AI、虛擬陪伴平台Talkie/星野等AI原生產品,佔比71%。Talkie通過Gacha抽卡機制,將AI技術封裝為娛樂消費品,上線18個月即在美國、日本、巴西等六個國家獲得應用程式商店總榜前十。單使用者日均使用時長75分鐘,超過TikTok的55分鐘,ARPU達3.2美元。2025年1-9月,MiniMax原生產品使用者量2.12億,MAU約2762萬,付費使用者數約177萬。與之對應的,2025年上半年,其AI原生產品業務的毛利僅為4.7%。困擾MiniMax的風險因素主要有兩個:一是,地緣政治的不確定性,易觸發監管出手,產品面臨突然整改及下架風險;另一個是,投流成本雖在被攤薄,仍然高企。招股書顯示,其銷售成本佔收入比,2023年、2024年分別是的124.7%、87.8%,2025年1-9月為76.7%。其AI原生產品業務的低毛利,也正是這個原因。寫在最後六年時間的演進,智譜與MiniMax成長為了兩個物種。智譜用技術重資產和合規可控,換取了政策紅利和大B/G端的確定性訂單,MiniMax則用架構輕量化,換取了C端的使用者增長和全球化擴張速度。技術路線與商業模式的差異,本質上是創始人基因、資本血統與市場環境共同作用下的理性選擇。在IPO之後,智譜與MiniMax面臨的考驗,是商業閉環與造血能力。二者的路徑或許永不相交,但平行存在,本身是中國AI產業走向多元與深水的標誌。 (鈦媒體)