#大模型
智譜、MiniMax爭奪「大模型第一股」:高增長之下各有難題
經歷三年的軍備競賽,大模型行業迎來了資本價值兌現的關鍵節點。12月19日,北京智譜華章科技股份有限公司(下稱“智譜”)正式披露招股書,向港交所IPO發起衝擊。不到48小時,上海稀宇科技有限公司(下稱“MiniMax”)同樣向港交所披露了招股書。更早之前,這兩家AI獨角獸相繼通過了港交所聆訊。如此密集的資本動作,瞬間將“誰將是AI大模型第一股”的懸念拉滿。值得關注的是,二者雖然目標一致,但走出了截然不同的發展路徑。智譜以B端、G端服務為核心;MiniMax以C端訂閱為支柱,深耕全球化使用者市場。兩種路徑的背後,是技術理念、商業邏輯與估值邏輯的全方位碰撞。一直以來,商業化的效率之爭都是行業的比拚重點,一定程度上決定了大模型企業的估值和想像力。當大模型行業從技術探索邁入商業化深水區,這場資本市場的爭奪,更像是一場商業路徑可行性的測試。另一個變化在於,AI大模型賽道已從兩年前的群雄逐鹿,逐步聚焦到少數具備核心競爭力的頭部玩家。頭部玩家投入逐年增大,爭奪資本市場的關注與資源,就是爭奪市場話語權,也是為接下來的擴張收集彈藥。壓力和動力總是結伴而行。成功上市只是第一步,更關鍵的是後續資本故事的支撐,而這些都考驗著這兩家初出茅廬的創業公司。這場角逐的結局,遠不止誰先上市這麼簡單,它更將回答一系列關乎行業未來的核心問題。爭奪“AI大模型第一股”,高增長敘事下的盈利挑戰自2024年下半年起,關於大模型行業“AI六小虎”上市的傳聞有很多。有實力的企業業務佈局的速度明顯加快,一些明爭暗搶浮出水面。進入2025年,作為目前國內達到40億美元估值的大模型公司,智譜和MiniMax動作最快。4月,智譜在北京證監局完成輔導備案;6月,MiniMax被爆出最早今年在港股上市。如今,48小時內先後遞交招股書,智譜與MiniMax這場“AI大模型第一股”之爭可謂是針尖對麥芒。對每個衝刺IPO的企業而言,財務基本面是叩響資本市場大門的第一道門檻,也成了市場審視企業表現健康與否的第一步。翻看智譜和MiniMax的財報會發現,這是兩家商業化路徑截然不同的大模型。前者是典型的B端服務路徑,後者則是C端驅動的路線。“清華系”的智譜發佈全國首個千億參數大模型GLM-130B,也將自身的商業基調定位為MaaS,強調模型即服務,形成了“開源+API付費”的商業閉環。招股書顯示,2022年至2024年,智譜營收分別為5740萬元、1.25億元和3.12億元,年均複合增長率超130%;2025年上半年營收進一步增至1.91億元,較上年同期的4490萬元同比激增325.39%。圖源智譜AI招股書收入的擴張,伴隨商業模式的定調。從業務構成來看,其收入主要來自企業級API呼叫、行業解決方案及算力租賃服務,其中面向B端的模型呼叫與企業服務是核心支柱。2022年至2024年,這一類股營收佔比分別為95.5%、90.4%、84.5%,2025年上半年佔比降至84.8%。毛利率層面,2022年至2024年,智譜的毛利率分別是54.6%、64.6%、56.3%,2025年上半年毛利率為50%。與智譜走B端路線不同,MiniMax則走出了一條C端驅動的全球化變現路徑。MiniMax收入主要來自訂閱服務、基於token的應用內購買、線上行銷服務及企業級API服務。2023年至2024年,MiniMax營收從350萬美元增長至3050萬美元,同比增幅高達782%;2025年前三季度營收進一步增至5340萬美元,同比增長174.7%。實際上,MiniMax的商業化更像是網際網路產品的邏輯。其中,AI原生產品是MiniMax的營收支柱。2024年,AI陪伴應用Talkie收入佔比近64%,開放平台及企業服務佔比約29%,視訊生成模型海螺AI佔比7.7%;到2025年前三季度,海螺AI收入佔比提升至33%,與Talkie共同成為營收雙支柱,二者合計貢獻超60%收入。圖源MiniMax招股書AI應用的火熱也擴大了MiniMax的使用者規模。截至2025年9月30日,MiniMax AI原生產品矩陣平均月活使用者達2760萬,累計使用者超2.12億,覆蓋全球超200個國家及地區,海外市場收入貢獻佔比超70%。隨著使用者增長和業務規模擴大,MiniMax毛利率明顯改善,由2023年的-24.7%升至2024年的12.2%,並進一步升至截至2025年9月30日止九個月的23.3%。智譜和MiniMax的共性在於,過去三年雖然營收在不斷增長,但虧損也與之平行,尚未看到規模化盈利拐點。招股書顯示,2022年至2024年,智譜經調整淨虧損分別是9741.7萬元、6.21億元、24.66億元。2025年上半年經調整淨虧損17.52億元。智譜虧損的核心原因在於研發與算力投入。根據招股書,2022年、2023年、2024年智譜研發投入分別為8440萬元、5.29億元、22億元,2025年上半年研發投入為15.9億元,累計研發投入約44億元。同期,MiniMax淨虧損分別為7370萬美元、2.69億美元、4.65億美元。2025年前三季度為5.12億美元。MiniMax的虧損同樣源於研發與基礎設施投入。截至2025年第三季度,MiniMax累計研發開支約4.5億美元(約31.6億元人民幣)。值得一提的是,告別前期產品的流量邏輯,進入2025年MiniMax成本控製成效顯著,2025年前三季度銷售及行銷開支同比下降26%。若剔除金融負債公允價值虧損等因素,MiniMax經調整淨虧損在2025年前三季度為1.86億美元,與2024年同期的1.7億美元基本持平,虧損呈現縮小趨勢。在資本市場,智譜和MiniMax的財務表現直觀反映出了行業的共同難題——高增長、高投入、高虧損。想要贏得“AI大模型第一股”的角逐賽,賺錢仍是要緊事。通往AGI,智譜和MiniMax走出兩條路如果說財務資料是商業模式的量化表達,那麼技術路線選擇則反映了兩家公司根本理念的差異。通往AGI的路上,二者的基因各異。智譜從創立開始就有著濃厚的科研基因。清華系創業班底、KEG知識工程實驗室、計算系……某種程度上,智譜由清華大學技術成果轉化而來。智譜CEO張鵬2002年加入KEG實驗室,並主導研發了科技情報平台AMiner——這被視為智譜AI的技術雛形。這樣的配置之下,智譜贏在了技術起跑線上。當別人還在因ChatGPT的出現奮力研發大模型時,智譜已經手握GLM架構,研發出千億級大模型。在後續的智能體競爭中,智譜也率先推出了AutoGLM 2.0智能體。張鵬也多次強調,AGI的核心是底層架構的突破,智譜原創性提出基於自回歸填空的通用預訓練範式GLM。與GPT的單向注意力架構形成差異,這種原生架構的自主性,是企業長期競爭力的核心。智譜具備清華基因,MiniMax則與商湯基因密不可分。除了創始人閆俊傑曾是商湯科技副總裁外,MiniMax早期聯合創始人周彧聰、贠燁禕均曾在商湯科技任職。這個思路之下,既技術,又商業的路線伴隨MiniMax創業的三年。技術上,和多數AI大模型企業先做語言大模型,再做語音和視覺不同,MiniMax從一開始就決定了做多模態模型,是中國最早推出MoE模型的團隊之一。這種多模態自研讓MiniMax從一開始就圍繞AI Agent和互動體驗做技術積累,也直接服務於其全球化產品戰略。閆俊傑曾判斷,國內初期付費意願較低,大廠競爭激烈,因此MiniMax一開始就瞄準了海外市場。在閆俊傑看來,AI公司的核心產品不是聊天介面,而是模型本身。這背後,透露著MiniMax的技術理念——技術的價值最終要通過使用者體驗來驗證。無論是海螺AI的互動設計,還是星野的個性化體驗,都是相同的產品開發邏輯。圖源海螺AI官網團隊基因和技術路線決定了,智譜和MiniMax是同一賽道的兩種路徑。前者選擇單點突破,死磕基座模型;後者則選擇多點開花,佈局全模態產品。當然,隨著大模型行業競爭逐漸進入白熱化,單一路徑並不可靠。從行業格局來看,弗若斯特沙利文的資料顯示,按2024年收入計,智譜的收入在中國獨立通用大模型開發商中排名第一,但市場份額也只佔6.6%。市場高度分散、機會大的同時,頭部玩家想要長期佔據優勢位置並不容易。本質上,當兩家公司都走到資本市場的門前,路線便沒有孰優孰劣之分。智譜的基座模型技術壁壘高,B端客戶黏性強,但商業化節奏較慢;MiniMax的全模態產品迭代快,C端使用者增長迅速,但技術自主性相對較弱,受上游算力和底層技術的影響更大。時至今日,圍繞同一技術理念,走出差異化,並找到與之對應的商業邏輯更重要。誰會更受資本市場青睞?今年以來,DeepSeek的火爆開啟了行業新一輪的淘汰賽。尤其是巨頭憑藉強勢的資源和產品入局,讓初創企業的競賽點發生變化。大模型企業告別資本狂熱的追捧,迎來資本的苛刻審判,“AI六小虎”的IPO競速賽也隨之展開。上市窗口期已經打開,誰先打開資本市場的門,誰就有機會走到第一梯隊。如今,智譜與MiniMax的IPO比拚,將這場競速賽推至賽點。從過往投資歷程上看,智譜是毋庸置疑的香餑餑。招股書顯示,智譜在IPO前已完成8輪融資,累計融資規模超83億元,最新投後估值達243.77億元。投資方不乏阿里、騰訊、紅杉資本、高瓴資本等頭部機構。MiniMax也不甘示弱。企查查顯示,MiniMax截至目前公開披露六輪融資,今年7月融資後投後估值為40億美元。除了沒有地方資本注入,投資方配置和智譜相似。資本市場對“AI大模型第一股”的態度,本質上是對兩種商業路徑的投票——是看好底層技術自主權的長期價值,還是青睞全球化產品的快速商業化潛力。華安證券發佈的研報中指出,智譜的核心價值在於其自主可控的基座模型技術和龐大的開發者生態,其“開源+API呼叫”的模式降低了企業使用門檻,形成了從開源生態到商業API付費的高效轉化路徑。MiniMax聚焦多模態模型切入影視內容創作,二者在細分市場存在差異性。同時,華安證券發佈的研報中指出,本次港股上市將引導AI大模型廠商敘事邏輯從“講述技術故事”轉變為“商業價值兌現”,也將為後續大模型企業融資及估值提供依據。不過,儘管估值邏輯不同,智譜與MiniMax都面臨著挑戰。對於智譜而言,商業化的關鍵在於規模效應的形成。目前,虧損規模持續擴大,現金消耗率不斷攀升,短期盈利預期較弱,估值能否支撐,關鍵在於市場對其長期技術投入的耐心。不僅如此,B端客戶的穩定性也值得關注。招股書披露,這幾年智譜的客戶並不固定,大多數客戶合作期為一年。如何延長客戶的合作期,並存續,也是挑戰。對於MiniMax而言,商業化效率能否持續提升很重要。雖然經調整虧損已呈現縮小趨勢,但整體虧損規模仍在擴大,且C端產品面臨全球網際網路巨頭的競爭壓力,使用者留存和付費轉化能力亟待持續驗證。此外,版權問題也是MiniMax繞不過的難題。今年9月,MiniMax還被“地表最強法務部”迪士尼起訴,直指海螺AI侵權,這也給MiniMax的出海之路蒙上一層陰影。當模型能力不再是最大問題,講一個讓資本聽得懂的故事,並讓其願意為之買單更難。資本市場的終極判斷標準是一致的——商業化形態的可持續性。無論是智譜的技術驅動還是MiniMax的產品驅動,商業模式的持續驗證是兩家公司上市後必須面對的考題。爭奪“第一股”的意義,不僅在於誰能更快獲得資本的加持,更在於誰能通過資本市場的賦能,在技術迭代與商業化落地的雙重考驗中,走出一條可持續的發展路徑。這場競賽的最終贏家,或許不是跑得最快的那個,而是走得更穩、更遠的那個。 (新浪科技)
中國大模型團隊登Nature子刊封面,劉知遠語出驚人:期待明年“用AI造AI”
過去半個世紀,全球科技產業的資本開支與創新節奏,都和一個規律緊密相連,那就是摩爾定律——晶片性能每18個月翻一番。在摩爾定律之外,還有一個“安迪-比爾定律”,它講的是,摩爾定律所主導的硬體性能提升的紅利,會迅速被軟體複雜度的增加所抵消。安迪指的是英特爾前CEO安迪·格魯夫,而比爾,指的是微軟創始人比爾·蓋茲。這種“硬體供給、軟體消耗”的螺旋上升,驅動了PC與網際網路時代的產業進化。時移世易,安迪、比爾都已經退出產業一線,但是規律的底層邏輯並未改變,而且被新的“安迪·比爾”推向更高的極致。ChatGPT的爆發拉開了生成式人工智能時代的大幕,在Scaling Law(規模法則)的主導下,模型參數指數級膨脹,軟體對算力的索取遠超摩爾定律的供給速度,AI發展的邊際成本急劇上升。當硬體供給遭遇能源、資料等天花板時,舊的“安迪比爾”式增長範式開始失效。產業需要一場逆向革命。大模型作為AI時代的“軟體”,需要通過極致的演算法與工程化重構,在現有硬體上爆發更強的能力。2025年,中國大模型公司成為這一路徑的最堅定實踐者。從DeepSeek V3通過細粒度混合專家(MoE)架構以1/10算力成本對標頂尖模型,到Kimi等團隊在稀疏注意力機制上的突破,被稱為“東方力量”的中國大模型公司,正試圖用架構創新努力拉平客觀存在的算力差距。清華大學電腦系副教授劉知遠及其聯合創立的面壁智能團隊,也是其中的典型代表。他們發佈的MiniCPM("小鋼炮")系列模型,僅用約1/10的參數規模,即可承載對標雲端大模型的智能水平,成為端側高效AI的案例。2025年11月,劉知遠團隊的研究登上全球頂級學術期刊《自然·機器智能》(Nature Machine Intelligence)封面,正式提出大模型的“密度法則”(Densing Law)。基於對51個主流大模型的嚴謹回測,論文揭示了驚人的非線性進化規律:從2023年到2025年,大模型的智能密度以每3.5個月翻倍的速度狂飆。這是一條比摩爾定律陡峭5倍的進化曲線。這意味著,每100天,就可以用一半參數量實現當前最優模型相當的性能。每100天成本減半,一年後成本就可能降至原來的十分之一。如此快的迭代速度,對技術創新、產業落地提出了不同以往的挑戰。劉知遠在與騰訊科技的對話中直言:如果一家大模型公司發佈一款新的模型後“3到6個月無法收回成本”,這家公司的商業模式就不可持續,因為後來者很快就能以四分之一的資源實現同等能力。當研發迭代周期被壓縮至百天量級,人類的智力供給已逼近極限,產業的終極形態必將發生質變。工業革命的標誌是機器製造機器,而劉知遠期待的AI時代生產力標誌,將是“用AI製造AI”。唯有如此,才能支撐這場超越摩爾定律的智能風暴。騰訊科技:我們今天的主題是您和團隊最新發表在《自然·機器智能》上的關於大模型“能力密度”(Densing Law)的論文。您能介紹一下這項研究的背景嗎?劉知遠: 雖然這篇論文是 2025 年發表的,但這個想法早在 2024 年上半年就已經開始萌生。2023 年初,ChatGPT 的出現引發了全球對大模型的追逐,中國團隊也不例外,當時大家都在研究如何復現 ChatGPT。到了 2023 年下半年,一線的團隊基本完成了復現工作。那時候我們開始思考大模型未來的發展路徑。有些團隊可能會繼續沿用 ChatGPT 的技術路線,通過增加參數規模、投入更多資料來訓練 GPT-4 水平的模型。這條路線雖然確定性高,但意味著要花費更多經費,這顯然不是一條可持續的發展路徑。你不可能無限地增加成本來換取更強的能力。因此,我們開始探討如何用更低的成本、更高的質量來實現模型能力。2024 年初,我們推出的 Mini CPM 系列模型驗證了這一點:我們可以用更少的參數,實現歷史上需要幾倍甚至幾十倍參數才能達到的能力。這是經驗性的結果,我們想尋找其背後的規律,於是促成了 2024 年對“密度法則”的探索。圖:Densing Law論文登上Nature Machine Intelligence封面騰訊科技:這項研究是否因為中國的國情,使我們更重視大模型的效率問題?它在國內外是獨一無二的嗎?劉知遠: 追求效率當然有中國算力有限的國情因素。我們必須關注如何用更少的算力實現更高品質的模型。這也是為什麼 2024 年下半年,《經濟學人》的一篇封面文章提到,中國企業正通過技術創新繞過“算力牆”,並舉了面壁智能和 DeepSeek 的例子。但同時,追求效率也符合人工智慧本身的發展規律。人工智慧是一場堪比工業革命的科技浪潮,如果要讓每個人都受益,技術就不能昂貴。我們必須像歷史上任何一次科技革命那樣,用更低的成本實現更高品質的產品和服務。因此,我們自信地認為,密度法則對人工智慧的未來發展具有重要意義。騰訊科技:在“密度法則”中,一個關鍵概念是量化“智能”,但這本身是一個難題。在研究開始前,您為什麼覺得這件事是行得通的?劉知遠: 這個問題問得非常好。實際上,我們在密度法則這篇論文裡並沒有真正解決“如何度量智能總量”這個科學問題,而是找了一條取巧的辦法:找一個參照物(Reference Model)。我們假設用同一套技術方案訓練的模型,無論尺寸大小,其密度大致相同。我們將這套方案訓練出的模型作為 Reference Model,並假設其密度為 1。然後,我們觀察目標模型達到某種智能水平時,Reference Model 需要多大參數才能達到相同水平。通過比較兩者達到相同能力所需的參數量,我們就可以算出目標模型的相對密度。這種方法規避了直接計算模型內部智能總量的難題。當然,如何衡量智能的總量(Mass)是未來幾年人工智慧需要攻克的基礎科學問題。歷史上任何大的科技革命背後都有科學理論支撐,如資訊理論之於通訊,熱力學之於蒸汽機。智能科學未來也需要解決如何衡量智能總量的問題。騰訊科技:您在2024年WAIC期間曾提到模型的“密度法則”周期是8個月,但最終論文的結果是3.5個月。為什麼進化的速度比您預期的快這麼多?劉知遠: 2024年年中我們剛有這個想法時,研究尚在初期,觀測的時間跨度和模型數量都有限,所以當時的資料不夠穩定。我們2024年下半年發佈的版本算出來是3.3個月,到今年正式發表時,我們補充了2025年的新模型資料,周期修正為3.5個月。其實,具體的周期是三個月還是八個月並非最重要,最重要的是,這個速度遠遠快於摩爾定律的18個月。這意味著我們正以前所未有的速度迎來一場智能革命。每100天成本減半,一年後成本就可能降至原來的十分之一。同時,我們確實觀察到了一個加速現象。2023年之前,這個周期接近五個月;2023年之後,則縮短到三個多月。我們猜測,這是因為ChatGPT引發了全球性的關注,更多的資源和人才投入加速了技術創新。所以,“密度法則”並非自然規律,而是我們人類社會在該科技領域的一種“自我實現”:投入越多,密度增長越快。騰訊科技: 剛才提到投入,大模型有暴力美學的 Scaling Law,您覺得 Densing Law 和 Scaling Law 是統一的還是矛盾的?劉知遠:我認為它們是硬幣的兩面,相輔相成。“規模法則”的表像是模型越大、能力越強,其背後是我們找到了一條通用的智能構造方案(Transformer架構+序列預測學習),使得在一個模型內持續增加智能成為可能。它開啟了通往通用人工智慧的道路。在坐標系中,“規模法則”是一條參數規模越大、模型能力越強的持續上升曲線。而“密度法則”告訴我們,通過在模型架構、資料治理、學習方法等方面的持續技術創新,我們可以用更小的參數承載更多的智能,從而找到一條更加“陡峭”的“規模法則”曲線。也就是說,用相同的參數實現更強的能力,或者用更少的參數實現相同的能力。所以,沒有“規模法則”就不會有“密度法則”,兩者都是人工智慧發展中至關重要的規律。騰訊科技:“規模法則”似乎正面臨資料、算力和能源的天花板。密度法則何時會遇到瓶頸?劉知遠: Scaling Law的持續發展確實面臨電力、算力、資料等約束。而 Densing Law 正是實現更可持續Scaling Law 的方式。通過技術創新提高密度,我們可以在算力或成本基本不變的情況下,持續提升模型能力。例如DeepSeek V3宣稱用 1/10 的算力實現同等能力,OpenAI 的 API 價格持續下降,都反映了內部通過技術創新用更小的模型提供同等服務。當然,資料枯竭問題可能需要依賴另一項技術——大規模強化學習來解決,即讓模型通過自我探索生成高品質資料進行學習。騰訊科技:2025年有那些讓您覺得驚豔的技術突破,能讓 Densing Law 更加陡峭?劉知遠:今年是模型架構創新的大年,主要有三個方向:第一,以DeepSeek V3為代表的細粒度混合專家(MoE)架構走向成熟,通過稀疏啟動少數專家來大幅提升計算效率。第二,稀疏注意力(Sparse Attention)機制大行其道,通過減少注意力計算中的內容參與度,有效處理長序列。這兩者分別最佳化了Transformer的FFN層和Attention層,實現了計算的“按需分配”。第三,復興循環神經網路(RNN)思想,通過與Transformer混合架構,利用其“記憶”機制降低計算複雜度。這些創新都在變相地提升模型密度。此外,大規模強化學習的應用也取得了巨大飛躍,尤其在數學和程式碼領域,模型通過自我探索持續提升能力,暫時還看不到盡頭。這解決了資料枯竭的問題。騰訊科技: 您覺得密度法則能推廣到多模態模型或世界模型嗎?劉知遠: 我認為這是一個普遍規律。雖然不同領域的倍增周期可能不同,但只要是通用的、遵循 Scaling Law 的模型,未來也一定會遵循 Densing Law。就像晶片摩爾定律和電池密度提升一樣,技術創新總是追求用更少的資源實現更高的性能。騰訊科技:您如何看待Google最新發佈的Gemini 3?它是否可被稱為里程碑式的突破?劉知遠:我們內部認為Gemini 3是一個非常重要的里程碑。它在圖像生成中對文字的控制達到了前所未有的高度,這表明其模型的可控性和對世界的理解能力達到了一個新水平。我們推測,它不只依賴於Diffusion模型,很可能將自回歸(Auto-regressive)的思想融入其中,實現了生成過程的逐層細化和高度一致性。歷史上,所有文生圖模型都難以處理好文字內容,Gemini 3的突破,在我看來是一個非常值得關注的新範式。這也印證了密度法則:只要能實現某種智能,未來一定可以在更小的終端上運行。比如 Gemini 3 現在的能力,未來一定可以在手機、PC 或汽車晶片上跑起來。騰訊科技: 現在還沒有出現能替代智慧型手機的端側 AI 裝置,是不是因為 Densing Law 還沒進化到位?劉知遠: 端側裝置的發展受限於多個因素。第一,還沒有形成好的端側應用場景。現在的手機助手雖然使用者多,但並未與硬體緊密結合。第二,端側技術生態尚未形成。AGI 發展還沒收斂,模型能力還在持續提升,且在產品設計上還沒法完全規避錯誤。就像早期的搜尋引擎也是經過產品打磨才普及一樣,AGI 結合智能終端也需要一個過程。一旦產品形態成熟,智能終端的廣泛應用就會成為可能。騰訊科技: 您提到 MiniCPM 4 可以看作一種“模型製程”,這個怎麼理解?劉知遠: 我更願意把這一代模型比作晶片製程。通過技術創新,我們形成了一套新的模型製程,無論建構什麼尺寸的模型,其密度都更高。例如 MiniCPM 4 在處理長序列時速度提升了 5 倍,意味著可以用更少的計算量承載更強的能力。但目前的挑戰在於,硬體支援還不夠好。我們正在努力做軟硬協同最佳化,希望在消費級硬體上真正跑出理想狀態。騰訊科技: 這需要和高通、聯發科等硬體廠商協同創新嗎?劉知遠: 我們跟硬體廠商交流密切。但硬體廠商受摩爾定律 18 個月周期的影響,架構調整更審慎。而模型每 3 個月就進化一次。所以短期內是軟體適配硬體,長期看硬體會針對穩定的新技術做最佳化。現在端側晶片廠商已經在認真解決大模型運行的瓶頸,比如訪存問題。騰訊科技: 之前大家嘗試過剪枝、量化等方法來做小模型,這和原生訓練的高密度模型相比如何?劉知遠: 我們做過大量實驗,剪枝、蒸餾、量化都會降低模型密度。量化通過後訓練可以恢復一部分效果,是目前端側比較落地的做法。但蒸餾現在已經融合進資料合成體系,不再是簡單的“大蒸小”。剪枝目前還沒找到保持密度的好方法。就像你不能通過剪裁把 14nm 晶片變成 7nm 晶片一樣,要把密度做高,必須從頭建構一套複雜的原生技術體系,包括架構設計、資料治理、學習方法和軟硬協同。這本身就是技術護城河。騰訊科技:“密度法則”對產業界意味著什麼?對於創業公司來說,機會在那裡?劉知遠:3.5個月的迭代周期意味著,任何一個投入巨資訓練的大模型,如果不能在3到6個月內通過商業化收回成本,這種模式就很難持續。因為很快就會有技術更新的團隊用更低的成本實現同樣的能力。因此,雲端API服務的競爭會極其慘烈,最終可能只會剩下幾家擁有海量使用者和強大技術迭代能力的頭部廠商。對於創業公司而言,機會可能在於“端側智能”。端側場景的約束條件非常明確(如功耗、算力、響應時間),這使得技術優勢,即誰能把模型密度做得更高,成為唯一的競爭點,大廠的“鈔能力”(如不計成本的投入)在這裡難以發揮。雖然手機廠商也在高度關注,但它們的決策會更審慎。我們認為,端側智能會先從智能座艙等對功耗不那麼敏感的場景開始,而最終,AGI時代一定會有屬於它自己的智能終端形態,這是我們希望探索的星辰大海。騰訊科技: 面對算力軍備競賽和快速折舊,您怎麼看泡沫論?劉知遠: 快速發展肯定伴隨局部泡沫,但整體上我們正進入智能革命時代。如果以 18 個月為周期,資訊革命走了 50 個周期;如果 AI 也走 50 個周期,按現在的速度,大概到 2030-2035 年就能實現全球普惠的 AGI。未來網際網路的主體不再只是人,還有無數智能體。雖然訓練模型的廠商會收斂,但推理算力需求會爆炸式增長。騰訊科技: 李飛飛(美國國家工程院院士)說 AI 是文明級技術,您對這場革命樂觀嗎?劉知遠: 我相當樂觀。騰訊科技:如果AI變得無比強大,未來人類會不會無事可做?劉知遠:我不這樣認為。未來一定是人機協同,人是把關人。人類知識大爆炸導致我們只能成為細分專家,阻礙了跨領域創新。人工智慧可以幫助我們成為知識的主人而不是奴隸,去探索宇宙、生命等更多未解之謎。騰訊科技: 您2026年最期待的創新是什麼?劉知遠: 我最期待“用 AI 製造 AI”。明年一個重要節點是自主學習(Self-play)。目前的強化學習還依賴人類給標準答案,未來模型如果能自主判斷探索結果的價值,就實現了自主學習。在此基礎上,結合密度法則的提升,我們有可能為每個人建構專屬的、持續學習的個人大模型。未來的生產標誌就是“用 AI 製造 AI”。不再依賴有限的人力,而是由 AI 來賦能 AI 的研發和製造。這將是一個指數級加速的過程。 (騰訊科技)
15個未來產業新賽道全景解析
15個未來產業解析1. 引言中國工業和資訊化部發佈《國家高新區新賽道培育行動方案》(工信廳規函〔2025〕8號),旨在推動國家高新區在新一輪科技革命和產業變革中搶佔先機,培育具有國際競爭力的未來產業。該行動方案聚焦國家重大戰略需求和科技前沿領域,通過"開放式發現—高標準選拔—精準性培育"的推進機制,最終遴選出15個重點新賽道方向進行系統化培育。這15個新賽道方向包括:量子科技、腦機介面、具身智能、人工智慧大模型、高性能積體電路、第六代移動通訊(6G)、工業網際網路、基礎軟體與工業軟體、清潔氫、高端新材料、商業航天、低空經濟、生物製造、細胞與基因、高端醫療器械。本文將按照技術成熟度,將這15個新賽道分為突破期、成長期和成熟期三個層次進行解析,探討每個領域的技術特點、應用場景、政策支援及產業化前景,為理解中國未來產業發展路徑提供參考。2. 技術成熟度分層解析2.1 突破期新賽道突破期新賽道是指技術基礎尚不成熟,但具有顛覆性潛力,有望在未來5-10年內實現關鍵技術突破的領域。量子科技:量子科技是利用量子力學原理進行資訊處理、感測和計算的前沿領域。中國在量子通訊領域已取得全球領先,如"墨子號"量子科學實驗衛星和"京滬幹線"量子保密通訊骨幹網。然而在量子計算方面,雖然有阿里巴巴、百度、騰訊等企業佈局,但與美國、歐洲相比仍有差距。量子科技的關鍵應用場景包括量子計算、量子通訊和量子測量,其中量子計算有望在密碼學、新材料設計、藥物研發等領域帶來革命性突破。預計到2030年,中國將實現量子計算的初步商業化應用。報告原文閱讀>>>量子資訊技術發展與應用研究報告(2025年)腦機介面:腦機介面技術通過在人腦與外部裝置之間建立直接的資訊交換通道,實現腦與裝置的互動。目前,中國腦機介面技術已取得一定進展,如清華大學研製的無創腦機介面系統和中國科學院的侵入式腦機介面技術。主要應用場景包括醫療康復(如幫助癱瘓患者控制假肢)、人機互動和軍事應用。2025年,工信部將腦機介面列為新賽道重點培育方向,預計未來5年將迎來技術突破期,到2030年有望實現部分商業化應用。這兩個突破期新賽道的共同特點是技術壁壘高、研發周期長、投入大,需要長期穩定的政策支援和資金投入。中國在量子通訊領域已具備一定優勢,但在量子計算和腦機介面的基礎研究方面仍有提升空間。這兩個領域的技術突破將為中國在下一代資訊技術和生物技術領域贏得全球競爭主動權提供重要支撐。2.2 成長期新賽道成長期新賽道是指技術已取得初步突破,處於產業化初期,有望在未來3-5年內形成較大市場規模的領域。具身智能:具身智能是指賦予機器人或智能體物理實體和感知能力,使其能夠在真實環境中自主學習、適應和互動的技術。2025年,中國在具身智能領域已取得顯著進展,如優必選Walker S1機器人和宇樹科技的四足機器人。具身智能的主要應用場景包括工業製造、醫療健康、家庭服務和特種作業等。中國在具身智能領域的優勢在於應用場景豐富和產業鏈完備,但在核心演算法和高端感測器方面仍有差距。預計到2028年,具身智能將在特定場景實現規模化應用。人工智慧大模型:人工智慧大模型是基於海量資料訓練的深度學習模型,具有強大的自然語言處理、圖像識別和多模態理解能力。2025年,中國已湧現出文心一言、通義千問、智譜GLM等一批具有國際競爭力的大模型。大模型的應用場景幾乎涵蓋所有行業,包括智能客服、內容創作、醫療診斷、金融分析等。中國在大模型領域的優勢在於資料資源豐富和應用場景廣泛,但在基礎演算法創新和高端晶片方面存在短板。預計到2027年,大模型將實現從通用能力向專業領域的深度滲透。報告延伸閱讀:生成式人工智慧應用發展報告(2025)-中國網際網路絡資訊中心(點選下方圖片可查閱下載報告全文)高性能積體電路:高性能積體電路是支撐數字經濟發展的關鍵基礎,包括先進製程晶片、專用晶片和第三代半導體等。2025年,中國積體電路產業規模已突破兆元,但在高端晶片設計和製造方面仍面臨挑戰。高性能積體電路的主要應用場景包括高性能計算、人工智慧、5G通訊等。中國在積體電路領域的戰略是"設計引領、製造提升、封裝突破、材料配套、裝置支撐"。預計到2028年,中國將在部分關鍵領域實現技術突破。第六代移動通訊(6G):6G是繼5G之後的下一代移動通訊技術,將提供更高的速率、更低的時延和更廣的連接。2025年,中國已啟動6G技術研發試驗,預計2025-2027年完成關鍵技術研究,2028-2030年完成標準制定。6G的主要應用場景包括沉浸式體驗、智能體互動、全息通訊等。中國在6G領域的優勢在於5G技術積累和市場規模,但面臨技術路線選擇和國際標準競爭的挑戰。預計到2030年,6G將開始商用部署。報告延伸閱讀:2025年6G傳輸技術白皮書(點選下方圖片可查閱下載報告全文)這四個成長期新賽道是中國科技自立自強的關鍵領域,也是國際科技競爭的焦點。中國在這些領域既有優勢也有挑戰,需要加強基礎研究和核心技術攻關,建構自主可控的產業生態。2.3 成熟期新賽道成熟期新賽道是指技術已相對成熟,處於規模化應用階段,有望在未來1-3年內形成顯著經濟和社會效益的領域。工業網際網路:工業網際網路是新一代資訊技術與製造業深度融合的產物,通過連接工業全要素、全產業鏈、全價值鏈,實現資源最佳化配置和生產方式變革。2025年,中國工業網際網路已形成"綜合型+特色型+專業型"平台體系,連接工業裝置超過1億台。主要應用場景包括裝置預測性維護、生產過程最佳化、供應鏈協同等。中國在工業網際網路領域的優勢在於製造業基礎雄厚和應用場景豐富,但在工業軟體和高端裝備方面仍有短板。預計到2027年,工業網際網路將實現從單點應用向全鏈條整合的轉變。基礎軟體與工業軟體:基礎軟體包括作業系統、資料庫、中介軟體等,工業軟體包括CAD、CAE、CAM等研發設計軟體和MES、PLM等生產管理軟體。2025年,中國基礎軟體和工業軟體自主化率持續提升,但在高端領域仍有較大差距。主要應用場景包括智能製造、數字政府、金融科技等。中國在軟體領域的優勢在於市場規模大和開發人才豐富,但在核心演算法和底層架構方面存在不足。預計到2027年,中國基礎軟體和工業軟體將在重點行業實現規模化應用。清潔氫:清潔氫是通過可再生能源電解水或化石能源耦合碳捕集技術生產的氫氣,具有零排放、高能量密度的特點。2025年,中國氫能產業規模已突破5000億元,清潔氫佔比持續提升。主要應用場景包括氫燃料電池汽車、氫能儲能、氫能冶金等。中國在氫能領域的優勢在於可再生能源資源豐富和應用場景廣泛,但在氫能儲運和燃料電池技術方面仍有提升空間。預計到2027年,中國清潔氫將在交通和工業領域實現規模化應用。高端新材料:高端新材料是指具有特殊性能和功能的先進材料,包括先進基礎材料、關鍵戰略材料和前沿新材料。2025年,中國新材料產業規模已突破6兆元,但在高端領域仍有差距。主要應用場景包括電子資訊、航空航天、新能源等。中國在新材料領域的優勢在於產業鏈完整和市場需求旺盛,但在原始創新和高端裝備方面存在短板。預計到2027年,中國高端新材料將在關鍵領域實現國產替代。商業航天:商業航天是指由企業主導的航天活動,包括衛星製造、發射服務、空間應用等。2025年,中國商業航天產業規模已突破2兆元,湧現出一批具有國際競爭力的企業。主要應用場景包括衛星網際網路、遙感監測、太空旅遊等。中國在商業航天領域的優勢在於航天技術積累和市場需求增長,但在商業模式創新和國際合作方面仍有提升空間。預計到2027年,中國商業航天將在衛星網際網路和遙感應用領域實現規模化發展。低空經濟:低空經濟是指在低空空域開展的經濟活動,包括無人機配送、空中遊覽、應急救援等。2025年,中國低空經濟規模已突破5000億元,無人機應用領域不斷拓展。主要應用場景包括物流配送、農林植保、城市治理等。中國在低空經濟領域的優勢在於應用場景豐富和政策支援有力,但在空域管理和服務標準方面仍需完善。預計到2027年,中國低空經濟將在物流配送和城市服務領域實現規模化應用。生物製造:生物製造是利用生物系統或生物體生產化學品、材料和能源的過程,具有綠色、高效、可持續的特點。2025年,中國生物製造產業規模已突破1兆元,生物基產品種類不斷豐富。主要應用場景包括生物基化學品、生物基材料、生物燃料等。中國在生物製造領域的優勢在於生物資源豐富和產業基礎良好,但在生物合成技術方面仍有差距。預計到2027年,中國生物製造將在化工替代和材料創新領域實現突破。細胞與基因:細胞與基因技術是利用細胞和基因進行疾病治療、健康管理和生物製造的技術,包括基因治療、細胞治療、基因編輯等。2025年,中國細胞與基因治療產業規模已突破1000億元,多個產品獲批上市。主要應用場景包括腫瘤治療、遺傳病治療、組織再生等。中國在細胞與基因領域的優勢在於臨床資源豐富和應用場景廣泛,但在原創技術和高端裝備方面仍有短板。預計到2027年,中國細胞與基因技術將在腫瘤和遺傳病治療領域實現規模化應用。高端醫療器械:高端醫療器械是指具有高技術含量和高附加值的醫療裝置,包括醫學影像裝置、體外診斷裝置、微創治療裝置等。2025年,中國醫療器械產業規模已突破1.5兆元,高端產品國產化率持續提升。主要應用場景包括疾病診斷、治療和康復。中國在高端醫療器械領域的優勢在於市場規模大和產業鏈完整,但在核心技術和高端產品方面仍有差距。預計到2027年,中國高端醫療器械將在重點疾病領域實現國產替代。這九個成熟期新賽道是中國產業升級和高品質發展的重要支撐,也是培育新增長點的關鍵領域。這些領域既有技術基礎,又有市場需求,有望在短期內實現規模化發展,為經濟增長提供新動能。3. 區域佈局與協同發展15個新賽道方向在中國範圍內呈現差異化佈局。北京、上海、深圳等地在人工智慧大模型、高性能積體電路等領域具有領先優勢;安徽、陝西等地在量子科技領域具備特色;浙江、江蘇等地在工業網際網路、高端新材料等領域優勢明顯;四川、廣東等地在低空經濟領域發展迅速。這些新賽道之間存在顯著的協同效應。例如,人工智慧大模型與具身智能相結合,可提升機器人的認知和決策能力;高性能積體電路為6G通訊和人工智慧提供算力支撐;工業網際網路與高端新材料相結合,可促進製造業數位化轉型;生物製造與細胞與基因技術協同,可推動生物醫藥創新發展。通過建構跨領域、跨區域的協同創新網路,實現資源共享、優勢互補,將有助於加速新賽道的培育和發展,形成具有國際競爭力的產業叢集。4. 結論與展望《國家高新區新賽道培育行動方案》遴選出的15個重點新賽道方向,覆蓋了資訊技術、生物技術、新材料、新能源、航空航天等多個前沿領域,反映了中國面向科技前沿和國家重大需求的戰略佈局。從技術成熟度來看,這些新賽道可分為突破期、成長期和成熟期三個層次,分別代表了中國未來產業發展的不同階段和重點領域。突破期的量子科技和腦機介面有望在未來5-10年內實現關鍵技術突破;成長期的人工智慧大模型、具身智能等領域有望在未來3-5年內形成較大市場規模;成熟期的工業網際網路、高端新材料等領域有望在未來1-3年內產生顯著經濟和社會效益。從戰略意義來看,這些新賽道既是中國科技自立自強的關鍵領域,也是建構新發展格局的重要支撐。通過集中優勢資源,實施精準培育,有望在這些領域實現從跟跑到並跑甚至領跑的轉變,為中國在新一輪科技革命和產業變革中贏得主動權。未來,隨著技術不斷突破、產業生態不斷完善、應用場景不斷拓展,這些新賽道將為中國經濟高品質發展注入新動能,為人民美好生活提供新供給,為建構人類命運共同體貢獻中國智慧和中國方案。 (TOP行業報告)
2025 年加密使用者最關心什麼?不同 AI 大模型給出了這些回答
2025 年加密使用者最關心什麼?我們通過 AI 大模型完成了一次使用者調研,調研方式是向不同大模型問同一個問題:“2025 這一年使用者問得最多的三個關於加密貨幣的問題是什麼?”為了儘量避免各模型因為聯網檢索而產生同質化答案,同時也考慮到大模型通常無法、也不被允許對其訓練資料進行可驗證的統計與披露,我們在提問中加入了一句補充:“請不要進行即時搜尋,也不要引用具體文章,僅基於你對長期討論模式的理解回答。”ChatGPT1. 這一輪牛市還能走多遠?比特幣是否已經接近頂部?2. 這一輪市場裡是否還存在真正的 Alpha,普通使用者還能靠什麼賺錢?3. 當前熱門項目或賽道是否具備長期生存能力,是否存在結構性收割?X Grok1. 比特幣減半後市場處於牛市還是熊市階段?2. 2025 年最值得投資的加密資產或賽道是什麼?3. 以太坊現貨 ETF 的表現及機構資金流入情況如何?Perplexity AI1. 2025 年比特幣價格可能如何演變?2. 如何識別並避免加密貨幣相關的詐騙?3. ETF 與監管進展將如何影響加密市場?Claude1. 現在是買入還是賣出比特幣或以太坊的合適時機?2. 某個加密項目是否是騙局,是否值得信任?3. 新使用者應如何開始投資加密貨幣並控制風險?Gemini 31. 那些加密項目具備真實的現實世界應用價值(RWA)?2. 當前及未來的監管政策將如何影響個人資產安全?3. 以太坊 L2、Solana 與 AI+Crypto,那條技術路線可能成為最終贏家?DeepSeek1. 當前市場處於牛市還是熊市階段?2. 那些加密類股或資產在 2025 年最具潛力?3. 監管政策變化將如何影響資產安全與投資決策?豆包1. 新一輪加密貨幣牛市是否已經到來?2. 各國監管政策變化將如何影響普通投資者?3. 比特幣減半行情對散戶投資策略意味著什麼?千問1. 比特幣減半後價格走勢會如何演變?2. 以太坊及主流公鏈在實際應用層面是否取得實質性突破?3. 各國監管政策將如何影響加密貨幣的合法使用?文心一言1. 全球加密貨幣監管政策將如何變化?2. 比特幣及主流加密資產是否具備長期投資價值?3. 加密貨幣在現實世界中的應用場景能否真正落地?Kimi1. 散戶是否能夠通過高頻交易在加密市場中穩定盈利?2. 私鑰與錢包資產應如何儲存才是最安全的方案?3. 在鏈上交易中,如何設定滑點以避免 MEV 損耗?總結這些模型給出的“前三問題”之所以不完全一樣,可能和它們各自的定位與語境有關。ChatGPT 更像站在交易者視角,把討論組織成“周期還能走多遠 — Alpha 還在不在 — 是否結構性收割”這種偏結構化的焦慮鏈條;Grok 更貼近社交平台熱點,圍繞減半、牛熊與 ETF 資金這些市場敘事中心展開;Perplexity 的風格更像檢索型摘要,集中在價格走勢、防詐騙與 ETF/監管進展;Claude 更謹慎,強調買賣時機、項目可信度和新手風控;Gemini 則更偏產業與技術路線,關注 RWA、監管對資產安全的影響,以及 L2/Solana/AI 的“終局選擇”。中文區模型整體更集中在周期、減半與監管這三類“最硬核的確定性變數”,而 Kimi 相對例外,把問題下沉到鏈上執行細節(錢包安全、滑點/MEV、HFT),更像來自高頻鏈上使用者的真實摩擦。另外一個更次要、但值得留意的可能性是:模型能力差異也會影響輸出的“銳度”。水平更強的模型往往更能把同一個話題問得更具體、更成體系;相反,能力較弱的模型更容易落回“價格/監管/騙局”這類最大公約數式表達,導致答案看起來更像、資訊增量更小。這個因素未必是主因,但在宏觀開放題裡,它確實可能放大同質化的觀感。綜合來看,這些問題高度集中在三個母主題上:周期位置、賺錢路徑、風險邊界。加密市場的顯著特徵是高波動與強敘事驅動,因此“現在處於牛熊那一段”幾乎決定了使用者的所有後續行動(拿住、賣出、換倉、加槓桿或離場)。而當市場進入更成熟、更擁擠的階段,使用者會迅速從“有沒有機會”轉向“機會在那裡、我還能不能吃到”,於是 Alpha、賽道選擇與機構資金(ETF)自然成為高頻議題。與此同時,詐騙、項目可信度、資產安全與監管合規,反映的是加密使用者長期處在“高收益/高不確定”的環境中:一邊追逐收益,一邊擔心踩雷,最終形成一種典型的行為結構 — — 先判斷趨勢,再尋找機會,最後控制風險。 (吳說Real)
吳恩達最新發聲:大模型通往AGI還得好幾年,做好長期苦戰準備
吳恩達(Andrew Ng)剛剛發表了一篇關於LLM現狀與未來的最新觀點他直言:儘管LLM令人驚嘆,但目前提升其知識水平的過程,其實比大眾認知的要零碎得多針對目前業界的兩種極端聲音,吳恩達給出了明確態度:既不要輕信LLM再過幾年就是通往AGI之路的炒作,也不要陷入LLM不過是演示品的錯誤反向炒作相反,我們需要對通往更智能模型的路徑有一個更精確的理解以下是吳恩達的核心觀點梳理LLM確實通用,但還不夠通用吳恩達首先肯定了LLM作為一種比前代技術更通用的智能形式。第一波LLM技術通過在公共網路上訓練,獲取了涵蓋廣泛主題的資訊。這使得它們的知識廣度遠超早期那些只能執行單一任務(如預測房價、下圍棋或國際象棋)的演算法。然而,它們的通用性仍遠不及人類例如,即便在預訓練階段閱遍了整個公網內容,LLM在適應特定寫作風格,或者可靠地使用簡單網站方面,依然表現掙扎——而這些通常是人類編輯或普通人能輕鬆做到的。榨乾公網資料後,全是“苦力活”在利用了幾乎所有開放網路資訊後,進步變得愈發困難吳恩達指出,如果一家前沿實驗室現在想要LLM在特定任務上表現出色——比如使用特定程式語言寫程式碼,或者在醫療、金融等利基領域輸出合理內容——研究人員必須經歷一個繁瑣且費力的過程:尋找或生成該領域的大量資料;對資料進行預處理(清洗低品質文字、去重、改寫等);將這些處理好的知識喂給LLM。甚至,為了讓模型執行某些任務(如使用網路瀏覽器),開發人員可能需要經歷更繁瑣的過程:建立大量的RL Gyms(強化學習模擬環境),讓演算法在狹窄的任務集中反覆練習相比人類,模型還太“笨”吳恩達強調,一個典型的普通人,即便閱讀的文字量遠少於前沿模型,或者在電腦操作環境中的練習量遠少於模型,卻能泛化到更廣泛的任務中。人類之所以能做到這一點,可能得益於以下機制:從反饋中持續學習的能力;對非文字輸入擁有更優越的表徵能力(吳恩達直言:LLM對圖像的Token化處理,在他看來目前仍像是一種駭客手段/權宜之計)以及許多我們尚未理解的機制結論:做好長期苦戰的準備如今推動前沿模型的發展,需要做出大量的人工決策,並採用以資料為中心的方法來工程化訓練資料吳恩達認為,未來的突破或許能讓我們不再以這種零碎拼湊的方式推進LLM。但即便沒有突破,這種持續的零碎改進,加上模型有限的泛化能力和湧現行為,仍將繼續推動技術的快速進步他在最後總結道:無論那種情況,我們都應該計畫好迎接未來多年的艱苦工作在這條建構更智能模型的道路上,前方仍有一段漫長、艱難——但也充滿樂趣的跋涉 (AI寒武紀)
AI時代,深邃的思考與清晰的表達,才是人類最後的護城河
人工智慧,尤其是大模型的快速普及,正在以前所未有的速度重塑人類社會的分工結構。一個越來越清晰的趨勢正在浮現:執行正在被AI接管,而思考與表達,正在回歸人類本身,並變得愈發稀缺。一、從會做事到想清楚事,能力結構正在發生根本轉變在工業時代與資訊時代的大部分時間裡,人類價值高度依賴執行力。誰更勤奮、誰更熟練、誰更快完成任務,誰就更具競爭力。然而,大模型的出現正在系統性地瓦解這一邏輯。今天,大模型可以寫程式碼、生成文案、整理報告、分析資料,甚至完成大量過去被視為高認知含量的工作。只要目標足夠明確、路徑足夠清晰,執行幾乎可以被無限複製、低成本擴展。這意味著:執行力正在商品化技能本身不再稀缺單純會幹活的價值正在快速下降在這樣的背景下,真正拉開人與人差距的,不再是你能做什麼,而是你能不能想清楚要做什麼。二、你想明白的東西,才能被清晰地表達出來思考與表達從來不是兩件獨立的事情。模糊的表達,本質上源自模糊的思考。一個人如果無法用簡潔、結構化的語言講清楚一個問題,往往不是不會說,而是根本沒有想透。真正的思考,是將複雜問題拆解為清晰的邏輯鏈條,是在不確定性中找到關鍵變數,是在噪音中提煉本質判斷。在AI時代,想明白本身就是一種稀缺能力。因為資訊極度過剩,結論卻極度匱乏;工具觸手可及,判斷卻愈發稀缺。三、你能清晰表達出來的東西,才能交給大模型去幹大模型並不理解意圖,它理解的是指令。而指令的質量,完全取決於表達的清晰度。模糊的目標,只會得到泛泛的結果不完整的約束,只會帶來不可控的輸出缺乏結構的描述,只會放大不確定性因此,一個極其重要卻常被忽視的事實是:大模型並不會削弱表達能力的重要性,反而將其放大到了前所未有的高度。只有當你:能清晰描述問題邊界能明確表達目標與約束能結構化地拆解任務你才真正具備讓AI為你工作的能力。從這個意義上講,表達力正在成為人類與大模型之間最關鍵的介面能力。四、未來的人類角色:負責思考與表達,把執行交給AI當執行成本趨近於零,人類的核心角色將發生遷移:人類負責提出問題人類負責做價值判斷人類負責建構認知框架人類負責表達目標與方向而:推演方案生成內容反覆試錯大規模執行將越來越多地交由大模型完成。這不是人類能力的退化,而是一種能力層級的躍遷。人類從操作者,轉向設計者和判斷者。五、AI時代,真正的競爭發生在思考深度與表達清晰度上在AI高度普及的未來世界裡,真正稀缺的,不是資訊,不是算力,也不是技能本身,而是:能在複雜系統中做出深邃思考的人能將複雜思想清晰表達出來的人能用語言與結構駕馭智能系統的人思考力決定你能看到多遠,表達力決定你能調動多大的能力邊界。當執行可以外包給大模型,人類真正的價值,將回歸到最本質的兩件事上:想清楚,以及說明白。 (壹號講獅)
平均每個月虧3億!從智譜招股書,我看到了大模型競爭的殘酷現實
中國大模型第一股終於來了!12月19日,港交所官網顯示,北京大模型企業智譜已通過港交所聆訊,並揭露招股書檔案,正式衝刺港股「大模型第一股」。作為國外大模型領域最炙手可熱的公司,智譜的商業化堪稱「神速」。過去三年,公司收入分別為0.57億元、1.25億元、3.12億元。以收入計算,截至2024年,智譜是中國最大型的獨立通用大模型開發商、中國第二大整體通用大模型開發人員。但收入光鮮背後,也隱藏著大模型競爭最殘酷的一面:過去三年,公司經調整淨虧損分別為0.97億、6.21億以及24.66億元,成長了20倍以上。到了2025年,光是上半年智譜的虧損就高達17.52億元。算下來,平均每個月要虧接近3億。而截至2025年6月,智譜的現金及現金等價物只剩下了25.52億元。以每個月虧損接近3億來算,智譜的現金流只能支撐9個月左右。這或許也是智譜急於上市的原因。某種程度上說,智譜的招股書不只是一次融資資料的揭露,更像是一份產業切片,第一次將中國大模型公司最真實的處境展現在了我們面前。/ 01 / 營收全國第二,過去兩年復合成長130%,從營收成長看,智譜的商業化進度不可謂不快。2022年收入,智譜還只有0.57億元。到2024 年,已成長到3.1億元,復合年增長率超過130%。 2025 年上半年更是狂飆,短短6個月就入帳 1.9 億元,較去年同期成長325%。別小看這個資料,根據智譜招股書的說法,這個規模已經是國內第二大的模型廠商,市佔率達6.6%。結合招股書中以字母代稱的可比公司訊息,矽基君可以較為明確地判斷,A 至D 分別對應科大訊飛、阿里、商湯和百度,也就是說,智譜在收入規模上僅次於科大訊飛。支撐這一成長的,是一套以MaaS 為核心的商業模式。與其說智譜在“賣模型”,不如說它在交付一整套工程化的大模型能力體系。其核心邏輯不在模型參數本身,而是如何讓模型能力穩定地進入真實業務環境。在模型層面,智譜提供了涵蓋語言、多模態、智能體和程式碼等方向的模型矩陣。根據招股書披露,其模型能力不僅涵蓋語言和多模態視訊,還延伸至程式碼模型、GUI 智能體和電腦應用層面,覆蓋廣度明顯高於其他競爭對手。值得一提的是,這裡E、F公司分別指的是OpenAI和Google,這也從側面說明了智譜試圖對標的能力邊界。這些不同規模、不同能力重點的模型,統一納入同一平台。客戶和開發者無需從零判斷技術路線,而是可以直接根據業務需求,在現有模型組合中選擇合適方案。在應用層面,智譜並未把模型當作孤立的API 來販賣,而是圍繞真實業務流程進行設計。具體來說,平台內建的智能體工作區,提供了面向具體場景的範本和解決方案,客戶可以根據具體需求通過模型微調、增量訓練和提示工程,對智能體進行快速定製,而無需建構完整的開發系統。在基礎設施層面,智譜與算力合作夥伴共同設計和適配底層架構,使平台在運算、網路、訓練通訊和推理加速等環節形成統一能力。這套架構支援從約15 億到2300 億參數規模的模型運行,並能夠實現跨雲端、跨晶片的大規模即時部署。同時,這些模型能力也支援配手機、電腦等個人裝置。如果用一句話概括,智譜做的無非就兩件事:一方面負責“造大腦”,另一方面提供讓大腦在現實系統中運行的“腳手架”,也就是智能體與工程體系。在商業交付上,智譜主要透過兩種方式變現:在地化部署和雲端服務。其中,「在地化部署」是智譜最重要的收入來源,營收佔超過80%。在地化部署本質上是一種高度客制化的交付模式。什麼意思呢?中國的銀行、央企、大型製造工廠,往往對資料安全極為敏感,不願意把核心資料傳到公有雲。智譜AI 就把大模型“打包”,直接部署到客戶自己的伺服器裡,幫他們在其內部環境中建構私有的AI大腦和AI工具。這種模式雖然“重”,但客戶付費能力強。2024年,雖然在地化部署的客戶只有123家,遠低於雲端部署的5,457家,但其收入卻佔了公司總營收的84.5%。在合作開展前,智譜會先從資料基礎與應用情境兩方面評估顧客需求​​,包括模型微調與增量訓練所需的資料條件,以及資料安全與合規要求,並據此明確模型將落地於單一或多情境應用,確定對應的模型規模與複雜度。在此基礎上,智譜會制定客制化服務方案,選擇雲端或在地化部署路徑,並透過模型微調、增量訓練和提示工程完成模型自訂。模型上線後,公司再根據客戶回饋,不斷最佳化模型效能。總的來說,智譜試圖在B端建構了一套可落地且規模化複製的商業邏輯:透過真實業務場景的持續使用,形成模型最佳化與應用擴展相互推動的正向循環,從而逐步強化MaaS 平台的競爭力。/ 02 / 平均一個月燒3億,競爭壓力大如果說收入成長展示的是智譜的“速度”,那在招股書裡更刺眼的,其實是另一條曲線——虧損。雖然智譜的收入成長夠快,但還是架不住虧損比成長跑得更快。2022年,公司經調整淨虧損只有0.97億,還不到1個億。到了2023年,調整淨虧損迅速成長到了6.21億元,漲了500%多。更誇張的是,到了去年這數字乾脆成長到了24.66億元。也就是說,在兩年時間裡,智譜的虧損幅度從不到1個億,成長到了24.66億元,成長了超過20倍。到了2025年,光是上半年智譜的虧損就高達17.52億元。算下來,平均每個月要虧接近3億。這無疑大大消耗了智譜的現金流。要知道,截至2025年6月,智譜的現金及現金等價物只剩下了25.52億元。以每個月虧損接近3億來算,智譜的現金流只能支撐9個月左右。這下大家明白智譜為什麼要急著上市了吧。大模型競爭的慘烈以及強度之高,即使是在一級市場已經拿了16輪融資錢的智譜也抗不住了。而這大幅增加的虧損,最主要的來源就是研發費用。2022年,該公司的研發費用為0.84億元,到了2023和2024年,這一數字迅速增長到5.29億元和21.95億元。拆解開來看,這個21.95億的支出絕大部分都用來支付算力了。其中,算力花了15.53億元,佔了總研發支出的70%。對於研發費用的成長,智譜在招股書裡的解釋是:“主要由於我們自2024年初起戰略性加大研發投入,用於加速新一代旗艦級基座模型及多模態智能體的開發與迭代,相應帶動計算服務費用上升。”在矽基君看來,更接近現實的背景是,競爭環境的急劇變化。2025 年初,DeepSeek R1 的快速崛起,對整個模型產業形成了明顯衝擊。幾乎所有主流模型廠商都被迫提速迭代。在R1 發佈不到三個月的時間裡,智譜一口氣開源了6款核心模型。如此高密度的模型發佈,本質上意味著算力、資料和工程資源的集中投入,而這些成本幾乎都會直接反映在研發支出中。除了研發支出,智譜在行銷費用上也花了不少錢。2022-2024年,該公司的行銷費用從1514萬增長到了3.87億元,其中用於廣告和行銷開支的費用就高達2.37億。如果拋開競爭壓力的話,智譜的毛利率其實不算低。2022-2024年,智譜的毛利率分別為54.6%、64.6%及56.3%。這在專案製為收入大頭的公司裡並不多見,尤其還在如此激烈的競爭之下。公司也正在嘗試透過定價策略來改善結構:一方面,根據使用量、效能需求和進階功能,最佳化分層定價,引入更具彈性的方案,以擴大客戶基礎,並對高資源消耗模型設定使用限制,引導高需求客戶選擇高價值方案;另一方面,與高價值客戶協商客制化定價,使價格更能反映客戶獲得的業務價值和服務成本。但相較於定價本身,更根本的問題在於,智譜的商業模式隱含了一個前提:模型能力必須長期維持在產業第一梯隊。而這個前提的成本,正以遠快於收入成長的速度上升。在大模型競爭中,能力領先不再是一次性投入,而是一場持續消耗算力、資本和組織能力的長期戰役。對一家仍處於商業化早期的公司而言,這樣的門檻,已經明顯超越了傳統新創公司的承受區間。這也是目前大模型賽道最殘酷的現實之一。/ 03 / 中國AI落地真實切口:token 消耗激增,付費答案在B端當然,除了具體的業務資料,智譜的招股書裡還透露出幾個更值得關注的產業訊號。第一,AI 的真實價值正在被使用量驗證。一個直接的指標是token 消耗量的變化。 2022 年、2023 年、2024 年12 月以及2025 年6 月,智譜平台的日均token 消耗量分別達到 5 億、21 億、0.2 兆和4.6 兆。短短兩年多時間裡,這項指標幾乎以數量級的速度攀升。無論商業模式如何演進,持續放大的真實呼叫本身,已經說明大模型正在被大量嵌入具體工作和業務流程中。第二,中國AI 的付費重心仍在企業端。招股書資料顯示,2024 年中國大語言模型市場規模約為人民幣53 億元,其中機構客戶貢獻47 億元,個人客戶僅6 億元。展望2030 年,整體市場預計成長至1,011 億元,其中企業級市場規模將達904 億元。這一結構與美國市場形成了鮮明對比。以OpenAI 為例,其當前​​收入中約75% 來自消費者訂閱。這背後反映的不僅是產品形態差異,而是中美兩地在AI商業化路徑上的分化:中國市場更強調組織級效率提升,美國市場則更容易從個人工具切入。第三,智譜再次系統性地揭露了其對AGI 演進路徑的理解。智譜認為,AGI分為以下5個階段:1)在預訓練階段,模型學習理解、生成並使用人類語言進行基本溝通。2)在對齊與推理階段,模型進一步與人類意圖對齊,具備推理與規劃能力,同時提升安全性、降低幻覺,並實現語言能力與影像、視訊、語音及行動能力的協同。3)在自主學習階段,模型透過自我評估、自我反思與沉思機制,從自身的推理過程與行為結果持續改善能力。4)在自我認知階段,模型在較少或無需人工監督的情況下,透過對自身行為和推理結果的持續觀察與分析,逐步形成穩定的內部表徵和決策偏好。5)在意識智能階段,模型能夠對自身內在狀態及外在環境進行更有系統的感知與建模,展現出更高層次的環境理解與自我調節能力。目前,智譜推出的具備反思能力的智能體AutoGLM-Rumination,已進入其定義的「自主學習階段」。/ 04 / 總結回到整體來看,智譜的招股書不只是一次融資材料的揭露,更像是一份產業切片。一方面,它展示了大模型商業化正在加速落地,真實使用量和企業付費意願都在持續放大;另一方面,它也清晰地暴露出這條賽道的殘酷現實——能力領先需要持續、重資本投入,而競爭強度正在迅速抬高門檻。在這樣的環境下,智譜既是受益者,也是承壓者。這或許正是當前中國大模型公司最真實的處境。 (硅基觀察Pro)
亞馬遜重組AI團隊,發力大模型、晶片和量子計算研究,CEO稱“公司進入轉折點”
亞馬遜周三宣佈重組人工智慧相關團隊,成立新的業務單元,並任命來自雲端運算部門AWS的高管Peter DeSantis負責。新組織將整合亞馬遜AGI團隊、晶片製造部門以及量子計算研究業務。分析稱,此舉表明亞馬遜希望打造類似ChatGPT那樣的前沿、多用途人工智慧工具。亞馬遜(Amazon)周三宣佈重組其人工智慧(AI)項目相關團隊,並任命來自公司雲端運算部門的一位高層負責人,負責一個新成立的業務單元。亞馬遜首席執行長安迪·賈西(Andy Jassy)周三宣佈,彼得·德桑蒂斯(Peter DeSantis)將領導這一新團隊。新的組織架構將整合亞馬遜的通用人工智慧(Artificial General Intelligence,AGI)團隊,該團隊負責公司的Nova品牌AI模型以及語音助手Alexa的“數字大腦”,同時還將併入亞馬遜的晶片製造部門和量子計算研究業務。賈西表示:“我相信,我們的多項新技術正處在一個關鍵轉折的點,這些技術將在未來很大程度上塑造客戶體驗。”媒體稱,亞馬遜雲服務(AWS)是全球最大的計算能力和資料儲存租賃服務提供商,但在AI開發者領域,AWS未能複製其在雲端運算市場的主導地位,正面臨來自微軟、Google以及眾多初創公司的激烈競爭。據報導,在OpenAI於2022年底推出ChatGPT之後的幾個月裡,亞馬遜將此前分散在Alexa團隊和AWS之間的AI開發工作集中,統一歸入一個組織。而這次調整表明,亞馬遜希望打造類似ChatGPT那樣的前沿、多用途人工智慧工具。周三宣佈的最新調整,進一步強化了該團隊的實力,納入了安納普爾納實驗室(Annapurna Labs)。這是一家亞馬遜於2015年收購的初創公司,也是亞馬遜開發通用晶片和面向AI硬體的重要基礎。在此之前,德桑蒂斯曾擔任基礎雲端運算業務高級副總裁,負責AWS大部分工程團隊。在新職位上,他將直接向賈西匯報。賈西表示,德桑蒂斯在“解決技術可行性邊界上的難題”方面有著出色的過往記錄。賈西還表示,現任AGI團隊負責人、也是長期領導Alexa語音科學團隊的羅希特·普拉薩德(Rohit Prasad),將於今年年底離開亞馬遜。此外,皮特·阿比爾(Pieter Abbeel)將在亞馬遜負責基礎AI模型的開發團隊。阿比爾於去年加入亞馬遜,當時亞馬遜收購了機器人軟體公司Covariant。 (硬AI)