#天數智芯
上海殺出500億隱形龍頭:中國第一
過去2個月,最吸金的賽道,莫過於中國國產GPU。那些1天賺700%、5年賺1000倍的神話,在這一輪全部實現,並且都繞不開一個關鍵詞:GPU四小龍——摩爾線程、天數智芯、沐曦、壁仞科技。一位長期跟蹤GPU產業的投資人對鉛筆道表示:誇張點說,過去5年,如果沒投GPU,相當於這一輪周期“白幹”。這種遺憾,不亞於移動網際網路時代錯過字節。這個機會窗口正越來越小。本月,隨著通用GPU企業——天數智芯在港股上市,募資約32億元,意味著四小龍最後一塊拼圖被補齊。值得注意的是:IPO之前,這家低調到幾乎不接受媒體採訪的公司,最近持續向市場釋放消息。1月26日,它亮出幾張底牌:公佈了2025到2027年的GPU架構路線圖,特別需要指出,2025年推出的天數天樞,在DeepSeekV3場景,性能已超輝達Hopper架構20%,這意味著天數的路線圖已經在兌現過程中。同時,這次發佈天數智芯還推出四款邊端產品彤央系列(可理解為“本地算力模組”),尺寸從口袋大小到桌面級;還披露了最新商業進展:覆蓋20個行業、300多個客戶、1000個聯合開發案例,數千卡叢集已穩定運行超1000天。這些動作,不禁引發好奇:它究竟能撐起多大的戲碼,能否持續創造千倍的收益神話,又會怎樣影響中國國產GPU的格局?- 01 - 新神話還是新泡沫這些動作背後,有一個特定背景,那就是目前的中國國產GPU,泡沫和機會一樣大——天數智芯這些動作,離機會更近,還是離泡沫更近?中國國產GPU的機會在那裡?多說無益,直接看輝達。過去10年,市值從幾百億美元,漲到兆美元,一年收入約1300億美金(2025財年),其中淨利潤超700億美元。這些數字背後,有一個幾乎共識的結論:AI的盡頭是算力;算力的盡頭,是GPU。AI要想聰明,必須燒錢、燒算力;而要想算力大,就必須“卡”多。這些元素中,錢、演算法都不稀缺,稀缺的幾乎只有一個:GPU。2020年之前,全球大部分的GPU產能,都卡在一家公司手裡:輝達。因此,中國國產GPU的起點,並不浪漫,只有三個字:買不到。尤其到2022年底,美國收緊AI晶片出口規則,相當於洪水撞上大壩,小路直接被堵死。這些“卡脖子”局面,逼得本土廠商必須自研。這支本土隊伍中,既包含了寒武紀、海光資訊等,也囊括著GPU四小龍:摩爾線程、天數智芯、沐曦、壁仞科技。此外,還包括各類超級獨角獸,比如燧原科技、崑崙芯等(見下表)。統計發現,這些公司的成立時間,可以分為兩類:一類成立於2019-2020年前後,正值中國國產GPU爆發前夕;另一類是先遣部隊,成立於2015年前後,風口還沒來就等在那裡,比如寒武紀、天數智芯、海光等。這些先遣部隊,成立之初,也不是完全奔著GPU而去。只是幹著幹著,風口來了。以天數智芯為例,2015年成立時(總部上海),它鎖定的並不是GPU,而是算力加速軟硬體產品,好比打遊戲時的“外掛工具”,能讓計算速度更快。但過程中,AI算力的需求,讓它發現GPU的供不應求。於是2018年,天數智芯轉向GPU研發,啟動首款產品(天垓100)的流片工作。這才有了後來的成果:實現中國通用GPU從0到1的首次突破,成為中國第一家自研、量產通用GPU的公司。這些隊伍,取得的成績也不盡相同。海光、寒武紀起步較早,成了第一批中國國產GPU上市公司,市值在5000億-7000億不等。剩下的“GPU四小龍”,上市時間接近,差異化也較大。觀察可以發現:錯位比較明顯的是天數智芯。它的成立時間最早,自研量產時間最早,晶片交付量靠前(通用GPU5.2萬枚),年收入排名第二(2024年)。基於這種全站自研通用GPU的技術優勢和實戰場景打磨的規模化商業落地優勢,不少投資人看好它的稀缺性和增長潛力。中國國產GPU四小龍市值及收入對比。- 02 - 偽需求與真痛點中國國產GPU現在熱度爆表,錢也追得凶,但能不能一直火下去,要回到一個根本問題:晶片好不好用,能不能被客戶認可。這個痛點下,中國國產GPU有三大流派。一類是“參數派”。這是最容易被市場看見的一類:指標好看。核心算力、記憶體頻寬、跑分成績都挺亮眼,宣傳材料資料一列一列地甩出去。另一類是“定製項目派”。它的風格是:先解決問題,再談指標,優點是:短期賺得穩、問題能解決,但想做成流水線大廠,天花板明顯。最後一派是“系統工程派”或者叫“解決方案派”,天數智芯就是這類企業。它是前面兩派的融合,既做晶片又承接定製項目,但不追求一次性表現,而是提供長期可運行的解決方案:不僅做硬體,還要自研軟體棧、工具鏈、編譯器和適配層等。這條路走的人不多,難度大。天數智芯副總裁鄒翾對鉛筆道說:“我們在中國首家建構了通用架構下的GPU全端設計能力,目的就是為了在客戶實際場景中實現好用、落地。”這三大路線差異較大,但面臨的瓶頸相同,那就是:直到今天,“中國國產卡”的份額依然很小。多家頭部算力中心負責人向鉛筆道表示:過去1-2年,中國國產晶片仍是少數選擇——就算是“老大哥”華為,也面臨這個瓶頸。具體的份額,可以用一組數字來形容:100張通用GPU裡,大約只有不到6.5張是中國國產卡(2025年/如圖)。天數智芯招股書中,對中國國產GPU份額的描述。“中國國產卡”為什麼份額少,是性能不行嗎?不完全是。據外媒報導,中國多款頭部晶片,關鍵性能與輝達旗艦產品(H100)相比,差距只有10%-20%。甚至某些產品,中國國產GPU還實現了反超。比如1月26日,天數智芯發佈的幾款邊端產品,打通客戶應用場景“最後一公里”,把雲端大算力能力折疊進方寸之間,將整合大算力的小巧產品,送到客戶的“手中”,就像在場景的端側產品中安裝了“大腦+小腦”,讓邊端場景的運行更加流暢。比如具身智能機器人,不但能夠走路,而且可以根據算力支撐的即時判斷能力,進行“勞動”。此外這個產品還可以應用在工業智能、交通智能、車陸運一體化協同。在這組產品中,“基礎款”的性能已反超國際卡3.7倍。天數智芯與輝達相關產品性能對比。性能的差距,為中國國產GPU爭回來不少分,但另一個更值得重視的問題是:晶片好不好用,客戶認不認可。- 03 - 破局思路中國國產GPU的破局思路是什麼?天數智芯副總裁鄒翾的建議是:回歸“好用”。“這麼多年,我們一直在思考:什麼是好用的GPU?如何衡量GPU價值?使用者核心訴求是什麼?我們的洞察就是簡單兩個字:好用——它不單單指的是價格優勢,還包括使用體驗:比如要花多少人力、多少物力、多少時間。”這聽起來可能有點抽象,他舉了兩個身邊案例。有家AI創業公司,金融大模型每季度至少迭代兩個版本,每次硬體適配,需要投入10人團隊,耗費兩周修改500至1000行程式碼。另一家傳統企業,需要用開源大模型建知識庫,因硬體介面不相容,落地周期常從一個月,延遲至兩到三個月。這些痛點,不只在1-2個案例身上體現。鄒翾介紹,截至去年底,天數智芯探索了20個行業,服務了300客戶,聯合開發了1000個案例,無一不指向這個答案:產品好用!。在客戶眼裡,這種“好用”,具體又包括什麼?天數智芯副總裁郭為向鉛筆道提到:客戶買不買你的產品,主要看三點。1、客戶現有使用習慣是否需要改變;2、是否提供本地化調優服務;3、是否有價格優勢。郭為表示,就算自己第一次拜訪客戶,也基本從這三點入手。這三句話背後,隱含著客戶的三大煩惱。1、別讓客戶為了“新卡”去改程式碼、換框架、重寫流程;2、通過貼身調優,把坑在前期填掉,幫客戶把系統真正跑穩;3、利用中國國產優勢,給客戶一個願意嘗試的理由。比如,天數智芯發佈了4款邊端產品:彤央系列(如下表)。天數智芯的新品,可用於機器人等新興場景。其中,副總裁郭為講述了一個客戶痛點。中國有家機器人未來獨角獸——格藍若,想選一款晶片,讓機器人“聽得清、想得快、說得明”。核心訴求之一,就是相容性。“我們模組採用的標準介面,和輝達的Orin完全相容。目前中國,機器人幾乎全行業採用的都是輝達標準,所以客戶的使用習慣等都不用改變,拿過去可以直接用。”最終,格藍若選擇了天數智芯。又比如,天數智芯還發佈了3年架構路線(如圖)。這些架構背後,主要的指引思路,也是“好用”:算得快、算得省、省力、可持續等。比如算得快(高利用率):天樞架構的“Attention效率>90%是個關鍵指標,意味著晶片幹正事的時間更多,浪費的算力更少。比如算得省。天樞架構追求更精細的“省電”模式,這就像給不同的任務(科學計算、AI推理)匹配最合適的“燃料”,在保證結果正確的前提下,最大限度降低功耗和成本。此外,為了讓客戶省錢,解決DDR儲存價格高的問題,天數智芯通過kv cache等技術,讓模型推理使用的記憶體量降低50%以上。- 04 - 結語未來幾年,通用GPU的中國國產化趨勢不可逆。據行業報告顯示,預計2029年,中國國產率有望達到50%。摩爾線程、天數智芯、沐曦、壁仞這四小龍,就像中國GPU市場的先遣部隊,各自搶佔陣地,也把初步經驗探索了出來:對使用者來說,買的不僅僅是卡,而是最終體驗。天數智芯此次向市場釋放消息,或許就是朝著這個目標,為下一輪競爭做鋪墊。 (鉛筆道)
瑞幸背後的晶片,藏不住了
瑞幸咖啡背後的晶片,藏不住了。當你走進瑞幸咖啡店,點一杯生椰拿鐵的所有過程,例如下單、出杯、核銷、取餐……這一切的背後其實都有一雙“眼睛”在盯著。在看什麼?它要即時識別訂單、判斷製作節奏、校驗物料狀態、監控裝置運行,還要把資料同步回總部,用於品控、調度和營運決策。這就是藏在瑞幸咖啡背後無數的邊緣側AI,它們有一個共性,那便是算力必須就近部署,響應必須足夠快,穩定性必須足夠強,成本還要可控。晶片,成了其中關鍵中的關鍵。就在今天,瑞幸背後晶片的廬山真面目終於浮出了水面——來自一家剛剛完成上市不久的中國國產通用GPU公司,天數智芯。前腳剛剛敲完鐘,時隔僅半個月時間,天數智芯便又一口氣發佈了四款邊端算力產品,彤央系列。而且不只是發佈的動作,像瑞幸已經在用的邊端算力,正是彤央。那麼這個系列的產品到底實力幾何,我們繼續往下看。一口氣發佈四款新品先來看名字。彤央之名,源自商周青銅器銘文,但在天數智芯的內部,彤央有著別樣的寓意:“彤”指向高能效計算能力,“央”則意味著在邊端場景中承擔核心算力樞紐的角色。換言之,這是一個為真實業務現場而生的算力系列。彤央系列的首發陣容,共包括四款產品:TY1000、TY1100,以及定位算力終端的TY1100_NX和TY1200。先看彤央TY1000。這是一個標準699Pin介面的模組,尺寸只有口袋大小,但在這個方寸之間,天數塞進了近200T的稠密算力。在實際測試中,無論是典型的CV任務,還是NLP推理,甚至是對參數規模達到32B的DeepSeek-R1模型進行推理,以及具身智能VLA模型及世界模型等場景,TY1000在多項指標上都展現出不弱於主流國際方案的表現。在天數智芯披露的測試資料中,TY1000在多類負載下的綜合效率,超過了輝達AGX Orin所對應的典型配置。雖然這並不意味著全面替代,但至少證明了一件事:在邊端通用推理這個維度,中國國產通用GPU已經具備了正面對比的能力。其次是彤央TY1100。這款產品在架構上進行了進一步升級,採用了12核ARM v9架構CPU,並在系統級算力供給上更加充沛。它面向的是對通用計算和AI推理都有較高要求的複雜場景,比如多感測器融合、邊緣資料預處理、即時決策等。如果說TY1000更偏向算力核心,那麼TY1100則更像是一塊完整的邊緣計算底座。接下來,是針對對視訊記憶體容量和性價比更加敏感使用者的TY1100_NX。更大的視訊記憶體配置,使其在多模型平行、長序列推理等場景中具備更高的穩定性,同時維持了即插即用的部署方式,降低了系統整合門檻。最後,便是彤央TY1200,則被天數智芯定義為算力終端。它的算力規格提升到了300 TOPS,更重要的是,它是面向終端形態的整體方案。這類產品的目標使用者,並不只是演算法工程師,還包括希望直接把AI能力裝進裝置的行業客戶。從產品組合上看,彤央系列並沒有走單點極致路線,而是刻意拉開了算力、形態和價格區間,覆蓋從算力模組到終端的不同部署需求。但天數智芯並沒有把重點只放在晶片的參數上。在生態層面,彤央系列在介面和形態上實現了與主流產品的Pin-to-Pin相容,大幅降低了客戶從既有方案遷移的成本。這一點,對於已經有成熟系統的工業和商業客戶來說,幾乎是“是否願意嘗試”的分水嶺。更重要的是,這些產品並不是為了發佈而發佈。在機器人領域,彤央與格藍若機器人合作進入企業實際應用場景;在工業側,比依電器等製造企業正在用其進行裝置智能化升級;在商業零售場景中,瑞幸咖啡只是其中一個典型案例;而在交通領域,彤央系列也已經參與到多個車路雲一體化試點中。當四個完全不同的行業場景,開始使用同一套通用GPU算力底座時,一個更大的問題隨之浮現:天數智芯真正想做的,究竟是什麼?天數智芯的“野心”也暴露了如果只看彤央系列,很容易理解為一家中國國產晶片公司想要率先補全雲邊端的業務版圖。但從其同樣於1月26日公開披露的架構路線圖來看,事情顯然沒有這麼簡單,在其業務大本營的雲端場景,天數有更野心勃勃的目標。天數智芯並不滿足於中國國產替代這個階段性目標。在多次公開場合中,它都明確提到,自己的長期目標是對標乃至超越輝達這樣的行業標竿。為此,天數智芯給出了一張明確到年份的架構路線圖。2025年天數智芯推出的天數天樞架構,超越輝達Hopper。據瞭解,這已經不是規劃,而是現實:該架構支援從高精度科學計算到AI精度計算,AI晶片在執行注意力機制相關計算時,算力的實際有效利用效率達到90%及以上。而測試資料顯示,天數天樞架構效率較當前行業平均水平提升60%,在DeepSeek V3場景平均比Hopper架構高約20%性能。到2026年,天數天璇架構,新增ixFP4精度支援,對標Blackwell;天數天璣架構,實現全場景AI與加速計算覆蓋,超越Blackwell。而在2027年,天數智芯規劃中的天權架構,則直接指向對Rubin架構的全面超越,重點融入更多精度支援與創新設計。支撐這條路線圖的背後,還有一整套底層技術能力。包括TPC Broadcast、Instruction Co-Exec、Dynamic Warp Scheduling在內的多項技術,構成了天數智芯在指令級平行、資源調度和算力利用率上的核心優勢。這些能力,決定了它是否真的具備在通用GPU賽道長期演進的可能性。那麼,天數智芯是否真的有這樣的實力?一個直觀的判斷方式,是看通用性。截至目前,天數智芯的通用GPU已經穩定運行400余種主流模型,並且強調Day 0適配能力;以DeepSeek為例,其在天數智芯平台上的適配和推理,已經成為客戶實際部署的一部分。第二個維度,是商業化落地。根據其公開披露的資料,天數智芯累計交付的晶片數量已經超過5.2萬片,服務客戶超過300家。在實際應用中,網際網路AI客服的算力成本被壓縮了一半,而單機性能翻倍;金融行業的研報生成效率提升了約70%;在高要求的叢集場景中,其千卡規模叢集已經實現了超過1000天的穩定運行。這些資料足夠耀眼,也足夠具體。尤其值得注意的是,天數智芯在招股書中,對客戶數量、量產發貨規模、卡級毛利等核心指標進行了相對完整的披露。這種攤開來講的方式,在當前的中國國產晶片行業中並不多見。也正是在這一點上,天數智芯與不少大廠自研晶片或專用NPU路線拉開了差距。它選擇了一條更難、也更慢的路——堅持通用GPU路線,從架構、指令集、編譯器到軟體棧進行全端自研。這意味著沒有盲區,也意味著每一步都必須自己趟過去。最後,回到瑞幸的那杯咖啡。當中國國產算力開始真正進入千行百業,進入門店、工廠、道路和裝置,晶片不再只是發佈會上的參數,已然是業務鏈條中不可或缺的一環。從這個角度看,此次發佈的意義,或許並不只在於發佈了四代架構圖,和四款邊端新品,而在於中國國產通用GPU,一邊抬頭,試圖超越行業標竿,並以更大的野心,嘗試面向無人區提出自己的路徑;一邊低頭,以一種更貼近現實的方式,不斷深入產業現場。而這,可能才是天數智芯真正想證明的事情。 (量子位)
總市值超6000億,四家中國GPU上市企業誰是真龍頭?
今天(1月8日)天數智芯登陸港交所,至此,摩爾線程、沐曦股份、壁仞科技和天數智芯這四家上市版本的“國產GPU四小龍”已齊聚資本市場。在國產巨大算力需求驅動下,四家被給予厚望的國產GPU企業上市後最新市值表現如何,主營業務有那些差異,商業化有何進展呢?本文將一一盤點。天數智芯(上海天數智芯半導體股份有限公司)上市時間:2026 年 1 月 8 日上市地點:香港交易所主機板最新市值:398億港元,約合357億元人民幣(截至 2026年1月8日收盤,下同)企業簡介:中國領先的通用 GPU(GPGPU)晶片及 AI 算力解決方案提供商,也是首家實現推理和訓練通用 GPU 晶片量產。公司以 “成為智能社會的賦能者” 為願景,致力於開發自主可控、國際領先的通用 GPU 產品,打造 “天垓” 訓練系列與 “智鎧” 推理系列兩大核心產品線,建構起覆蓋雲端訓練、邊緣推理到大模型部署的全場景國產算力體系,全面相容國內外主流 AI 生態以及各類深度學習框架。商業化現狀與近三年營收:產品已在超過 290 家客戶中完成超 900 次實際部署,在網際網路、智能製造等垂直領域相容性測試通過率高,截至 2025 年 6 月 30 日,已向超 290 名客戶交付超 5.2 萬片通用 GPU。2022 年營收 1.89 億元,2023 年營收 3.08 億元,2024 年營收 5.40 億元,2025 年上半年營收 3.24 億元,營收復合年增長率達 68.8%。企業官網:https://www.iluvatar.com/壁仞科技(上海壁仞科技股份有限公司)上市時間:2026 年 1 月 2 日上市地點:香港交易所主機板最新市值:805億港元(約合人民幣721億元)企業簡介:成立於 2019 年,是國內通用智能計算解決方案提供商,堅持原創核心架構,是國產 GPU 企業中最早實現 Chiplet(芯粒)封裝技術商用落地的公司之一。公司致力於研發通用圖形處理器(GPGPU)晶片及智能計算解決方案,已推出 BR106、BR166、BR110 等多款晶片,覆蓋雲端訓練、雲端推理、邊緣推理場景,建構軟硬協同創新的技術體系,為數字經濟發展提供核心算力支援。商業化現狀與近三年營收:已開發基於壁礪 106 和壁礪 166 晶片的全面 GPGPU 硬體系統組合,如 PCIe 板卡、OAM、伺服器及多伺服器叢集,BR106 和 BR110 晶片合計銷量已超過 1.2 萬顆,截至 2025 年 6 月,公司已手握 5 份框架銷售協議及 24 份銷售合同,總價值約 12.41 億元。2022年至2024年,壁仞科技年收入分別為49.9萬元、6203萬元、3.37億元,2025年上半年該公司收入5890.3萬元。企業官網:https://www.birentech.com/沐曦股份(沐曦積體電路(上海)股份有限公司)上市時間:2025 年 12 月 17 日上市地點:上海證券交易所最新市值:2570億元企業簡介:2020 年 9 月在上海成立,是國內高性能通用 GPU 領域的領軍企業之一,致力於自主研發全端高性能 GPU 晶片及計算平台,主營業務是研發、設計和銷售應用於人工智慧訓練和推理、通用計算與圖形渲染領域的全端 GPU 產品,並圍繞 GPU 晶片提供配套的軟體棧與計算平台。公司基於自主研發的 GPU IP 和統一的 GPU 計算架構,已推出用於智算推理的曦思 N 系列 GPU 和用於訓推一體及通用計算的曦雲 C 系列 GPU,是國內少數實現千卡叢集大規模商業化應用的 GPU 供應商(公司官網、招股書)上海證券交易所。商業化現狀與近三年營收:產品累計銷量超過 25,000 顆,已部署於 10 余個智算叢集,曦雲 C500 系列佔 2024 年營收 97% 以上,正在研發和推動萬卡叢集的落地,目前已成功支援 128B Mo 大模型等完成全量預訓練。沐曦股份2022年、2023年和2024年的營收分別約為42.64萬元、5302.12萬元和7.43億元。企業官網:https://www.metax-tech.com/index.html摩爾線程(摩爾線程智能科技(北京)股份有限公司)上市時間:2025 年 12 月 5 日上市地點:上海證券交易所科創板最新市值:3168億元企業簡介:成立於 2020 年 6 月,以全功能 GPU 為核心,致力於向全球提供計算加速的基礎設施和一站式解決方案,為各行各業的數智化轉型提供強大的 AI 計算支援,目標是成為具備國際競爭力的 GPU 領軍企業,為融合 AI 和數字孿生的數智世界打造先進的計算加速平台。公司實現了一系列技術突破和創新佈局,MTT S80 是國內首款支援 Windows 作業系統以及 DirectX 11/12 圖形計算庫的消費級顯示卡,相容近千款遊戲和應用。商業化現狀與近三年營收:是國內少有的在京東等電商平檯面向消費者市場展開銷售的國產 GPU 企業,產品覆蓋 AI 智算、高性能計算、圖形渲染、計算虛擬化等多個領域,實現了雲、邊、端全站 AI 產品線的佈局,2024 年圖形渲染產品線佔營收 25%,通用 GPU 佔 75%。摩爾線程2022 年營收 4608.83 萬元,2023 年營收 1.24 億元,2024 年營收 4.38 億元,2025 年上半年營收 7.02 億元,已超過過去三年的總和。企業官網:https://www.mthreads.com/ (芯師爺)
中國“GPU四小龍”殺瘋了,上海成最大贏家!
當前,中國股市最熱的題材,莫過於GPU。當全球GPU龍頭輝達創下4.4兆美元的市值,中國GPU企業也在股市掀起科技旋風。中國GPU四小龍中,兩家已在科創板上市,剩下的兩家即將登陸港交所。上海,憑什麼成為最大贏家?中國GPU企業,迎來上市潮。12月5日,摩爾線程在上交所科創板掛牌上市,成為中國首家登陸資本市場的全功能GPU企業。在申購啟動之前,摩爾線程已經創造了包括上市速度、發行價、募資規模在內的多個“第一”,成為今年最具話題性的硬科技上市項目。上市首日漲幅,漲幅425.46%,中一簽(500股)盈利達26.78萬元,創下A股新股最賺錢紀錄。截至12月22日,摩爾線程股價為673元/股,總市值高達3177億元。摩爾線程股價12月17日,沐曦股份在上交所科創板掛牌上市,成為第二家上市的GPU企業。上市首日漲幅,漲幅692.95%,中一簽(500股)最高浮盈達39.5萬元,超過摩爾線程創A股歷史新高。截至12月21日,沐曦股份股價為703.35元/股,總市值高達2745億元。沐曦股份股價正解局注意到,摩爾線程在北京,沐曦股份在上海。一南一北,一城一個,可謂平分秋色。實際上,在GPU賽道上,上海已然一騎絕塵。摩爾線程、沐曦股份、壁仞科技、天數智芯,處於國產高性能通用GPU領域的第一梯隊,因此被稱為中國GPU四小龍。壁仞科技、天數智芯都來自上海,已先後於12月17日、12月19日通過了港交所聆訊,衝刺“港交所GPU第一股”。天數智芯申報材料即便是摩爾線程,雖然總部在北京,但在上海張江亦有關鍵佈局。摩爾線程實行的是雙核佈局,北京為公司總部所在地,負責總體戰略、架構設計和公司治理;上海張江是公司產業協同、研發資源與供應鏈協作的基地。也就是說,半個摩爾線程,要算在上海。這樣一看,中國GPU四小龍,上海獨攬三個+半個。上海,成了最大贏家。國內的絕大部分產業,大多呈現“一超多強”的格局,即一兩個城市佔主導地位,其他城市亦能分一杯羹。為什麼GPU產業的集中度更高?這是由GPU產業的特點決定的。GPU是一個典型的人才密集、資金密集、技術密集、生態密集型產業。正解局分析中國GPU四小龍後發現,這四家企業有一個顯著的特徵:創始人或研發團隊核心成員,都來自國際大廠。比如,摩爾線程創始人張建中曾任輝達全球副總裁、大中華區總經理,沐曦股份創始人陳維良曾是AMD全球圖形研發副總裁,天數智芯的首席科學家是AMD前資深晶片專家,壁仞科技的聯合創始人兼首席技術官(CTO)是洪洲早年任職於輝達科學計算部門。輝達、AMD、英特爾等國際大廠的中國研發中心,就在北京或上海。這些大廠佈局北京、上海,當然是看中了這兩座城市匯聚清華、北大、復旦、上交等頂尖高校,及中科院等科研機構,可以持續輸送晶片設計、架構、軟體人才。復旦大學微電子學院近水樓台先得月。北京、上海,是中國唯二的高端人才“蓄水池”。中國GPU創業企業選擇落戶北上,可快速組建頂尖技術團隊,降低人才引進成本。此外,北京、上海的資本市場發達,擁有大量硬科技投資機構,對GPU這類長周期、高投入項目的容忍度更高。先看摩爾線程,早在2021年,北京海淀區就設立了50億元規模的一期基金,對摩爾線程進行了投資。2022年,北京銀行為摩爾線程量身定製了一份數億元的貸款方案,為企業的產品研發和創新提供了重要助力。再看沐曦股份,2024年,上海浦東創投集團通過引領區發展基金,完成對沐曦股份的5億元戰略投資,為企業關鍵階段夯實資金儲備。從人才、資本上看,北京、上海不相上下。上海的獨特優勢,在產業鏈。2024年,上海積體電路產業規模達3900億元,佔全國的25%。除了規模獨大外,上海產業鏈最完整、技術水平最高,集聚超1200家企業,形成“設計—製造—封測—裝備材料—EDA/IP”的完整閉環。根據世界積體電路協會公佈的資料,2025中國積體電路創新百強企業中,上海企業上榜最多,有23家,而且大部分企業都是積體電路設計企業。在設計環節,上海連續多年蟬聯“積體電路設計業規模最大城市地位”,華為海思、中芯國際、展銳、韋爾股份、豪威科技等頭部設計企業總部或研發中心都在上海。在製造環節,中芯國際、華虹集團等龍頭企業在上海佈局了28nm、14nm、7nm等先進製程生產線,佔全國總產能30%。在封測環節,長電科技、通富微電、華天科技等頭部封測企業佈局,是全球最大的封測產業基地之一。在裝備材料環節,上海裝備材料產業規模佔全國比重超25%,是國產裝備和材料的重要基地。在EDA/IP環節,Cadence、Synopsys、Siemens EDA等國際EDA巨頭在滬設立區域總部,華大九天、概倫電子等國產EDA企業在上海快速發展。中芯國際上海,是名副其實的中國積體電路產業“第一城”。如果以上海為中心,將積體電路產業鏈擴展至長三角,那麼,上海的優勢就更明顯了。長三角的積體電路產業規模,佔全國的60%!上海、江蘇、浙江、安徽四地的分工與協同,為積體電路企業提供了“從0到1”再到“從1到N”的全周期、全要素孵化支撐。這也是北京沒有的優勢。中國GPU四小龍,上海獨佔其三,絕非偶然。雖然GPU產業呈現出向長三角等核心區域集中的特徵,但這絕不意味著其他城市沒有機會。恰恰相反,GPU產業的特性為非核心城市提供了廣闊的差異化發展空間。其一,產業規模足夠大,細分賽道藏著“兆級”機會。GPU早已跳出傳統圖形處理的單一範疇,成為AI訓練/推理、智能駕駛、邊緣計算等多領域的“算力心臟”。中國GPU市場規模中國GPU市場規模在2024年約為‌1073億元人民幣‌,預計在AI算力需求驅動下持續高速增長,到2029年有望突破‌1.4兆元‌。‌‌龐大的市場規模和多元的需求場景,讓不同城市都能找到切入點,也提供了參與產業鏈的空間。其二,產業鏈條足夠長,協同分工創造“生態紅利”。GPU產業鏈涵蓋設計、製造、封測、EDA/IP、裝備材料、應用適配、算力服務等多個環節。每個環節都需要專業化分工,為不同城市提供了差異化定位的機會。一個細節是,在沐曦股份成立初期,南京市政府投資基金合作子基金就參與投資,累計投資7.18億元。2020年10月,沐曦股份在南京浦口區成立了第一家全資子公司——沐曦積體電路(南京)有限公司,承擔著公司全系列產品的研發重任,已成為沐曦股份的“最強大腦”。南京投資沐曦股份沐曦股份上市後,南京不僅獲得了豐厚的財務回報,還壯大了自己的積體電路產業。產業鏈不是“零和遊戲”,而是要“各展所長、協同共贏”。中國GPU產業突圍,需要各大城市一起努力。 (正解局)
第三大中國國產通用GPU廠商衝刺IPO!年入5.4億元,從賣晶片到賣算力
港股即將再次迎來一家國產GPU公司!12 月 19 日,港交所官網披露,天數智芯已通過聆訊並公佈招股書。在這條國內最滾燙的硬科技賽道上,天數智芯跑出了驚人的加速度:過去三年,公司收入分別為1.89 億元、2.89 億元和5.4 億元。這份成績單將其推向了行業頭部。按2024 年收入計算,天數智芯以 9.8% 的市佔率位列國產通用 GPU 賽道第三,僅次於海光資訊和沐曦股份。但如果只看收入規模,很容易忽略另一條同樣重要的變化:天數智芯的業務形態也在發生變化。過去,天數智芯更像一家典型的GPU 產品公司,主要收入來自通用 GPU 的直接銷售。2023年,通用 GPU 相關收入佔比仍在90%以上。而到了2024年,AI 算力解決方案的收入佔比已經提升至30.8%,並開始成為新的增長來源。這意味著,公司正在從“賣晶片”,轉向“交付算力”。這種變化並非天數智芯一家的選擇,而是當前國內GPU 廠商在商業化階段普遍面臨的現實。某種程度上看,這種用更“重”的交付方式,彌補生態尚未完全建立的短板,或許是國產 GPU 走向規模化最現實的路徑。/ 01 /全國第三大國產通用GPU廠商,24年收入增長186%從收入層面看,天數智芯可以說是增長迅速。2022年,天數智芯收入為1.89億元。到了2024年,這一數字增長到了5.4億元,增長了186%。進入 2025 年後,增長節奏並未放緩,僅上半年收入已達3.24億元,同比增長64.47%。單說收入規模,僅看國內的國產通用GPU市場,天數智芯則拿到了9.8%的份額,高居行業第三,僅次於海光資訊和沐曦股份。(A為輝達,B為AMD)與摩爾線程強調“全功能GPU”不同,天數智芯更聚焦在通用GPU(GPGPU)上,優先錨定在 AI訓練與AI推理這兩個最現實、也最剛性的需求上。最早的GPU,並不是為“計算”而生的。它的唯一使命就是圖形渲染:把幾何模型、紋理和光照快速變成螢幕上的像素。為此,GPU 被設計成擁有大量平行單元,擅長做同一種運算的重複計算——這正是圖形流水線最需要的能力。直到後來,研究人員逐漸意識到,這種“為圖形而生”的平行架構,恰好也非常適合另一類問題:大規模矩陣與向量運算。於是,人們開始“順手”把 GPU 從圖形管線里拉出來,用它來算圖形以外的東西。為了區分這兩種完全不同的使用場景,學術界和產業界引入了一個新的說法:GPGPU(General-Purpose computing on GPU)。這種取捨,直接對應到了天數智芯的產品矩陣上,分為兩條清晰的主線:一條是以“天垓”系列為核心的訓練通用 GPU;另一條是以“智鎧”系列為代表的推理通用 GPU。其中,天垓系列是天數智芯的旗艦產品,也是國內首批次產的訓練通用GPU。它的設計邏輯不是從圖形反推,而是從負載反推:針對大模型訓練中吞吐量大、精度要求多變、多卡平行的特點,直接最佳化計算單元。在產品節奏上,天垓Gen 1於2021年實現量產,Gen 2於2023年第四季度量產並迅速成為收入主力;2024年第三季度,公司發佈天垓Gen 3,並計畫於2026年第一季度進入量產階段。從出貨資料看,訓練系列在2022 年出貨7700片,2023 年回落至7000片,並在 2024 年維持穩定;但到 2025 年,上半年出貨量已達6200片,明顯高於去年同期。推理晶片智鎧系列則是天數智芯另一款核心產品。智鎧系列發佈於2022 年底,定位為中國首款面向推理設計的通用 GPU。與訓練卡不同,推理卡的核心指標是低延遲、高吞吐和能效比。因此在架構層面,智鎧系列對整數計算單元和資料通路進行了針對性最佳化,並廣泛引入量化技術,以提升終端應用的實際性能。甚至,為了適配更邊緣的場景(如自動售貨機、工業電腦),天數智芯還推出了功耗僅75W 的智鎧 Gen 1X,它保留了完整的視訊處理能力,但在能耗上做了極致設計。受益於AI應用的爆發,智鎧系列的增長勢頭甚至超過了天垓。智鎧的出貨量從2022 年的寥寥38片,激增至 2024 年的9800片。2025 年上半年,其出貨量已達9500片,接近去年全年水平。這種雙輪驅動的策略,正在改變天數智芯的營收結構。截至2024 年,訓練晶片(天垓)依然是絕對的收入支柱,佔比曾高達 99.3%。但到了去年年底,訓練晶片的佔比已降至 49.9%,而推理晶片(智鎧)的佔比則從0 攀升至 18.6%。除了賣GPU ,天數智芯還做了一件更“重”的事:賣算力解決方案。這背後的邏輯並不複雜。對於很多客戶而言,買回來的GPU 只是零件,要把它變成能跑模型的算力,中間還隔著複雜的硬體整合和軟體偵錯。具體的交付模式主要分為兩種:一種是通用GPU 伺服器,相當於“即插即用”的標準化產品,就是將一定數量的通用 GPU 加速卡與完整的軟體棧整合在一起,形成預配置的計算節點,主要用於企業級 AI 工作負載和大語言模型的快速部署。另一種是通用GPU算力叢集,適用於大規模訓練、高吞吐推理等對算力密度和調度能力要求更高的場景。相比單一伺服器,這是一種更偏系統級的解決方案,將通用 GPU 產品與第三方伺服器、儲存和網路基礎設施深度整合,並針對整體系統進行調優。由於AI算力需求的增長,這一需求也很快反映到了業績層面。在開闢AI算力解決方案的第一年,也就是2023年,該業務收入佔比就達到了5.4%。2024年,這一數字又提升到了30.8%。/ 02 /每賺2塊錢收入,分給代工廠1塊在收入持續增長的同時,天數智芯的虧損規模也在同步擴大。2022—2024 年,公司經調整淨虧損分別為4.33億元、6.10億元和 6.45 億元。進入 2025 年後,虧損並未繼續放大,今年上半年經調整淨虧損約 3 億元,基本與去年同期持平。放在晶片行業的背景下看,這樣的表現並不算差。2022—2024 年,公司毛利率分別為 59.4%、49.5% 和 49.1%,整體維持在接近50%的水平。對於一家仍處在產品快速迭代、尚未形成規模效應的通用 GPU 公司來說,這仍然是一個相對可觀的水平。但毛利結構背後,也藏著晶片行業最現實的一條約束:製造成本幾乎不可迴避。在營業成本中,最大的一塊支出來自晶片製造。2023 年,公司支付給晶圓製造商的費用達到 1.36 億元,佔當年收入的 47%。換句話說,AI晶片廠商每獲得2元收入,其中就有約1元需要交給下游代工廠。這並非個別公司的問題,而是先進製程時代晶片行業的普遍現實。進一步拆分毛利結構,我們能看到不同產品線之間也存在著明顯差異。訓練晶片的毛利率整體更高,也更穩定。過去幾年,訓練通用GPU 的毛利率基本維持在60%左右:截至 2024 年底為60.2%,今年上半年雖略有回落,但仍保持在58.2%。相比之下,推理晶片的毛利率波動明顯更大。2024 年底,推理晶片毛利率為46.7%;到今年上半年,已從去年同期的52.9%下滑至32%。這一下滑,並非來自成本端的突然惡化,而更多是價格端主動調整的結果。原因很簡單,市場競爭變得更激烈了。招股書披露,自2024 年底起,多家競爭對手的新一代推理產品陸續進入量產階段,市場供給顯著增加。在這種情況下,為了延長其在主流推理場景中的競爭窗口,公司主動下調價格,以維持在規模化部署中的性價比優勢。同時,也為下一代智鎧產品預留性能與價格空間。從結果上看,2025 年上半年推理系列產品的平均售價由上年同期的 1.14 萬元下降至0.92萬元,下調了接近20%。相比直接賣晶片,AI 算力解決方案的毛利率本身就更低,波動也更大。2024 年,該業務毛利率為 31.7%;到今年上半年,提升至 45.7%。這一變化更多受到了項目結構的影響。原因在於,這類解決方案通常以“整機或整套系統”的形式交付,毛利率高度依賴於內嵌晶片的型號、數量以及第三方硬體配置。不同客戶在規模、性能和部署方式上的差異,會直接拉開項目之間的成本結構,最終體現為毛利率的波動。/ 03 /總結無論是已經上市的摩爾線程,還是準備衝擊港股的天數智芯,在這些國產GPU 獨角獸的招股書裡,都能看到一個共同且反直覺的趨勢:國內GPU公司,很難像輝達那樣單純地“賣晶片”。在收入規模化的過程中,這兩家公司不約而同地走向了更“重”的交付模式。摩爾線程的主要營收來自於叢集產品,而“AI 算力解決方案”也正在成為天數智芯重要的收入支柱。這揭示了國產GPU 行業當下最真實、也最殘酷的生存邏輯:無論是摩爾線程的叢集交付,還是天數智芯的算力解決方案,本質上都是在用“工程化的確定性”來彌補“生態的短板”。這種彎腰做髒活、累活的整合模式,雖然拉低了毛利,卻解決了中國 B 端客戶最核心的痛點,開箱即用與合規可控。這看似是商業模式的降維,實則是現階段國產晶片跨越生存鴻溝的必經之路。只有先通過繁瑣的系統工程把規模做起來,才有可能在未來反哺生態,最終從“賣項目”的系統公司,進化為真正“賣標準品”的晶片巨頭。 (矽基觀察Pro)