上海殺出500億隱形龍頭:中國第一

過去2個月,最吸金的賽道,莫過於中國國產GPU。

那些1天賺700%、5年賺1000倍的神話,在這一輪全部實現,並且都繞不開一個關鍵詞:GPU四小龍——摩爾線程、天數智芯、沐曦、壁仞科技。

一位長期跟蹤GPU產業的投資人對鉛筆道表示:誇張點說,過去5年,如果沒投GPU,相當於這一輪周期“白幹”。這種遺憾,不亞於移動網際網路時代錯過字節。

這個機會窗口正越來越小。本月,隨著通用GPU企業——天數智芯在港股上市,募資約32億元,意味著四小龍最後一塊拼圖被補齊。

值得注意的是:IPO之前,這家低調到幾乎不接受媒體採訪的公司,最近持續向市場釋放消息。

1月26日,它亮出幾張底牌:公佈了2025到2027年的GPU架構路線圖,特別需要指出,2025年推出的天數天樞,在DeepSeekV3場景,性能已超輝達Hopper架構20%,這意味著天數的路線圖已經在兌現過程中。同時,這次發佈天數智芯還推出四款邊端產品彤央系列(可理解為“本地算力模組”),尺寸從口袋大小到桌面級;還披露了最新商業進展:覆蓋20個行業、300多個客戶、1000個聯合開發案例,數千卡叢集已穩定運行超1000天。

這些動作,不禁引發好奇:它究竟能撐起多大的戲碼,能否持續創造千倍的收益神話,又會怎樣影響中國國產GPU的格局?

- 01 - 新神話還是新泡沫

這些動作背後,有一個特定背景,那就是目前的中國國產GPU,泡沫和機會一樣大——天數智芯這些動作,離機會更近,還是離泡沫更近?

中國國產GPU的機會在那裡?多說無益,直接看輝達。過去10年,市值從幾百億美元,漲到兆美元,一年收入約1300億美金(2025財年),其中淨利潤超700億美元。

這些數字背後,有一個幾乎共識的結論:AI的盡頭是算力;算力的盡頭,是GPU。AI要想聰明,必須燒錢、燒算力;而要想算力大,就必須“卡”多。

這些元素中,錢、演算法都不稀缺,稀缺的幾乎只有一個:GPU。2020年之前,全球大部分的GPU產能,都卡在一家公司手裡:輝達。

因此,中國國產GPU的起點,並不浪漫,只有三個字:買不到。

尤其到2022年底,美國收緊AI晶片出口規則,相當於洪水撞上大壩,小路直接被堵死。這些“卡脖子”局面,逼得本土廠商必須自研。

這支本土隊伍中,既包含了寒武紀、海光資訊等,也囊括著GPU四小龍:摩爾線程、天數智芯、沐曦、壁仞科技。

此外,還包括各類超級獨角獸,比如燧原科技、崑崙芯等(見下表)。

統計發現,這些公司的成立時間,可以分為兩類:一類成立於2019-2020年前後,正值中國國產GPU爆發前夕;

另一類是先遣部隊,成立於2015年前後,風口還沒來就等在那裡,比如寒武紀、天數智芯、海光等。

這些先遣部隊,成立之初,也不是完全奔著GPU而去。只是幹著幹著,風口來了。

以天數智芯為例,2015年成立時(總部上海),它鎖定的並不是GPU,而是算力加速軟硬體產品,好比打遊戲時的“外掛工具”,能讓計算速度更快。

但過程中,AI算力的需求,讓它發現GPU的供不應求。於是2018年,天數智芯轉向GPU研發,啟動首款產品(天垓100)的流片工作。

這才有了後來的成果:實現中國通用GPU從0到1的首次突破,成為中國第一家自研、量產通用GPU的公司。

這些隊伍,取得的成績也不盡相同。

海光、寒武紀起步較早,成了第一批中國國產GPU上市公司,市值在5000億-7000億不等。

剩下的“GPU四小龍”,上市時間接近,差異化也較大。

觀察可以發現:錯位比較明顯的是天數智芯。

它的成立時間最早,自研量產時間最早,晶片交付量靠前(通用GPU5.2萬枚),年收入排名第二(2024年)。

基於這種全站自研通用GPU的技術優勢和實戰場景打磨的規模化商業落地優勢,不少投資人看好它的稀缺性和增長潛力。

中國國產GPU四小龍市值及收入對比。

- 02 - 偽需求與真痛點

中國國產GPU現在熱度爆表,錢也追得凶,但能不能一直火下去,要回到一個根本問題:晶片好不好用,能不能被客戶認可。

這個痛點下,中國國產GPU有三大流派。

一類是“參數派”。這是最容易被市場看見的一類:指標好看。核心算力、記憶體頻寬、跑分成績都挺亮眼,宣傳材料資料一列一列地甩出去。

另一類是“定製項目派”。它的風格是:先解決問題,再談指標,優點是:短期賺得穩、問題能解決,但想做成流水線大廠,天花板明顯。

最後一派是“系統工程派”或者叫“解決方案派”,天數智芯就是這類企業。

它是前面兩派的融合,既做晶片又承接定製項目,但不追求一次性表現,而是提供長期可運行的解決方案:不僅做硬體,還要自研軟體棧、工具鏈、編譯器和適配層等。

這條路走的人不多,難度大。天數智芯副總裁鄒翾對鉛筆道說:“我們在中國首家建構了通用架構下的GPU全端設計能力,目的就是為了在客戶實際場景中實現好用、落地。”

這三大路線差異較大,但面臨的瓶頸相同,那就是:直到今天,“中國國產卡”的份額依然很小。

多家頭部算力中心負責人向鉛筆道表示:過去1-2年,中國國產晶片仍是少數選擇——就算是“老大哥”華為,也面臨這個瓶頸。

具體的份額,可以用一組數字來形容:100張通用GPU裡,大約只有不到6.5張是中國國產卡(2025年/如圖)。

天數智芯招股書中,對中國國產GPU份額的描述。

“中國國產卡”為什麼份額少,是性能不行嗎?不完全是。據外媒報導,中國多款頭部晶片,關鍵性能與輝達旗艦產品(H100)相比,差距只有10%-20%。

甚至某些產品,中國國產GPU還實現了反超。比如1月26日,天數智芯發佈的幾款邊端產品,打通客戶應用場景“最後一公里”,把雲端大算力能力折疊進方寸之間,將整合大算力的小巧產品,送到客戶的“手中”,就像在場景的端側產品中安裝了“大腦+小腦”,讓邊端場景的運行更加流暢。比如具身智能機器人,不但能夠走路,而且可以根據算力支撐的即時判斷能力,進行“勞動”。此外這個產品還可以應用在工業智能、交通智能、車陸運一體化協同。在這組產品中,“基礎款”的性能已反超國際卡3.7倍。

天數智芯與輝達相關產品性能對比。

性能的差距,為中國國產GPU爭回來不少分,但另一個更值得重視的問題是:晶片好不好用,客戶認不認可。

- 03 - 破局思路

中國國產GPU的破局思路是什麼?天數智芯副總裁鄒翾的建議是:回歸“好用”。

“這麼多年,我們一直在思考:什麼是好用的GPU?如何衡量GPU價值?使用者核心訴求是什麼?我們的洞察就是簡單兩個字:好用——它不單單指的是價格優勢,還包括使用體驗:比如要花多少人力、多少物力、多少時間。”

這聽起來可能有點抽象,他舉了兩個身邊案例。

有家AI創業公司,金融大模型每季度至少迭代兩個版本,每次硬體適配,需要投入10人團隊,耗費兩周修改500至1000行程式碼。

另一家傳統企業,需要用開源大模型建知識庫,因硬體介面不相容,落地周期常從一個月,延遲至兩到三個月。

這些痛點,不只在1-2個案例身上體現。鄒翾介紹,截至去年底,天數智芯探索了20個行業,服務了300客戶,聯合開發了1000個案例,無一不指向這個答案:產品好用!。

在客戶眼裡,這種“好用”,具體又包括什麼?天數智芯副總裁郭為向鉛筆道提到:客戶買不買你的產品,主要看三點。

1、客戶現有使用習慣是否需要改變;

2、是否提供本地化調優服務;

3、是否有價格優勢。

郭為表示,就算自己第一次拜訪客戶,也基本從這三點入手。

這三句話背後,隱含著客戶的三大煩惱。

1、別讓客戶為了“新卡”去改程式碼、換框架、重寫流程;

2、通過貼身調優,把坑在前期填掉,幫客戶把系統真正跑穩;

3、利用中國國產優勢,給客戶一個願意嘗試的理由。

比如,天數智芯發佈了4款邊端產品:彤央系列(如下表)。

天數智芯的新品,可用於機器人等新興場景。

其中,副總裁郭為講述了一個客戶痛點。

中國有家機器人未來獨角獸——格藍若,想選一款晶片,讓機器人“聽得清、想得快、說得明”。核心訴求之一,就是相容性。

“我們模組採用的標準介面,和輝達的Orin完全相容。目前中國,機器人幾乎全行業採用的都是輝達標準,所以客戶的使用習慣等都不用改變,拿過去可以直接用。”

最終,格藍若選擇了天數智芯。

又比如,天數智芯還發佈了3年架構路線(如圖)。這些架構背後,主要的指引思路,也是“好用”:算得快、算得省、省力、可持續等。

比如算得快(高利用率):天樞架構的“Attention效率>90%是個關鍵指標,意味著晶片幹正事的時間更多,浪費的算力更少。

比如算得省。天樞架構追求更精細的“省電”模式,這就像給不同的任務(科學計算、AI推理)匹配最合適的“燃料”,在保證結果正確的前提下,最大限度降低功耗和成本。

此外,為了讓客戶省錢,解決DDR儲存價格高的問題,天數智芯通過kv cache等技術,讓模型推理使用的記憶體量降低50%以上。

- 04 - 結語

未來幾年,通用GPU的中國國產化趨勢不可逆。據行業報告顯示,預計2029年,中國國產率有望達到50%。

摩爾線程、天數智芯、沐曦、壁仞這四小龍,就像中國GPU市場的先遣部隊,各自搶佔陣地,也把初步經驗探索了出來:對使用者來說,買的不僅僅是卡,而是最終體驗。

天數智芯此次向市場釋放消息,或許就是朝著這個目標,為下一輪競爭做鋪墊。 (鉛筆道)