#小摩
聚光燈外的輝達中國門徒
狂熱資本的熱情助推下,摩爾線程+沐曦股份+寒武紀,三家AI晶片新貴的總市值已經高達1.2兆元,超過了老牌半導體廠商德州儀器和科技巨頭索尼。然而,三家企業上年的總營收還不到德州儀器的十四分之一。伴隨著幾個超級IPO的問世,其炸裂的估值增長、匪夷所思的傳奇投資故事,開始在中文網際網路上廣泛傳播開來。梳理來看,絕大多數知名中國算力GPU初創企業,實際上都可稱為輝達和AMD的門徒。摩爾線程創始人張建中曾是輝達大中華區總裁,沐曦股份的創始三人組都來自AMD,寒武紀亦有技術大拿曾是輝達員工,壁仞科技的多個高管也曾在輝達、AMD任職。此外,輝達還創辦了“初創加速計畫”,旨在通過提供技術輔導、融資對接、產品支援等路徑孵化新型企業,已為上千家初創機構提供資源扶持。但蹊蹺的是,這其中幾乎沒有來自中國大陸的初創企業獲得了直接資金支援。中國幾大GPU新秀已經全面崛起,在資本市場上吸金無數,獲得的訂單金額數以億計,在某種程度上觀察,卻又似乎並未真正衝破兩大AI晶片巨頭的陰影。門徒2006年,擁有在惠普和戴爾兩大PC廠商工作經驗的張建中加入輝達。彼時GPU尚未普及,CUDA平台才剛剛推出,AI還處萌芽階段。張建中從銷售工作起步,提出更“親民”的市場策略,他從網咖切入,推廣高性價比顯示卡。在當年PC遊戲盛行的年代,網咖是玩家們接觸高性能圖形處理器的首要場所,通過與網咖合作,輝達顯示卡迅速打開市場,並為此後的AI晶片擴張奠定了基礎。張建中借此開拓了輝達GPU在中國的完整生態系統,並使得輝達在中國GPU市場的市佔率從不足50%上漲到80%,他也因此升任輝達全球副總裁、大中華區總經理。在黃仁勳眼中,張建中儼然就是自己“最重要的男人”和“最得意的中國門徒”。在敲鑼儀式後的專訪中,張建中回憶道:在輝達的14年,“從普通銷售做到全球副總裁,我最清楚GPU行業的命脈,那就是技術、生態,還有懂行的團隊。”因此,當他拉著老部下擠在中關村軟體園創業時,摩爾線程就被稱作“中國輝達”。除了創始人張建中,摩爾線程的核心創始團隊均來自輝達,職工董事周苑曾在輝達任市場生態高級總監,副總經理張鈺勃、楊上山曾任輝達GPU架構師,王東則曾出任過輝達銷售總監。不僅團隊來源於輝達,張建中的行事作風,摩爾線程的研發、經營、商業模式,均全面對標輝達。2022秋季的發佈會上,張建中一襲黑色皮衣亮相,並推出了中國首個遊戲顯示卡MTTS80、多功能GPU晶片“春曉”等。他的著裝風格被認為明顯是在模仿黃仁勳。創立摩爾線程伊始,張建中就豪言:“輝達有的,我們都要有。”目前,AI晶片分為三大流派,而輝達就是全能型GPU的翹楚,可實現“一芯多用”,AI計算、圖形渲染、科學計算樣樣精通。張建中深知該模式的領先性,因此全面押注“全能型GPU”技術路徑,率先賦予了國產GPU多種功能於一體的能力。此外,CUDA生態被稱為輝達屹立於AI晶片之巔的核心利器。輝達耗費巨資,歷時十多年打造的這套AI“作業系統”,不僅創造了編譯器、工具鏈、演算法庫等工具庫,更形成了繁榮活躍的生態開發者社區。為此,摩爾線程自主研發了MUSA生態,手握100%自主智慧財產權。上市15天的12月20日,摩爾線程就舉行了首屆“MUSA開發者大會”,發佈全新一代全功能GPU架構“花港”、AI訓推一體晶片“華山”、高性能圖形渲染晶片“廬山”。MUSA架構還可與輝達GPU生態相容,使開發者能夠以較低成本利用國際主流生態程式碼資源。類似CUDA,摩爾線程也在建構以MUSA為基座的生態護城河。輝達門徒,為國產GPU帶來了寶貴的火種,以及開發相關產品的一系列基礎設施。魅影摩爾線程之後,號稱“國產GPU第二股”沐曦股份拿過接力棒,也已登陸科創板。摩爾線程的創業元老們擁有輝達背景,而沐曦股份的創業三人組,則與輝達的老對手AMD有著非同一般的淵源。其創始人、實控人陳維良,在創立沐曦股份之前,曾在上海AMD任高級總監,供職時間長達10餘年。另外兩位聯合創始人——彭莉和楊建,也都曾在上海AMD幹過10多年的企業院士,楊建此後還進入華為,歷任上海華為、海思半導體的架構師。而更早上市的寒武紀,其創始團隊雖主要來自中國科學院計算技術研究所,但一些技術大拿也擁有輝達背景。副總經理劉毅於2012年至2016年,擔任上海輝達高級工程師,並在2023年新增為寒武紀核心技術高管。目前正在衝刺H股的壁仞科技,由曾經闖蕩華爾街的張文創辦,他曾找朋友給他列出一張GPU大牛名單,隨後,張文按圖索驥,洪洲、徐凌傑、張凌嵐等高管都被招至麾下。執行董事兼CTO洪洲主導公司技術研發,其此前在輝達、S3 Graphics等企業擔任GPU研發要職,負責架構設計與性能最佳化;前總裁徐凌傑曾在輝達、AMD和三星擔任過GPU項目的高級管理和架構師,後於2024年1月離開壁仞科技,並創辦魔形智能科技;首席營運官張凌嵐,也曾在三星電子美國研發中心及AMD擔任GPU 架構師。另一家國產GPU新秀也不例外。燧原科技創始人趙立東曾在AMD擔任計算事業部高級總監,負責CPU/APU產品規劃,並參與成立中國研發中心,還曾在S3 Inc.從事GPU圖形處理器晶片的研發工作;CEO張亞林也在2008年加入AMD,據說他當時就是由趙立東親自招聘。張亞林歷任AMD資深晶片經理、技術總監,曾經作為全球晶片研發主要負責人之一,領導團隊為微軟定製開發了XBOX-ONE系列晶片,還參與創立了AMD北京研發中心。這對老搭檔同時於2018年離職創業,共同成立燧原科技,並很快獲得了來自騰訊的大筆投資。目前,燧原科技也在衝刺A股上市。如今摩爾線程和沐曦股份、壁仞科技、燧原科技已經被併稱為“國產GPU四小龍”。而這四家國產替代之光,其創立和發展的背後都離不開輝達、AMD的身影。潛行和資本市場炸裂的表現、輿論層面的超高曝光度相反,幾家企業的創始人都十分低調。他們基本都是職業經理人出身,學歷極高、履歷驚豔,熟諳科技型公司技術研發、市場推廣、融資上市以及企業運作,但名氣相比此前網際網路時代的馬雲、馬化騰、丁磊們相差甚遠。譬如,張建中在惠普公司時,擔任產品總經理,主導了x86伺服器產品線的本土化適配,同時又首創“技術顧問+銷售”的複合型團隊,使惠普在中小企業市場佔有率三年提升17%。在戴爾任職期間,又借助這種“六邊形戰士”的能力,幫助高能公司在金融、電信等ToB大客戶領域實現訂單增長300%。和老一輩網際網路時代的企業家如雷軍、劉強東、周鴻禕、俞敏洪們相比,他們步伐一致,低調潛行,很少公開露面,也較少接受採訪。雖然硬科技是一條靠程式碼、產品和性能說話的賽道。但如此淡化創始人個人IP,也反映出和上一輪網際網路創業潮時截然不同的風格,並且與輝達、AMD強調創始人和掌舵者個人魅力的模式完全相反。12月8日,美國正式允許輝達向中國“經批准的客戶”出售H200晶片。H200並非輝達最新一代產品,但也已經讓這些國內的“門徒”們感受到了一絲寒意。放行H200,其實是中美大國競合博弈下的一種商業妥協。黃仁勳也表示,美國的出口管制已“完全失效”,反而倒逼中國晶片自主發展。當前,國產AI領域IPO審批都以極快的速度疾馳。摩爾線程IPO創下多項紀錄,它是2025年科創板“1+6”政策落地後首家過會上市的科技企業,從受理到過會僅用時88天,從受理到上市不足半年。投行人士更是感慨,“這速度在硬科技領域絕無僅有。‘1+6’政策提前掃清了稽核障礙,加上國產GPU的戰略地位,一路綠燈。”12天後,沐曦股份也正式登陸科創板。在他們身後,壁仞科技已通過港交所聆訊,有望在2026年1月2日成為H股GPU第一股,燧原科技已重啟上市輔導,百度旗下崑崙芯也被曝開啟IPO處理程序。不僅是晶片領域,一切跟AI相關的資本運作,都呈現出一股集體亢奮的狀態。港股市場上,2025年以來,已有超30家機器人相關企業遞交申請表,前三季度,機器人創業公司融資總額就達到500億元。大模型賽道,智譜AI也提交了港交所聆訊資料,而稀宇科技MiniMax僅相隔48小時,就遞交招股書,兩家企業將角逐“全球大模型第一股”。當整個中國資本市場裹挾著大大小小無數的投資人,在AI宏大的歷史性敘事中狂歡,這些掀起了資本狂潮的輝達、AMD的門徒們,享受了這場造富浪潮和未來廣闊的發展空間。但幾乎無一例外,他們都選擇將自己藏身到聚光燈之外。寫在最後門徒們引領著中國AI晶片產業發展的浪潮,但輝達卻從未投資過一家中國大陸初創企業。輝達2025年參與的AI融資已達50筆,超過2024年全年總和。2023年至今,其參投的單筆過億美元的企業達31家,總投金額超500億美元。但反常識的事實在於,這31家企業中沒有一家中國大陸公司。直到今年1月,輝達參與了數字孿生技術公司 MetAI(宇見智能)的 400 萬美元種子輪融資,這是其在台灣的首筆創業投資。輝達當然不會培養自己的競爭者,然而在全球AI創業最活躍的市場,沒有一家公司能入得了輝達的法眼,這背後也許更多是非市場因素所致。考慮到目前頭部的中國算力晶片企業的核心創始團隊和技術人才,來自輝達或AMD的比例是如此之高,這意味著兩家美國巨頭正以另外一種方式,參與到中國AI的發展浪潮中。可預見的時間裡,這種狀態還將持續存在,這也許是它們為中國科技發展所做出的某種貢獻。 (鈦媒體)
中國AI晶片告別“草莽時代”
2025年,中國國產晶片概唸成為貫穿資本市場全年的絕對主線。而隨著摩爾線程-U(688795.SH)、沐曦股份-U(688802.SH)在科創板掛牌上市,以及壁仞科技、天數智芯加速衝刺港股,一場由政策、資本、需求三方共同驅動的國產算力熱潮似乎已至沸點。在造富神話背後,國產AI晶片行業已行至新階段。DeepSeek等國產大模型的爆發倒逼硬體架構演進,“訓推分離”的產業共識正將競爭焦點引向新的維度。在這個節點,我們也不禁思考:2025年,這個產業到底經歷了什麼?2026年,它又將走向何方?資本熱潮如果用一個詞形容2025年的國產AI晶片的產業階段,“成年禮”或許很貼切。頭豹研究院AI行業高級分析師莫舒棋向財聯社記者表示,目前,國產AI晶片在推理計算、特定模型適配以及軟硬體協同和系統級最佳化方面已具備實際交付與規模部署能力,能夠滿足部分行業客戶的核心需求。“今年就是先把能做的公司推上牌桌,再用公開市場融資繼續迭代。”某A股晶片上市廠商人士告訴財聯社記者,科創板在制度與風險偏好上,更能承接高研發投入、短期虧損但具備戰略屬性的算力企業。然而,上市只是第一步。“2025年並非傳統龍頭地位被實質性撼動的一年,而是市場被進一步‘拉長’的一年。以輝達為代表的高端訓練晶片依然不可替代。”莫舒棋向財聯社記者表示。回顧過去幾年,國產AI晶片企業通過“堆面積、堆電晶體、堆晶片”的方式彌補單卡性能差距,雖然把硬體做到了“可用”,但能效比和軟體生態的短板依然明顯。資本狂歡的同時,產業側的“壞”消息也一併傳來。2025年12月,有消息稱美國將允許輝達向中國出口H200晶片,雖然要加收25%的費用,但這依然像一條“鯰魚”,攪動了國產AI晶片的舒適區。有產業鏈人士告訴財聯社記者,相較於目前最先進的AI晶片輝達Blackwell系列,H200的主要指標只有其二分之一甚至更低;但相較於輝達的“中國版”定製晶片H20,H200主要指標則領先5到10倍不等。“H200的性能恰好卡在‘能用但不是最先進’的甜蜜點上,這其實是‘溫水煮青蛙’策略的延續。”有產業鏈人士向財聯社記者直言,這種傾銷正試圖延緩中國國產替代的處理程序。不過,在莫舒棋看來,2025年並不是簡單的“替代年”,而是市場的“結構成型年”。她表示,AI晶片的競爭格局正從單一龍頭的壟斷,逐步演變為多層級並存。“圍繞推理算力、行業定製和國產替代,多個平行發展的細分賽道正在逐步形成,不同層級的廠商在各自適配的應用場景中,開始建立起相對清晰且穩定的市場定位。”多位受訪人士認為,H200的入局雖然增加了變數,但並未撼動國產算力將來在政務、營運商、金融等領域的“基本盤”——畢竟,供應鏈的安全與可控,已經成為比性能更硬的指標。DeepSeek的“當頭一棒”過去幾年,大家習慣拿著放大鏡對比AI晶片的參數:誰的峰值算力高?誰的製程更先進?但2025年,DeepSeek等國產大模型的爆發,給沉迷於“堆參數”的硬體廠商上了一課——如果不完善生態,你的晶片可能根本沒人用。一個標誌性事件是,DeepSeek採用了創新的UE8M0 FP8量化策略,並特意指出這是針對下一代國產晶片設計的機制。這不僅是一個技術細節的調整,更是一種訊號,軟體開始反向定義硬體了。“DeepSeek的成功表明,通過模型壓縮、稀疏計算、混合精度訓練等技術手段,可以在一定程度上彌補硬體性能的不足。”摩爾線程方面在接受財聯社記者採訪時坦言,在硬體性能短期內難以趕超的情況下,通過軟體層面的創新仍可提升整體計算效能。在不少受訪的業內人士看來,很多晶片雖然標稱算力很高,但因為不支援混合精度訓練、不支援高效互聯,在實際的大模型訓練中效率極低。摩爾線程方面也進一步指出,DeepSeek讓MoE(混合專家模型)、混合精度、高效互聯等技術成為必須,這對國產GPU廠商的綜合軟硬體設計能力提出了更高的要求。“以前是拿著錘子找釘子,晶片做出來再找場景;現在是釘子決定了錘子長什麼樣。”某A股AI晶片上市廠商人士告訴財聯社記者,這種變化直接導致了市場的劇烈分化,把行業從“大亂燉”引向了兩個方向。第一個方向是奉行“大力出奇蹟”的訓練側,這裡是壁仞、摩爾線程等通用GPU玩家的主戰場,大家拼的是多機多卡的叢集能力,是能不能把幾千張卡連在一起不掉線,是軟體棧能不能扛得住高強度的平行訓練。第二個方向是信仰“精打細算”的推理側,這裡的邏輯完全變了,客戶不再關心你單張卡能跑多快,而是關心“跑一次業務要花多少錢”(單位業務成本)。華為昇騰、雲天勵飛-U(688343.SH)、寒武紀-U(688256.SH)等廠商在這裡廝殺,比拚的是誰能把推理跑得更穩、更省錢、更容易遷移。這就像買車,以前大家只看極速是多少,現在DeepSeek告訴大家,如果是跑網約車(推理),省油和皮實耐用才是王道;如果是跑F1(訓練),那再談極速。“把這兩件事混在一起談,往往從第一句話就跑偏了。”上述A股廠商人士打了個比方,同一家公司可能覆蓋多個領域,但如果連自己的主戰場是在“造F1”還是“開網約車”都搞不清楚,那在2026年一定會被淘汰。2026年打響“突圍賽”站在2025年尾展望2026年,一個共識正在形成,做好訓練是巨頭的“遊戲”,但做好推理才能為國產AI晶片帶來更多落地的可能性。“全球算力競爭的重心正在發生變化。”雲天勵飛副總裁鄭文先在接受財聯社記者採訪時敏銳地指出,輝達與推理晶片企業Groq的交易,以及Google發佈專為推理而生的TPU Ironwood,都釋放了一個強烈訊號,推理不再是訓練的附屬品,而是決定AI應用能否規模化落地的關鍵。鄭文先告訴財聯社記者,這背後的驅動力是“訓推分離”。隨著智能體應用的興起,推理不再是一次性的問答,而是包含規劃、檢索、呼叫的持續流程。企業最關心的不再是單點算力,而是單位業務的成本和服務質量。這對中國晶片廠商來說,極有可能是一個“彎道超車”的窗口期。“訓練市場的生態鎖定效應太強,追趕成本很高。但推理賽道場景分散、需求多樣,更適合中國廠商通過工程化能力實現突圍。”鄭文先認為。那麼,2026年國產晶片競爭下半場將如何展開?首先是“推理規模化”的爭奪,莫舒棋預測,2026年推理算力的增長速度將明顯快於訓練算力。在這個戰場上,誰能提供更低成本、更穩軟體棧的方案,誰就能拿下政務、金融、工業這些“大糧倉”。此外,客戶的需求正由“買晶片”向“買算力服務”轉變。莫舒棋告訴財聯社記者,單純比拚製程和峰值算力已難以形成壁壘,未來的競爭是“晶片+系統+軟體”的整體較量。這意味著,像HBM(高頻寬儲存)、銅纜互聯、先進封裝這些“周邊配套”的穩定供應與交付,將從加分項變成入場券。2026年,資本市場熱炒的概念也會出現分流,上述A股AI晶片上市廠商人士告訴財聯社記者,2026年資本市場將更加“實用主義”:A股科創板將繼續承接以通用GPU為代表的“硬科技”敘事,而港股則會成為以地平線機器人(09660.HK)、黑芝麻智能(02533.HK)為代表的“場景牽引型”晶片的主陣地。“年終回看,中國AI晶片版圖正從‘概念公司’階段邁向‘產品公司’階段。”上述A股廠商人士總結道,2026年更像是一場“工業化比賽”,而不是“單點技術秀”。下一步的分水嶺,將是能否把資本市場給出的時間與資金,轉化為真正的產業化份額與可持續的現金流。對於國產晶片產業而言,國際巨頭們前後夾擊的產業環境從未改變。但好消息是,專注於AI晶片的國產廠商們,終於不再盲目地在別人的跑道上狂奔,而是開始建立自己的坐標系。 (財聯社)
中國GPU造富狂歡:誰是最大贏家?
■誰最先嗅到國產GPU的機會?■誰在上市前突擊入股?■這場造富盛宴能持續多久?進入2025年的最後一個月,兩隻GPU股摩爾線程和沐曦股份的上市,讓資本市場迎來了狂歡。先是12月5日,摩爾線程頭頂“國產GPU第一股”的光環登陸科創板,上市首日大漲425.46%。上市一周後,摩爾線程股價衝至941.08元/股,公司不得不發出公告,提示投資者注意風險。半月後,“國產GPU第二股”沐曦股份上市,再度上演暴漲情形。截至當日收盤,沐曦股份大漲692.95%。股價暴漲的同時,造富效應也隨之而來。有不少網友曬出自己的中籤記錄,上市首日便盈利24萬元,若持有至12月11日收盤,盈利已達到41.3萬元。摩爾線程也因此有了“摩王”之稱。這還只是股民的狂歡,摩爾線程的上市前投資人收穫則更多。綜合公司公告統計顯示,公司最早一批投資人憑藉190萬元的投資,目前價值已超百億,以首日收盤價計算,帳面回報已經達到了5300倍。摩爾線程、沐曦股份的股價飆升,更多源於市場對 “國產 GPU 替代” 賽道的情緒溢價,資金基於行業前景的樂觀預期集中追捧,催生了階段性的估值暴漲。但從長期維度來看,股價的可持續性終究要回歸企業基本面的支撐。GPU 行業屬於典型的高投入、高壁壘、高風險賽道,當前兩家企業均尚未實現盈利,核心技術的商業化落地成效、市場競爭力的建構、持續盈利能力的培育等關鍵問題仍待驗證。01. 靠著“牽線” 小城機構成了摩爾最賺錢的投資人總體來看,各地國資或擁有國資背景的投資方,在摩爾線程和沐曦股份上市前的發展中佔據了重要地位。摩爾線程在2022年之前,就獲得了上海國資、深圳國資管理的投資基金,以及央企招商局旗下投資基金的加入。2022年之後,中國移動、廈門國資、北京中關村科學城投資基金等也加入其中。沐曦股份最早由上海、南京兩地國資參與投資。之後建銀國際旗下基金,三大營運商、工銀瑞信、中郵保險等聯合出資的中國網際網路投資基金,四川綿陽國資等也參與了對沐曦股份的投資。直到上市之前,摩爾和沐曦的股東中,國資背景的股東仍然佔有大多數比重。公開資料顯示,摩爾線程成立於2020年6月,註冊資本金為1000萬元,3個月後進行了第一次增資。摩爾線程招股書顯示,公司第一代GPU晶片“蘇堤”於2021年發佈,2020年9月的摩爾線程尚未有產品和營收,此時,沛縣乾曜興科技合夥企業(有限合夥)和深圳市明皓新科技合夥企業(有限合夥)成為除摩爾創始團隊和高管之外的第一批投資人。其中,沛縣乾曜興科技的入股價為1元/註冊資本,深圳明皓的入股價為35.28元/註冊資本。之所以拿到如此低的優惠價格,得益於沛縣乾曜興科技合夥企業(下稱“沛縣乾曜”)為摩爾線程引入了深圳明皓的大額投資,因此作為最早期的外部投資人,增資價格經談判形成1元/註冊資本的優惠價格。這也是摩爾線程所有的投資方中,拿到的最優惠的原始股價格。此後一直到2023年10月,摩爾線程累計通過商業談判,經歷7次增資,投前估值也從創立時的1000萬元一路增至240億元,單筆註冊資本金(即原始股)的價格也逐步上升至1008.48元/註冊資本。截至上市前,摩爾線程共有86名股東,除創始人張建中之外,其餘85名股東均為機構投資者。按照1元/註冊資本的價格,沛縣乾曜以190.48萬元拿下了約19%的初始股權。而在摩爾線程IPO前,沛縣乾曜持股 1699.87萬股,佔比 4.2494%。以上市首日收盤價600.50元計算,沛縣乾曜對應持股市值約102億元。帳面回報達到5354倍。不過,沛縣乾曜的退出路徑並非僅靠IPO。綜合摩爾線程公告發現,沛縣乾曜在入股一年後,就以50億元估值向國盛資本轉讓了部分股權,國盛資本的接收價格為253.60元/註冊資本,按單筆價格計算,回報達到253倍。根據工商資訊,沛縣乾曜共有4名合夥人,分別為楊斌持股32.72%、周啟持股31.25%、上海諸神投資管理有限公司持股23.53%,黃博昊持股12.5%。其中,在沛縣乾曜中持股比例最高的楊斌是廣州市瑞展股權投資管理有限公司的法人代表,曾在深圳特區證券、聯合證券、國海證券等機構任職,後在藍橋投資擔任合夥人。黃博昊同樣也在瑞展股權投資和藍橋投資中持有股份。與摩爾線程相比,GPU第二股沐曦股份上市前股東數達到了124名,但除創始人陳維良及一致行動人上海驕邁、上海曦驥三者合計持有公司22.94%股權之外,其餘股東的持股數均未超過5%。與摩爾線程一致的是,沐曦股份也在2020年9月成立後兩個多月,就迎來天使輪融資。領投方是擁有南京國資背景的和利國信智芯。2020年12月,和利國信智芯作為早期投資人,看重創始團隊的行業經驗,看好GPU行業的未來發展前景,以5000萬元作為領投方參與了沐曦股份的天使輪融資;後續企業發展持續向好,投資人行使優先認購權,作為跟投方,又在2021年1月-6月,追加了多輪投資。2019年,南京浦口區政府通過旗下浦口高科投資,以7.6億元出資獲得和利國信智芯22.65%的份額,成為基金最大出資人;南京產發基金、江北新區投發等市級國資主體合計持股10.43%。至沐曦股份上市前,和利國信智芯持有1437.89萬股沐曦股份股票,佔發行前總股本的3.99%,是除沐曦股份創始團隊及一致行動人之外的最大股東。而以上市後首日收盤價計算,和利國信智芯持有的市值達到119.33億元。若不計中途多輪追加和交易退出,以天使輪的5000萬元投資額計算,回報倍數超過200倍。從持股比例來看,南京國資合計的浮盈超過了40億元。02. 私募大佬“突擊入局”沐曦股份與早早作為沐曦股份支援方的各地國資相比,私募大佬葛衛東的入局,更像是一場2025年牛市前夜的精準突進。2025年2月和2025年3月,沐曦股份進行了第六輪和第七輪增資。由於在第五輪增資之後,沐曦股份完成了從有限責任公司到股份有限公司的股改,股改後股東持股數量與其註冊資本實現1:1對應。因此第六輪和第七輪增資是沐曦股份在上市前的最後兩次融資。私募大佬葛衛東就在這兩輪入局,在第六輪和第七輪融資中,他分別出資3億元、5億元,合計投入8億元,同時,葛衛東旗下混沌投資也參與多輪融資,累計投入約6.49億元。上市前,葛衛東累計持有沐曦股份1433.82萬股股票,佔發行前總股本的3.98%,僅次於沐曦股份創始團隊及一致行動人,以及最早領投沐曦股份的南京國資和利國信智芯。按上市首日收盤價計算,葛衛東個人持股的帳面價值已達119億元,浮盈超110億元,回報倍數接近14倍;混沌投資的持股帳面價值也超104億元,回報倍數達16倍。個人+機構合計持股市值超220億元。除了私募大佬葛衛東之外,在以上兩輪入股沐曦股份的知名投資方,還包括七匹狼、娃哈哈、九安醫療等知名企業,以及經緯創投、紅杉資本等知名創投機構。市值榜統計顯示,在2025年2月和3月的沐曦股份第六輪和第七輪增資中,累計有81名股東參與,剔除重複之後,有73位不同的股東在上市前一年參與增資。摩爾線程上市前的最後一輪融資出現在2024年11-12月期間,共有38家主體參與融資,以國資為主,合計出資52.24億元,認購約7002萬股股份,對應股價為74.6元/股。以摩爾線程上市首日收盤價計算,最後一輪融資的股東們,回報倍數也超過了8倍。在摩爾線程IPO發行配售階段,入局的仍然以國資為主,其中保薦人兼主承銷商中信證券獲配140萬股。其它獲配機構分別包括中國電信、北京國資為主的電控產業投資方、中國兵器裝備旗下南方資管、無錫惠山國資、中國再保險、合肥國資等。無論是早有佈局,還是突擊入股,其根本動力,或者說能夠爆賺的根本原因,都在於國產自主替代為晶片行業留下的寶貴窗口期。與輝達相比,中國晶片企業的實力仍然站在弱勢一方,但地緣影響,使得中國晶片市場需求與供給出現了錯位。在政策和市場需求面前,中國晶片企業迎來了空前的發展機遇。03. 狂歡背後國產GPU戰力幾何?回到摩爾線程與沐曦股份成立的2020年,GPU晶片還是一個讓國人“又愛又恨”的事物。儘管2018年美國對中興的制裁,已經令人意識到研發本土晶片的重要性。但2019年科創板設立、2020年美國對華為制裁升級,才令各界開始拿出家底,努力為晶片研發而戰。據雲岫資本《2020年中國半導體行業投資解讀》的統計,2020年半導體行業股權投資案例413起,投資金額超過1400億元人民幣,相比2019年約300億人民幣的投資額,增長近4倍,這也是中國半導體一級市場有史以來投資額最多的一年。(來源:雲岫資本微信公眾號)2020年,除了摩爾線程與沐曦股份之外,有不少晶片企業和項目都在這一階段開始佈局。例如,現任深圳理工大學算力微電子學院院長、高性能處理器和電腦系統專家唐志敏就於2020年9月在重慶註冊成立了象帝先計算技術有限公司,聚焦GPU晶片研發設計。當月完成天使輪融資,2022年完成A輪融資。但晶片行業的本質,是“倖存者偏差”。流片失敗、迭代淘汰,都可能直接決定一家晶片企業的生死。大量的企業會在技術迭代中淪為陪跑,而最終的勝出者便是那個收穫極高回報的贏家。象帝先的業務處理程序經過兩年左右的高光之後便暗淡下來。當晶片越來越聚焦於人工智慧的需求時,象帝先的算力和工藝短板便由此暴露。2024年11月,象帝先傳出解散清算消息。但公司回應稱,這只是組織結構和人員配置的最佳化,以降低營運成本並提高效率,公司核心研發和營運團隊仍將保留,並全力尋找外部融資機會。相比象帝先而言,摩爾線程和沐曦股份的競爭力顯然強出不少。綜合券商調研資訊,摩爾線程是國內唯一實現全功能GPU量產量銷的廠商,覆蓋晶片、板卡、叢集及軟體生態全鏈條,產品矩陣涵蓋 AI 智算、專業圖形、桌面級 GPU 與智能 SoC 四大類。其中 AI 智算板卡與叢集為公司核心營收來源。受益於 AMD 基因加持,沐曦股份成為國內高性能通用GPU產品的領軍企業之一,有望充分受益於國產替代的持續推進。但兩家企業的挑戰並不小。其一,無論是摩爾線程還是沐曦股份,都是僅攻克了設計這一關,而在製作方面,光刻機仍然是當前遭受“卡脖子”的重要環節,國產供應鏈還在建設中。製作工藝的進化程度,將直接影響到摩爾線程和沐曦股份的量產前景和市場生存前景。其二,國產GPU產品與輝達之間還存在一定差距。沐曦股份招股書中表示,國內 AI 晶片行業的主流算力水平尚處於輝達 A100 產品階段,少數廠商通過先進封裝等方式能實現接近輝達 H100 產品的算力,為國內廠商中的最先進水平。“目前,沐曦股份基於自主研發的 GPU IP 核心 XCORE 架構,推出的訓推一體 GPU 算力處於國內第一梯隊。以行業內通常用來衡量 GPU 晶片在人工智慧訓練場景下的算力性能指標 FP16/BF16 為例,曦雲 C500/C550 晶片處於輝達 A100的算力區間;曦雲 C588 晶片在曦雲 C550 晶片的基礎上實現算力躍升,大幅縮小與輝達 H100 的差距,在國內處於先進水平。”沐曦股份在招股書中稱。摩爾線程也在招股書中對比了自家S5000晶片與輝達A100、H100之間的差距,在衡量算力的關鍵指標FP32 Vector(Flops)方面,摩爾線程S5000為32T,高於輝達A100的19.5T,但低於H100的67T。而更重要的是,輝達是否未來會通過某些形式,重新回到摩爾、沐曦們正在全力爭取的市場,也猶未可知。兩家公司在風險提示中也表示,隨著國家在AI和高性能計算領域的強力政策支援,國內 GPU 晶片領域正吸引大量資本和人才湧入,行業進入快速發展期,競爭也將加劇。從產品定位來看,摩爾線程GPU產品覆蓋消費應用、資料中心和專業圖形市場,是國內少數能提供全場景GPU解決方案的廠商。沐曦股份主打資料中心AI計算,產品以訓推一體GPU與推理GPU為主,尚未涉及消費應用和專業圖形市場。在國內,壁仞科技、寒武紀、海光資訊等均與上述兩家企業構成同業競爭關係。最新的消息是,2025年12月17日,壁仞科技通過港交所上市聆訊,計畫以18C規則登陸港股,成為“港股GPU第一股”。一個典型的現實是,兩家企業均未實現盈利。2022-2025年前三季度,沐曦股份分別虧損7.77億元、8.71億元、14.09億元、3.46億元。摩爾線程同期虧損18.94億元、17.03億元、16.18億元、7.24億元。對於盈利預期,沐曦股份預計達到盈虧平衡點的最早時間是2026年,摩爾線程給出的最早合併報表盈利時間是2027年。這意味著,GPU市場的競爭,還遠遠未到最白熱化的程度。 (芯師爺)
系統級摩爾定律:推理時代 NVIDIA×Groq 的真實含義,光進銅退的再加速
過去半個世紀,“摩爾定律”幾乎是科技行業最強的敘事武器:把更多電晶體塞進一顆晶片,性能更強、成本更低,世界自動向前滾動。但到了 AI 時代,尤其進入大模型推理成為主戰場之後,這套敘事正在發生一次深刻升級——摩爾定律從“晶片內部”擴展為“系統工程”。如果說過去的摩爾定律在追求“每平方毫米更多電晶體”,那麼 AI 時代的摩爾定律更像是在追求:單位時間產出更多 token(token throughput),並且這條曲線要能持續向上。而 token throughput 的提升,早就不再是單顆 GPU 的問題,它是一整座“AI 工廠”的問題:晶片、HBM、封裝、PCB、供電散熱、機櫃內互聯、機櫃外網路,以及軟體如何把這些組織起來、調度起來,讓系統始終跑在“最短板”之上。在這個框架下,NVIDIA×Groq 的合作/交易(無論最終形態是什麼)更值得被理解為:推理時代的一次“系統級加碼”,而不是“解決某個供應鏈瓶頸”的神蹟。一、先把交易定性:不是“買產能”,更像“推理能力授權 + 關鍵人才併入 + 生態介面補強”市場上最常見的誤讀,是把這類交易想像成“為了補齊 CoWoS、HBM、電力”等供給瓶頸而做的資本動作。現實更複雜。公開披露資訊顯示,這一合作/交易的核心是推理技術的非獨家授權,並伴隨 Groq 核心人員加入 NVIDIA 推進相關技術的規模化落地,Groq 公司仍獨立營運。換句話說,它更像是在為 NVIDIA 增加一條推理時代的“技術路線選項”,並把關鍵經驗與人才納入自己的產品化體系,而不是直接改變封裝產能、HBM 供給這類供應鏈事實。這一定性非常關鍵:因為它將討論重心從“供給約束”拉回到“推理範式”。二、AI 時代的“系統級摩爾定律”:為什麼摩爾定律必然外溢到 PCB、機櫃和互聯?推理系統的吞吐,本質上受制於一個非常樸素的三角形:算、存、傳。算(Compute):算力夠不夠、計算單元是否被喂飽存(Memory):權重/啟動/KV 的訪問是否形成記憶體牆傳(Communication):跨卡、跨 tray、跨機櫃的資料交換是否堵塞這個三角形的殘酷之處在於:只要把其中一條邊推上去,瓶頸就會遷移到另一條邊。因此推理時代的競爭,必然從 GPU 單點性能擴展到系統工程能力:互聯拓撲、網路頻寬密度、功耗與可靠性、軟體抽象與調度策略,都會變成吞吐曲線的一部分。這也解釋了為什麼 NVIDIA 的“摩爾定律”會被改寫成系統級版本:它追求的不是單晶片 transistor scaling,而是整座 AI 工廠的 token scaling。三、MoE 推理的結構性事實:天然需要“權重分層”(Weight Hierarchy)如果要理解“Groq 的 SRAM 路線”為什麼會在推理時代顯得格外有價值,必須先抓住當下主流模型架構之一:MoE(Mixture of Experts)。MoE 在推理側的關鍵特徵是:權重訪問天然分成兩類。1)always-on 的熱權重:每個 token 都必須執行的部分dense 層shared experts(共享專家,層層必跑)2)sparse-on 的冷權重:按路由稀疏啟動的部分routed experts(例如從 256 個裡選 top-8)啟動更隨機、訪問更像“按需取用”於是,一個極其工程化、極其自然的推理加速方向出現了:把 always-on 的熱權重常駐在更近、更低延遲、更高頻寬的儲存層(比如 SRAM/近儲存),把 routed experts 留在 HBM 或更遠端,並用熱度快取/複製策略最佳化。這件事的目標不是“省 HBM”,而是更直接的兩件事:降低 latency(減少權重搬運等待)提高穩定吞吐(HBM 頻寬從“啥都搬”變成“只搬稀疏部分”)可以把它理解為:CPU 時代的 cache hierarchy,在 MoE 時代升級為 weight hierarchy。四、用 DeepSeek V3 做一次“量級校驗”:為什麼“3–4GB FP8 熱權重集合”是硬體形態演化的抓手?推理討論最怕缺乏量級感。這裡用 DeepSeek-V3(總參 671B、每 token 啟動 37B,MoE 架構)做一次可復算的量級校驗。結合典型實現參數(hidden=7168,MoE FFN 的 intermediate=2048,約 58 個 MoE 層 + 3 個 dense 層;每 MoE 層 1 shared + 256 routed;每 token top-8 路由),可以得到一個關鍵結論:always-on 的熱權重集合本身就是 GB 級。1)shared experts(跨 58 層)的 FFN 主權重規模門控 FFN(如 SwiGLU)的一個 expert,近似包含三塊矩陣:up、gate、down。每層 shared expert 參數量約為:Params ≈ 3 × hidden × moe_intermediate= 3 × 7168 × 2048≈ 44M / 層58 層合計:44M × 58 ≈ 2.55B 參數2)3 個 dense 層的 FFN 主權重規模dense 的 intermediate 更大(約 18432):Params ≈ 3 × 7168 × 18432≈ 396M / 層3 層合計 ≈ 1.19B 參數3)合計熱權重集合(FFN 主體)≈ 3.74B 參數2.55B + 1.19B ≈ 3.74B 參數按 FP8 粗算 1 byte/參數:≈ 3–4GB 量級(不同實現是否包含量化中繼資料會有小幅偏差)這個量級的意義非常關鍵:大到:普通意義上的 L2/L3 cache 解決不了問題小到:如果系統存在某種近儲存層/推理專用駐留層,讓這 3–4GB 常駐,就非常有吸引力換句話說,MoE 推理天然提供了一個“熱權重集合”的明確對象——這就是推理硬體形態演化最容易抓住的把手。註:估算聚焦 FFN/expert 權重,是因為 MoE 推理權重搬運的大頭集中在專家 FFN;注意力部分在不同架構(如低秩投影/MLA 等)下可顯著壓縮,不改變熱權重集合為 GB 級這一判斷。五、“Groq 式 SRAM/近儲存能力”的合理落點:推理專用“熱權重層”,不是取代 GPUGroq 長期強調片上 SRAM 帶來的高頻寬與流水線式推理執行。把這一點放到 NVIDIA 的系統工程語境裡,最符合邏輯的推斷並不是“把 NVIDIA 變成 Groq”,而是:為推理系統增加一層 熱權重近儲存/專用駐留層讓 GPU 更容易被喂飽,提高有效 token/s通過軟體抽象層把這種形態納入 NVIDIA 生態,降低開發與遷移成本這裡關鍵不是“SRAM 這個名詞”,而是:更近、更低延遲、更高頻寬的權重層。至於它長在 GPU 封裝裡、長在板上、長在 tray 上,或者以某種異構加速單元形態出現,都屬於工程實現的分叉路線;但動機與收益目標是清晰的:推理提速。六、最重要的鏈式反應:計算效率上升 → 互聯壓力上移 → 光進銅退可能再加速一旦熱權重常駐近儲存,使推理端的“記憶體牆”變薄,系統會進入典型的再平衡過程:單節點有效 token/s 上升(等待變少、計算更“吃飽”)同時間裡生成更多 token,平行請求更大MoE 路由與跨卡/跨節點組織開銷佔比上升為繼續擴吞吐,系統平行度向外擴:卡內 → tray 內 → 機櫃內 → 機櫃間互聯成為新短板:頻寬密度、距離、功耗與可管理性壓力增大銅在更高頻寬與更長距離下更快觸頂,光的滲透被動加速因此,“推理提速→互聯升級→光進銅退”的邏輯並不是口號,而是一條相對自洽的系統工程鏈條:推理加速的盡頭往往不是算力,而是互聯;當計算更快,互聯必須更快。這也解釋了為什麼很多人只盯著 GPU 出貨,會低估光通訊的“二階彈性”:計算端效率提升,會讓通訊需求斜率變陡,從而推高機櫃內/機櫃間頻寬升級的緊迫性。七、投資對應:系統級摩爾定律下,那些環節更容易成為“增量受益”?如果把“推理吞吐持續提升”作為主線,那麼產業鏈受益往往不是單點,而是鏈式擴散。1)機櫃內互聯:從“銅還能撐一撐”走向“更早換光”頻寬密度更快觸頂距離、損耗、功耗與可維護性讓銅在高階速率下更尷尬光在機櫃內滲透有可能被動加速2)機櫃間網路:更高階速率光模組與交換體系token/s 上升帶動跨節點平行更深scale-out 網路更容易成為系統短板交換晶片、光模組速率升級與拓撲最佳化的需求更強3)PCB/連接器/電源散熱:系統密度提升的“基礎設施”計算更密,供電散熱與板級設計更關鍵可靠性與可維運性成為規模化推理的隱性門檻4)軟體與調度:最終決定“硬體是否兌現吞吐”MoE 路由、批處理、快取/複製策略跨卡/跨節點通訊編排統一抽象層(生態介面)帶來的鎖定效應如果說訓練時代的核心是“買更多 GPU”,那麼推理時代的核心越來越像“買系統、買網路、買軟體”。八、風險提示與可證偽點:那些前提不成立,推演就要改寫?為了避免過度演繹,有必要把邊界條件講清楚:MoE 未必長期絕對主導:結構變化會改變“熱權重集合”的形態近儲存不必然是 SRAM:實現路徑可能多樣,關鍵是“更近的權重層”專家不必然跨機櫃:現實系統會優先局部化、熱專家複製,跨櫃更多是邊界情況收益受制於軟體調度:硬體再優,調度若跟不上,吞吐不會線性提升TCO 約束:電力、散熱、網路、維運、良率與供給鏈會共同決定最優點這些因素決定了:相關判斷應被視作“方向與機制”,而不是確定性預告。結語:NVIDIA×Groq 更像推理時代的“系統級選項”,而不是供應鏈神話當摩爾定律升級為系統級摩爾定律,推理競爭的核心就從“單點性能”轉向“系統吞吐曲線”。MoE 推理所暴露出的“熱權重集合”與“權重分層”需求,為近儲存/推理專用駐留層提供了清晰抓手;一旦推理效率上升,互聯壓力上移,機櫃內與機櫃間的頻寬升級與光滲透加速也更可能成為連鎖反應。因此,NVIDIA×Groq 的意義更接近:推理時代的一次系統級加碼——未必立刻改變供給,卻可能在下一代推理範式與異構硬體生態的介面層與方法論層面,提前佔住高地。(彼得全球科技觀察)
黃仁勳沒瞎說,摩爾定律的喪鐘響了?但有4條路能破局...
2025年底的輝達發佈會上,黃仁勳一句“摩爾定律已死”,讓台下的行業大佬們集體沉默。不是質疑,是默認。那種複雜的沉默裡,藏著對一個時代落幕的悵然,也藏著對未知的忐忑。我們這代人,早已習慣了算力的“免費午餐”。手機一年比一年快,電腦效能翻番價格卻降半,甚至當年登月用的超級電腦,算力還不如現在口袋裡的手機。這一切,都源於摩爾定律。可它真的停了嗎?新的算力時代,又該靠什麼撐起來?我們薅了幾十年的摩爾定律紅利,到底是什麼?1965年,英特爾創始人戈登·摩爾隨手畫了條曲線,提出一個大膽預測:積體電路上的電晶體數量,每18到24個月就翻一番。沒人想到,這條曲線成了現代科技的增長密碼。它不只是數位遊戲,更是一場全民受益的技術狂歡。電晶體越做越小,晶片性能指數級暴漲,成本卻斷崖式下跌。曾經幾百萬美元的大型電腦,如今幾千塊就能買到同款算力的筆記本;以前只能存幾張照片的記憶體卡,現在能裝下整部高畫質電影庫。過去幾十年,我們就坐在這趟高速列車上,不費吹灰之力就享受到了技術進步的紅利。可列車跑得再快,也終有撞牆的一天。不是不想續,是物理和錢包都不允許了摩爾定律的退場,不是技術停滯,是被三道無形的牆攔住了去路。第一道是物理的硬邊界。現在晶片製程已捲到3nm,一根頭髮絲的直徑,差不多是它的2萬倍。到了這個尺度,微觀世界的規則徹底變了。電晶體柵極薄到只有幾十個原子,電子不再乖乖聽話,會直接“穿牆而過”——這就是量子隧穿效應。關不住電子,晶片就會漏電、發熱,甚至徹底罷工。再往小做,已經不是技術問題,是違背物理規律。第二道是散熱的噩夢。以前電晶體縮小,功耗也會跟著降。這個紅利,15年前就被吃乾抹淨了。指甲蓋大的晶片裡,塞了幾百億個電晶體。要是讓它們全力運轉,產生的熱量能瞬間熔化晶片。這也是高端CPU、GPU主頻,死活難突破6GHz的核心原因。第三道是錢的無底洞。造3nm晶片,台積電、三星得買ASML的EUV光刻機,一台就超過1.5億美元,運它要好幾架波音747。更諷刺的是,最先進工藝的晶體管成本不僅沒降,反而在漲。3nm晶片的製造成本,已經是45nm晶片的15倍。花錢換性能的遊戲,越來越玩不起了。後摩爾時代,算力靠這4招續命摩爾定律停了,但行業不會坐以待斃。聰明的工程師們換了思路,不走“平面堆料”的老路,改玩起了立體、模組化的新花樣。1.3D堆疊:把平房改成多層公寓既然平面空間不夠用,就往垂直方向要效益。3D堆疊技術,就是把不同功能的晶片層疊起來,用矽通孔、混合鍵合技術打通連接。這就像把平房改成多層公寓,不擴大佔地面積,卻能大幅提升使用效率。三星的238層3D NAND晶片,單顆容量就能到2TB,我們用的高速SSD,背後就是這技術撐著。AMD的3D V-Cache技術更直接,在CPU核心上方堆疊快取,遊戲性能一下提升15%-25%。目前這技術已大規模商用,預計2028年全球市場規模將突破千億美元。當然難題還在,層數越多散熱越棘手。好在西門子EDA推出了專用散熱分析軟體,能提前模擬熱分佈,幫工程師最佳化設計。2.Chiplet:半導體界的樂高積木傳統晶片是個“整體積木”,一處出錯整個報廢。Chiplet技術則把它拆成多個獨立模組,像樂高一樣按需拼接。不同模組可以用不同製程生產,平行研發測試,既降低成本又提升良率。AMD MI300晶片就用了13個Chiplet模組,整合1460億電晶體,頻寬突破5TB/s。2022年英特爾、ARM等推出的UCIe標準,解決了不同廠商模組的相容問題。但整合時的氣泡殘留的難題,曾長期困擾行業。南京屹立芯創給出了答案,他們的除泡系統靠“震盪式真空壓力”技術,能精准消除氣泡,已在頭部封測企業產線落地。3.新材料:繞開EUV的破局者既然矽基晶片快到頂了,就換種材料接著玩。二維材料成了新寵,原子級厚度的特性,讓電子能“暢行無阻”。復旦大學研發的“長纓(CY-01)”快閃記憶體晶片,擦寫速度比傳統快閃記憶體快100萬倍,還不用EUV光刻機,28nm成熟工藝就能量產。北大團隊更厲害,研發出的硒化銦晶圓,電子遷移率是矽的數倍,10nm溝長電晶體的開關速度,是3nm矽基技術的3倍。未來手機續航、電腦速度,都靠這些新材料突破。4.量子計算:還在修煉的未來王牌量子計算走的是完全不同的路線,靠量子位元的疊加態和糾纏態,實現平行計算。它不用跟矽基晶片比精度,而是在特定領域實現降維打擊。微軟的拓撲量子晶片提升了穩定性,中科大的“祖沖之三號”有105個量子位元,性能比肩Google同類產品。最新的“祖沖之3.2號”更實現了關鍵突破,達到“越糾越對”的糾錯閾值。雖然現在還處於實驗室向商用過渡的階段,但在藥物研發、材料設計等領域,量子計算已經展現出巨大潛力。最後後摩爾時代的技術路線,沒有那條是一帆風順的。3D堆疊要解決散熱和應力問題,Chiplet需完善介面標準,新材料要突破量產瓶頸,量子計算還得攻克糾錯難題。但比起摩爾定律末期的束手無策,現在的行業更有活力。不再是所有人擠在“製程微縮”的獨木橋,而是多路並進、各顯神通。黃仁勳喊出“摩爾定律已死”,不是宣告算力革命終結,而是提醒大家換道前行。未來的手機、電腦,或許不會再靠單純堆性能取勝,但體驗只會更好。這場不靠電晶體數量的算力革命,才剛剛拉開序幕。 (半導體工師瀟威)
中國“GPU四小龍”殺瘋了,上海成最大贏家!
當前,中國股市最熱的題材,莫過於GPU。當全球GPU龍頭輝達創下4.4兆美元的市值,中國GPU企業也在股市掀起科技旋風。中國GPU四小龍中,兩家已在科創板上市,剩下的兩家即將登陸港交所。上海,憑什麼成為最大贏家?中國GPU企業,迎來上市潮。12月5日,摩爾線程在上交所科創板掛牌上市,成為中國首家登陸資本市場的全功能GPU企業。在申購啟動之前,摩爾線程已經創造了包括上市速度、發行價、募資規模在內的多個“第一”,成為今年最具話題性的硬科技上市項目。上市首日漲幅,漲幅425.46%,中一簽(500股)盈利達26.78萬元,創下A股新股最賺錢紀錄。截至12月22日,摩爾線程股價為673元/股,總市值高達3177億元。摩爾線程股價12月17日,沐曦股份在上交所科創板掛牌上市,成為第二家上市的GPU企業。上市首日漲幅,漲幅692.95%,中一簽(500股)最高浮盈達39.5萬元,超過摩爾線程創A股歷史新高。截至12月21日,沐曦股份股價為703.35元/股,總市值高達2745億元。沐曦股份股價正解局注意到,摩爾線程在北京,沐曦股份在上海。一南一北,一城一個,可謂平分秋色。實際上,在GPU賽道上,上海已然一騎絕塵。摩爾線程、沐曦股份、壁仞科技、天數智芯,處於國產高性能通用GPU領域的第一梯隊,因此被稱為中國GPU四小龍。壁仞科技、天數智芯都來自上海,已先後於12月17日、12月19日通過了港交所聆訊,衝刺“港交所GPU第一股”。天數智芯申報材料即便是摩爾線程,雖然總部在北京,但在上海張江亦有關鍵佈局。摩爾線程實行的是雙核佈局,北京為公司總部所在地,負責總體戰略、架構設計和公司治理;上海張江是公司產業協同、研發資源與供應鏈協作的基地。也就是說,半個摩爾線程,要算在上海。這樣一看,中國GPU四小龍,上海獨攬三個+半個。上海,成了最大贏家。國內的絕大部分產業,大多呈現“一超多強”的格局,即一兩個城市佔主導地位,其他城市亦能分一杯羹。為什麼GPU產業的集中度更高?這是由GPU產業的特點決定的。GPU是一個典型的人才密集、資金密集、技術密集、生態密集型產業。正解局分析中國GPU四小龍後發現,這四家企業有一個顯著的特徵:創始人或研發團隊核心成員,都來自國際大廠。比如,摩爾線程創始人張建中曾任輝達全球副總裁、大中華區總經理,沐曦股份創始人陳維良曾是AMD全球圖形研發副總裁,天數智芯的首席科學家是AMD前資深晶片專家,壁仞科技的聯合創始人兼首席技術官(CTO)是洪洲早年任職於輝達科學計算部門。輝達、AMD、英特爾等國際大廠的中國研發中心,就在北京或上海。這些大廠佈局北京、上海,當然是看中了這兩座城市匯聚清華、北大、復旦、上交等頂尖高校,及中科院等科研機構,可以持續輸送晶片設計、架構、軟體人才。復旦大學微電子學院近水樓台先得月。北京、上海,是中國唯二的高端人才“蓄水池”。中國GPU創業企業選擇落戶北上,可快速組建頂尖技術團隊,降低人才引進成本。此外,北京、上海的資本市場發達,擁有大量硬科技投資機構,對GPU這類長周期、高投入項目的容忍度更高。先看摩爾線程,早在2021年,北京海淀區就設立了50億元規模的一期基金,對摩爾線程進行了投資。2022年,北京銀行為摩爾線程量身定製了一份數億元的貸款方案,為企業的產品研發和創新提供了重要助力。再看沐曦股份,2024年,上海浦東創投集團通過引領區發展基金,完成對沐曦股份的5億元戰略投資,為企業關鍵階段夯實資金儲備。從人才、資本上看,北京、上海不相上下。上海的獨特優勢,在產業鏈。2024年,上海積體電路產業規模達3900億元,佔全國的25%。除了規模獨大外,上海產業鏈最完整、技術水平最高,集聚超1200家企業,形成“設計—製造—封測—裝備材料—EDA/IP”的完整閉環。根據世界積體電路協會公佈的資料,2025中國積體電路創新百強企業中,上海企業上榜最多,有23家,而且大部分企業都是積體電路設計企業。在設計環節,上海連續多年蟬聯“積體電路設計業規模最大城市地位”,華為海思、中芯國際、展銳、韋爾股份、豪威科技等頭部設計企業總部或研發中心都在上海。在製造環節,中芯國際、華虹集團等龍頭企業在上海佈局了28nm、14nm、7nm等先進製程生產線,佔全國總產能30%。在封測環節,長電科技、通富微電、華天科技等頭部封測企業佈局,是全球最大的封測產業基地之一。在裝備材料環節,上海裝備材料產業規模佔全國比重超25%,是國產裝備和材料的重要基地。在EDA/IP環節,Cadence、Synopsys、Siemens EDA等國際EDA巨頭在滬設立區域總部,華大九天、概倫電子等國產EDA企業在上海快速發展。中芯國際上海,是名副其實的中國積體電路產業“第一城”。如果以上海為中心,將積體電路產業鏈擴展至長三角,那麼,上海的優勢就更明顯了。長三角的積體電路產業規模,佔全國的60%!上海、江蘇、浙江、安徽四地的分工與協同,為積體電路企業提供了“從0到1”再到“從1到N”的全周期、全要素孵化支撐。這也是北京沒有的優勢。中國GPU四小龍,上海獨佔其三,絕非偶然。雖然GPU產業呈現出向長三角等核心區域集中的特徵,但這絕不意味著其他城市沒有機會。恰恰相反,GPU產業的特性為非核心城市提供了廣闊的差異化發展空間。其一,產業規模足夠大,細分賽道藏著“兆級”機會。GPU早已跳出傳統圖形處理的單一範疇,成為AI訓練/推理、智能駕駛、邊緣計算等多領域的“算力心臟”。中國GPU市場規模中國GPU市場規模在2024年約為‌1073億元人民幣‌,預計在AI算力需求驅動下持續高速增長,到2029年有望突破‌1.4兆元‌。‌‌龐大的市場規模和多元的需求場景,讓不同城市都能找到切入點,也提供了參與產業鏈的空間。其二,產業鏈條足夠長,協同分工創造“生態紅利”。GPU產業鏈涵蓋設計、製造、封測、EDA/IP、裝備材料、應用適配、算力服務等多個環節。每個環節都需要專業化分工,為不同城市提供了差異化定位的機會。一個細節是,在沐曦股份成立初期,南京市政府投資基金合作子基金就參與投資,累計投資7.18億元。2020年10月,沐曦股份在南京浦口區成立了第一家全資子公司——沐曦積體電路(南京)有限公司,承擔著公司全系列產品的研發重任,已成為沐曦股份的“最強大腦”。南京投資沐曦股份沐曦股份上市後,南京不僅獲得了豐厚的財務回報,還壯大了自己的積體電路產業。產業鏈不是“零和遊戲”,而是要“各展所長、協同共贏”。中國GPU產業突圍,需要各大城市一起努力。 (正解局)
“寒武紀已成老登”
短短十來天,兩家市值超3000億的巨頭誕生——摩爾線程和沐曦整合排隊科創板敲鐘,首日漲幅均超500%,令人驚嘆。若是打新中上一簽,當日即可實現數十萬浮盈。一時間,幾乎所有的目光都聚集在這兩家晶片新貴身上。而作為AI晶片帶頭大哥的寒武紀,也在這個熱鬧非凡的時刻被“端”了出來。正如股民們調侃:摩爾線程和沐曦整合就像18歲熱情洋溢的少女,寒武紀則像沉默寡言的老登。其實,此時距離市場尊稱其為“寒王”,才僅僅過去不到四個月。01小登排隊敲鐘暴漲寒王有點落寞不曾想,A股總市值一下子就增了6000多億。12月5日,摩爾線程在萬眾期待中摘下“GPU第一股”,首日表現較發行價最高漲超5倍,市值突破3000億元。隨後幾個交易日又續寫新高,股價一度開掛衝至941元成為A股“第三貴”,市值逼近4500億元。然而這似乎只是一個開始。12月17日,沐曦整合登陸科創板,一度暴漲超750%,迅速奪走A股“第三貴”頭銜,市值最高沖上3500億元。那些參與打新的人,若看首日收盤價,中一簽(500股)首日便可浮盈超36萬元,這是全面註冊制以來最賺錢的新股。“摩爾線程和沐曦整合讓很多投資機構活過來了。”驚人的財富效應同樣漫灌兩家公司背後的早期投資人們。比如,同時投中兩家的紅杉中國一度浮盈超過100億。那些最早上船的人更不必多說,當年沐曦整合的天使輪投資人們以4.8億元估值進場,若堅守至今,帳面回報定然不菲。熱鬧之間,“摩王”“沐王”站到舞台中央。二級市場,一股情緒迅速蔓延。用股民的話來調侃,現在摩爾就像18歲的青春少女,熱情洋溢;東芯就像30歲大姐姐,成熟穩重;寒王像是步入更年期的老登,暮氣初現……何曾想幾個月前,大家都還在追著“寒王”。甚至今年12月前,寒武紀還獨自穩坐“AI晶片第一股”的寶座。猶記得5年前寒武紀科創板上市時同樣是風頭無兩,開盤即大漲超350%,首日市值一度超過1000億元。其實今年寒武紀資本市場和基本面表現令所有人印象深刻,其淨利潤在沉寂和攻堅多年後自今年一季度開始轉盈,這份成績單放在AI晶片行業中相當亮眼。與此同時,其股價也走出低谷屢創新高,市值在8月底一度超7000億。也因寒王,一種獨屬於中國半導體投資圈的反思曾蔓延開來:“寒武紀沒趕上或退早了,現在必須抓住下一個。”恰恰是這種FOMO情緒,一定程度上為今天新貴們的估值抬了下轎。02活下來的老登才是英雄無疑,今天中國的算力盛宴風頭正盛。就在沐曦上市的同一時間,壁仞科技港股IPO通過聆訊;消息也傳出,百度旗下AI晶片公司崑崙芯即將完成股改加速推進衝刺上市的步伐;時間再往前,11月1日,燧原科技重新提交上市輔導備案。細看下來,包括寒武紀在內,當下這批熱門AI晶片公司幾乎都是在2017年前後成立。那一年,為大模型奠定技術底座的Transformer架構誕生,國內外大模型賽道暗潮湧動,AI晶片廠商應運而生。再後來,ChatGPT在全球打響,大模型全民應用時代來臨。到了2023年,被稱之為“大模型元年”,GPU廠商輝達市值一舉飛躍兆美元。或許那時,市場已經捕捉到了一條樸素的投票邏輯:AI競爭是一場堆積算力競買大賽,無論最終誰主沉浮,賣AI晶片的都是躺賺的那一個。於是,在國產替代和“中國輝達”的期待中,屬於國內AI晶片廠商的機遇從未像今天這樣濃烈。但機遇從來都伴隨著競爭。一種更為現實主義且更具普適性的論調是,能活下來的老登才是真英雄。誠如眼下,國內AI晶片廠商技術路線稍有區分:比如摩爾線程選擇對標輝達、堅持全功能GPU路線;寒武紀則聚焦AI專用晶片賽道,類似ARM與Google TPU的混合技術路徑。再如沐曦,重點強化AI和高性能計算能力,這與摩爾線程的全功能GPU路線形成差異。但AI晶片最後的解決方案是什麼?這尚是需充分競爭和市場閱卷後才明晰的未至之境。一位AI投資人向我們聊起他的觀點:“當下大模型處於快速發展期,因此通用性強的GPU看起來更佔領優勢,但當大模型某些範式固定下來,一些最佳化過的專用晶片(TPU)也可能會更好。”技術世界變化之快,沒有人有明確的答案。對於不願錯過的投資人,最重要的事情是:先投進去,讓自己在船上。03面孔更迭背後是中國產業接力賽從寒武紀到摩爾線程、沐曦,再次證明了一個共識:AI是一件長期的事。這份長期主義中,勢必會不斷湧現新賽道承接下一輪的AI敘事。我們不妨把思緒拉回2023年左右,那時當屬“百模大戰”正酣,國內跑出了智譜AI、月之暗面、MiniMax等大模型“六小虎”,所有頭部VC幾乎都在投大模型,動輒數億元的融資比比皆是。行至今天,大模型公司們或許終於快到了去資本市場兌現估值的時刻。幾乎同一時間,智譜、MiniMax兩家AI大模型獨角獸傳出已經通過了港交所聆訊的消息,開搶“大模型第一股”。若是把目光放到2025年,具身機器人賽道無疑是焦點。開源證券有一組資料顯示,截至2025年10月,具身智能領域融資總金額已超500億元,較2024年全年增長超400%,融資事件超200起。“具身機器人公司門檻都要被投資人踏破了”,這樣的調侃今年投資圈沒少聽到。而沿著AI算力賽道,除了估值想像空間巨大的GPU新貴們,還有曾經的老登搖身變小登燃炸資本市場的故事。不得不提到光模組產業。這原本是發源於通訊行業的傳統賽道,年初AI東風刺激算力需求猛增,光模組迎來絕佳逆襲良機:當GPU與光模組結合,可以為AI訓練提高資料傳輸速度,提供更高效的計算能力。資本市場迅速買帳,今年4月來,光模組巨頭們股價紛紛翻了若干倍,新易盛、天孚通訊市值最高分別沖上4400億、1800億,中際旭創則一度達6900億,三家以驚人漲勢,成就A股“易中天”老師。不由感嘆,沒有永遠的新賽道,只有永遠的參與者。而新賽道總是熱情洋溢、不缺擁躉——因為關注它們,就是關注中國科技產業的未來。 (EDA365電子論壇)