大摩:中國AI GPU縮小與美國的差距(上篇)

大中華區半導體中國AI GPU:不斷縮小與美國的差距

高昂的人工智慧資本支出(Capex)和持續的政策支援,催化了中國AI GPU生態系統的發展。在本篇深度研報中,我們引入了一個分析框架,以評估該行業的商業價值、競爭力及整合路徑。

AI技術的迅速擴張正推動中國向更高品質的增長模式轉型。去年,我們在藍皮書報告《中國人工智慧:沉睡的巨龍甦醒》(China – AI: The Sleeping Giant Awakens)中,探討了中國AI的發展現狀及其邁向2030年及以後的發展軌跡。在本報告中,我們將聚焦中國AI基礎設施的核心——作為該技術基石的AI晶片——並評估不斷演變的需求前景、晶圓代工供應瓶頸以及塑造該行業的競爭格局。

  • 國產AI GPU供應取得重大進展: 在很長一段時間內,中國AI技術的普及並非受制於電力、資料或工程人才,而是受制於美國出口管制下無法獲取先進的AI晶片。中國自2020年起開始研發本土AI GPU,當時獲取海外先進製程技術的管道已十分有限。隨著管控趨嚴,這一窗口在2022年基本關閉,這重塑了(但並未阻斷)中國AI晶片產業的發展處理程序。過去12個月裡,中國在緩解裝置和晶圓代工瓶頸方面取得了有意義的進展。在政策支援下,我們預計到2028年左右,國內的晶圓代工產能和晶片供應將足以滿足國家的核心主權需求。
  • 從政策支援邁向商業化可行: 政策支援可以加速產業的早期發展,但長期價值取決於商業競爭力。中國AI GPU供應商必須展現出極具吸引力的經濟效益,才能在2028年之後維持增長。我們的分析表明,在較低的晶片價格、更廉價的電力成本以及不斷完善的基礎設施支撐下,中國AI資料中心的總擁有成本(TCO)有望具備競爭力。對於推理工作負載(inference workloads)而言,單位Token的成本比峰值性能更為重要,這進一步強化了國產替代方案的競爭力。
  • 行業與個股影響: 中國的國產化戰略——即通過擴大晶片、晶圓廠和裝置的規模來彌補製程上的劣勢——正持續見效。在樂觀情形(bull case)下,我們假設國產GPU將擴展至訓練工作負載領域,並可能獲得海外採用;在悲觀情形(bear case)下,我們假設產品差異化減弱,從而導致商品化(同質化)和行業整合。雖然我們不對AI GPU個股做出直接評級,但我們對中國AI半導體供應鏈保持建設性(樂觀)態度,包括中芯國際(晶圓代工)、北方華創(裝置)和 ASMPT(先進封裝),並看好AI晶片投資有助於鞏固其戰略地位的中國網際網路平台。關於後者的更多細節,請參閱 Gary Yu 撰寫的中國網際網路報告。

關於中國AI GPU的六大核心圖表

中國AI GPU:建構本土化的AI計算生態系統

致首席資訊官(CIO)的資訊: 中國正通過系統級創新和以成本驅動的推理經濟性(inference economics),迅速縮小與美國在AI算力領域的差距。這一發展軌跡有望使國產AI GPU的自給率達到約76%,並在未來十年內對全球AI半導體的競爭格局產生深遠的重塑作用。

致首席執行長(CEO)的資訊: 儘管美國晶片製造商在矽晶圓前沿技術上仍保持領先地位,但中國正加速轉向成本更低、針對推理最佳化的國產AI晶片。這將對全球AI的經濟性帶來中期的競爭壓力,而非在短期內實現技術層面的並駕齊驅。

AI技術的快速擴張正推動中國向高品質經濟模式轉型。在去年的藍皮書報告《中國人工智慧:沉睡的巨龍甦醒》(China – AI: The Sleeping Giant Awakens)中,我們探討了中國AI的發展現狀及其邁向2030年及以後的發展軌跡。在本報告中,我們再次回歸AI主題,重點剖析中國AI基礎設施的基石——即支撐該技術的AI晶片——並對需求前景、晶圓代工供應以及競爭格局進行評估。

我們分析了中國AI GPU的關鍵需求驅動因素及國內供應鏈的商業可行性,同時評估了本土生產晶片的性能與潛在商業價值。此外,我們還考察了中國全境與AI相關的資本支出(Capex)規模、本土晶圓代工供應的動態,以及塑造該行業的政策支援力度。最後,我們引入了一個框架,用於評估國產AI GPU晶片(即輝達的本土替代方案)的商業價值,並為投資者梳理了如何在長期內評估該行業及相關個股標的的路徑。

行業展望:需求強勁、供給改善及同質化風險上升

受制於晶圓代工產能的瓶頸,中國AI GPU在2026年和2027年的營收仍將維持“供給主導”的格局。在雲服務提供商(CSP)強勁的商業需求以及不斷增長的主權和政府主導的AI投資支撐下,該市場已進入高速增長階段。基於雲端資本支出(Capex)趨勢及隱含的AI半導體消耗量,我們預計2026年中國AI GPU的總潛在市場規模(TAM)約為500億美元,到2030年將增長至約670億美元。隨著國內晶圓廠產能的擴張和本土裝置能力的提升,國產AI GPU的供應正在快速追趕。我們預計到2027年,本土供應規模有望達到約300億美元,足以覆蓋中國算力總需求的一半以上。鑑於產能限制依然存在,我們預計到2027年之前,該市場將在很大程度上維持供給驅動的特徵。

中國的基礎設施優勢縮小了表面上的技術差距

在我們的基準情形(base case)下,輝達(NVIDIA)在大規模AI預訓練領域繼續佔據主導地位。中國主要的雲服務提供商處理預訓練工作負載時,依然依賴部署在海外資料中心的輝達伺服器機架。相比之下,國產AI GPU在中國國內的推理工作負載(inference workloads)中正獲得越來越高的市場認可度,因為在這些應用場景中,更低的延遲、資料本地化要求以及成本效益顯得更為重要。中國AI GPU能否充分縮小性能差距以勝任預訓練任務——並最終在出口市場贏得客戶——仍是一個關鍵的長期議題。

我們的分析表明,儘管中國在晶片層面仍略落後於美國,但在系統硬體層面已具備廣泛競爭力,並在基礎設施和政策層面擁有優勢。因此,國產AI GPU在推理工作負載方面已經具備競爭力。需要強調的是,僅基於製程節點(process node)的比較會誇大實際的性能差距。當以“每瓦特每美元性能(performance per watt per dollar)”為基準進行評估時,這種差距會大幅縮小,特別是考慮到中國相對較低的利潤率要求和較低的能源成本。這種成本優勢顯著提升了國產替代方案的商業可行性。我們在下文中提供了一個基於此背景的輝達與沐曦(MetaX)GPU的對比案例研究。

為了評估這一不斷演變的行業格局,我們引入了一個聚焦於中國AI GPU生態系統商業價值的分析框架。該市場目前有超過10家上市及非上市供應商,涵蓋獨立第三方供應商、內部專屬設計公司(captive design houses)以及國資背景企業。我們對中美AI計算生態系統進行了對比,並從設計能力、系統級性能、晶圓代工產能獲取、戰略合作夥伴關係、政府支援及商業戰略等維度對各供應商進行了評估。我們還應用了我們的全球AI半導體估值框架,為市值、晶圓代工產能隱含營收以及估值倍數提供了參考基準(圖表59)。關於百度崑崙和阿里平頭哥等內部專屬設計公司如何為母公司估值貢獻增量,請參閱我們的中國網際網路分析師 Gary Yu 的相關報告(連結)。

聚焦商業價值分析

近期的行業動態凸顯了中國AI GPU格局演變的迅速程度,並印證了為何商業價值與技術能力同等重要。幾家領先的中國網際網路平台正在轉向定製化或“合規(within spec)”的推理晶片,這些晶片通常通過設計服務模式並在海外先進的晶圓代工節點上生產。例如,據路透社報導,字節跳動正通過中國設計服務公司芯原股份(VeriSilicon),利用三星的4奈米製程生產其AI推理ASIC晶片。儘管這些解決方案通常針對偏低端的推理工作負載,但仍加劇了獨立GPU供應商面臨的競爭壓力。

與此同時,政策訊號表明,可能會允許少量進口輝達的H200晶片,同時可能要求配套支援國產替代方案。這種做法強化了“雙軌制”戰略,而非實施全面替代。同步地,中國主要的大語言模型(LLM)供應商已開始提高Token價格,這改善了AI工作負載的商業化變現能力,並對整個生態系統中AI GPU的長期商業經濟效益形成了支撐。

展望未來,行業結構引發了對產品同質化(commoditization)風險的擔憂。包括雲服務提供商和電信營運商在內的大客戶有強烈的動機去扶持至少一家具有國資背景的GPU供應商(如華為),而領先的CSP同時也支援自身內部的或關聯的設計公司(如百度崑崙、阿里平頭哥)。這種動態擠壓了獨立第三方供應商的潛在市場空間,並增加了其規模化發展的難度。隨著晶圓代工產能可能從2027年起擴張,加上AI GPU設計日益成熟,產品的差異化將變得更加困難。因此,我們認為隨著時間的推移,行業利潤率存在下降的風險,且未來兩到三年內行業整合的可能性日益增加。

關於中國AI GPU類股的核心爭議

上述結論建立在三個相互關聯的核心爭議之上,這些爭議塑造了中國AI GPU生態系統的未來前景。在接下來的部分中,我們將詳細探討這些爭議,以揭示中國AI GPU市場的發展脈絡、國產替代方案在那些領域已具備競爭力,以及那些結構性制約因素依然存在。

  • 核心爭議 #1:中國能否大規模供應具備競爭力的AI GPU?第一個爭議聚焦於供給端——即中國能否生產出具備足夠競爭力且能實現規模化量產的AI GPU。中國受益於系統級的工程優勢、基礎設施的快速鋪建以及強有力的政策支援,但在先進晶片設計和前沿製造工藝方面仍面臨挑戰。我們將評估這些優勢與限制因素如何相互交織,本土供需如何演變,以及這將如何影響國產AI GPU的長期競爭力。
  • 核心爭議 #2:需求端:中國AI GPU市場的潛在規模有多大?該爭議聚焦於需求端。中國AI GPU市場反映了雙重需求:一是由雲服務提供商和AI應用主導的商業化普及需求,二是與主權戰略優先順序掛鉤的政策驅動需求。我們分析了這些驅動因素的相對權重、政策持續支援國產AI晶片的底層邏輯,以及它們如何轉化為實際的市場規模。通過對本土AI晶片需求的情景分析(基於Gary Yu的預測),我們估算了中國AI GPU市場的潛在規模和增長軌跡。
  • 核心爭議 #3:如何評估中國AI GPU的商業價值?該爭議從估值和投資的視角審視該行業。中國AI GPU生態系統包括獨立供應商、國資背景企業,以及隸屬於大型網際網路平台的內部設計公司。我們將這些企業置於全球AI GPU和ASIC的背景下進行定位,勾勒出評估相對市場地位的定性標準,並應用統一的估值框架以幫助投資者權衡整個類股的投資機遇與風險。

類股估值——高經營槓桿下的高市銷率(P/S)倍數

儘管收入基數小得多且處於盈利的更早期階段,中國AI半導體設計公司的市銷率(P/S)倍數仍顯著高於全球可比同業。

  • 寒武紀(688256.SS,未覆蓋): 目前其2026年預期市銷率(P/S)約為32倍,市盈率(P/E)約為96倍;相比之下,其2026年晶圓代工產能隱含營收約為22億美元,市場一致預期營收約為21億美元。儘管其銷售倍數低於部分國內同行,但在經過增長調整後,相對於輝達仍享有明顯的估值溢價,這反映了市場對國內AI市場快速實現國產替代的預期。
  • 海光資訊(688041.SS,未覆蓋): 其2026年預期P/S約為94倍,P/E約為1118倍,隱含晶圓代工產能營收約為9億美元。這表明在本土化供應鏈結構下,市場對其捕獲CPU/GPU相關周邊需求抱有極高的期望。
  • 沐曦(MetaX,688802.SS,未覆蓋)與摩爾線程(Moore Threads,688795.SS,未覆蓋): 兩者的2026年預期P/S分別約為60倍和139倍,而隱含營收分別僅為約5億美元和3億美元,且尚未實現實質性盈利。
  • 在香港上市的壁仞科技(Biren,6082.HK,未覆蓋)和天數智芯(Iluvatar CoreX,9903.HK,未覆蓋): 其2026年預期P/S分別約為37倍和62倍,同樣基於較為有限的隱含營收(約2億至3億美元)。

(估算來源請參見圖表11。)

類股估值——非上市企業

我們綜合使用定性評分卡和定量指標(包括營收規模、市場份額和晶片性能),來評估中國非上市AI GPU供應商的潛在市值。

1. 崑崙芯 (Kunlunxin)崑崙芯已將銷售擴展至外部客戶,如中國移動、騰訊及其他的國有企業(SOEs)。我們預估其2025年營收為60億元人民幣(約50%來自外部),並預計在近期新GPU發佈的支撐下,2026年營收將在70億至130億元人民幣之間,代表其在國內GPU行業中佔據高單位數百分比的市場份額(相比之下,華為佔63%,寒武紀佔11%,平頭哥佔高單位數百分比)。

我們對崑崙芯的估值為200億至610億美元:提議的分拆與上市是管理層釋放股東價值計畫的一部分,但隨著近期AI晶片的首次公開募股(IPOs),近期的市場情緒有所走強。

基於2026年預期市銷率(P/S)20至33倍(較A股上市的寒武紀有0%至40%的折價),我們對崑崙芯的估值為200億至610億美元,假設控股公司(holdco)折價30%,這轉化為百度(BIDU)約60%股權的價值為80億至260億美元。

將百度的中端分類加總(SOTP)估值修訂為215美元(原為220美元);高端估值為330美元:我們的215美元中端SOTP估值,將崑崙芯估值為45美元/股(26倍 企業價值/銷售額(EV/S)),AI雲基礎設施(不含崑崙芯)估值為45美元/股(5倍 EV/S),行銷業務估值為44美元/股(6倍 企業價值/息稅前利潤(EV/EBIT));我們330美元的高端SOTP估值,將崑崙芯估值為73美元/股(33倍 EV/S),AI雲基礎設施(不含崑崙芯)估值為62美元/股(7倍 EV/S),文心大模型(Ernie LLM)估值為38美元/股(30倍 EV/S),行銷業務估值為54美元/股(7倍 EV/EBIT)。

2. 平頭哥 (T-Head)我們預估其2026年營收為140億至260億元人民幣,其中約一半來自AI GPU晶片,其餘來自CPU。我們預計平頭哥將在2026年至2030年間躋身國內第一梯隊GPU供應商,佔據高單位數百分比的市場份額(與崑崙芯類似),相比之下,華為為63%,寒武紀為11%。

我們對平頭哥的估值為280億至860億美元:鑑於平頭哥一直以來保持低調、公開披露有限,且長期專注於內部供應,此次潛在的分拆令人感到意外。我們預計分拆後外部銷售將會加速增長。在需求端和供給端,支援依然強勁:阿里雲繼續驅動龐大的訓練與推理需求,並不斷增加產能供應。

基於20至33倍的市銷率(P/S)(較寒武紀有0%至40%的折價),並應用於140億至260億元人民幣的營收區間(CPU + GPU),我們得出了280億至860億美元的估值區間。假設控股公司(holdco)折價30%,這轉化為阿里巴巴(BABA)分類加總(SOTP)估值中的12至36美元/股。

我們對關鍵行業風險的情景分析

我們概述了中國國內AI晶片市場的三個情景,這些情景由出口管制、國內製造的進展以及替代激勵機制之間的相互作用所驅動。

基準情形——在持續受限下取得漸進式進展 先進AI晶片的海外流片(tape out)依然受限,限制了獲取前沿晶圓代工服務的管道。中芯國際繼續擴張國內產能,但在美國出口管制下,獲取關鍵晶圓製造裝置的管道受限,制約了先進製程節點的進展。輝達H200對中國的出口依然有限,無論是因為美國法規,還是中國方面的採購和政策考量。在此背景下,政府對國內計算基礎設施的持續支援推動了對本土生產的AI加速器的需求,並在性能差距持續存在的情況下,支撐了國內供應商的銷量增長。

樂觀情形——國內能力加速提升與替代加速 國內AI晶片供應狀況實質性改善。通過替代性安排,或中芯國際在良率和製程穩定性上取得有意義的突破,獲取前沿晶圓代工服務(如台積電或三星)的管道得到改善;同時,本土裝置供應商的進展緩解了關鍵的製造瓶頸。對美國先進AI加速器出口的持續限制強化了對國產解決方案的需求,並促使生態系統在設計、製造和系統整合方面更快地走向成熟。

悲觀情形——國內供應疲軟與替代壓力減輕 對晶圓製造裝置的限制進一步收緊,實質性地制約了先進製程節點的產能擴張,並推遲了製程改進。與此同時,對輝達H200的出口管制放鬆,或中國重新獲得更先進AI加速器的管道,從而降低了國產替代的緊迫性。對EDA(電子設計自動化)工具的額外限制制約了本土設計公司的架構升級,並進一步削弱了國產AI加速器產品的競爭力。

關鍵爭議#1:中國能否大規模供應具備競爭力的AI GPU?

市場觀點: 在比較中美AI晶片時,全球投資者往往只關注晶圓工藝——例如,台積電4奈米的輝達GPU與中芯國際12奈米的沐曦(MetaX)GPU的對比。基於此,他們通常得出結論,認為中國的AI晶片無法與之競爭。

我們的觀點: “每瓦每美元性能”的評估框架顯著縮小了這一差距,特別是因為能耗(瓦特)因素在中國的權重較低。在我們對沐曦與輝達的案例研究中,按每瓦每美元性能衡量,沐曦C600的表現與輝達A100相當。隨著沐曦推出C700,我們認為它能夠在AI推理領域與輝達的H200相抗衡。

然而,從長遠來看,我們認為市場對中國在某些裝置瓶頸上取得突破的預期過於樂觀。例如,我們認為在未來五年內,中國晶圓廠將繼續依賴阿斯麥(ASML)的DUV光刻機進行多重曝光(multiple patterning),這與部分市場預期(即中國能夠研發自有光刻裝置)截然相反。

需監測的指標: 1)先進製程節點的晶圓月產能(wpm)及良率提升情況;2)叢集規模的穩定性改善;3)本土軟體及類CUDA生態系統的進展。

我們可能出錯的地方(潛在風險): 1)良率提升進展慢於預期;2)裝置瓶頸持續的時間更長;3)軟體生態系統的規模化擴展比最初預期的更為複雜。

大規模晶片製造面臨的障礙

為了評估中國能否大規模供應具備競爭力的AI GPU並切實滿足市場需求,我們從AI半導體價值鏈的供給側——特別是晶圓代工產能——開始分析。

在這一層面上,規模擴張不僅取決於名義產能的增加,還取決於關鍵上游要素的可用性與成熟度。因此,一系列供應瓶頸繼續影響著整個AI GPU價值鏈的最終產出。

這些限制在晶圓前道裝置(WFE)和電子設計自動化(EDA)領域表現得最為明顯。在中芯國際產能擴張的背景下,幾個關鍵的半導體裝置瓶頸——例如外延裝置——目前已基本能由北方華創(Naura)、中微公司(AMEC)和新凱來(SiCarrier)等本土WFE供應商解決。然而,我們看到在光刻和檢測工具方面仍存在持續的限制。

在光刻機方面,中國在2025年進口了大量阿斯麥(ASML)DUV系統,以防範未來潛在的限制。同時,我們的行業調研表明,中芯國際先進製程晶圓廠(特別是中芯南方)在科磊(KLA)檢測和量測工具方面的受限,推高了裝置利用率並導致檢測步驟減少,晶圓廠僅能專注於最關鍵的層級。雖然這種方法保障了產能產出(吞吐量),但可能以犧牲良率為代價,這進一步凸顯了國內先進製程製造所面臨的結構性挑戰。

EDA是中國擴大先進製程產能的另一個關鍵制約因素。2025年,中國最大的EDA供應商華大九天(Empyrean Technology)按營收計算僅佔全球約1-2%的市場份額。迄今為止,華大九天尚未提供全流程數字IC EDA套件,更不用說支援先進製程節點GPU設計的工具了。相比之下,楷登電子(Cadence)、新思科技(Synopsys)和西門子EDA(Siemens EDA)在2025年合計佔據了全球80%以上的市場份額。美國政府對華實施了嚴格的EDA軟體出口管制,特別針對全環繞柵極(GAA)電晶體架構所需的工具。這些限制旨在阻礙中國開發先進的3奈米和2奈米晶片,而這些晶片對於高性能計算和AI至關重要。如果本土EDA能力無法迎頭趕上,且現行出口管制維持不變,本土AI晶片設計公司將很難向3奈米和2奈米節點遷移。

中芯國際的擴張轉移了——但並未消除——晶片供應瓶頸

儘管晶圓前道裝置(WFE)的限制構成了中國先進製程雄心的上游制約因素,但其下游影響日益顯現在晶圓代工層面。工具可用性、工藝成熟度以及產能吞吐量的侷限,實際上已將中國的先進製程產能集中於一家佔據主導地位的供應商。這種動態將供應瓶頸從裝置獲取轉移到了晶圓代工的執行與產能分配上。因此,中芯國際(SMIC)已成為擴大本土AI GPU生產規模的實質性“咽喉”所在。

根據我們的行業調研,幾家本土AI晶片供應商已將製造環節遷回中國大陸,試圖在本土先進製程節點(如N+2的7奈米和N+1的12奈米)上流片AI加速器,以利用本土產能並緩解外部限制。目前,中國的先進製程產能仍高度集中在中芯南方,該公司已通過使用DUV光刻機進行多重曝光,將工藝技術延伸至N+2,並有可能延伸至N+3(約5奈米)。

我們預計,中芯國際的N+2晶圓月產能(wpm)在2025年約為2.2萬片,2026年(預期)約為4萬片,2027年(預期)約為5.1萬片。然而,考慮到同樣嚴重依賴N+2級節點的智慧型手機和汽車SoC(系統級晶片)的持續需求,我們預計這些產能不會完全分配給本土AI處理器的生產。

面對這些制約因素,一些AI GPU供應商選擇在N+1節點上製造加速器。我們認為,這一選擇反映了在產能可用性、流片成功率、製造穩定性以及成本控制方面所做出的務實妥協。相較於更先進的節點,N+1提供了更好的良率特徵和更成熟的供應鏈,從而在工藝受限的情況下仍能實現量產。然而,基於N+1節點的產品在計算密度和能效方面仍處於結構性劣勢,使其更適合AI推理及其他對功耗和成本敏感的工作負載,而非大規模訓練。

應對晶圓工藝制約的戰略性舉措

如上所述,中芯國際的產能擴張只能部分緩解中國的晶圓工藝瓶頸。在獲取先進製程節點受到結構性制約的情況下,本土AI晶片供應商和雲服務提供商(CSP)日益將焦點從直接縮小工藝差距,轉向通過系統級和架構層面的戰略來彌補單裸片(per die)性能較弱的劣勢。

儘管中芯國際在N+2節點上取得了實質性進展,但與在4奈米或3奈米節點上製造的海外加速器相比,國產AI加速器在計算性能和能效方面仍處於結構性劣勢。我們認為,即使7奈米工藝得到廣泛應用,也無法在晶圓層面完全消除這一差距。

鑑於能源供應在中國並不構成硬性約束,戰略重心已轉向提高絕對計算密度和系統級性能,而非每瓦能效。我們將中國AI晶片供應商和CSP當前的主流應對策略歸納為三大類:

1)“如果單個計算裸片不夠強大,就把更多裸片封裝進同一塊晶片中。”由於製造技術和晶片設計的侷限性,國產AI加速器的計算能力仍大幅低於輝達及部分海外ASIC解決方案。在某些情況下,隨著獲取海外先進製程節點的管道受限,計算性能甚至出現了下降。例如,據報導,昇騰(Ascend)950PR的計算性能比其上一代產品910C低約38%。在此背景下,供應商採用了先進封裝和多裸片配置,以在單個封裝內擴展算力。這種方法在不需要獲取更先進製程節點的情況下,部分抵消了單裸片性能較弱的問題。雖然它未能完全消除與海外領先產品的差距,但已切實提升了絕對計算性能。

2)“如果單塊晶片不夠強大,就建構更大的機架和叢集。”在系統層面,我們觀察到本土AI晶片供應商和CSP正越來越多地採用縱向擴展(scale-up)架構,這從輝達的NVL72設計中汲取了靈感。傳統的AI伺服器配置通常在每台伺服器中部署4或8個加速器,多節點擴展嚴重依賴伺服器間的網路連線,這可能會引入通訊瓶頸。NVL72標誌著一種轉變,即在單一系統內實現72個加速器的全互聯(all-to-all interconnect),從而顯著提升了GPU到GPU的頻寬和機架級性能。中國企業正在推行類似的縱向擴展戰略,包括華為的CloudMatrix 384、阿里巴巴基於PPU的機架解決方案,以及字節跳動的單機架256加速器設計,旨在克服單晶片的侷限性,提升機架級性能。

3)“如果一家晶圓廠產能不足,就擴大製造產能。”第三項應對策略的核心是在現有工藝制約下擴大產能。中國的先進邏輯晶圓代工廠繼續進行激進的投資。中芯國際在2023年、2024年和2025年的資本支出分別達到了約75億美元、73億美元和81億美元,佔其營收的比例大幅提升。在2025年下半年,中國還加速了DUV光刻裝置的採購,從荷蘭的進口量同比急劇上升。我們認為,這些裝置的交付支撐了中期內先進製程產能的擴張,但不太可能消除與海外晶圓廠之間根本的工藝差距。

網路與機架級設計彌補了晶圓工藝制約 即便在7奈米工藝上取得了進展,中國在晶圓層面縮小AI算力差距的能力依然受到結構性制約。因此,性能差異化的焦點已日益從單晶片算力轉向系統級架構,特別是網路互聯和機架級設計。

面對晶圓工藝的制約,中國在系統級設計方面取得了切實的進展,特別是在光網路和伺服器機架架構方面。在去年的上海世界人工智慧大會(WAIC)(參見我們的報告《上海WAIC主要啟示》)上,我們觀察到了華為昇騰(Ascend)CloudMatrix 384的原型機,它展示了國內企業如何通過激進的縱向擴展(scale-up)和光互聯設計,來彌補單晶片算力較弱的問題。

展望未來,在下一代昇騰平台(Atlas 950)中,華為聲稱其SuperPod架構最高可擴展至8,192顆晶片。在處理器層面,昇騰950PR和升級後的950DT預計將實現高達2TB/s的AI處理器間互聯頻寬,紙面資料超過了輝達NVLink第五代(Gen5)1.8TB/s的規格。單從原始規格來看,華為的互聯頻寬目前已超越NVLink Gen5。

更均衡的算網配比(compute to networking ratios)。 我們觀察到海外AI晶片(例如輝達的Blackwell系列)的原始算力出現了急劇增長,但網路性能並未實現相應的階躍式提升。我們認為,這種分化很大程度上受制於電互連的物理極限,而光互連雖然前景廣闊,但尚未在大規模應用中證明具備足夠的穩定性。因此,在實際部署中,基於輝達的最先進系統可能會面臨算力未被充分利用的時期,空閒周期正日益成為軟體和調度層面的挑戰,而非純粹的硬體制約。

相比之下,國內AI平台在網路能力方面實現了快速提升。雖然絕對計算性能仍落後於全球前沿水平,但從算網配比的角度來看,系統配置顯得更為均衡。在橫向擴展(scale-out)和以推理為主的重度部署場景中,儘管單晶片性能較弱,這種均衡性可能會減少系統層面的結構性低效。

核心爭議 #2:需求端:中國AI GPU市場的潛在規模有多大?

市場觀點:市場共識預期,領先的雲服務提供商(CSP,如阿里巴巴、騰訊、字節跳動)將繼續增加與AI相關的資本支出(Capex),以支援模型訓練和推理部署。在這一觀點下,政府的政策支援是本土AI GPU普及的主要驅動力。

我們的觀點:我們採用情景分析法,將圍繞供需和地緣的風險納入對中國AI GPU市場的預測中。我們預計,到2030年總潛在市場規模將達到670億美元,其增長更多由推理而非訓練驅動,並將佔到屆時雲端總資本支出的約51%。我們預計國產AI晶片營收將從2024年的60億美元增長至2030年的510億美元(復合年增長率達42%),自給率將從33%提升至76%。除了政策支援外,我們認為本土AI晶片的商業價值是更為持久和可持續的需求驅動力。

需要監測的指標:1) CSP雲端資本支出增長;2) 月度Token吞吐量增長;3) 國產AI晶片的平均售價(ASP)趨勢及分配訊號。

我們可能判斷有誤之處:1) 地緣政治降溫使得獲取美國先進GPU的管道得以改善;2) AI商業化變現表現不及預期,導致資本支出增長慢於預期。

中國AI晶片需求

要評估中國AI GPU需求的持久性與規模,區分其潛在驅動因素至關重要。在我們看來,對國產AI晶片的需求取決於兩股力量:一是對技術自立自強的結構性推動;二是在消費者和企業端應用場景中,AI部署所帶來的日益重要的商業回報。

應對美國晶片限制的自立自強。 中國將AI視為事關國家與經濟安全的戰略性領域。。。這段不展開了。

如下圖所示,中國本土的AI晶片設計公司與先進製程晶圓代工供應商形成了一種共生關係。一方面,國產AI加速器供應商需要獲取產能並實現製程節點迭代,因為AI晶片通常需要經歷兩到三代製程的演進才能達到具備競爭力的性能。另一方面,本土先進製程晶圓代廠需要錨定客戶(anchor customers)及規模效應,以支撐其持續的投資。

商業回報作為中國AI晶片市場的第二大主要驅動力。 儘管自立自強催化了早期的投資,但持續的AI相關資本支出最終需要可證明的商業回報,尤其是隨著支出規模的擴大以及利用率成為核心制約因素。因此,中國的AI發展路徑日益強調具有成本效益的創新以及能夠帶來可衡量商業回報的應用。

中國主要的科技公司正步入正軌,有望在2026年將與AI相關的資本支出同比增長38%,達到5970億元人民幣,這反映了在廣告、消費者端(2C)及企業端(2B)應用場景中已被證明的商業化變現潛力。

在我們看來,消費者端和企業端應用中由AI驅動的提升所帶來的總回報可能是巨大的。在扣除折舊、電力和伺服器租賃成本後,預計到2028年有望實現盈虧平衡,到2030年利潤率可能達到約50%(更多細節請見此處)。

在政策支援與商業回報改善的雙重驅動下,中國AI GPU的需求集中在少數大型買家群體手中,其資本支出(Capex)決策最終決定了可觸達市場的規模。第一類群體由中國的雲服務提供商(CSP)構成——包括字節跳動、阿里巴巴和騰訊——這些企業採購AI晶片,既用於訓練自身專有模型並運行推理,也用於為外部雲客戶部署AI基礎設施。

第二類群體包括中國的電信營運商、國有企業及地方政府——即所謂的“主權AI買家”——其需求主要由國家AI基礎設施建設、資料主權以及公共部門的應用驅動。AI初創企業(如DeepSeek、MiniMax)及汽車整車廠(如小鵬、小米)同樣採購AI晶片,儘管目前的採購量仍低於前兩類群體。

我們預測,到2030年,中國AI晶片的總潛在市場規模(TAM)將達到670億美元,這意味著2024至2030年間的復合年增長率(CAGR)將達到23%。我們的估算基於主要CSP、電信營運商、政府與國企買家以及其他AI相關企業的雲端運算資本支出總額。我們預計,到2030年,中國雲端運算資本支出總額將達到1300億美元,其中AI GPU將佔據670億美元,約佔雲端運算總資本支出的51%。

我們的預測基於以下幾項假設:

1. CSP海外資料中心佔比下降。我們估計,2025年中國CSP雲端運算資本支出中約有40%投向了海外資料中心,用於大語言模型的預訓練,這反映了國內獲取先進GPU受限的現狀。我們預計,從2026年(預期)起,在本土AI晶片性能提升與供應增加,以及算力需求向推理端轉移的共同推動下,這一比例將降至30%左右。

2. 伺服器支出佔比保持在雲端運算總資本支出的90%左右。

3. AI加速伺服器佔伺服器總量的比例,將從2025年(預期)的75%上升至2030年(預期)的85%。

4. AI加速器元件價值佔AI加速伺服器總價值的80%。

基於上述假設,我們預測中國AI晶片的總潛在市場規模(TAM)將從2024年的190億美元增長至2030年的670億美元,2024至2030年間的復合年增長率(CAGR)將達到23%。

本土化勢將支撐需求

隨著中國AI GPU市場規模不斷擴大,關鍵問題不僅在於需求能變得多大,還在於這些需求最終流向何方。我們認為,持續的地緣政治風險將AI晶片需求鎖定在本土,使本土化成為中國AI GPU市場的結構性特徵,而非對出口管制的暫時性應對。

減少對美國技術的依賴: 儘管在單晶片層面,中國的AI晶片仍落後美國約1.5至2代,但系統級性能差距正在持續縮小,這進一步強化了AI基礎設施部署本土化的動力。我們預計,在未來四年內,受晶片封裝(中國本土的2.5D和3D封裝)、架構縱向擴展(光網路)以及軟硬體協同最佳化的驅動,而非單純依靠工藝節點微縮,這一差距將縮小至約1代。

中國還在減少供華晶片對台積電(TSMC)的依賴,轉而採用中芯國際(SMIC)的N+2和N+3節點,以及三星部分符合規格的設計。儘管在韓國儲存晶片(HBM)、歐洲光刻裝置(DUV)以及美國檢測裝置(KLA明場檢測)等方面仍存在一定的依賴,但我們最新的行業調研表明,本土在其中一些領域正在取得進展。

在大多數地區,商業和主權買家對AI晶片的需求,既可以通過美國供應商滿足,也可以通過台積電代工的定製設計來滿足。然而,自2023年10月以來,美國工業和安全域(BIS)的規定限制了美國供應商向中國出售晶片技術的發展水平。這些限制包括對14奈米FinFET裝置、3奈米GAA EDA工具的限制,以及對性能密度和總性能等性能指標的限制。美國當局在2025年初進一步收緊了這些管制。

來自外國晶片供應商的激烈競爭意味著,中國需要政策支援以推動本土AI GPU的發展。本土晶圓廠也需要具備競爭力的AI晶片供應商來實現規模化、提高良率並降低成本。因此,在規模擴張階段,政府的支援錨定了供應的形成與國內需求,包括鼓勵本土化應用,以及協調如中芯國際7奈米生產等稀缺的先進製程產能。

基準情形

綜合我們的供需分析,我們勾勒出中國AI晶片自給率的基準情形發展軌跡。

我們預計中國的AI晶片自給率將從2024年的33%上升至2030年(預期)的76%。我們預計先進製程產能的擴張和晶片性能的持續提升將推動本土AI晶片營收的增長。我們的核心假設如下:

先進製程產能顯著擴張。 在強勁的資本支出投資以及矽鍺(SiGe)外延等本土裝置技術突破的支撐下,我們預計中國的先進製程晶圓月產能(wpm)將從2025年的8千片增至2028年的4.2萬片,並於2030年達到5萬片。

生產良率顯著提升。 在更優質的檢測工具和不斷積累的操作經驗驅動下,我們預計中國AI晶片的生產良率將從2025年的約20%提升至2030年的約50%。

產能分配依然由政策驅動。由於先進製程產能具備稀缺性,其分配很大程度上由政府機構決定。我們認為華為獲得的分配額度最高,其次是寒武紀(Cambricon)和海光(Hygon),而二線和三線AI晶片設計公司各自獲得的產能可能不到總產能的10%。

海外晶圓廠供應“合規(within spec)”晶片。 我們預計三星等海外晶圓廠將為崑崙芯和字節跳動等本土設計公司流片符合規格要求的AI晶片。

基於這些假設,我們預計中國本土AI晶片營收將從2024年的60億美元增至2030年(預期)的510億美元,2024至2030年的復合年增長率(CAGR)達到42%,同時我們預計AI晶片自給率將從2024年的33%提升至2030年(預期)的76%。

我們在出口管制、本土製造進展以及替代激勵機制的相互作用驅動下,概述了中國本土AI晶片前景面臨的三種情景。

關鍵爭議#3:我們該如何評估中國AI GPU的商業價值?

市場觀點: 市場共識將政策驅動的替代視為本土AI GPU應用的主要驅動力。在這種觀點下,供應商的估值通常錨定於從輝達手中奪取市場份額的假設,以及對市場結構分散化的預期。

我們的觀點: 我們認為,AI晶片的商業價值最終將決定各家供應商的長期營收和市值。儘管政府支援和雲服務提供商(CSP)的內部自研戰略依然重要,但我們預計市場領導地位將由產品競爭力和執行力來塑造。因此,我們結合定性因素(包括晶圓代工獲取能力、客戶關係、政策支援和技術方向)以及定量指標(如TPS(每秒生成Token數)、每瓦性能和每瓦每美元性能)來評估供應商。我們還密切監控不斷湧現的新發佈的晶片規格。

隨著時間的推移,我們預計中國AI GPU市場將趨於整合,隨著產品差異化縮小和規模經濟佔據主導,利潤率壓力將會增加。

需監測的指標: 1)新晶片規格;2)向主要客戶(如CSP)的出貨量爬坡情況;3)平均售價(ASP)趨勢及毛利率軌跡。

我們可能出錯的地方(潛在風險): 1)本土AI GPU供應商未能獲得先進製程晶圓代工廠的產能;2)CSP採用國產AI晶片的意願低於預期;3)AI計算範式的顛覆性轉變(例如,模型架構或工作負載特徵的根本性改變)降低了基於TPS的性能比較的相關性。

識別長期贏家的分析框架

潛在的贏家能夠將系統級競爭力轉化為大規模的商業應用。在實踐中,供應商需要具備四大特質:(1)具備競爭力的推理經濟效益;(2)可靠的先進製程節點產能獲取管道;(3)深厚的CSP合作關係;(4)與政策導向保持一致。如果供應商缺失其中一項或多項特質,即使他們發佈了強悍的規格資料,也很難維持其市場份額和利潤率。

我們採用雙層分析框架:

第一層 —— 定量的推理經濟效益

我們側重於驅動大規模應用的、以推理為核心的指標,包括單Token成本和總擁有成本(TCO)、TPS(每秒Token數),以及每瓦和每美元性能。我們認為,要維持領導地位,必須在這兩個層面上都具備實力。

第二層 —— 定性的市場定位

我們評估獲取先進製程產能的管道、CSP合作關係的深度、政策契合度,以及技術路線圖的可信度。

聚焦推理端:本土供應商持續追趕

持續存在的生態系統與工藝制約因素,限制了國產加速器在先進基礎模型大規模訓練領域的定位。因此,我們預計近期的部署將集中在大語言模型(LLM)推理而非訓練上。

這一重心與需求趨勢相符。DeepSeek、Doubao和Qwen(通義千問)等國產基礎模型,已將每日Token消耗量推高至10兆以上,驅動了推理需求的結構性上升。與此同時,輝達的A100以及部分已安裝的H100和H800越來越多地用於服務訓練工作負載。因此,我們預計中國的推理算力——儘管目前仍以輝達H20為基本盤——隨著時間的推移將更加依賴國產加速器。

為了比較各家供應商的推理競爭力,我們採用每秒生成Token數(TPS)這一指標。TPS反映了硬體能力(計算吞吐量、記憶體頻寬、互連)以及軟體和模型的假設。我們以DeepSeek R1作為國產大語言模型的代表,以反映真實的推理部署場景。輝達在2025年第一季度公佈了其H200在DeepSeek R1推理下的官方TPS資料。在採用相同的Token長度和資料格式假設下,我們獨立推算的估計值與輝達公佈的結果基本一致,這印證了我們建模方法的可靠性。

(Port Selected)