2025 年,全球 AI爆發點燃算力需求。當前的全球算力格局,呈現出一超多強、競爭加劇的態勢。輝達憑藉 CUDA 生態的護城河和 H/B 系列晶片,基本壟斷了全球AI算力。但與此同時,國產算力產業快速崛起、國產替代,從華為昇騰、寒武紀,到沐曦、摩爾線程等加速發展,國產算力正在蓄勢爆發。1 輝達的背後是美國AI戰略和國家力量輝達作為全球龍頭GPU公司,其核心是“三大業務+CUDA生態”,承載著美國AI和半導體戰略構想。輝達的三大主要業務:業務一:資料中心業務。直接服務於全球AI基礎設施建設,包含計算、網路、系統級平台,其銷售模式也不再只是售賣晶片,而是為各行業提供全端解決方案。產品包括Blackwell架構GPU、Hopper架構GPU、NVLink、InfiniBand、Spectrum-X乙太網路等。業務二:消費顯示卡業務。從純遊戲市場轉型成為融合AI入口,其新一代發佈顯示卡在迎合傳統遊戲市場的基礎上,側重於AI大模型的能力,可以滿足本地化AI部署需求,成為開發者生態擴大基礎。主要是GeForce RTX系列和Project Digits等AI PC產品。業務三:具身智能應用。被輝達視作未來增長引擎,主要有機器人、智能駕駛、世界模型三大類。比如,機器人基礎模型的Isaac GR00T系列,用於模擬與開發平台的Omniverse(數字孿生)、Isaac Sim,還有AI模型與引擎的Cosmos世界模型、Cosmos Reason VLM、Newton物理引擎。CUDA生態是輝達壟斷GPU行業的核心護城河。CUDA是輝達自2007年就搭建的軟體程式設計模型,繫結其GPU產品,隨著GPU發展迭代,其功能和應用範圍也不斷擴大,開發者的投入與CUDA深度繫結,建構了一個龐大的、自我循環、自我強化的生態平台。輝達的背後是美國政府加強半導體產業鏈、確保AI技術主導權的戰略構想。美國對輝達的支援已經從市場層面的扶持,升級為國家力量的系統性工程。不僅將輝達直接納入多個國家戰略計畫和科研基礎設施,為其提供大規模、高價值的訂單,還保障供應鏈安全並享受豁免優惠,比如促成半導體上游關鍵企業遷移美國本土等。同時,也在確保美國本土企業優先獲得輝達最新算力,鞏固其領先地位,加速技術迭代與生態擴張。2 中國需要自己的輝達中國需要自己的“輝達”,核心原因遠不止於製造一款高性能GPU。從國家戰略角度,關乎當下科技自主權,產業鏈安全,以及全球AI競賽領導權。從產業角度,是加速推動半導體行業全鏈條國產化,從成熟製程邁向高性能晶片的自主可控。從企業的角度,是需要具有持續技術創新力和產品實力的中國GPU龍頭領軍。當前中國GPU力量正在崛起,GPU實現國產替代是大勢所趨。2024年中國半導體自給率達到24%,同比增長4pct;其中AI領域半導體自給率已達到三分之一,相較於2023年顯著提升,仍有大幅提升空間。長期看,中國的優勢在完善的產業鏈、龐大市場和應用空間,實現晶片行業的大規模降本和全產業鏈突破只是時間問題。以太陽能與新能源汽車產業為例。20年前,太陽能技術掌握在歐美企業手中,價格昂貴。中國企業通過技術引進再創新,發揮製造優勢和規模效應降本,最終實現了絕對領先。新能源汽車最早也是美國領先,在三電技術上實現突破後,中國新能源車企憑藉完整的工業體系和敏銳的市場洞察,形成了產業鏈整合,主導全球新能源汽車行業。晶片行業的挑戰更複雜,但中國從技術追趕到全球領先的邏輯不會改變。一是國家戰略確保AI產業發展自主權,政策強力推動。從“十四五”規劃重視晶片自給率,2024年七部門《關於推動未來產業創新發展的實施意見》加快GPU領域突破;到2025年下半年的《電子資訊製造業2025-2026方案》強調推動AI終端創新應用;同期證監會推出科創板“1+6”新政引導AI和晶片企業發展,產業和市場政策組合夯實國產替代基礎。二是市場高增速催化。據測算,2024年起全球雲AI市場規模復合年增長率達到28%,到2027年將達2390億美元,中國市場需求佔全球1/3,市場增量約800億美元。先是公有雲和國資智算中心實現規模化替代,國產GPU獲得穩定份額後,未來3-5年完善軟體生態和工藝進步,形成更廣泛的全市場競爭力。三是企業競爭力提升。中國晶片產業的各環節企業都在技術突破期。華為以全端自研的解決方案引領國產替代;摩爾線程從消費級GPU切入AI智算;中興通訊的5nm製程ASIC開始流片;中微公司介質刻蝕機已進入台積電5nm產線;中芯國際步入先進製程良率和產能突破期。中國半導體產業的快速進步已成趨勢。3 中國AI晶片:從0到1,快速崛起根據年市場份額和出貨表現,中國AI晶片市場的“七小龍”初現端倪:華為昇騰、崑崙芯、寒武紀、天數智芯、燧原科技、沐曦股份、摩爾線程。但是市場的競爭格局遠未定型,國產算力仍處於征途中。AI晶片有通用型和專用型兩種。通用型晶片是“通才”,利用平行處理能力來加速各種計算任務,不侷限於特定的應用領域,旨在提供一個靈活的、可程式設計的平台,能夠適應多種不同的計算需求。通用型AI晶片主要指通用GPU,代表企業輝達,晶片型號有B200、H200等。專用型晶片是“專才”,是專為特定應用或領域定製的計算架構,旨在針對某一特定任務進行最佳化,優勢在於執行該任務時性能極強、能效比極高、成本可能更低;劣勢是功能固化、靈活性差。專用型AI晶片有ASIC和FPGA兩種,ASIC討論度更高,代錶廠商是Google,其TPU就是一種ASIC晶片。總體格局上,GPU佔據絕對的AI主流地位,ASIC則是崛起中的支線力量。全球AI晶片市場由GPU巨頭輝達壟斷,是絕對的行業領導者,佔據超過80%的全球市場份額。ASIC架構則是快速發展的一股支線力量,代錶廠商是Google,其在全球ASIC出貨量佔比超70%,今年11月Google第七代TPU發佈,迅速造成對輝達GPU壟斷敘事的衝擊:內部,GoogleGemini3 Pro大模型使用自研TPU訓練;外部,儘管其TPU 暫未向外部客戶直接銷售,僅通過Google雲提供服務,但是與Meta的合作意向已經達成,後者計畫2026年通過Google雲租用算力,從2027年起在自己的資料中心部署GoogleTPU。在全球AI競爭加劇和算力基礎設施自主性需求日益迫切的雙重背景下,中國本土AI晶片企業也加速發展,但總體上仍處於“從0到1”的初期階段,尚未形成明朗的競爭格局,GPU和ASIC兩種架構平行發展、各有側重。中國本土AI晶片企業中,GPU路線的有沐曦、海光資訊、天數智芯、壁仞科技、摩爾線程;ASIC路線的有華為海思(華為系)、寒武紀、崑崙芯(百度系)、平頭哥(阿里系)、燧原科技。都是Fabless模式,即公司主體負責晶片的研發、設計與銷售,生產環節由專業的外協廠商完成,主要包括晶圓代工廠和封裝測試廠,也包括板卡加工服務等等。中國本土AI晶片企業在全球市場份額合計不足1%,當下主要是國產替代邏輯。IDC資料顯示,本土AI晶片廠商的國內市場佔有率正在快速提升,2024年出貨量82萬張,滲透率約30%;相較2023年15%的國產滲透率有明顯提升。分類看,GPU伺服器在中國加速伺服器市場依然是主導地位,佔比近70%;ASIC 和 FPGA等非GPU加速伺服器高速增長,佔比約30%。按企業看,華為昇騰銷量64萬,在中國AI晶片市場佔23%,是本土第一品牌;崑崙芯(百度系)6.9萬、天數智芯3.8萬、寒武紀2.6萬、沐曦2.4萬、燧原科技1.3萬,其他品牌銷量未過萬。綜合來看,在ASIC路線上,華為昇騰領先。通用GPU路線並未形成鮮明的格局,沐曦股份營收小幅領先。華為昇騰可以說是國產算力的“定海神針”,定位是 ASIC專用型計算架構。作為擁有全端自研能力的巨頭,其昇騰 910B/C系列已在大型智算中心規模化部署。華為升騰的核心競爭力是 CANN 異構計算架構,已建立起堅固的閉環生態。2024年,華為昇騰在中國 A 晶片市場份額達 23%,穩居本土第一品牌。寒武紀,作為國內最早的AI晶片上市企業,寒武紀深耕專用架構ASIC/DSA。核心競爭力是雲邊端一體化開發環境,在特定算子下能效比極高。2024年智能晶片及加速卡收入約11.7億元,主要服務於政府智算中心及特定行業。崑崙芯脫胎於百度AI晶片部門,是典型的“大廠底座”與“應用驅動”派代表 。憑藉自研的XPU架構,屬於ASIC/DSA路線,深度適配百度文心大模型及飛槳等生態,在自然語言處理、搜尋推薦等垂直場景擁有極高的迭代效率 。2024年其在中國AI晶片出貨量佔比約3%,位列本土品牌前三,是國產算力排位賽中從網際網路內循環跨向通用市場大循環的標竿。燧原科技也是國產算力陣營中深耕“專才”路線的典型,背靠第一大股東騰訊提供的強大應用生態資源,在政務MaaS(模型即服務)等實戰場景中展現出優勢。作為主攻ASIC/DSA專用計算架構的代表,燧原科技於2024年佔據了約1%的市場份額。沐曦股份定位是通用 GPU 架構,核心團隊有高端GPU設計背景。沐曦的優勢是走自研架構+高度相容 CUDA路線,主打的是平滑遷移,讓開發者能以最低成本從輝達陣營切換過來。其主力產品曦雲c500系列,綜合性能對標輝達A100,在2024年實現7.2億元的收入,佔主營業務收入97%以上。但產品結構單一也有一定短板。2024年智算推理系列(曦思 N 系列)的收入佔比不到 1%,高度依賴訓推一體晶片的銷售。同時,公司仍處於巨額虧損階段,盈虧平衡點最早也要到 2026 年才能看到。摩爾線程定位全功能 GPU,兼顧圖形渲染消費級顯示卡與AI計算。優勢是依託 MUSA的架構,讓產品一卡多用:既能做動畫渲染、遊戲畫面、虛擬場景,又能搞定訓練 AI大模型、跑AIGC生成內容,還能萬卡叢集、相當於萬卡一起幹活。但短板是2024年營業收入約4.38 億元,雖有增長,但遠低於寒武紀和海光資訊等成熟廠商。由於戰線拉得太長,在每個細分市場都要面對輝達及國產專項廠商的競爭,是其隱憂。天數智芯是通用架構路線的堅定踐行者。2024年其憑藉約1%的市場份額躋身本土品牌出貨量前五,展現出較早的商業化落地能力。在技術路徑上,天數智芯堅持GPGPU設計,通過相容AMD ROCm等開源生態來降低開發者的遷移門檻,產品全面覆蓋AI訓練、推理及大規模通用計算場景。4 GPU國產化關鍵是產業自主和軟體生態中國GPU國產化要突破的重點領域有兩類:一是產業上,從EDA、IP、裝置、材料到晶圓代工的半導體產業鏈都需要攻堅。二是軟體端,面對CUDA生態近20年的“護城河”。國產替代非一朝一夕,高端晶片領域挑戰依然艱巨。4.1 EDA和IP:點工具突破、GPU核心仍薄弱EDA(電子設計自動化)和IP(半導體智慧財產權)處於半導體產業最上游。EDA是晶片設計的一整套工具鏈,設計師用其進行數字設計、模擬、驗證概念,並最終生成晶片製造圖紙。IP是已驗證過的成熟模組,晶片公司以自研、購買、或獲得授權使用IP的方式來搭建各項功能,在EDA的輔助下整合為晶片圖紙。EDA和IP自主是晶片產業國產化的基石。目前先進製程晶片改採用的FinFET正逐步升級為下一代的GAAFET架構,有更優秀的靜電特性和功耗、頻率,是發展2nm晶片的關鍵。而先進製程晶片的數字設計、線路佈局、驗證等環節高度依賴最新EDA工具和IP。IP能加快設計和迭代的速度,先進製程晶片設計也依賴IP的更新。全球EDA市場主要由三家美國公司:新思科技(Synopsys)、鏗騰電子(Cadence)、西門子EDA(Siemens EDA,原明導國際)主導。2024年三家的市場份額分別為31%、30%、13%。中國EDA的主要參與者包括華大九天、概倫電子、廣立微、芯和半導體、芯華章與鴻芯微納。IP市場,安謀(ARM,軟銀旗下)和新思兩家佔有全球2/3的份額,鏗騰和Alphawave(高通收購)合計9%。其中,安謀主要市場在移動計算,後三者主要市場在高性能計算。國內半導體IP的主要參與者有芯原股份、芯耀輝、銳成芯微、芯來科技、寒武紀、平頭哥(阿里旗下)。EDA的突破在於“點工具”,比如原理圖和PCB設計工具上已經完全自主,在模擬晶片EDA領域,也已經有國內廠商實現了全流程自主,但數字晶片、系統級晶片的全流程領域還存在空缺。由於設計一顆先進製程晶片需要上百種工具協同,而國際EDA工具與台積電的工藝設計套件深度繫結,因此EDA自主化和晶圓代工的國產替代需同步實現。IP的挑戰在於架構創新和生態獨立。常見IP有處理器核心、介面IP、基礎IP、GPU專用IP。其中,介面IP過去主要由新思和鏗騰提供,現在是國產替代較快的環節,並有國內IP授權給多家國內外晶片公司的成功案例。同時,GPU IP自研起步,通常國內GPU廠商採用“IP授權”模式開發晶片,但隨著下游晶片設計企業對本土IP採購意願增強,GPU核心IP自研是大勢所趨,但生態壁壘也很明顯。由於GPU設計的特殊性,不同模組的IP來源通常分散。以輝達為例,其流處理器架構、平行計算架構、張量核心等關鍵IP都由自主設計,但部分特定功能也需要採用第三方IP來開發。目前,實現純粹國產GPU核心IP還不具條件,而高性能的GPU架構設計也才起步,自主GPU IP生態搭建是長期工程,國內需要加緊人才培育和市場經驗積累。4.2 晶圓製造和裝置:良率、產能、光刻裝置攻堅晶片製造商也被稱為晶圓代工廠(Foundry),職責是將設計圖紙上的晶片實際製造出來。也是整個半導體產業中價值含量最高、流程最複雜、資本開支最大的環節。根據2025年Q2資料,全球近七成的晶圓代工市場由台積電(TSMC)獨佔,三星市佔率達到7.3%,中芯國際升至全球第三,市佔率5.1%,華虹集團也躋身全球第六,份額2.5%。目前,中芯國際、華虹半導體已具備28nm及以上晶片的大規模、高良率的製造能力,能滿足大部分中低端GPU和國產GPU初代產品的製造需求,總體看28nm及以上的產能自給率已超過40%。14nm及以下的先進製程代工還需突破,中芯國際是國產GPU產能的主要來源,目前中芯國際已實現14nm量產,但良率和產能有限。由於無法獲取EUV光刻機,且材料方面的超高純度化學品、光刻膠等仍依賴進口,因此7nm、5nm等更先進製程的研發和量產仍需攻堅。好在國產DUV(深紫外)光刻裝置研發已經落地。由深圳市政府投資的俞亮昇,已成功研發DUV光刻裝置,目前正在測試階段,預計其進入產線後將在一定程度上降低對海外光刻裝置的依賴,先進製程仍需要EUV光刻裝置。光刻裝置的戰略價值和技術壁壘極高,是晶片圖案轉移的核心,和薄膜沉積、刻蝕裝置同屬於半導體三大前道環節。全球主要供應商是阿斯麥(ASML),市場份額佔比高達82.1%,其次是佳能(Canon)和尼康(Nikon)市佔率分別為10.2%、7.7%。國內主要光刻裝置研發參與者有上海微電子、新凱來、以及長光所。雖然利用現有DUV光刻機,採用“多重曝光”技術仍可以生產7nm及以下的晶片,但會導致生產成本上升、生產時間延長以及良率降低。因此,長期看實現EUV光刻裝置自主還是關鍵,重點在於如何解決頂級裝置對全球供應鏈依賴的問題。光刻機被稱為“工業明珠”,打造靠的是全球頂尖技術的合力。比如,阿斯麥的氣體來自美國、光源有日本供應、鏡頭來自德國,因此,光刻裝置的國產化替代考驗的不僅是單點技術突破,更是細分產業鏈的完備和自主可控。4.3 GPU軟體生態:核心挑戰在於打破CUDA壁壘CUDA是輝達壟斷GPU行業的核心護城河,也是GPU自主攻堅最大的壁壘。截止2024年底,CUDA已擁有超過500萬開發者,服務於全球85%以上的資料中心,90%的AI框架基於CUDA開發,95%的AI訓練任務依賴CUDA工具鏈。CUDA全稱“統一計算裝置架構”,其作用是讓圖形程式設計之外的領域也能最大程度利用GPU。CUDA的組成結構主要有三個部分:開發庫、運行期環境、驅動。開發庫的作用是讓開發者可以快速建立起自己的應用,並且開發者也可以在CUDA的技術基礎上搭建出定製化的開發庫。運行期環境主要提供應用開發介面和運行期元件,基本上涵蓋通用GPU開發所需要的所有功能和資源介面。驅動部分即是輝達顯示卡的驅動,雖然不同版本系列GPU有不同,但本質上是為輝達自家的硬體裝置建立的抽象層,提供訪問介面。CUDA和輝達硬體繫結擴張,已經成為事實上的GPU軟體行業標準。隨著GPU發展迭代,其功能和應用範圍也不斷擴大。開發者的投入與CUDA深度繫結,協同最佳化,在多代技術躍遷下建構了一個龐大的、自我循環、自我強化的生態平台。當前,國內GPU生態和輝達CUDA差距在於兩方面。一是使用者適配成本高。由於國內的GPU生態起步晚,且碎片化,基礎軟體不統一。各家廠商自建生態,形成了互不相通的技術壁壘,導致使用者適配成本高,軟體迭代時間和成本增加,制約了產業效率和競爭力。二是缺乏高階工具。CUDA生態GPU的特點是穩定、高效、易用,而國產GPU常面臨硬體“紙面”算力與實際應用輸出存在差距的問題,本質上是缺乏成熟的高階軟體棧,效能被軟體短板所抵消。好在國內廠商都意識到軟體生態的重要性。目前主要存在兩種方案路線。一是相容CUDA路線,通過軟體層轉換,降低開發者的遷移門檻。但這種方式存在性能損耗和長期開發風險。二是建構獨立生態路線,比如華為的CANN、摩爾線程的MUSA等,目的是打造自主的開發者體系但需要巨大的投入和耐心,核心在於能否吸引開發者長期在其平台上創造價值。雖然許多國內企業已形成“高性能用進口、安全可控用國產”的雙供應鏈策略,為國產GPU提供了政務、金融、特定行業的應用空間。但通用、高性能領域仍需要自主廠商發力。CUDA的護城河深厚,但並非不可挑戰。中國擁有全球最豐富的AI應用場景,利用龐大的市場優勢,通過開放協同的策略,最終有希望走出一條從相容遷移到逐步自主的GPU生態標準。在全球供應鏈動盪的背景下,擁有自主可控的算力已成為國家戰略。中國本土AI晶片企業這一戰略最核心的承載者,其價值首先在於戰略安全,而非短期市場份額。近期中國本土AI晶片實現0到1的突破,並且正加速成長。未來,他們的首要目標並非在全球與輝達正面交鋒,而是先服務於中國本土的國產化替代市場。當然,挑戰依然嚴峻,7奈米及更先進製程的獲取、CUDA生態的銅牆鐵壁、以及如何在保障性能的同時將叢集功耗和成本最佳化到最佳水平,都需要長期攻堅。 (澤平宏觀展望)