#中國AI晶片
美國卡不住了?中國AI晶片未來五年將供大於求
今天看到《The Information》的一篇報導,原標題《Why China Doesn’t Want to Buy More Nvidia Chips》,裡面有一些資料很有意思,分享給各位參考:在美國對華實施AI晶片出口管制三年後,中國已顯著扭轉被動局面。據《The Information》援引傑富瑞(Jefferies)報告,到2025年底,中國用於AI“推理”(即模型執行任務)的晶片供應量將達市場需求的近四倍;即便逐年回落,至2030年仍將供大於求。這一過剩源於兩方面:一是本土晶片廠商快速追趕,二是企業通過公開及灰色管道大量囤積輝達晶片。正因如此,中國數月前要求企業暫停採購輝達專為中國“降規”設計的H20晶片——官方稱出於“國家安全”,實則因已不再需要此類性能受限產品(註:用於AI“訓練”的高端晶片仍被美國禁售)。更關鍵的是,國產晶片性能已實現突破。伯恩斯坦分析顯示,在美國商務部用以制定禁令的“總處理性能”(TPP)指標上,華為昇騰910C得分超10,000,是H20(2,368分)的四倍以上;海光、寒武紀等廠商產品也優於H20。儘管輝達最新Blackwell晶片仍遙遙領先,但一旦國產晶片全面超越合法可購的美系產品,出口管制的實際效力將大打折扣。這也印證了輝達CEO黃仁勳等人的觀點:封鎖只會加速中國自主創新。產能方面,傑富瑞預計中國7奈米AI晶片年產能將從2025年的110萬片增至2030年的410萬片。儘管遠低於美國(2025年370萬片),但中國晶圓廠通過在老舊裝置上重複工藝步驟,“極限壓榨”出7奈米等效製程,雖良率低、成本高,卻實現了技術突圍。尤為重要的是,推理晶片的市場遠大於訓練晶片——應用場景覆蓋終端裝置、邊緣計算與雲服務,需求呈碎片化、泛在化。隨著國產推理晶片在性能與供應上實現自主,中國AI在應用落地層面有望與美國保持同步,甚至憑藉更豐富的場景實現局部領先。因此,不被“卡脖子”的推理環節,或將成為中國AI發展的關鍵支點。(衛斯李的投研筆記)
輝達H200預計對華出口,中國AI晶片企業如何正面硬剛?
根據環球網引述路透社消息透露,川普政府正考慮批准向中國出口美國晶片製造商輝達的H200人工智慧晶片。根據介紹,兩年前發布的H200晶片相比於其前代產品H100晶片擁有更多的高頻寬內存,使其能夠更快速地處理資料。據估計,H200晶片的性能是輝達H20晶片的兩倍。報導引述知情人士消息稱,負責監管美國出口管制的美國商務部正就改變對華出口限制一事進行審查,並表示相關計畫可能會發生變動。報導稱,美國商務部尚未對此作出回應,輝達尚未就此直接置評。值得一提的是,因為各種原因,今年夏天輝達在華新增市佔率歸零。「我們在中國市場的份額已經從95%下降到0%。對於投資者來說,我們所有的預測都是假設中國市場為零。」近期出席紐約Casa Cipriani舉辦的Citadel Securities「2025年全球市場未來」會議時,輝達CEO黃仁勳透露公司在華市場的困境。不過,一門心思想賺錢的黃仁勳對重返中國市場仍保持著希望,他在該會議上表示,“中國是全球第二大AI市場,生態系統活躍,美國無法參與是難以置信的。如果中國市場有任何變化——我希望會有,那將是額外的收益。因此,希望我們能夠繼續解釋、溝通,並對政策變化保持希望。”如今,輝達重返中國市場似乎有希望,國內的科技企業會願意為供應鏈安全有隱患的輝達買單嗎?先前,騰訊集團副總裁、騰訊雲總裁邱躍鵬宣佈,目前騰訊雲已全面適配主流的國產晶片,並積極參與並回饋開源社群。海光資訊海光資訊科技股份有限公司成立於2014年,主要從事高階處理器、加速器等運算晶片產品與系統的研究、開發,目標成為世界一流的晶片企業,為數位中國提供核心運算引擎。身為國產先進微處理器產業的推動者,海光資訊以務實的態度、創新的理念、先進的技術和可靠的產品,致力於促進中國資訊產業核心競爭力的提升。海光資訊作為國內少數同時佈局高階通用處理器(CPU)和深度學習加速器(DCU)的公司,其主要產品包括海光通用處理器(CPU)和海光協處理器(DCU)。海光CPU系列產品相容於x86指令集以及國際上主流作業系統及應用軟體,產品得以廣泛滲透政務、金融、電信等領域。海光DCU系列產品以GPGPU架構為基礎,可廣泛應用於大數據處理、人工智慧、商業運算等應用領域。近期,海光資訊揭露2025年第三季報告。財報顯示公司前三季累計營業收入94.9億元,年增54.65%;實現歸母淨利19.61億元,年增28.56%。第三季單季,公司營收達40.26億元,較去年大幅成長69.60%,季增31.38%,創下年內單季營收成長新高。海光資訊將前三季業績成長歸因於,公司與整機廠商、生態夥伴在重點產業和重點領域的深化合作,加速客戶端導入,推動高階處理器產品的市場版圖擴展,隨著市場銷售大幅提升,實現利潤總額成長。這顯示海光資訊在國產替代和自主可控的大背景下,其高階處理器產品在特定市場(如政務、金融、能源等關鍵資訊基礎設施領域)的需求持續釋放,市場滲透率不斷提升。值得一提的是,國慶期間,海光資訊斬獲大單。工商銀行發布了《2025年度海光晶片伺服器採購專案中標候選人公示》,其中浪潮為中標主力,中興、聯想成為備選。顯然,上述三家伺服器整機方案全部基於國產海光晶片路線。有消息稱,此次項目集採總金額高達30億元。華為昇騰基於華為昇騰系列(HUAWEI Ascend)AI處理器和基礎軟體建構Atlas人工智慧運算解決方案,包括Atlas系列模組、闆卡、小站、伺服器、叢集等豐富的產品形態,打造面向「端、邊、雲」的全場景AI基礎設施方案,涵蓋深度學習領域推理和訓練全流程。9月18日,華為揭露了接下來三年的昇騰晶片規劃與演進方向。根據介紹,除了今年第一季已經量產商用的昇騰910C,明年第一季將發布昇騰950PR,明年第四季發布昇騰950DT。 2027年第四季要發布昇騰960、2028年發布昇騰970。此外,華為也發表了最新超節點產品Atlas 950 SuperPoD和Atlas 960 SuperPoD超節點,分別支援8192及15488張昇騰卡,在卡片規模、總算力、記憶體容量、互聯頻寬等關鍵指標上全面領先,在未來多年都將是全球最強算力的超節點。基於超節點,華為同時發布了全球最強超節點叢集,分別是Atlas 950 SuperCluster和Atlas 960 SuperCluster,算力規模分別超過50萬卡和達到百萬卡。寒武紀寒武紀成立於2016年,提供雲端端一體、軟硬體協同、訓練推理融合、具備統一生態的系列化智慧晶片產品及平台化基礎系統軟體。寒武紀產品廣泛應用於伺服器廠商和產業公司,以網路、金融、運輸、能源、電力和製造等領域的複雜AI 應用場景提供充裕算力,推動人工智慧賦能產業升級。在先前很長一段時間裡,市場上關於寒武紀的討論非常多。根據公司揭露的財報,2025年上半年實現營收28.81億元,年增4,347.82%;實現歸母淨利10.38億元,年增295.82%。寒武紀方面表示,2025年上半年,人工智慧算力需求持續成長,公司憑藉著人工智慧晶片產品的核心優勢,持續深化與大模型、網路等前沿領域頭部企業的技術合作。公司以技術合作促進應用落地,以應用落地拓展市場規模,營業收入實現了顯著成長。寒武紀主要有雲端訓練(包括思元290)、雲端推理(包括思元100、思元270及思元370)等AI晶片,並在性能上展現了一定競爭力,包括用於終端場景的寒武紀1A、寒武紀1H、寒武紀1M 系列智能處理器。摩爾線程摩爾線程成立於2020 年10 月,以全功能GPU 為核心,致力於向全球提供加速運算的基礎設施和一站式解決方案,為各行各業的數智化轉型提供強大的AI 運算支援。目前,摩爾線程的AI智算產品主要包括叢集、闆卡、一體機等。自去年開始,AI智算成為摩爾線程核心產品和主要收入來源。招股書顯示,2025年上半年摩爾線程AI智算產品營收佔94.85%。相關產品:MTT S4000(GPGPU)、誇娥(KUAE)GPU智算群集等壁仞科技壁仞科技研發高效能通用GPU,打造自主原創的高效能GPU軟硬體體系,建構國產智慧運算產業生態。首代壁仞科技通用GPU產品基於原創訓推一體晶片架構,已在多地智算中心落地,壁仞科技實現中國首個四種及以上異構晶片混訓技術落地,突破了算力孤島難題。合作夥伴包括中興通訊、中國移動、中國電信、上海人工智慧實驗室等。相關產品:壁礪系列(106M、106B、106E、110E)等芯動科技芯動科技(北京)有限公司是中國人工智慧(AI)和圖形渲染領域的GPU領導企業。本公司匯集了全球頂尖的科學研究團隊和技術專家,在晶片設計、演算法建模、軟硬體開發及系統架構設計等多個領域擁有深厚的累積和卓越的創新能力。憑藉持續的研發投入,公司不斷推出創新產品和解決方案,有效解決客戶痛點,推動產業發展。近期,芯動科技推出新產品「風華3號」。據瞭解,針對存力和運力瓶頸,「風華3號」是國內首款單卡配備112GB+大容量高帶寬顯存和自研IP的全功能GPU,較國內外競品,數倍提升了存力,有效地容納AI大參數模型,突破目前國產GPU顯存和多產卡大運的上限,單卡B/232多快好省地賦能各垂類大模型業務落地;單機八卡,更是能直驅DeepSeek 671B/685B 滿血版大模型,達到了之前不得不多機部署的效果,精度一步到位,滿足行業最苛刻的高智能化需求。 「風華3號」對DeepSeek V3/R1/V3.1、千問Qwen2.5/3全系列、以及智譜GLM系列大模型相容度“拉滿”,支援多模態模型,實現了“輕量化部署,重量級賦能”的效果。雲天勵飛雲天勵飛成立於2014年,是AI推理晶片的領導者。本公司自主研發了神經網路處理器核心IP和晶片,聚焦大模型高效推理,為人工智慧的普惠應用提供算力支撐。本公司建構AI推理晶片生態,賦能消費者、企業與產業的各類場景,加速推理AI時代的發展,讓智慧無所不在。雲天勵飛自主研發的「算力積木」架構,讓晶片能像搭積木一樣靈活組成、靈活擴展,能夠在國產製程下實現算力單元的高效靈活擴展,滿足多樣化應用場景對AI算力的需求。 2023年公司正式發表基於「算力積木」架構打造的DeepEdge10晶片平台,並推出DeepEdge10C、DeepEdge10 標準版、DeepEdge10Max 和DeepEdge200 四款晶片,提供算力範圍覆蓋8T 至256T,可滿足從小型邊緣設備到智算中心的高位能力計算中心可滿足從小型邊緣設備到智算中心的高性能運算中心。中昊芯英中昊芯英由前GoogleTPU 晶片核心研發者楊龔軼事攜一批來自於Google、微軟、三星等海外科技巨頭公司的AI軟硬體設計專家於2018 年創立。本公司全自研的中國首款TPU架構高效能Al 晶片"剎那®",用於AI運算場景時算力效能超越海外知名GPU 晶片近1.5 倍,能耗降低30%。「泰則®」大規模AI 運算群集系統是基於中昊芯英自研的高性能TPU晶片「剎那®」所建構的AI運算群集系統,實現了1024 片晶片的高效片間互聯,可支撐超千億參數大模型的計算與推理。其強悍的系統效能和卓越的擴展性專為處理如AlphaZero、AlphaGo、GPT 等前沿人工智慧模型的大規模運算任務量身打造。目前該系統已在與各地政府、營運商、企業、高校與科研機構合作興建的多個超大規模智算中心中成功落實。希姆計算廣州希姆半導體科技有限公司(希姆計算)成立於2019年,是全球首個採用RISC-V指令集研發資料中心級高階AI晶片的企業,是RISC-V國際基金會針對AI擴充指令集標準制定的核心貢獻單位。本公司主營晶片已在一線網路廠商和營運商智算中心落地多個千卡叢集。 2024提出【算力即服務】策略,已與多家政企聯合推進智能體應用落地,相關方案入選工信部新質生產力典型案例。其產品STCP920是基於自研RISC-V AI Matrix擴展指令集打造的雲端推理加速晶片,透過NeuralScale NPC的專用運算單元、眾核脈衝陣列、多層儲存架構等技術,實現了高能效比、低功耗、靈活可編程,支援LLM、CV、NLP、推廣等模型,廣泛適用於網際網路、智慧沐曦沐曦致力於為異構運算提供全端GPU晶片及解決方案,可廣泛應用於智算、智慧城市、雲端運算、自動駕駛、數位孿生、元宇宙等前沿領域,為數位經濟發展提供強大的算力支撐。相關產品:曦雲C系列通用GPU(GPGPU)晶片是針對智算及通用運算的完美解決方案,沐曦自主智慧財產權架構提供強大高精度及多精度混合算力,可廣泛應用於智算以及通用計算、教育和科研等場景。曦思N系列是面向雲端應用的智算推理產品,採用高頻寬內存,提供強大的算力和領先的視頻編解碼能力,可廣泛應用於智慧城市、公有雲運算、智慧視訊處理、雲端遊戲等場景。燧原科技燧原科技專注人工智慧領域雲端算力產品,致力於為通用人工智慧打造算力底座,提供原始創新、具備自主智慧財產權的AI加速卡、系統叢集和軟硬體解決方案。憑藉其高算力、高能效比的創新架構和高效易用的軟體平台,產品可廣泛應用於泛互聯網、智算中心、智慧城市,智慧金融、科學運算、自動駕駛等多個產業、場景。相關產品:邃思T20/T21(雲端訓練晶片)、雲燧i10(邊緣推理晶片)等崑崙芯崑崙芯(北京)科技有限公司前身為百度智慧晶片及架構部,於2021年4月完成獨立融資,首輪估值約130億元。公司團隊在國內最早佈局AI加速領域,深耕十餘年,是一家在體系結構、晶片實現、軟體系統和場景應用均有深厚累積的AI晶片企業。相關產品:崑崙芯P800(支援8bit推理的GPGPU)等天數智芯上海天數智芯半導體股份有限公司(簡稱「天數智芯」)是中國領先的通用GPU 高階晶片及超級算力系統供應商。天數智芯致力於開發自主可控、國際領先的高性能通用GPU產品,探索通用GPU趕超發展道路,加速建立自主產業生態,為全產業提供高階算力解決方案。相關產品:天垓BI-V100(GPGPU)等天垓100聚焦高效能、通用性和靈活性,支援200餘種人工智慧模型(數量持續增加),支援通用運算、科學運算、大模型、支援業界前沿新演算法模型。模型適配速度快,從容面對未來的演算法變遷,為人工智慧及通用運算和相關垂直應用產業提供匹配產業高速發展的運算力。清微智能清微智能是可重構運算(CGRA)領導企業,核心團隊來自於清華大學以及海思、輝達、蘋果、AMD等知名企業,專注於可重構運算晶片的創新研發與產業應用。目前已量產TX5、TX8兩大系列十多款高能效智慧運算晶片,面向智算中心、大模型,自動駕駛智慧安防等智慧運算場景,提供高效能算力支援,致力於打造自主可控的可重構通用運算生態。據瞭解,清微智能目前已量產TX8與TX5兩大系列共十餘款晶片,為AI智算中心、大模型、自動駕駛、智慧安防等場景提供智慧算力支援。截至2025年5月,清微智能可重構晶片累計出貨量已超2000萬顆,成功實現全球可重構晶片銷量領跑。礪算科技算科技成立於2021年,是研發高效能GPU的公司,專注自研架構、全自有智慧財產權,深度掌握GPU大晶片的架構、設計、軟體研發和know-how,對處理器生態狀況及生態建設具有深厚經驗。7月26日,礪算科技在上海召開產品發表會,正式發表首款GPU晶片「7G100」系列及首款顯示卡產品Lisuan eXtreme系列。礪算科技介紹,礪算7G100系列從指令集到運算核心完全自主設計,基於自研TrueGPU天圖架構,並自研指令集、自研軟體棧。圍繞拓展性,礪算GPU支援NRSS動態最佳化渲染畫質,實現對輝達DLSS(深度學習超級取樣)技術和AMDFSR(超級解析度銳利化)技術的對標。礪算科技透露,Lisuan eXtreme系列顯示卡包含專業版及消費級兩大類,預計產品送樣時間為2025年8月,啟動量產時間為2025年9月。 (芯師爺)
中國算力基建與AI晶片發展
Q: AI 發展經歷了那些階段,各階段與計算系統有何關聯?A: AI 發展歷經符號主義、控制主義、連結主義三個核心階段,且每個階段的突破都與計算系統的支撐密不可分。第一階段符號主義以邏輯運算與符號操作為核心,依託圖靈機背後的基礎計算系統實現符號的推理與處理,此階段也為AI奠定了早期的理論與實踐基礎;第二階段控制主義的控制機制建立在自控系統的基本演算法之上,這些演算法的運作完全依賴於電腦的運算支援,聚焦於透過明確的控制邏輯解決特定場景問題;第三階段連接主義借助神經網路實現了重大突破,其核心依賴運算系統在平行運算方面的革新,本質是多層神經網路構成的數學模型,具備明確的輸入輸出邏輯,例如在影像判別場景中,輸入人物照片後,模型可輸出判斷為該人物的機率,完美適配複雜場景下的智慧處理需求。Q: AI 晶片類型有那些,GPU 和CPU 在平行運算中的表現如何,中國國內AI 晶片架構選擇情況如何?A: AI 晶片的發展與平行運算架構密切相關,主要包括通用運算晶片、專用晶片以及基於新興架構的晶片類型。其中,GPU 在平行運算中表現極為出色,因其整合了大量運算單元和高速內存,能夠精準適配AI 任務的加速需求,是當前並行運算的核心硬體之一;而CPU 雖具備一定的AI 運算能力,但在平行處理效率上遠低於GPU,難以應付AI 任務中大規模的並行運算需求,僅能承擔部分簡單的輔助運算工作。隨著技術演進,ASIC、FPGA 等專用晶片逐漸興起,ASIC 可針對特定AI 演算法進行深度最佳化,推理晶片多基於這兩種架構開發;新興的非馮・諾依曼架構也衍生出存算一體架構,以及在SoC 上整合CPU 與NPU 的混合架構。國內國產AI 晶片架構選擇呈現多樣化特徵,多數產品基於ASIC 架構打造,部分採用可重構的FPGA 架構以提升彈性,同時也有廠商推出基於通用GPU 架構的產品,滿足不同情境的應用需求。Q: 國內外AI 晶片生態差距體現在那些方面,國內建構狀況如何?A: 國內外AI 晶片生態的差距主要體現在發展歷程、完善程度和技術自主性。輝達自20 世紀90 年代起就基於遊戲闆卡逐步構建生態,經過數十年的積累,其生態系統已極為完善,涵蓋硬體、軟體、演算法、開發者社群等全產業鏈環節。而國內AI 晶片生態建構明顯落後,頭部廠商大多成立於2019 年後,發展歷史僅3-6 年。從建造難度來看,硬體層面的晶片設計可在約1 年內完成,但完整生態的搭建需要大量模型架構師、軟體工程師熟悉硬體特性及驅動開發,周期長、投入大。先前國內頭廠商多依賴類CUDA 或類輝達生態的技術,但2023 年左右輝達對相關技術實施禁令,導致國內廠商無法繼續沿用原有生態,軟體生態和硬體適配均受到顯著影響,進一步拉大了與國際成熟生態的差距。Q: 國內先進製程晶片製造有那些瓶頸,台積電採取了什麼措施?A: 國內在低於7 奈米的先進製程晶片製造領域存在明顯瓶頸。儘管中芯國際等企業已具備一定的先進製程產能,但產品穩定性較差,良率遠未達到台積電等國際頂尖廠商的成熟水平,青島等地的相關先進製程研發與生產嘗試也尚未實現穩定量產。台積電則以限制產能為由,對國內先進製程晶片設計企業(無論是否列入相關名單)的流片需求實施嚴格限制,這直接導致國內企業在5 奈米、7 奈米等先進製程晶片的製造上仍面臨較大困難。在此背景下,國內廠商開始嘗試Chiplet(芯粒)及多芯粒架構等替代方案,但這些方案目前仍面臨高功耗、算力規格不足等技術難題,尚未能完全彌補先進製程製造的短板。Q: 國產化需求對國內AI 晶片發展有怎樣的推動作用,國內廠商採取了什麼措施?A: 國產化需求為國內AI 晶片產業的發展提供了強勁動力,相關政策明確要求算力闆卡等核心硬體的國產化率達到40% 以上,且必須優先使用國產晶片,這一要求倒逼國內AI 晶片企業加速技術研發與產品迭代。為滿足國產化適配需求,實現不同架構晶片之間的高效互聯,國內廠商積極探索異構晶片架構,透過整合多種類型晶片的優勢,嘗試多晶片協同的綜合任務處理模式,突破單一架構在特定場景下的效能限制。這種基於國產化需求的技術探索,不僅推動了國內AI 晶片在架構創新、相容性等方面的進步,也為建構自主可控的AI 產業鏈奠定了基礎。Q: 大模型普及對國內AI 晶片產業有怎樣的驅動作用,以DeepSeek 為例說明?A: 大模型的快速普及為國內AI 晶片產業帶來了強烈的新增需求,成為推動產業發展的核心驅動力之一。大模型在訓練和推理過程中需要處理大量數據,對晶片的算力、記憶體頻寬等性能指標提出了極高要求,直接拉動了高性能AI 晶片的市場需求。以DeepSeek 為代表的大模型,其獨特的多步驟驗證機制(包含反思機制、知識遷移能力等)使得推理過程中的token 用量大幅增加,多步驟驗證的推理token 數量較單步驗證上升10 倍以上,這意味著需要更強大的晶片算力來支撐模型的高效運行。這種需求傳導直接刺激國內AI 晶片企業加大對高算力、高適配性晶片的研發投入,推動晶片產品性能持續升級,以配合大模型的發展節奏。Q: 開源模型對AI 普惠有怎樣的推動作用,DeepSeek 衍生模型情況如何,對AI 應用拓展有何影響?A: 開源模型大大降低了AI 技術的使用門檻,推動AI 普惠進程加速,讓更多企業、開發者乃至科研機構能夠低成本獲取先進的AI 技術與模型,打破了技術壟斷,促進了行業創新活力的釋放。以DeepSeek 為例,其衍生模型數量已達47 萬個,覆蓋全球超170 個國家和地區,形成了龐大的開源生態。這些衍生模型不僅豐富了AI 技術的應用場景,也推動AI 應用從傳統的公共安全、政府部門等領域,廣泛拓展至金融、醫療、教育、工業等20-30 個產業,產業滲透率超過30%。尤其在科學智慧場景中,大模型能夠取代部分科研人員的實驗過程,大大提升了科研效率,同時也產生了龐大的算力需求,進一步帶動了AI 晶片及相關產業的發展。Q: MCP、A to A 等協定對多智能體綜效有怎樣的影響,多智能體協作對算力需求有怎樣的成長?A: MCP、A to A 等協定的出現與應用,顯著增強了多智能體之間的協同效應,使得多智能體能夠高效配合完成複雜任務,逐步取代傳統的單點應用模式。在多智能體協作場景中,單一智能體呼叫模型一次約消耗2000 個token,而多智能體之間的協同互動作用需要處理大量的跨智能體資料傳輸與計算任務,導致算力需求爆發式增長。與單智能體相比,多智能體協作的算力需求倍增,以10 倍的成長幅度估算並不誇張。這種算力需求的成長,不僅對AI 晶片的平行運算能力、資料處理速度提出了更高要求,也為算力基礎設施的升級與擴容提供了重要的市場驅動力。Q: 當前推理算力市場處於什麼階段,從那些數據可以看出,未來算力需求趨勢如何?A: 目前推理算力市場仍處於早期滲透階段,尚未進入大規模普及期。從具體數據來看,2025 年年終座談會的相關統計顯示,阿里雲每月帳面使用推理算力達到1 萬以上的客戶佔比不足5%;同時,國央企雖然在推理端存在明確需求,且透過雲端部署或私有化部署等方式開展相關應用,但整體態度較為謹慎,僅在個別行業實現了大規模普及,尚未形成全行業的普及,尚未形成全行業的普及,尚未形成全行業的普及,尚未形成全行業的普及。基於當前的市場滲透情況和AI 技術的發展趨勢判斷,隨著大模型應用的持續深化、開源生態的不斷完善以及多智能體協同場景的日益豐富,未來推理算力需求將迎來爆發式增長,成為算力市場增長的核心引擎。Q: 東數西算工程在十四五期間的實施情況如何,建成了多少國家級計算中心,資金來源是怎樣的,政策統籌情況如何?A: 東數西算工程是十四五期間國內算力基礎設施升級的核心舉措之一,其核心邏輯是將東部發達地區對算力需求大、能耗較高的訓練任務,轉移至中西部能耗成本低、水電和風電等綠色能源充足的地區進行算力部署,計算完成後再將結果參數傳回東部地區。透過這項工程的實施,國內已成功建成12 個國家級運算中心,建構全國性的算力網路骨幹架構。在資金來源方面,並非由國家全額出資,而是採用多元化的融資模式,包括企業(如華為等科技企業)自主投資、地方政府統籌籌措資金,同時輔以地方債補充資金缺口。政策統籌層面,東數西算工程需要國家發改委與地方發改委協同推進,涉及算力佈局、能耗指標、能效標準等多項審批工作,地方新計算中心通常需要上報至國發改委層面完成最終審批,確保工程實施與國家整體算力規劃、能源戰略相契合。Q: 算力具有怎樣的戰略意義,未來算力規模將有怎樣的變化,中國為何必須持續投入算力基建?A: 算力已從過去的技術支援角色走向台前,成為與電力同等重要的經濟基礎設施,是衡量一個國家科技實力和經濟競爭力的核心指標之一。掌握先進的算力基礎設施,意味著在全球科技競爭中擁有主導權,同時也能獲得推動經濟結構轉型升級、實現高品質發展的核心引擎。從未來發展趨勢來看,隨著AGI(通用人工智慧)、科學智慧及具身智慧等技術的持續演進,資料處理的規模和複雜度將大幅提升,算力規模將從目前的10 萬卡等級快速提升至30 萬張卡等級。算力是實現下一代智慧技術突破的核心前提,對中國而言,持續投入算力基建不僅是應對全球科技競爭的戰略選擇,更是保障產業鏈供應鏈自主可控、推動數位經濟高品質發展的必然要求,因此必須長期堅持並加強投入。Q: 國內主流的AI 晶片頭廠商有那些,是基於什麼排序的?A: 目前國內主流的AI 晶片頭廠商包括華為、寒武紀、沐曦、摩爾線程、壁仞、天數等企業。這項排名是基於個人實測的角度形成的大致排序,主要參考維度包括晶片的實際算力性能、在不同應用場景下的適配能力、軟硬體生態的完善程度、產品的穩定性與良率,以及在市場中的實際應用案例和客戶反饋等多方面因素,綜合反映了各廠商在當前國內AI 晶片市場中的競爭力水平。Q: 未來算力市場規模成長情況如何,2025 年國內智算規模及全球算力市場規模預計為多少,國內2025 年整體服務市場規模及構成情況如何?A: 未來全球及國內算力市場規模都將呈現指數級成長態勢,過去幾年算力市場的年增長率已超過40%,且此成長趨勢將持續。 2025 年國內智算規模已達1000 多EFLOPS(其中1000P 相當於10 的18 次方FLOPS,1P 算力可拆分為兩張卡,規模相當於2×10^6);全球2025 年算力市場規模預計達726 億美元。從國內市場來看,2025 年AI 算力整體服務市場(包含晶片及相關配套服務)規模約為155 億元,其中基礎設施整合規模(涵蓋晶片、伺服器、機櫃、電源配套、網路儲存設備等核心硬體)達到120 億元,年成長超過110%,呈現強勁的成長動力。值得注意的是,目前市場資金正快速向頭部企業集中,產業集中度持續提升,頭部廠商在技術研發、產能供應和生態建構的優勢將進一步擴大。Q: 晶片算力的主要消費主體有那些,國內主要雲廠商和營運商的算力投資情況如何?A: 晶片算力的主要消費主體集中在雲端廠商和營運商,這兩類主體憑藉其業務特性,對算力有著持續且大規模的需求。國內主要雲端廠商中,阿里、騰訊、百度、字節(合稱BATT)是核心採購方,其中阿里已明確宣佈未來在算力領域的投入將超過3800 億元;騰訊的算力相關開支增長超過200%,資金主要集中於晶片採購、伺服器部署和計算叢集搭建。營運商方面,中國移動、中國聯通、中國電信的算力投資未來將至少維持10% 的年均成長,但由於過去幾年已進行了大規模的基礎設施投入,2025 年的實際投入量相對平穩,不會出現爆發式增長。此外,除了頭部雲廠商和營運商,國內其他科技企業也紛紛加大算力佈局,預計將有多家廠商相繼投入千億以上資金用於算力相關的硬體採購和基礎設施建設。Q: 華為新出的昇騰910C 晶片在2025 年WIC 世界人工智慧大會展出情況如何,其技術性能如何?A: 華為全新推出的昇騰910C 晶片在2025 年WIC 世界人工智慧大會上正式展出,引發業界廣泛關注。該晶片在技術性能上表現突出,採用384 卡全光互聯技術,推理效率較行業標竿產品H100 提升超過20%,國產化率達到85%,由中芯國際採用7 奈米過程代工生產,實現了核心硬體的高度自主化。在關鍵參數方面,昇騰910C 支援HBM3 的128G 顯存規格,標準算力達到800T FLOPS,1 至8 卡叢集的算力可達到1500 多TOPS,在當前國產AI 晶片中技術性能排名靠前,能夠充分滿足大模型訓練、複雜推理等高端算力需求,為國內AI 的獨立硬體支撐提供了支援。Q: 沐曦晶片有什麼特點,代表型號是什麼?A: 沐曦晶片的核心特點是原生支援FP8 標準,而FP8 是當前大模型訓練的主流精度標準,這使得沐曦晶片在大模型訓練場景中具備天然的適應優勢。同時,得益於軟硬體的深度適配優化,沐曦晶片的千卡叢集吞吐率較業界平均提升40%,能夠大幅提升大型模型訓練與推理的效率,降低算力消耗成本。沐曦晶片的代表型號為MXCU C600,該型號產品憑藉其高性能、高適配性的特點,已在多個國內大模型項目中得到應用,成為國產高端AI 晶片的重要選擇之一。Q: 計算中心建置需要採購那些設備和服務?普通42U 機櫃最多可容納多少八卡設備,單機櫃功耗一般多少?A: 計算中心建置是一項系統工程,需要購買的設備和服務涵蓋多個維度。核心設備包括伺服器、AI 闆卡、儲存設備等算力核心硬體;配套設備則包括機櫃、電力供應系統、冷卻系統(如暖通空調、液冷設備等)、網路交換設備等基礎設施;此外,還需要專業的運維服務、技術支援服務以及後期的設備升級與維保服務,以保障運算中心的穩定運作。在硬體部署方面,普通42U 機櫃受設備尺寸和安裝規範限制,最多可容納約15 台八卡設備;單機櫃功耗通常不超過12000 瓦,不過部分廠商透過優化設備佈局、採用高效電源和冷卻方案等適配改良措施,可在保證安全的前提下適當提升單機櫃的功耗上限,以滿足高密度算力部署的需求。Q: 光互聯技術有什麼優勢,國內有什麼實務應用?A: 光互連技術作為算力網路中的關鍵支撐技術,具有顯著的效能優勢。與傳統的電互聯技術相比,全光互聯能夠大幅降低節點間的資料傳輸延遲,減少訊號衰減和乾擾,從而提升計算任務的成功率和整體運算效率,尤其適合大規模計算叢集、跨區域算力調度等對傳輸速度和穩定性要求極高的場景。在國內,光互聯技術已進入實際應用階段,以上海為例,當地已在多個資料中心和算力叢集中採用光互聯、光直連(闆卡間直接互聯)技術,透過建構高速、低延時的算力網絡,為大模型訓練、跨區域資料共享等場景提供了高效的傳輸保障,成為國內光互連技術實踐的標竿案例。Q: 國家製訂了那些完整的人工智慧晶片系統標準?A: 國家已針對人工智慧晶片領域制定了完整的系統標準體系,涵蓋AI 晶片從設計、生產到應用的全生命周期關鍵環節。具體包括智慧晶片指令集標準,規範晶片的指令架構,確保軟硬體的相容性;性能功耗測試要求,明確晶片在不同負載下的性能評估指標和功耗控制標準,為產品選型提供依據;軟體算子互聯互通標準,保障不同廠商的晶片與各類AI軟體、演算法的適配性,打破技術壁壘;神經網路模型演算法載入標準,規範模型在晶片上的部署流程與運作機制;以及編譯器相關標準,優化晶片對模型的編譯效率,提升算力發揮水準。這一系列標準的製訂,為國內AI 晶片產業的規範化發展提供了重要保障,推動產業形成統一的技術規範和市場秩序。Q: 根據巴克萊預測,2026 年全球推理算力需求將如何,產業發展方向有那些?A: 根據巴克萊的專業預測,到2026 年,全球推理算力需求將佔總運算需求的70% 以上(此資料不含訓練需求),推理算力將成為算力市場的核心成長極。未來AI 算力產業的發展方向主要集中在兩大領域:一是綠電佈局,透過電算協同的模式,引導算力資源向綠電富集的負極區佈局,實現能源供給與算力需求的精準匹配,既降低算力運行成本,又符合綠色低碳的發展理念;二是十萬卡跨域分佈式跨域分佈式晶片協同作用,萬張,其中國產晶片佔比達50% 以上,未來將進一步推動跨區域、大規模的算力協同,提升整體算力的利用效率與調度彈性。Q: 主流AI 晶片效能參數如何,國內算力需求規模預計是多少,網路廠商需求情況怎樣,從應用場景看訓練與推理佔比如何?A: 主流國產AI 晶片的性能參數各有優勢:華為昇騰910C 的INT8 算力為1500 TOPS,FP16 算力為800T FLOPS,顯存規格128GB;寒武紀690 的FP16 算力為512T FLOPS,顯存容量為1444218697239753;算力約320T FLOPS。從國內算力需求規模來看,未來兩年預計將達到500 萬張卡的總量需求,其中互聯網廠商是核心需求主體,由於其業務涵蓋大模型應用、短視頻處理、智能推薦等多個高算力消耗場景,需求規模較大。從應用情境來看,目前大部分GPU 卡均具備訓練與推理雙重功能,無需嚴格區分場景屬性;若需明確劃分,推理場景的算力需求佔比約為60%-70%,訓練場景佔比約為30%,推理需求已成為算力消耗的主要部分。Q: 適合國內大模型訓練的國產晶片建議型號有那些?A: 適合國內大模型訓練的國產晶片推薦機型包括一系列經過市場驗證、性能穩定的產品:華為昇騰910B、華為昇騰910C、寒武紀690、沐曦MXCU C600、壁仞BR200、天數智芯天垓2000、摩爾線程S80 等。這些晶片均具備高算力、大顯存、高頻寬等大模型訓練所需的核心特性,能夠適應不同規模、不同類型的國內大模型訓練需求。其中,華為昇騰系列憑藉著完善的生態支援和穩定的性能表現,在頭部大模型項目中應用廣泛;寒武紀、沐曦、壁仞等廠商的產品則在特定場景下具備獨特優勢,為國內大模型訓練提供了豐富的國產化選擇,有效降低了對國外晶片的依賴。Q: 華為384 叢集搭載的是920B 還是920C 晶片,該產品大規模出貨情況如何?A: 華為在2025 年展出的384 卡算力叢集搭載的是昇騰920C 晶片,該晶片作為華為推出的新一代高端AI 晶片,在算力性能和互聯技術上均有顯著提升。不過,昇騰920C 晶片目前尚未實現大規模售賣,核心限制因素是代工供貨短缺,當前國內先進製程代工產能的不足,導致該型號晶片的量產規模無法滿足市場的大規模需求。需要注意的是,目前華為在市場上大規模出貨的並非昇騰910C 晶片,而是技術成熟、產能穩定的昇騰910B 晶片,昇騰910B 仍是當前華為AI 晶片的主流出貨型號,能夠滿足大部分客戶的算力需求。Q: 該產品對外宣傳的算力指標是基於920B 還是920C 計算的,市場實際交付情況如何?A: 從業界常規宣傳邏輯來看,產品對外宣傳時通常會採用最先進或最新推出的版本所對應的性能指標,華為384 叢集對外宣傳的算力指標正是基於已流片的新一代晶片昇騰920C 計算的,這能夠更直觀地展現產品的技術實力和未來潛力。但從市場實際交付情況來看,由於昇騰920C 晶片受代工產能限制,尚未實現大規模量產,因此當前市場實際交付的產品仍以昇騰920B 為主。而在華為的整體產品矩陣中,昇騰910B 憑藉穩定的產能、成熟的技術和較高的性價比,成為當前市場的主流交付產品,能夠充分滿足國內大部分AI 項目的算力需求。Q: 910C 與690 兩款產品中,那一款的算力較強,實測效果較優,實測的算力水準分別是多少?A: 在華為昇騰910C 與寒武紀690 兩款產品的比較中,昇騰910C 的算力更強,實測效果更優,更能滿足高端算力需求場景。根據實測數據,昇騰910C 在FP16 精度下的算力達到1500 TOPS,配備128GB HBM 顯存,顯存帶寬和數據處理速度表現出色;寒武紀690 在FP16 精度下的實測算力約為500 TOPS,沐曦同級在FP16 下昇級功率下的實測算功率為華FLOPS,顯存容量為144GB,在實際運行大模型時,昇騰910C 消耗的卡牌數量相對較少,算力利用效率更高,能夠有效降低大規模算力部署的成本。Q: 920B 是否優於590,海光目前是否涉及生產3 號產品?A: 華為昇騰920B 在性能上明顯優於寒武紀590,寒武紀590 作為前一代產品,在算力、顯存頻寬、適配性等核心指標上均落後於昇騰920B,已逐漸退出高端算力市場,僅在部分中低端場景中仍有應用。關於海光的產品佈局,海光的核心產品以CPU 為主,其推出的DPU 產品主要面向大數據處理場景,專注於資料傳輸、儲存最佳化等任務,一般不用於AI 加速運算。目前海光並未涉及所謂「3 號產品」 的生產,其業務核心仍聚焦於CPU 及相關配套晶片的研發與生產,主要應用於國產替代中的CPU 晶片領域,為國內電腦設備提供自主可控的核心處理器支援。Q: 目前國內市場算力晶片以卡片數量計算的整體市場需求量級是多少,其中用於訓練與推理的卡數量分別是多少,該投資範圍僅指特定主體嗎,互聯網廠商的投資規模情況如何,分兩年規劃的500 萬卡中,用於推理與訓練的比例分別是多少?A: 國內算力晶片按卡數量計算的總體市場需求量級可透過區域增量推導得出:上海未來兩年的算力將從當前的30 億FLOPS 增長至55 億FLOPS,增量約25 億FLOPS,對應約10 萬張晶片需求;按全國範圍需求為上海的10 倍總投資,未來兩年國內算力道而網路廠商的算力需求更為龐大,保守估計其投資規模是政府或國有投資資料中心的5 倍,約500 萬張卡,這部分需求主要來自頭部雲廠商和科技企業的算力叢集搭建。從場景劃分來看,目前無需嚴格區分訓練與推理用卡,因為大部分GPU 卡均可相容兩種場景,僅端側設備用卡更側重推理;若需明確區分任務屬性,預計推理用卡佔比約60%-70%,訓練用卡佔比約30%,推理場景仍是算力晶片的主要需求來源。 (大道調查)
一邊美國一邊中國,老黃左右為難
一場AI晶片的中國國產替代浪潮,正在加速展開。輝達晶片被美國政府限製出口中國、被中國政府質疑有後門,給了中國AI晶片取代輝達的大好機會。它們正躍躍欲試,搶走輝達的市場份額。今年4月,川普要求,輝達向中國出口H20晶片需要美國政府許可。被川普突然限制,輝達停止H20向中國出貨。輝達只能眼睜睜看著中國市場被蠶食,黃仁勳感嘆:“四年前,輝達在中國的市佔率高達95%,如今只有50%。”等了三個月,事情等來了轉機,中美趨向緩和,7月15日,輝達宣佈美國政府放開對AI晶片H20的出口限制。可輝達剛想要在中國市場大展拳腳,很快就又遭到暴擊。7月底,國家網信辦要求輝達就H20漏洞後門安全風險問題進行說明。面對突如其來的質疑,輝達當天就回應稱,輝達的晶片不存在“後門”,不會讓任何人有遠端存取或控制這些晶片的途徑。H20本是為了能順利出口中國,輝達不得不閹割功能的AI晶片,競爭力已削弱。如今又有後門質疑,中國算力中心和雲廠商更轉向國產AI晶片。字節跳動就在今年初,向國產AI晶片廠商寒武紀下單20萬張AI晶片。今年上半年是寒武紀第一個獲利的半年,扣非淨利有9.13 億元,要知道去年同期還是淨虧損6.09 億元。業績一好,股價也跟著漲,寒武紀股價甚至一度漲過了貴州茅台,登頂新股王。中國移動,也把十億級訂單砸給了崑崙芯。崑崙芯是百度旗下的AI晶片設計公司,已經可以量產並大規模用於算力叢集,是百度這些年裡的亮點。而且崑崙芯不同於華為和寒武紀,不是被美國槍打的出頭鳥,尚可以在境外流片,產能更靈活。崑崙芯也相容於CUDA架構,該架構是輝達發佈的,能將高階電腦語言轉化為GPU硬體能讀懂的底層電腦語言,隨著輝達GPU的推廣,大多數AI工程師已經習慣用其來訓練模型。這就讓使用者從輝達GPU遷移到崑崙芯更絲滑。華為升騰則走了另一條道路。近年來華為多次遭到美國製裁,所以為預防美國禁止相容CUDA,華為只能力推自己的CANN生態,而非相容CUDA。而華為不能在境外流片,內地半導體製造製程受限,只能另闢蹊徑。例如華為計畫2026年第四季發佈Atlas 950超節點,裝入8192顆升騰950 DT晶片。華為測算,和輝達2026年下半年要上市的NVL144機架比,Atlas 950 超節點在卡的規模上是它的56.8倍,總算力是6.7倍,記憶體容量是15倍,互聯頻寬是62倍。2027年四季度,華為還要推出Atlas 960超節點,能支援15488顆升騰晶片,與帶有576顆GPU的輝達NV576競爭。華為找到的新路,就是用「超節點+叢集」 的方式,把總算力堆上去。而華為還有通訊領域數十年的累積加持,能夠重新設計光器件、光模組和互聯晶片,還在互聯協議每一層都加了高可靠機制,讓光互聯的可靠性提升了100倍,互聯距離能超過200 米。這種技術積累,不是隨便那家公司都能有的,所以華為才走得通這條堆算力的新路。正是因為國內AI晶片迎頭趕上,越來越多的國內雲廠商就有底氣,在輝達遭受了「後門」質疑時,選擇國內AI晶片。9月16日,騰訊就表態,騰訊雲端的異構運算平台已經對國產晶片做了全面的相容與適合。輝達在國內的AI晶片市場,正被其他廠商分食,也不是國內的特例。畢竟輝達身為業界領導者,樹大招風,AI公司怕晶片命脈落在輝達手中。所以最近博通宣佈,將與OpenAI合作大量生產自研AI晶片,也是OpenAI想要找到更多AI晶片來源。說穿了,AI晶片設計的技術含量很高,也就中美兩國的公司還能挑戰輝達。輝達也不是一下子就能完全退出中國市場,而是它之前那種「一家獨大」 的地位,肯定會被打破。中國的AI產業需要安全、穩定、自主可控的算力支撐。如果一直依賴輝達的晶片,萬一那天外部環境變化,整個產業都會面臨風險。所以不管是從企業本身的供應鏈安全形度,或是從國家產業發展的角度,國產AI晶片取代輝達,都是必然的趨勢。最後還是要清醒地看到,中國AI晶片取代輝達絕不是一帆風順的,我們的晶片產能還受制於人。騰訊內部人士就提到,華為、寒武紀、崑崙,包括騰訊投資的國內AI晶片的性能都已接近H20,但出貨量都跟不上,都需要等中芯國際等代工廠的產線,出貨、提高良品率都還需要時間。在美國製裁下,我們的晶片製造仍然捉襟見肘。 (非凡油條)
華為發佈全新晶片之後,中國AI晶片面對的三個關鍵問題
中國的算力晶片領域,正在悄然發生變化。在2025年華為全連接大會上,華為發佈了多款重磅晶片新品,包括昇騰950系列、960以及970等AI晶片,並公佈了未來三年的昇騰AI晶片產品路線圖。其中,950系列採用了兩個不同的後綴——PR(Prefill & Recommendation,預填充與推薦)、DT(Decoder & Training,推理解碼與訓練)。傳統AI晶片在處理大模型推理時面臨資源爭搶問題,而在網際網路平台企業中,其推薦演算法推理模型所需的記憶體容量也巨大。如何在算力、記憶體容量和記憶體頻寬之間取得平衡,是提升投入產出比的關鍵。華為的“P/D分離”設計就是嘗試通過為不同應用場景配置不同的算力、記憶體容量和頻寬來實現這一目標。這種設計正是針對中國AI市場面臨的現實挑戰:能夠運行DeepSeek滿血版幾乎成為國內衡量AI計算系統的試金石。然而,要承載671B的參數,僅僅是採用不同版本Memory這一項的成本差異就可達數萬美金。可以說,中國AI產業的市場化需求,倒逼了國產晶片的產品創新。從產品角度看,發佈會上的這一最大看點,也是一個強烈的行業訊號:1)以DeepSeek為代表的應用與基礎模型產業方,在持續不斷且深度推動著中國AI晶片的發展;更進一步,受益於中國龐大的資料中心基礎設施規模與未來需求,“華為-海光-其他”的生態格局基本形成;2)時代亟需一個具備技術背景、但又對市場應用嫻熟於心、同時又具有平衡取捨之道的產品經理人才梯隊;3)AI產業的繁榮與領先,是AI晶片突破與創新的前提。01. 產能已經不是問題,下一步是生態從近期華為主動發出的訊號,以及作者作為多年從業者獲得的行業資訊,華為的產能約束基本上得到了緩解。資料中心的三大基石是計算、通訊(網路互連)和儲存,這是分析算力系統必須牢記的前提。在AI算力系統中,影響計算性能的,也可以劃分為三個部分,設計算力值、計算(算力)核之間高速互聯以及儲存頻寬。在《軟銀投資20億,英特爾成為全球高端製造業最大變數》中,筆者曾經提到算力的大小和工藝製程強相關,而這種高端工藝製程的主要體現就是Fab的高端產能與先進封裝。為華為提供類CoWoS封裝的企業,今年已經出現產能盈餘並向外釋放,說明在7nm節點附近,華為的需求已基本得到滿足。再來看高速互聯。WAIC期間,超節點是AI基建的重頭戲。其中,華為的CloudMatrix384成為了亮點,它的顯著特徵是其點對點、全互聯、超高頻寬的網路,通過 UB 協議連接所有的 NPU 和 CPU。CloudMatrix384通過Ultra-High-Performance Networking實現了 CPU、NPU、記憶體、網路卡(NICs)以及其他資源的完全點對點解耦與池化,其點對點硬體架構,包含用於超節點內擴展的超高頻寬統一匯流排(UB)、用於超節點間通訊的 RDMA ,以及用於與資料中心網路整合的虛擬專有雲(VPC)。這再次證明,通訊技術本就是華為的核心優勢。再來看記憶體頻寬。華為本來在通訊領域有深厚積累,可以說高速互聯技術是華為的“老本行”。再來看記憶體頻寬。這次的發佈會上,華為發佈了950、960、970系列產品,其中最為引人注目的950系列推出了兩個版本,從應用上看這標誌著PD分離在硬體層面的解偶,但從結果來看,記憶體頻寬也跟了上來。計算、高速互聯與儲存頻寬這些硬體上都有了大的突破,產能問題得到解決的華為,需要攻克的下一個堡壘就是產品的生態了。2022年,當業內開始注意到CUDA生態之於輝達的意義時,建構生態似乎成了老生常談。生態的本質是生意。intel建構了X86生態,輝達建構了CUDA生態,那怕蘋果、小米、騰訊都有各自的生態。其共同點,正是依附於這一生態中的每一家企業、機構、開發者,都可以在其中找到自己的生態位、並在其中商業變現、進而獲利。總不能指望,當一家企業舉起了生態大旗,就有許多企業不求回報地進行資源的投入。無利不起早,才是商業世界的常態。具有生意(潛力)是生態建立的基礎。那麼,傳統的華為可能就面臨著(也在進行著)模式的轉變,從封閉到開放,從肥水不流外人田到利益共享。Intel和輝達作為帶頭大哥走過的路,華為也要走一遍。這條路上華為並不孤獨,因為還有,海光。地緣政治的風險裡,孕育了自主可控的機遇。作為技術國產化成功的典範,海光憑藉X86架構的優勢,其CPU在信創領域和國產化市場中所向披靡。隨著資本的積累日漸豐盈,其技術實力與產品涉足領域也與日俱增。除了CPU之外,AI算力晶片、RAID Controller、高速網路晶片也日漸成熟,在資料中心的重要晶片上,海光在一步步地攻城略地。2025年5月下旬,海光宣佈將會合併曙光。而在更早,這兩家兄弟公司已經在生態層面開始協同,重新對旗下各家企業進行定位,通過讓渡市場的措施,實現同國內伺服器廠商和其他產業鏈上企業的合作,建構系統層面的生態。可以說,“華為-海光-其他”的格局基本形成。基於這個觀察,可以進一步推演:華為會在不久的將來做出選擇,到底是IDM還是Fabless模式。當然,不論做何選擇,他應該還是會繼續保持對產能的強力控制;合併後的海光下一步,就是入股高端產能,在當下的中國,也就意味著Fab大機率是SMIC或者華虹。從商業實操方面看,華虹可能性更大。至於OSAT,通富微電本來就和海光有著千絲萬縷的關係。02. 中國晶片產業的產品經理時代到來了上文提到,本次發佈的950系列之所以受到關注,核心就在於其PR和DT兩個不同型號,這正是業界探索已久的“P/D分離”。這又是一個類似於DeepSeek發佈時的解碼遊戲。為瞭解釋清楚這個概念,需要看一下大模型的演進路程和中國AI算力面臨的實際挑戰。大模型的參數量是從Billion(十億)等級起跳,百億千億是常態,直至兆級規模。這些參數需要容量非常大的空間進行儲存,且由於計算時需要極高速訪問這些儲存器,就需要極高的頻寬。這就催生出了HBM這種既有大容量又有高頻寬的新型儲存器。在進行計算時,算力的大小也決定著計算的效率,因此一顆AI晶片的目標設計算力也會做得儘量大。然而,很少有產品經理在設計中深入思考算力與儲存頻寬的最佳配比關係。畢竟,除了輝達和Broadcom為大平台訂製的AI晶片之外,能用起來已經是了不起的存在了。但是,一個現實問題是,HBM的成本實在是太貴了,單GB容量的HBM是DDR的近乎10倍、甚至更高。對於中國的AI晶片公司來說,不僅成本壓力大,而且想要獲得足夠的產能、甚至是穩定的供應都是一個挑戰。一個優秀的產品經理、架構師,之所以稱為合格、優秀,就是要會最佳化、取捨,Trade-Off。做好最佳化與取捨的前提,是要對應用場景有深刻的理解與洞察。在AI的應用場景中,對資源需求最高的的,除了模型的訓練過程,一個是大家耳熟能詳的大語言模型,一個是每一家網際網路公司的主要利潤來源——推薦演算法。在大模型推理中,常用以下兩項指標評估性能:TTFT(Time-To-First-Token):首 token 的生成時間,也就是從使用者輸入完畢到大模型回覆的第一個字(母)所花費的時間,主要衡量 Prefill 階段性能,這是一種計算密集型任務,對平行能力要求高,但是對記憶體頻寬相對可以低一點;TPOT(Time-Per-Output-Token):生成每個 token 的時間,也就是使用者直接感受到的回覆速度,主要衡量 Decode 階段性能,這一階段對記憶體容量和記憶體頻寬的要求更高。當 Prefill 和 Decode 在同一塊AI晶片上執行階段,由於兩階段的計算特性差異,會導致 TTFT 和 TPOT 之間的資源爭搶。若優先處理 Prefill 階段以降低TTFT,Decode 階段的性能(TPOT)可能下降。若選擇提升 TPOT,則會增加 Prefill 請求的等待時間,導致 TTFT 上升。這次華為的兩個型號,採用不同的記憶體容量和記憶體頻寬,應該是採取了PD分離思路,正是為了打破這一矛盾。可以運行DeepSeek滿血版,幾乎成為國內衡量一個AI計算系統的試金石。然而,要放得下671B的參數,僅僅是採取不同版本HBM這一項的成本差異就可達數萬美金。而在網際網路平台企業中,其推薦演算法推理模型所需的記憶體容量也頗為巨大。如果可以在算力、記憶體容量和記憶體頻寬間取得最佳化、取捨與平衡,投入產出比(ROI)就會提高。時代呼喚專業的AI晶片產品經理。事實上,在國內的晶片企業中,真正具備產品經理經理能力的人才非常稀缺。在曾經晶片主要還是由外企壟斷的時代,一家晶片企業的Product  Marketing 或 Product Line Manager是產品線的核心管理崗位,一般是由在總部的極少數人擔任,隨著中國市場的需求和美國出現了一定程度的不同,才有中國大陸人逐步躋身這一崗位。而在中文語境下,“市場經理”常被理解為負責市場傳播(Marcom)或市場推廣(Business Development)的角色。在今天的國內AI晶片企業中,目前仍然是研發崗在定義產品。從DeepSeek的滿血版提出的要求,到FP8資料精度的國產化需求,直至這次P/D分離,隱隱中可以看到模型應用提出需求進而驅動產品定義這一趨勢在中國已然發生。那麼理所應當地,一個具備技術背景、但又對市場應用嫻熟於心、同時又具有平衡取捨之道的產品經理,將成為下一階段定義和推動算力晶片和系統發展的主導力量。這個趨勢,是AI晶片與AI系統專業化、精細化的開端,是產品營運上了新台階的標誌。這個趨勢,是“需求決定供給”這一經濟學規律在AI的中國市場中的再次體現。03. AI產業是戰略高地,AI晶片與AI產業可互相促進正因為此,我們必須旗幟鮮明地說:不能為了發展AI晶片,而拖累放緩了AI產業的發展。AI產業的繁榮與領先,是AI晶片突破與創新的前提。AGI和可控核聚變是人類文明當前面對的兩座生產力高峰。在當前的地緣格局下,大國的競爭圍繞這兩座高峰而展開。而企業之間的競爭,都在力圖確保自己一直能留在牌桌上,不被時代甩在後面。正如在戰爭一樣,不能僅憑著熱血和口號,但使用落後的武器裝備去攻佔戰略高地,我們應該利用一切可以獲得的優勢資源去確保戰爭的勝利。在通訊行業、在電力行業、在大基建行業,正是由於我們市場規模大、終端產業繁榮,一步步倒逼上游的技術突破與產品創新,最終在全行業上下游實現各環節的突破。在AI產業的競爭中,首先要確保在競爭中留在牌桌上、甚至成為其中最為領先的佼佼者。正如這一次次的案例說明、也正如經濟學規律所揭示的一樣,只要AI產業我們處於世界領先水平,其所引領的趨勢、提供的豐富場景和明確需求、以及最重要的資本與人才、行業know-how積累,最終都會推動我們的AI晶片、算力系統取得突破,這只是個時間問題。不過,網路上有句流傳很廣的話:成年人不做選擇,我都要。作為一個超大規模經濟體的中國,在行業豐富度、產業協同度和資本積累程度上,當前基本具備“都要”的實力。也就是說,在市場化經營的情況下,既有著使用世界頂級算力設施去沖頂的基礎與必要性,也有著扶持AI國產算力所需要的資源與意願。努力奮鬥的目的,正是為了可以爭取更多的選擇空間,於個人、於國家,皆如是。經過各領域國人同胞們多年不懈的奮鬥與多方面積累,我們身處產業變革與飛速發展的時代,這是理性者的福音,是魄力者的機遇,更是每一個普通奮鬥者可能的逆襲之路。 (騰訊科技)
騰訊宣佈全面適配中國AI晶片架構!
2025年9月16日,騰訊在深圳舉行的全球數字生態大會上宣佈,其雲服務已全面適配主流國產晶片。這一戰略轉變標誌著中國科技企業在應對全球半導體供應鏈不確定性的過程中,邁出了實質性一步。騰訊集團副總裁、騰訊雲總裁邱躍鵬在會上宣佈:“目前騰訊雲已經全面適配主流的國產晶片,並積極參與和回饋開源社區。”01 戰略轉型背景騰訊此次戰略調整發生在複雜國際背景下。美國對華科技出口管制日益嚴格,限制了高性能AI晶片的對華供應。中國國家市場監督管理總局日前指控輝達違反反壟斷法規,這一消息在騰訊宣佈轉型前24小時發佈,凸顯了地緣政治緊張正在重塑全球科技供應鏈。騰訊雲高級執行副總裁湯道生表示:“市場對晶片的需求是多種多樣的,針對不同的場景會跟不同的晶片廠商有合作。”02 技術實施方案騰訊採用軟硬體協同全端最佳化策略。通過異構計算平台的軟體能力,整合不同類型的晶片對外提供高性價比的AI算力。騰訊推出了面向智能體的運行環境解決方案“Agent Runtime”。其核心元件“雲沙箱”啟動速度最高可達100ms,並能支援數十萬Agent實例同時並行。騰訊內部超過90%工程師已在使用AI程式設計工具CodeBuddy,編碼時間縮短40%以上,新增程式碼中AI生成佔比超過50%。03 國產晶片生態合作騰訊正與多家國內晶片製造商合作,為不同應用場景部署最適合的硬體。雖然未具體說明合作的晶片廠商名稱,但業內專家認為華為昇騰、寒武紀等企業可能包含其中。2025年7月,中國成立了“模型-晶片生態創新聯盟”,匯聚多家半導體和AI企業,推進本土處理器在AI項目中的應用。該聯盟為騰訊等企業的戰略轉型提供了產業支援。04 內部應用成效AI已在騰訊內部業務中取得顯著成效。騰訊元寶AI助手的日活躍使用者數已位居國內前三,當前日均提問量相當於2025年年初一個月的總量。騰訊會議的AI功能使用者量近一年同比增長150%。騰訊電子簽通過“AI智能審查”,將簡單合同稽核時間縮短至1分鐘。05 全球化佈局騰訊在加速國產晶片適配的同時,也在加快國際化佈局。騰訊計畫投入1.5億美元在沙烏地阿拉伯建設其中東首個資料中心,並在日本新建第三個資料中心。過去一年騰訊雲出海業務表現亮眼,海外客戶規模實現翻番。90%以上的中國網際網路企業和95%以上頭部遊戲公司出海時選擇了騰訊雲。騰訊此次全面適配國產晶片的戰略轉變,標誌著中國數字基礎設施自主化處理程序進入新階段。隨著騰訊等頭部企業的引領作用,中國AI晶片產業的技術迭代速度將顯著提升,整個生態系統有望加速成熟。全球科技供應鏈正在經歷深刻重構,中國企業通過加強自主研發與合作,正逐步降低對外部技術的依賴。 (晶片行業)
輝達“圍城”!BAT拋棄輝達,中國AI晶片反擊來了?
9月16日最新消息,在2025騰訊全球生態大會主峰會上,騰訊公佈了多項AI技術與產品的最新進展;針對業界廣泛關注的算力挑戰,騰訊集團副總裁、騰訊雲總裁邱躍鵬表示,騰訊已完成對主流中國國產晶片的全面適配,並持續積極參與和回饋開源社區。而且,根據外媒《The Information》的消息,阿里巴巴與百度已經在人工智慧模型訓練中引入自研晶片,以部分替代輝達的產品。這意味著,中國傳統三大網際網路巨頭——BAT都開始棄輝達晶片,而選擇國產晶片了。其實,阿里的晶片野心由來已久,2018年,阿里收購中天微,並在此基礎上成立“平頭哥”半導體;隨後推出了含光800、玄鐵處理器、倚天710等產品,並在雲端運算與推理加速場景中逐步落地。另外,從年初開始阿里就在小規模模型的訓練中使用自研晶片——"振武"(Zhenwu)處理器。更加讓人振奮的是,據說阿里正內部測試一款由國內晶圓廠代工的新型AI推理晶片,該晶片面向更廣泛的AI推理任務,並保持對輝達生態的相容性。這款晶片之所以引人關注,在於其將不再依賴台積電,而是選擇了國內廠商代工。如果此款晶片順利流片並量產,那將又是國產AI晶片的一大突破。對於百度則深耕AI晶片多年,其崑崙系列晶片一直都在百度雲服務中扮演著不可或缺的作用;此次最新消息是:百度正嘗試用崑崙P800晶片訓練新版文心大模型。但與國產網際網路巨頭截然相反的是,輝達在中國市場的處境並不是那麼一帆順風。最新消息是,國家市場監督總局發佈公告稱:輝達涉嫌違反反壟斷法,已依法進行立案調查。針對輝達違反反壟斷法的主要是針對:輝達2019年收購邁絡思一案啟動進一步調查,理由是初步發現其涉嫌違反當年附加的限制性條件。當年中國批准這項收購案的時候設下五項承諾:不得強制搭售、保障互操作性、堅持開源、公平供應、保護第三方資訊,有效期長達六年。顯然在過去的5年多時間,輝達並未嚴格遵守上述5項承諾;現在一台輝達AI訓練伺服器的標配是:輝達的GPU,邁絡思的高速網路卡和CUDA生態的程式碼。這已經是典型的強制搭售了!當然,當前公佈對輝達的調查落地,其敲打的意味強烈是不言而喻的。同時,輝達還需要應對美國多變的出口管制政策,可以說輝達現在面臨的挑戰著實不小;輝達在中國市場的份額正在大幅下降也已是既成事實。就如輝達CEO黃仁勳在2025年台北國際電腦展上所言:輝達在中國人工智慧市場的份額已從95%降至50%,這是美國實施嚴格出口限制的結果。其實輝達在中國市場面臨的反壟斷壓力並非孤例。目前美國司法部已向輝達發出具有法律約束力的傳票,歐盟正深入調查其捆綁銷售行為,法國監管機構更直指其存在價格操縱與供應限制風險。也就是說,目前全球幾大主要經濟體同時發難輝達;這其實已經不僅是市場和技術壟斷問題,更多的是各國對於未來AI算力主導權的爭奪!因此,對於輝達而言,在中國市場面臨市場競爭和政策監管的雙重壓力,其未來市場或將進一步萎縮;但更重要的是,輝達如何面對洶湧而來的“全球監管”,以及各國對於AI算力主導權的爭奪! (飆叔科技洞察)
中國AI晶片,集體增加存貨
2025年上半年,中國國產AI晶片持續獲得熱捧,多家廠商業績持續高增。在旺盛的AI推理需求支撐下,中國頭部AI晶片廠商左手積累產成品,右手儲備關鍵材料,以應對未來市場發展。21世紀經濟報導記者梳理公司財報發現,總收入規模與海光資訊還有一定差距的寒武紀,在上半年卻與前者的淨利潤規模已經十分接近;海光資訊在上半年相比同業,有較大比例花費用在了銷售上;龍芯中科雖然盈利能力依然面臨壓力,但在市場周期回暖處理程序中,旗下核心產品毛利率表現已經逐漸回歸,近期其攜“三劍客”進入市場,接下來有望看到進一步商用的好消息。當然,中國AI晶片廠商的份額仍有較大提升空間。從沐曦股份披露的回覆問詢公告可見,政策支援對國內市場採用國產AI晶片有一定驅動,但更大程度還是來自於內生競爭力提升和國內開源生態的密切聯動。訂單與存貨“齊飛”從收入規模看,分別有CPU和DCU(GPGPU的一種)業務的海光資訊一直都在穩健增長態勢中。上半年海光資訊實現營業收入54.64億元,同比增長45.21%;歸母淨利潤12.01億元,同比增長40.78%。同時,在旺盛的AI推理需求支撐下,正式擺脫“多年虧損”帽子的寒武紀追趕勢頭猛烈。上半年實現營業收入28.81億元,同比增長4347.82%;歸屬於上市公司股東的淨利潤10.38億元,上年同期為虧損5.3億元,同比增長295.85%。寒武紀無論從總資產還是營收規模都與海光資訊有一定差距,但在淨利潤層面實現了快速接近。寒武紀在公告中提到,淨利潤大幅增長源於營業收入增長,期內公司在持續拓展市場,助力人工智慧應用落地。相比之下,收入規模有限的龍芯中科,盈利能力也在持續改善。公告提到,公司發展的主要矛盾開始從產品研發端轉向市場銷售端,營收開始進入新一輪增長周期。上半年實現營業收入2.44億元,同比增長10.9%;歸母淨利潤為虧損2.94億元,上年同期為虧損2.38億元,同比下降23.53%。其中,傳統優勢的安全應用工控市場恢復增長,上半年8722.93萬元營收已經接近2024年全年水平;資訊化類晶片營收1.15億元,同比增長5.01%,65.45%的毛利率對公司整體盈利能力有拉動作用;公司持續調整收入結構,減少了整機型解決方案銷售。最終實現毛利率42.44%,同比提高12.77個百分點,正逐步恢復到正常水平。頭部AI晶片公司收入快速增長的另一面,是延續了一季度態勢,仍在積極儲備存貨,代表未來訂單兌現空間的合同負債表現同樣強勁。寒武紀在上半年有存貨26.9億元,佔總資產比例31.95%,去年末則佔總資產的26.41%,期內比上年期末增加51.64%。根據披露,主要為本期產成品增加所致。合同負債的增長更為迅猛,期內為5.43億元,佔總資產比例的6.45%,去年末佔總資產比例僅0.01%,財報顯示,這主要因截至期內,公司預收合同款項相比上年期期末增加61223.22%所致。海光資訊有類似表現,公司上半年合同負債大幅增加242.1%至30.91億元,佔總資產比例9.57%,主要為收到客戶預定合同貨款。存貨方面也在提前準備,期內公司有60.13億元存貨,相比去年末增加10.84%,佔總資產的18.62%。拆解來看,存貨中增加最多的為產成品和原材料。國內AI晶片廠商積極增加存貨,均有戰略性發展考慮。根據沐曦股份披露,在一季度公司的原材料構成中,HBM(高頻寬記憶體)和晶圓是整體原材料帳面餘額中佔比最高的細分類目,近兩年來,二者之和幾乎構成了原材料主要來源。尤其截至今年3月末,公司存貨中HBM佔比大幅提升到1.23億元,佔整體原材料的63.73%。沐曦股份在回覆上交所問詢的公告中提到,公司核心原材料晶圓、HBM的採購周期(從下單至交付)平均為6個月左右,採購周期較長且不可避免受到國際供應政策和供應商產能分配的影響,具有一定不確定性,因此提前備貨比例較高。典型如HBM,目前全球技術最前沿的HBM主要由SK海力士、美光和三星供應,三者都為海外供應商,由此提前儲備一定存貨,實則在情理之中。此外,存貨變化還有季節性因素影響。沐曦股份提到,公司在一季度的原材料佔比由7.78%上升至21.64%,主要原因為在2025年一季度集中大量備貨原材料,而2024年期末處於原材料備貨空窗期。應對成長挑戰當然,相比GPU巨頭輝達的絕對領先市場地位,國內AI晶片廠商仍有較高提升空間。目前國內採取了不同技術路線爭奪市場的方式,且開放生態、產業鏈深度協同是其中關鍵。國內AI晶片參與者並非全部擠在GPU賽道,目前與輝達相同路線競爭的主要玩家包括海光資訊、沐曦股份、天數智芯、壁仞科技、摩爾執行緒等;另一個不容忽視的ASIC定製化晶片市場,差異化競爭思路更為明顯,參與者則包括華為海思、寒武紀以及國內科技巨頭生態鏈中企業如崑崙芯、平頭哥等。相比通用計算場景,ASIC晶片可以針對特定AI推理場景進行定製化設計,因此近兩年來愈發受到雲端運算廠商如Meta、亞馬遜等公司青睞,這也是國內ASIC晶片備受關注的原因。目前國內頭部AI晶片廠商的商業化都取得了一定進展。根據Bernstein Research資料,輝達和AMD在2024年中國AI加速晶片市場中分別佔據66%、5%份額;國內企業中,華為海思佔約23%份額,沐曦股份市場份額約為1%。根據IDC資料,2024年中國資料中心加速晶片市場中,出貨量在10000張以上的GPU公司(不含ASIC晶片公司)包括輝達、沐曦股份和天數智芯。寒武紀提到,公司產品持續在營運商、金融、網際網路等多個重點行業規模化部署並通過了客戶嚴苛環境的驗證。海光CPU系列產品相容x86指令集以及國際上主流作業系統和應用軟體,應用於電信、金融、網際網路、教育、交通等行業;海光DCU系列產品可廣泛應用於巨量資料處理、人工智慧、商業計算等應用領域。龍芯中科在上半年更是發佈了備受矚目的3C6000系列產品。根據官方說法,其綜合性能達到2023年市場主流產品水平,對標英特爾公司這一年發佈的第三代至強可擴展架構伺服器晶片。公司將接下來進入市場的重點產品稱為“三劍客”,在公告中提到,將探索基於3C6000系列CPU的儲存伺服器、網路安全裝置、密碼伺服器等專用伺服器市場,探索基於2K3000/3B6000M系列CPU的雲終端、雲筆電等專用終端市場。當然,目前面臨的挑戰依然是顯性的,沐曦股份在回覆問詢函時進行了闡述。例如在採購方面,目前國內網際網路企業採購GPU仍以可售的國際產品為主,國產GPU佔比較低且多數集中於推理場景,訓練場景需要更大規模叢集測試的時間與資源投入,因此國產GPU產品匯入較慢。雖然國產GPU依託通用型架構優勢,具備相容CUDA的理論基礎及路徑可行性,但生態適配、迭代和培育建設是一項長期、複雜的系統性工程。當然對於沐曦股份來說,自身的劣勢在於,目前在網際網路企業客戶開拓及產品匯入方面,相比部分國內友商進度有所滯後。這類廠商在部分推理場景下可能會使用國產算力晶片,但通常也是優先選擇自有產品或者扶持其投資的生態鏈企業。當然,該公司也是國內少數真正實現千卡叢集大規模商業化應用的GPU供應商,並正在研發和推動萬卡叢集的落地,目前已成功支援128B MoE大模型等完成全量預訓練。據介紹,沐曦股份的算力網路覆蓋國家人工智慧公共算力平台、營運商智算平台和商業化智算中心,下游應用領域覆蓋金融、交通、能源、醫療健康、大文娛等行業。公司正在進行功能測試,預計於2025年底進入風險量產的曦雲C600系列,已經與多家頭部網際網路大廠或AI大模型廠商、國家人工智慧公共算力平台、金融、能源、交通等客戶推進接洽交流、產品評測等,頭部伺服器OEM廠商也在積極適配曦雲C600樣片。該系列還增加了對FP8資料格式的支援,尤其是FP8 Tensor及Tensor轉置指令。開放生態加速度要真正推動國產AI晶片生態持續規模發展,開放包容的產業鏈環境尤為重要。近期DeepSeek在官方檔案中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數精度,其是針對即將發佈的下一代國產晶片設計,就是一種明確表態。有國產晶片公司高管就對21世紀經濟報導記者指出,很樂於見到有DeepSeek這類企業,告訴大家那些是趨勢,這可以讓國產晶片廠商有更多機會與模型廠商發揮協同作用。其公司一方面會沿著DeepSeek為代表的精益求精路線,在有限資源範圍內,儘可能多地推進計算實現;另一方面仍然不可忽視OpenAI“大力出奇蹟”的路線。海光資訊則進一步在推動產業鏈整合。公司在公告中提到,隨著智算伺服器從模組化走向高密度整合化,晶片廠商必須與產業鏈上下游深度協同,實現晶片、整機平台全程同步研發,推動“硬體—軟體—生態”系統化協同發展。這側面解釋了其與中科曙光進行業務整合的邏輯所在。為了更大力度投入生態,海光資訊在上半年還產生了大量支出。期內公司銷售費用2.034億元,相比上年同期的0.7116億元,同比增加185.83%;其中增加較多的是市場推廣費,期內為1.106億元,同比增加330.35%。公告中解釋,這源於期內加大了市場推廣力度,快速擴充市場和行銷團隊,同時推進生態建設令相關市場費用同比有大幅增加。此外記者還發現,國內營運商也在大力推動Scale up和Scale out兩條重要技術路線的生態合力,以期更好驅動基於國內AI晶片生態的計算效率提升。國產AI晶片自去年以來突飛猛進的發展,是多年來持續大力投入研發、蓄力的結果。隨著國內AI產業生態以開放姿態共同發力,市場份額層面也將不斷進步。 (21世紀經濟報導)