#崑崙芯
大摩:中國AI GPU縮小與美國的差距(上篇)
大中華區半導體中國AI GPU:不斷縮小與美國的差距高昂的人工智慧資本支出(Capex)和持續的政策支援,催化了中國AI GPU生態系統的發展。在本篇深度研報中,我們引入了一個分析框架,以評估該行業的商業價值、競爭力及整合路徑。AI技術的迅速擴張正推動中國向更高品質的增長模式轉型。去年,我們在藍皮書報告《中國人工智慧:沉睡的巨龍甦醒》(China – AI: The Sleeping Giant Awakens)中,探討了中國AI的發展現狀及其邁向2030年及以後的發展軌跡。在本報告中,我們將聚焦中國AI基礎設施的核心——作為該技術基石的AI晶片——並評估不斷演變的需求前景、晶圓代工供應瓶頸以及塑造該行業的競爭格局。國產AI GPU供應取得重大進展: 在很長一段時間內,中國AI技術的普及並非受制於電力、資料或工程人才,而是受制於美國出口管制下無法獲取先進的AI晶片。中國自2020年起開始研發本土AI GPU,當時獲取海外先進製程技術的管道已十分有限。隨著管控趨嚴,這一窗口在2022年基本關閉,這重塑了(但並未阻斷)中國AI晶片產業的發展處理程序。過去12個月裡,中國在緩解裝置和晶圓代工瓶頸方面取得了有意義的進展。在政策支援下,我們預計到2028年左右,國內的晶圓代工產能和晶片供應將足以滿足國家的核心主權需求。從政策支援邁向商業化可行: 政策支援可以加速產業的早期發展,但長期價值取決於商業競爭力。中國AI GPU供應商必須展現出極具吸引力的經濟效益,才能在2028年之後維持增長。我們的分析表明,在較低的晶片價格、更廉價的電力成本以及不斷完善的基礎設施支撐下,中國AI資料中心的總擁有成本(TCO)有望具備競爭力。對於推理工作負載(inference workloads)而言,單位Token的成本比峰值性能更為重要,這進一步強化了國產替代方案的競爭力。行業與個股影響: 中國的國產化戰略——即通過擴大晶片、晶圓廠和裝置的規模來彌補製程上的劣勢——正持續見效。在樂觀情形(bull case)下,我們假設國產GPU將擴展至訓練工作負載領域,並可能獲得海外採用;在悲觀情形(bear case)下,我們假設產品差異化減弱,從而導致商品化(同質化)和行業整合。雖然我們不對AI GPU個股做出直接評級,但我們對中國AI半導體供應鏈保持建設性(樂觀)態度,包括中芯國際(晶圓代工)、北方華創(裝置)和 ASMPT(先進封裝),並看好AI晶片投資有助於鞏固其戰略地位的中國網際網路平台。關於後者的更多細節,請參閱 Gary Yu 撰寫的中國網際網路報告。關於中國AI GPU的六大核心圖表中國AI GPU:建構本土化的AI計算生態系統致首席資訊官(CIO)的資訊: 中國正通過系統級創新和以成本驅動的推理經濟性(inference economics),迅速縮小與美國在AI算力領域的差距。這一發展軌跡有望使國產AI GPU的自給率達到約76%,並在未來十年內對全球AI半導體的競爭格局產生深遠的重塑作用。致首席執行長(CEO)的資訊: 儘管美國晶片製造商在矽晶圓前沿技術上仍保持領先地位,但中國正加速轉向成本更低、針對推理最佳化的國產AI晶片。這將對全球AI的經濟性帶來中期的競爭壓力,而非在短期內實現技術層面的並駕齊驅。AI技術的快速擴張正推動中國向高品質經濟模式轉型。在去年的藍皮書報告《中國人工智慧:沉睡的巨龍甦醒》(China – AI: The Sleeping Giant Awakens)中,我們探討了中國AI的發展現狀及其邁向2030年及以後的發展軌跡。在本報告中,我們再次回歸AI主題,重點剖析中國AI基礎設施的基石——即支撐該技術的AI晶片——並對需求前景、晶圓代工供應以及競爭格局進行評估。我們分析了中國AI GPU的關鍵需求驅動因素及國內供應鏈的商業可行性,同時評估了本土生產晶片的性能與潛在商業價值。此外,我們還考察了中國全境與AI相關的資本支出(Capex)規模、本土晶圓代工供應的動態,以及塑造該行業的政策支援力度。最後,我們引入了一個框架,用於評估國產AI GPU晶片(即輝達的本土替代方案)的商業價值,並為投資者梳理了如何在長期內評估該行業及相關個股標的的路徑。行業展望:需求強勁、供給改善及同質化風險上升受制於晶圓代工產能的瓶頸,中國AI GPU在2026年和2027年的營收仍將維持“供給主導”的格局。在雲服務提供商(CSP)強勁的商業需求以及不斷增長的主權和政府主導的AI投資支撐下,該市場已進入高速增長階段。基於雲端資本支出(Capex)趨勢及隱含的AI半導體消耗量,我們預計2026年中國AI GPU的總潛在市場規模(TAM)約為500億美元,到2030年將增長至約670億美元。隨著國內晶圓廠產能的擴張和本土裝置能力的提升,國產AI GPU的供應正在快速追趕。我們預計到2027年,本土供應規模有望達到約300億美元,足以覆蓋中國算力總需求的一半以上。鑑於產能限制依然存在,我們預計到2027年之前,該市場將在很大程度上維持供給驅動的特徵。中國的基礎設施優勢縮小了表面上的技術差距在我們的基準情形(base case)下,輝達(NVIDIA)在大規模AI預訓練領域繼續佔據主導地位。中國主要的雲服務提供商處理預訓練工作負載時,依然依賴部署在海外資料中心的輝達伺服器機架。相比之下,國產AI GPU在中國國內的推理工作負載(inference workloads)中正獲得越來越高的市場認可度,因為在這些應用場景中,更低的延遲、資料本地化要求以及成本效益顯得更為重要。中國AI GPU能否充分縮小性能差距以勝任預訓練任務——並最終在出口市場贏得客戶——仍是一個關鍵的長期議題。我們的分析表明,儘管中國在晶片層面仍略落後於美國,但在系統硬體層面已具備廣泛競爭力,並在基礎設施和政策層面擁有優勢。因此,國產AI GPU在推理工作負載方面已經具備競爭力。需要強調的是,僅基於製程節點(process node)的比較會誇大實際的性能差距。當以“每瓦特每美元性能(performance per watt per dollar)”為基準進行評估時,這種差距會大幅縮小,特別是考慮到中國相對較低的利潤率要求和較低的能源成本。這種成本優勢顯著提升了國產替代方案的商業可行性。我們在下文中提供了一個基於此背景的輝達與沐曦(MetaX)GPU的對比案例研究。為了評估這一不斷演變的行業格局,我們引入了一個聚焦於中國AI GPU生態系統商業價值的分析框架。該市場目前有超過10家上市及非上市供應商,涵蓋獨立第三方供應商、內部專屬設計公司(captive design houses)以及國資背景企業。我們對中美AI計算生態系統進行了對比,並從設計能力、系統級性能、晶圓代工產能獲取、戰略合作夥伴關係、政府支援及商業戰略等維度對各供應商進行了評估。我們還應用了我們的全球AI半導體估值框架,為市值、晶圓代工產能隱含營收以及估值倍數提供了參考基準(圖表59)。關於百度崑崙和阿里平頭哥等內部專屬設計公司如何為母公司估值貢獻增量,請參閱我們的中國網際網路分析師 Gary Yu 的相關報告(連結)。聚焦商業價值分析近期的行業動態凸顯了中國AI GPU格局演變的迅速程度,並印證了為何商業價值與技術能力同等重要。幾家領先的中國網際網路平台正在轉向定製化或“合規(within spec)”的推理晶片,這些晶片通常通過設計服務模式並在海外先進的晶圓代工節點上生產。例如,據路透社報導,字節跳動正通過中國設計服務公司芯原股份(VeriSilicon),利用三星的4奈米製程生產其AI推理ASIC晶片。儘管這些解決方案通常針對偏低端的推理工作負載,但仍加劇了獨立GPU供應商面臨的競爭壓力。與此同時,政策訊號表明,可能會允許少量進口輝達的H200晶片,同時可能要求配套支援國產替代方案。這種做法強化了“雙軌制”戰略,而非實施全面替代。同步地,中國主要的大語言模型(LLM)供應商已開始提高Token價格,這改善了AI工作負載的商業化變現能力,並對整個生態系統中AI GPU的長期商業經濟效益形成了支撐。展望未來,行業結構引發了對產品同質化(commoditization)風險的擔憂。包括雲服務提供商和電信營運商在內的大客戶有強烈的動機去扶持至少一家具有國資背景的GPU供應商(如華為),而領先的CSP同時也支援自身內部的或關聯的設計公司(如百度崑崙、阿里平頭哥)。這種動態擠壓了獨立第三方供應商的潛在市場空間,並增加了其規模化發展的難度。隨著晶圓代工產能可能從2027年起擴張,加上AI GPU設計日益成熟,產品的差異化將變得更加困難。因此,我們認為隨著時間的推移,行業利潤率存在下降的風險,且未來兩到三年內行業整合的可能性日益增加。關於中國AI GPU類股的核心爭議上述結論建立在三個相互關聯的核心爭議之上,這些爭議塑造了中國AI GPU生態系統的未來前景。在接下來的部分中,我們將詳細探討這些爭議,以揭示中國AI GPU市場的發展脈絡、國產替代方案在那些領域已具備競爭力,以及那些結構性制約因素依然存在。核心爭議 #1:中國能否大規模供應具備競爭力的AI GPU?第一個爭議聚焦於供給端——即中國能否生產出具備足夠競爭力且能實現規模化量產的AI GPU。中國受益於系統級的工程優勢、基礎設施的快速鋪建以及強有力的政策支援,但在先進晶片設計和前沿製造工藝方面仍面臨挑戰。我們將評估這些優勢與限制因素如何相互交織,本土供需如何演變,以及這將如何影響國產AI GPU的長期競爭力。核心爭議 #2:需求端:中國AI GPU市場的潛在規模有多大?該爭議聚焦於需求端。中國AI GPU市場反映了雙重需求:一是由雲服務提供商和AI應用主導的商業化普及需求,二是與主權戰略優先順序掛鉤的政策驅動需求。我們分析了這些驅動因素的相對權重、政策持續支援國產AI晶片的底層邏輯,以及它們如何轉化為實際的市場規模。通過對本土AI晶片需求的情景分析(基於Gary Yu的預測),我們估算了中國AI GPU市場的潛在規模和增長軌跡。核心爭議 #3:如何評估中國AI GPU的商業價值?該爭議從估值和投資的視角審視該行業。中國AI GPU生態系統包括獨立供應商、國資背景企業,以及隸屬於大型網際網路平台的內部設計公司。我們將這些企業置於全球AI GPU和ASIC的背景下進行定位,勾勒出評估相對市場地位的定性標準,並應用統一的估值框架以幫助投資者權衡整個類股的投資機遇與風險。類股估值——高經營槓桿下的高市銷率(P/S)倍數儘管收入基數小得多且處於盈利的更早期階段,中國AI半導體設計公司的市銷率(P/S)倍數仍顯著高於全球可比同業。寒武紀(688256.SS,未覆蓋): 目前其2026年預期市銷率(P/S)約為32倍,市盈率(P/E)約為96倍;相比之下,其2026年晶圓代工產能隱含營收約為22億美元,市場一致預期營收約為21億美元。儘管其銷售倍數低於部分國內同行,但在經過增長調整後,相對於輝達仍享有明顯的估值溢價,這反映了市場對國內AI市場快速實現國產替代的預期。海光資訊(688041.SS,未覆蓋): 其2026年預期P/S約為94倍,P/E約為1118倍,隱含晶圓代工產能營收約為9億美元。這表明在本土化供應鏈結構下,市場對其捕獲CPU/GPU相關周邊需求抱有極高的期望。沐曦(MetaX,688802.SS,未覆蓋)與摩爾線程(Moore Threads,688795.SS,未覆蓋): 兩者的2026年預期P/S分別約為60倍和139倍,而隱含營收分別僅為約5億美元和3億美元,且尚未實現實質性盈利。在香港上市的壁仞科技(Biren,6082.HK,未覆蓋)和天數智芯(Iluvatar CoreX,9903.HK,未覆蓋): 其2026年預期P/S分別約為37倍和62倍,同樣基於較為有限的隱含營收(約2億至3億美元)。(估算來源請參見圖表11。)類股估值——非上市企業我們綜合使用定性評分卡和定量指標(包括營收規模、市場份額和晶片性能),來評估中國非上市AI GPU供應商的潛在市值。1. 崑崙芯 (Kunlunxin)崑崙芯已將銷售擴展至外部客戶,如中國移動、騰訊及其他的國有企業(SOEs)。我們預估其2025年營收為60億元人民幣(約50%來自外部),並預計在近期新GPU發佈的支撐下,2026年營收將在70億至130億元人民幣之間,代表其在國內GPU行業中佔據高單位數百分比的市場份額(相比之下,華為佔63%,寒武紀佔11%,平頭哥佔高單位數百分比)。我們對崑崙芯的估值為200億至610億美元:提議的分拆與上市是管理層釋放股東價值計畫的一部分,但隨著近期AI晶片的首次公開募股(IPOs),近期的市場情緒有所走強。基於2026年預期市銷率(P/S)20至33倍(較A股上市的寒武紀有0%至40%的折價),我們對崑崙芯的估值為200億至610億美元,假設控股公司(holdco)折價30%,這轉化為百度(BIDU)約60%股權的價值為80億至260億美元。將百度的中端分類加總(SOTP)估值修訂為215美元(原為220美元);高端估值為330美元:我們的215美元中端SOTP估值,將崑崙芯估值為45美元/股(26倍 企業價值/銷售額(EV/S)),AI雲基礎設施(不含崑崙芯)估值為45美元/股(5倍 EV/S),行銷業務估值為44美元/股(6倍 企業價值/息稅前利潤(EV/EBIT));我們330美元的高端SOTP估值,將崑崙芯估值為73美元/股(33倍 EV/S),AI雲基礎設施(不含崑崙芯)估值為62美元/股(7倍 EV/S),文心大模型(Ernie LLM)估值為38美元/股(30倍 EV/S),行銷業務估值為54美元/股(7倍 EV/EBIT)。2. 平頭哥 (T-Head)我們預估其2026年營收為140億至260億元人民幣,其中約一半來自AI GPU晶片,其餘來自CPU。我們預計平頭哥將在2026年至2030年間躋身國內第一梯隊GPU供應商,佔據高單位數百分比的市場份額(與崑崙芯類似),相比之下,華為為63%,寒武紀為11%。我們對平頭哥的估值為280億至860億美元:鑑於平頭哥一直以來保持低調、公開披露有限,且長期專注於內部供應,此次潛在的分拆令人感到意外。我們預計分拆後外部銷售將會加速增長。在需求端和供給端,支援依然強勁:阿里雲繼續驅動龐大的訓練與推理需求,並不斷增加產能供應。基於20至33倍的市銷率(P/S)(較寒武紀有0%至40%的折價),並應用於140億至260億元人民幣的營收區間(CPU + GPU),我們得出了280億至860億美元的估值區間。假設控股公司(holdco)折價30%,這轉化為阿里巴巴(BABA)分類加總(SOTP)估值中的12至36美元/股。我們對關鍵行業風險的情景分析我們概述了中國國內AI晶片市場的三個情景,這些情景由出口管制、國內製造的進展以及替代激勵機制之間的相互作用所驅動。基準情形——在持續受限下取得漸進式進展 先進AI晶片的海外流片(tape out)依然受限,限制了獲取前沿晶圓代工服務的管道。中芯國際繼續擴張國內產能,但在美國出口管制下,獲取關鍵晶圓製造裝置的管道受限,制約了先進製程節點的進展。輝達H200對中國的出口依然有限,無論是因為美國法規,還是中國方面的採購和政策考量。在此背景下,政府對國內計算基礎設施的持續支援推動了對本土生產的AI加速器的需求,並在性能差距持續存在的情況下,支撐了國內供應商的銷量增長。樂觀情形——國內能力加速提升與替代加速 國內AI晶片供應狀況實質性改善。通過替代性安排,或中芯國際在良率和製程穩定性上取得有意義的突破,獲取前沿晶圓代工服務(如台積電或三星)的管道得到改善;同時,本土裝置供應商的進展緩解了關鍵的製造瓶頸。對美國先進AI加速器出口的持續限制強化了對國產解決方案的需求,並促使生態系統在設計、製造和系統整合方面更快地走向成熟。悲觀情形——國內供應疲軟與替代壓力減輕 對晶圓製造裝置的限制進一步收緊,實質性地制約了先進製程節點的產能擴張,並推遲了製程改進。與此同時,對輝達H200的出口管制放鬆,或中國重新獲得更先進AI加速器的管道,從而降低了國產替代的緊迫性。對EDA(電子設計自動化)工具的額外限制制約了本土設計公司的架構升級,並進一步削弱了國產AI加速器產品的競爭力。關鍵爭議#1:中國能否大規模供應具備競爭力的AI GPU?市場觀點: 在比較中美AI晶片時,全球投資者往往只關注晶圓工藝——例如,台積電4奈米的輝達GPU與中芯國際12奈米的沐曦(MetaX)GPU的對比。基於此,他們通常得出結論,認為中國的AI晶片無法與之競爭。我們的觀點: “每瓦每美元性能”的評估框架顯著縮小了這一差距,特別是因為能耗(瓦特)因素在中國的權重較低。在我們對沐曦與輝達的案例研究中,按每瓦每美元性能衡量,沐曦C600的表現與輝達A100相當。隨著沐曦推出C700,我們認為它能夠在AI推理領域與輝達的H200相抗衡。然而,從長遠來看,我們認為市場對中國在某些裝置瓶頸上取得突破的預期過於樂觀。例如,我們認為在未來五年內,中國晶圓廠將繼續依賴阿斯麥(ASML)的DUV光刻機進行多重曝光(multiple patterning),這與部分市場預期(即中國能夠研發自有光刻裝置)截然相反。需監測的指標: 1)先進製程節點的晶圓月產能(wpm)及良率提升情況;2)叢集規模的穩定性改善;3)本土軟體及類CUDA生態系統的進展。我們可能出錯的地方(潛在風險): 1)良率提升進展慢於預期;2)裝置瓶頸持續的時間更長;3)軟體生態系統的規模化擴展比最初預期的更為複雜。大規模晶片製造面臨的障礙為了評估中國能否大規模供應具備競爭力的AI GPU並切實滿足市場需求,我們從AI半導體價值鏈的供給側——特別是晶圓代工產能——開始分析。在這一層面上,規模擴張不僅取決於名義產能的增加,還取決於關鍵上游要素的可用性與成熟度。因此,一系列供應瓶頸繼續影響著整個AI GPU價值鏈的最終產出。這些限制在晶圓前道裝置(WFE)和電子設計自動化(EDA)領域表現得最為明顯。在中芯國際產能擴張的背景下,幾個關鍵的半導體裝置瓶頸——例如外延裝置——目前已基本能由北方華創(Naura)、中微公司(AMEC)和新凱來(SiCarrier)等本土WFE供應商解決。然而,我們看到在光刻和檢測工具方面仍存在持續的限制。在光刻機方面,中國在2025年進口了大量阿斯麥(ASML)DUV系統,以防範未來潛在的限制。同時,我們的行業調研表明,中芯國際先進製程晶圓廠(特別是中芯南方)在科磊(KLA)檢測和量測工具方面的受限,推高了裝置利用率並導致檢測步驟減少,晶圓廠僅能專注於最關鍵的層級。雖然這種方法保障了產能產出(吞吐量),但可能以犧牲良率為代價,這進一步凸顯了國內先進製程製造所面臨的結構性挑戰。EDA是中國擴大先進製程產能的另一個關鍵制約因素。2025年,中國最大的EDA供應商華大九天(Empyrean Technology)按營收計算僅佔全球約1-2%的市場份額。迄今為止,華大九天尚未提供全流程數字IC EDA套件,更不用說支援先進製程節點GPU設計的工具了。相比之下,楷登電子(Cadence)、新思科技(Synopsys)和西門子EDA(Siemens EDA)在2025年合計佔據了全球80%以上的市場份額。美國政府對華實施了嚴格的EDA軟體出口管制,特別針對全環繞柵極(GAA)電晶體架構所需的工具。這些限制旨在阻礙中國開發先進的3奈米和2奈米晶片,而這些晶片對於高性能計算和AI至關重要。如果本土EDA能力無法迎頭趕上,且現行出口管制維持不變,本土AI晶片設計公司將很難向3奈米和2奈米節點遷移。中芯國際的擴張轉移了——但並未消除——晶片供應瓶頸儘管晶圓前道裝置(WFE)的限制構成了中國先進製程雄心的上游制約因素,但其下游影響日益顯現在晶圓代工層面。工具可用性、工藝成熟度以及產能吞吐量的侷限,實際上已將中國的先進製程產能集中於一家佔據主導地位的供應商。這種動態將供應瓶頸從裝置獲取轉移到了晶圓代工的執行與產能分配上。因此,中芯國際(SMIC)已成為擴大本土AI GPU生產規模的實質性“咽喉”所在。根據我們的行業調研,幾家本土AI晶片供應商已將製造環節遷回中國大陸,試圖在本土先進製程節點(如N+2的7奈米和N+1的12奈米)上流片AI加速器,以利用本土產能並緩解外部限制。目前,中國的先進製程產能仍高度集中在中芯南方,該公司已通過使用DUV光刻機進行多重曝光,將工藝技術延伸至N+2,並有可能延伸至N+3(約5奈米)。我們預計,中芯國際的N+2晶圓月產能(wpm)在2025年約為2.2萬片,2026年(預期)約為4萬片,2027年(預期)約為5.1萬片。然而,考慮到同樣嚴重依賴N+2級節點的智慧型手機和汽車SoC(系統級晶片)的持續需求,我們預計這些產能不會完全分配給本土AI處理器的生產。面對這些制約因素,一些AI GPU供應商選擇在N+1節點上製造加速器。我們認為,這一選擇反映了在產能可用性、流片成功率、製造穩定性以及成本控制方面所做出的務實妥協。相較於更先進的節點,N+1提供了更好的良率特徵和更成熟的供應鏈,從而在工藝受限的情況下仍能實現量產。然而,基於N+1節點的產品在計算密度和能效方面仍處於結構性劣勢,使其更適合AI推理及其他對功耗和成本敏感的工作負載,而非大規模訓練。應對晶圓工藝制約的戰略性舉措如上所述,中芯國際的產能擴張只能部分緩解中國的晶圓工藝瓶頸。在獲取先進製程節點受到結構性制約的情況下,本土AI晶片供應商和雲服務提供商(CSP)日益將焦點從直接縮小工藝差距,轉向通過系統級和架構層面的戰略來彌補單裸片(per die)性能較弱的劣勢。儘管中芯國際在N+2節點上取得了實質性進展,但與在4奈米或3奈米節點上製造的海外加速器相比,國產AI加速器在計算性能和能效方面仍處於結構性劣勢。我們認為,即使7奈米工藝得到廣泛應用,也無法在晶圓層面完全消除這一差距。鑑於能源供應在中國並不構成硬性約束,戰略重心已轉向提高絕對計算密度和系統級性能,而非每瓦能效。我們將中國AI晶片供應商和CSP當前的主流應對策略歸納為三大類:1)“如果單個計算裸片不夠強大,就把更多裸片封裝進同一塊晶片中。”由於製造技術和晶片設計的侷限性,國產AI加速器的計算能力仍大幅低於輝達及部分海外ASIC解決方案。在某些情況下,隨著獲取海外先進製程節點的管道受限,計算性能甚至出現了下降。例如,據報導,昇騰(Ascend)950PR的計算性能比其上一代產品910C低約38%。在此背景下,供應商採用了先進封裝和多裸片配置,以在單個封裝內擴展算力。這種方法在不需要獲取更先進製程節點的情況下,部分抵消了單裸片性能較弱的問題。雖然它未能完全消除與海外領先產品的差距,但已切實提升了絕對計算性能。2)“如果單塊晶片不夠強大,就建構更大的機架和叢集。”在系統層面,我們觀察到本土AI晶片供應商和CSP正越來越多地採用縱向擴展(scale-up)架構,這從輝達的NVL72設計中汲取了靈感。傳統的AI伺服器配置通常在每台伺服器中部署4或8個加速器,多節點擴展嚴重依賴伺服器間的網路連線,這可能會引入通訊瓶頸。NVL72標誌著一種轉變,即在單一系統內實現72個加速器的全互聯(all-to-all interconnect),從而顯著提升了GPU到GPU的頻寬和機架級性能。中國企業正在推行類似的縱向擴展戰略,包括華為的CloudMatrix 384、阿里巴巴基於PPU的機架解決方案,以及字節跳動的單機架256加速器設計,旨在克服單晶片的侷限性,提升機架級性能。3)“如果一家晶圓廠產能不足,就擴大製造產能。”第三項應對策略的核心是在現有工藝制約下擴大產能。中國的先進邏輯晶圓代工廠繼續進行激進的投資。中芯國際在2023年、2024年和2025年的資本支出分別達到了約75億美元、73億美元和81億美元,佔其營收的比例大幅提升。在2025年下半年,中國還加速了DUV光刻裝置的採購,從荷蘭的進口量同比急劇上升。我們認為,這些裝置的交付支撐了中期內先進製程產能的擴張,但不太可能消除與海外晶圓廠之間根本的工藝差距。網路與機架級設計彌補了晶圓工藝制約 即便在7奈米工藝上取得了進展,中國在晶圓層面縮小AI算力差距的能力依然受到結構性制約。因此,性能差異化的焦點已日益從單晶片算力轉向系統級架構,特別是網路互聯和機架級設計。面對晶圓工藝的制約,中國在系統級設計方面取得了切實的進展,特別是在光網路和伺服器機架架構方面。在去年的上海世界人工智慧大會(WAIC)(參見我們的報告《上海WAIC主要啟示》)上,我們觀察到了華為昇騰(Ascend)CloudMatrix 384的原型機,它展示了國內企業如何通過激進的縱向擴展(scale-up)和光互聯設計,來彌補單晶片算力較弱的問題。展望未來,在下一代昇騰平台(Atlas 950)中,華為聲稱其SuperPod架構最高可擴展至8,192顆晶片。在處理器層面,昇騰950PR和升級後的950DT預計將實現高達2TB/s的AI處理器間互聯頻寬,紙面資料超過了輝達NVLink第五代(Gen5)1.8TB/s的規格。單從原始規格來看,華為的互聯頻寬目前已超越NVLink Gen5。更均衡的算網配比(compute to networking ratios)。 我們觀察到海外AI晶片(例如輝達的Blackwell系列)的原始算力出現了急劇增長,但網路性能並未實現相應的階躍式提升。我們認為,這種分化很大程度上受制於電互連的物理極限,而光互連雖然前景廣闊,但尚未在大規模應用中證明具備足夠的穩定性。因此,在實際部署中,基於輝達的最先進系統可能會面臨算力未被充分利用的時期,空閒周期正日益成為軟體和調度層面的挑戰,而非純粹的硬體制約。相比之下,國內AI平台在網路能力方面實現了快速提升。雖然絕對計算性能仍落後於全球前沿水平,但從算網配比的角度來看,系統配置顯得更為均衡。在橫向擴展(scale-out)和以推理為主的重度部署場景中,儘管單晶片性能較弱,這種均衡性可能會減少系統層面的結構性低效。核心爭議 #2:需求端:中國AI GPU市場的潛在規模有多大?市場觀點:市場共識預期,領先的雲服務提供商(CSP,如阿里巴巴、騰訊、字節跳動)將繼續增加與AI相關的資本支出(Capex),以支援模型訓練和推理部署。在這一觀點下,政府的政策支援是本土AI GPU普及的主要驅動力。我們的觀點:我們採用情景分析法,將圍繞供需和地緣的風險納入對中國AI GPU市場的預測中。我們預計,到2030年總潛在市場規模將達到670億美元,其增長更多由推理而非訓練驅動,並將佔到屆時雲端總資本支出的約51%。我們預計國產AI晶片營收將從2024年的60億美元增長至2030年的510億美元(復合年增長率達42%),自給率將從33%提升至76%。除了政策支援外,我們認為本土AI晶片的商業價值是更為持久和可持續的需求驅動力。需要監測的指標:1) CSP雲端資本支出增長;2) 月度Token吞吐量增長;3) 國產AI晶片的平均售價(ASP)趨勢及分配訊號。我們可能判斷有誤之處:1) 地緣政治降溫使得獲取美國先進GPU的管道得以改善;2) AI商業化變現表現不及預期,導致資本支出增長慢於預期。中國AI晶片需求要評估中國AI GPU需求的持久性與規模,區分其潛在驅動因素至關重要。在我們看來,對國產AI晶片的需求取決於兩股力量:一是對技術自立自強的結構性推動;二是在消費者和企業端應用場景中,AI部署所帶來的日益重要的商業回報。應對美國晶片限制的自立自強。 中國將AI視為事關國家與經濟安全的戰略性領域。。。這段不展開了。如下圖所示,中國本土的AI晶片設計公司與先進製程晶圓代工供應商形成了一種共生關係。一方面,國產AI加速器供應商需要獲取產能並實現製程節點迭代,因為AI晶片通常需要經歷兩到三代製程的演進才能達到具備競爭力的性能。另一方面,本土先進製程晶圓代廠需要錨定客戶(anchor customers)及規模效應,以支撐其持續的投資。商業回報作為中國AI晶片市場的第二大主要驅動力。 儘管自立自強催化了早期的投資,但持續的AI相關資本支出最終需要可證明的商業回報,尤其是隨著支出規模的擴大以及利用率成為核心制約因素。因此,中國的AI發展路徑日益強調具有成本效益的創新以及能夠帶來可衡量商業回報的應用。中國主要的科技公司正步入正軌,有望在2026年將與AI相關的資本支出同比增長38%,達到5970億元人民幣,這反映了在廣告、消費者端(2C)及企業端(2B)應用場景中已被證明的商業化變現潛力。在我們看來,消費者端和企業端應用中由AI驅動的提升所帶來的總回報可能是巨大的。在扣除折舊、電力和伺服器租賃成本後,預計到2028年有望實現盈虧平衡,到2030年利潤率可能達到約50%(更多細節請見此處)。在政策支援與商業回報改善的雙重驅動下,中國AI GPU的需求集中在少數大型買家群體手中,其資本支出(Capex)決策最終決定了可觸達市場的規模。第一類群體由中國的雲服務提供商(CSP)構成——包括字節跳動、阿里巴巴和騰訊——這些企業採購AI晶片,既用於訓練自身專有模型並運行推理,也用於為外部雲客戶部署AI基礎設施。第二類群體包括中國的電信營運商、國有企業及地方政府——即所謂的“主權AI買家”——其需求主要由國家AI基礎設施建設、資料主權以及公共部門的應用驅動。AI初創企業(如DeepSeek、MiniMax)及汽車整車廠(如小鵬、小米)同樣採購AI晶片,儘管目前的採購量仍低於前兩類群體。我們預測,到2030年,中國AI晶片的總潛在市場規模(TAM)將達到670億美元,這意味著2024至2030年間的復合年增長率(CAGR)將達到23%。我們的估算基於主要CSP、電信營運商、政府與國企買家以及其他AI相關企業的雲端運算資本支出總額。我們預計,到2030年,中國雲端運算資本支出總額將達到1300億美元,其中AI GPU將佔據670億美元,約佔雲端運算總資本支出的51%。我們的預測基於以下幾項假設:1. CSP海外資料中心佔比下降。我們估計,2025年中國CSP雲端運算資本支出中約有40%投向了海外資料中心,用於大語言模型的預訓練,這反映了國內獲取先進GPU受限的現狀。我們預計,從2026年(預期)起,在本土AI晶片性能提升與供應增加,以及算力需求向推理端轉移的共同推動下,這一比例將降至30%左右。2. 伺服器支出佔比保持在雲端運算總資本支出的90%左右。3. AI加速伺服器佔伺服器總量的比例,將從2025年(預期)的75%上升至2030年(預期)的85%。4. AI加速器元件價值佔AI加速伺服器總價值的80%。基於上述假設,我們預測中國AI晶片的總潛在市場規模(TAM)將從2024年的190億美元增長至2030年的670億美元,2024至2030年間的復合年增長率(CAGR)將達到23%。本土化勢將支撐需求隨著中國AI GPU市場規模不斷擴大,關鍵問題不僅在於需求能變得多大,還在於這些需求最終流向何方。我們認為,持續的地緣政治風險將AI晶片需求鎖定在本土,使本土化成為中國AI GPU市場的結構性特徵,而非對出口管制的暫時性應對。減少對美國技術的依賴: 儘管在單晶片層面,中國的AI晶片仍落後美國約1.5至2代,但系統級性能差距正在持續縮小,這進一步強化了AI基礎設施部署本土化的動力。我們預計,在未來四年內,受晶片封裝(中國本土的2.5D和3D封裝)、架構縱向擴展(光網路)以及軟硬體協同最佳化的驅動,而非單純依靠工藝節點微縮,這一差距將縮小至約1代。中國還在減少供華晶片對台積電(TSMC)的依賴,轉而採用中芯國際(SMIC)的N+2和N+3節點,以及三星部分符合規格的設計。儘管在韓國儲存晶片(HBM)、歐洲光刻裝置(DUV)以及美國檢測裝置(KLA明場檢測)等方面仍存在一定的依賴,但我們最新的行業調研表明,本土在其中一些領域正在取得進展。在大多數地區,商業和主權買家對AI晶片的需求,既可以通過美國供應商滿足,也可以通過台積電代工的定製設計來滿足。然而,自2023年10月以來,美國工業和安全域(BIS)的規定限制了美國供應商向中國出售晶片技術的發展水平。這些限制包括對14奈米FinFET裝置、3奈米GAA EDA工具的限制,以及對性能密度和總性能等性能指標的限制。美國當局在2025年初進一步收緊了這些管制。來自外國晶片供應商的激烈競爭意味著,中國需要政策支援以推動本土AI GPU的發展。本土晶圓廠也需要具備競爭力的AI晶片供應商來實現規模化、提高良率並降低成本。因此,在規模擴張階段,政府的支援錨定了供應的形成與國內需求,包括鼓勵本土化應用,以及協調如中芯國際7奈米生產等稀缺的先進製程產能。基準情形綜合我們的供需分析,我們勾勒出中國AI晶片自給率的基準情形發展軌跡。我們預計中國的AI晶片自給率將從2024年的33%上升至2030年(預期)的76%。我們預計先進製程產能的擴張和晶片性能的持續提升將推動本土AI晶片營收的增長。我們的核心假設如下:先進製程產能顯著擴張。 在強勁的資本支出投資以及矽鍺(SiGe)外延等本土裝置技術突破的支撐下,我們預計中國的先進製程晶圓月產能(wpm)將從2025年的8千片增至2028年的4.2萬片,並於2030年達到5萬片。生產良率顯著提升。 在更優質的檢測工具和不斷積累的操作經驗驅動下,我們預計中國AI晶片的生產良率將從2025年的約20%提升至2030年的約50%。產能分配依然由政策驅動。由於先進製程產能具備稀缺性,其分配很大程度上由政府機構決定。我們認為華為獲得的分配額度最高,其次是寒武紀(Cambricon)和海光(Hygon),而二線和三線AI晶片設計公司各自獲得的產能可能不到總產能的10%。海外晶圓廠供應“合規(within spec)”晶片。 我們預計三星等海外晶圓廠將為崑崙芯和字節跳動等本土設計公司流片符合規格要求的AI晶片。基於這些假設,我們預計中國本土AI晶片營收將從2024年的60億美元增至2030年(預期)的510億美元,2024至2030年的復合年增長率(CAGR)達到42%,同時我們預計AI晶片自給率將從2024年的33%提升至2030年(預期)的76%。我們在出口管制、本土製造進展以及替代激勵機制的相互作用驅動下,概述了中國本土AI晶片前景面臨的三種情景。關鍵爭議#3:我們該如何評估中國AI GPU的商業價值?市場觀點: 市場共識將政策驅動的替代視為本土AI GPU應用的主要驅動力。在這種觀點下,供應商的估值通常錨定於從輝達手中奪取市場份額的假設,以及對市場結構分散化的預期。我們的觀點: 我們認為,AI晶片的商業價值最終將決定各家供應商的長期營收和市值。儘管政府支援和雲服務提供商(CSP)的內部自研戰略依然重要,但我們預計市場領導地位將由產品競爭力和執行力來塑造。因此,我們結合定性因素(包括晶圓代工獲取能力、客戶關係、政策支援和技術方向)以及定量指標(如TPS(每秒生成Token數)、每瓦性能和每瓦每美元性能)來評估供應商。我們還密切監控不斷湧現的新發佈的晶片規格。隨著時間的推移,我們預計中國AI GPU市場將趨於整合,隨著產品差異化縮小和規模經濟佔據主導,利潤率壓力將會增加。需監測的指標: 1)新晶片規格;2)向主要客戶(如CSP)的出貨量爬坡情況;3)平均售價(ASP)趨勢及毛利率軌跡。我們可能出錯的地方(潛在風險): 1)本土AI GPU供應商未能獲得先進製程晶圓代工廠的產能;2)CSP採用國產AI晶片的意願低於預期;3)AI計算範式的顛覆性轉變(例如,模型架構或工作負載特徵的根本性改變)降低了基於TPS的性能比較的相關性。識別長期贏家的分析框架潛在的贏家能夠將系統級競爭力轉化為大規模的商業應用。在實踐中,供應商需要具備四大特質:(1)具備競爭力的推理經濟效益;(2)可靠的先進製程節點產能獲取管道;(3)深厚的CSP合作關係;(4)與政策導向保持一致。如果供應商缺失其中一項或多項特質,即使他們發佈了強悍的規格資料,也很難維持其市場份額和利潤率。我們採用雙層分析框架:第一層 —— 定量的推理經濟效益我們側重於驅動大規模應用的、以推理為核心的指標,包括單Token成本和總擁有成本(TCO)、TPS(每秒Token數),以及每瓦和每美元性能。我們認為,要維持領導地位,必須在這兩個層面上都具備實力。第二層 —— 定性的市場定位我們評估獲取先進製程產能的管道、CSP合作關係的深度、政策契合度,以及技術路線圖的可信度。聚焦推理端:本土供應商持續追趕持續存在的生態系統與工藝制約因素,限制了國產加速器在先進基礎模型大規模訓練領域的定位。因此,我們預計近期的部署將集中在大語言模型(LLM)推理而非訓練上。這一重心與需求趨勢相符。DeepSeek、Doubao和Qwen(通義千問)等國產基礎模型,已將每日Token消耗量推高至10兆以上,驅動了推理需求的結構性上升。與此同時,輝達的A100以及部分已安裝的H100和H800越來越多地用於服務訓練工作負載。因此,我們預計中國的推理算力——儘管目前仍以輝達H20為基本盤——隨著時間的推移將更加依賴國產加速器。為了比較各家供應商的推理競爭力,我們採用每秒生成Token數(TPS)這一指標。TPS反映了硬體能力(計算吞吐量、記憶體頻寬、互連)以及軟體和模型的假設。我們以DeepSeek R1作為國產大語言模型的代表,以反映真實的推理部署場景。輝達在2025年第一季度公佈了其H200在DeepSeek R1推理下的官方TPS資料。在採用相同的Token長度和資料格式假設下,我們獨立推算的估計值與輝達公佈的結果基本一致,這印證了我們建模方法的可靠性。(Port Selected)
崑崙芯上市引爆價值重估,百度的長期主義迎來收穫期
十年磨刀百度正在亮劍2026年1月1日,百度控股的AI晶片公司“崑崙芯”正式向香港聯交所提交主機板上市申請。受此消息影響,百度港股大幅上漲9.35%,美股大漲15%。而在此前2025年12月首次傳出分拆上市消息時,百度股價也曾一度拉升5.01%。崑崙芯的獨立上市,是百度從“起大早趕晚集”轉變為“起大早趕大集”的一次關鍵轉折。長期以來,百度一度被視為“搜尋公司”,其AI投入未被充分定價。而崑崙芯作為百度AI全端佈局中的硬科技資產,其獨立上市已經讓市場再次重新審視百度的估值邏輯。摩根大通的最新預測是,崑崙芯2026年營收將增長6倍至83億元。百度“十餘年磨一劍”的沉默,開始了真正的爆發。在百度放出大招之前,網上關於國產晶片的討論,很少會提到百度,其實“崑崙芯”並不是十五年磨劍之路一夜之間冒出的新玩家,也不是那些高調的“GPU新概念”,其前身為百度內部項目和晶片架構部,它的歷史,可以追溯到2011年。2018年7月,百度推出了崑崙1代AI晶片,並於2020年實現大規模部署。技術層面的顯著突破出現在2025年3月,當時,百度宣佈崑崙芯第三代產品P800點亮了首個叢集,4月又點亮三萬卡叢集。晶片業務需要長期投入,為什麼要做崑崙芯?李彥宏透露,崑崙晶片最早是因為搜尋應用需要,“買別人的晶片,畢竟太貴了”,所以才決定自己開發。從全球視角看,大廠自研AI晶片已成為普遍路徑。Google推出TPU,亞馬遜設計Inferentia,背後邏輯均在於提升能效比、滿足內部大規模業務場景需求。提前佈局AI基礎設施的企業,先手牌已成王牌之一。在2023年3月的“文心一言”發佈會上,李彥宏表示,崑崙晶片已經為百度的搜尋服務最佳化了10年。“我們是一個技術公司,我想用技術去改變世界,有各種各樣技術創新的方向,好多我都想去試一試,試一年不成,OK;試兩年不成,OK;試五年不成,OK;試十年還沒成,我還會接著試下去。”美國電商亞馬遜上市後曾迎來連續17個季度的股價下跌,且連續虧損了20年才首次盈利。但這份堅持也帶來了驚人回報:如今亞馬遜的股價是初始的1000倍,成為全球最具價值的公司之一。容忍流言,忍受寂寞,是優秀企業的必要代價。時間會獎勵那些堅持“難而正確”,並為之不捨晝夜的耕耘者。今天崑崙芯的分拆上市非常具有戰略意義,一方面,可以提升崑崙芯獨立估值的透明度,吸引專注硬科技領域的專業投資者;另一方面,獨立運作後,崑崙芯能用更市場化的身份,釋放技術價值,去到算力產業的深水區競爭。而作為百度AI全端佈局中的重要一環,蘿蔔快跑也在近期展現了百度在自動駕駛領域的長期投入成果。作為百度馬拉松式研發投入的典型代表。百度自動駕駛研發起步於2013年,2017年,百度推出全球首個自動駕駛開放平台Apollo,2021年將無人駕駛出行服務平台命名為蘿蔔快跑。2024年5月,百度Apollo發佈全球首個支援L4級自動駕駛的大模型Apollo ADFM以及第六代無人車。可以做到安全性高於人類駕駛員10倍以上。資料證明了一切:截至2025年10月31日,蘿蔔快跑總服務訂單量超過1700萬次,覆蓋全球22座城市,總行駛里程超過2.4億公里,其中全無人行駛里程超過1.4億公里。實戰里程全球第一。這年頭,投資者們更傾向於“看得見的穩定”,2025年7月,全球最大的移動出行服務平台Uber主動和蘿蔔快跑建立戰略合作夥伴關係,將數千輛無人駕駛汽車接入Uber全球出行網路。同年8月,蘿蔔快跑又與Lyft達成合作,計畫於2026年率先在德國和英國部署蘿蔔快跑第六代無人車。與Uber、Lyft等全球出行平台的合作,不僅驗證了百度無人駕駛技術的成熟度,更為其提供了規模化落地場景。李彥宏判斷,“無人駕駛技術已經越過了那個臨界點”,這一判斷正在被市場驗證。左手晶片,右手AI,百度的長期主義正在迎來集中式的爆發,然而外界忽略的是,這家企業在近十年來,已經累計研發投入超1800億元。李彥宏在2017年的一次演講中提出:“過去兩年,我們在研發上的投入就高達兩百億。在中國五百強企業當中,我們論收入肯定不是排在第一的,但是論研發佔收入的比例,那絕對是第一的。”這種對技術長期性的投入,是百度區別於許多追逐短期風口企業的關鍵。其實,崑崙芯和蘿蔔快跑還只是百度AI全端佈局的兩個重心。在人工智慧領域,百度是全球為數不多在AI四層技術堆疊(晶片層、框架層、模型層、應用層)都有全面佈局的企業。全球AI企業全端格局圖在晶片層,崑崙芯為整個AI棧提供算力支撐。2025年,百度成功點亮崑崙芯三萬卡叢集,可同時承載多個千億參數大模型全量訓練。在框架層,百度飛槳深度學習開源開放平台已適配60多款系列晶片,建立超過110萬個模型。2016年,在TensorFlow和PyTorch佔據主流的背景下,百度堅持自研底層框架“飛槳”,率先勾勒“框架-模型-應用”的產業藍圖。如今飛槳已成為中國首個自主研發的產業級深度學習平台,賦能超2333萬開發者、76萬家企業。在模型層,文心大模型5.0採用原生全模態統一建模技術,參數規模達2.4兆。在應用層,蘿蔔快跑、百度搜尋等產品實現了技術的最終價值轉化,還有秒噠、伐謀、GenFlow等原生AI應用。2025年第三季度,百度首次披露AI業務收入,顯示同比增長超50%。其中,AI雲收入同比增長33%;AI應用收入達26億元;AI原生行銷服務收入同比增長262%達28億元。這些資料表明,百度的AI戰略正在進入規模化收穫期。而隨著崑崙芯上市處理程序的推進,以及蘿蔔快跑、文心大模型等AI業務的進一步發展,百度這種圍繞高門檻技術建構的護城河也將越來越寬。李彥宏曾在世界大會上提出一個“倒金字塔”理論,很好地解釋了百度全端佈局的邏輯:“晶片廠商不管賺多少錢,晶片之上的模型要產生10倍的價值,基於模型開發的應用要創造100倍的價值,這才是一個健康的產業生態。”也正是因為生態的健康,百度逐漸收穫了很多長期投資者的認可,2025年12月23日,“木頭姐”Cathie Wood旗下ARK基金再度買入百度,目前總持倉量已達1055473股。從10月至12月中旬,ARK對百度的持倉量激增超2.3倍。時間本身並不主動獎勵任何人,它只是見證者。百度能“起大早趕大集”,本質就是用技術耐力換未來確定性。選擇“難而正確”的賽道,以非凡的耐心和毅力,成為一名堅定的“長期主義者”,是穿越周期、贏得未來的根本之道。 (正解局)
2025中國GPU市場份額:華為、輝達並列第一,寒武紀、海光、平頭哥、崑崙芯緊隨其後
海外投行Bernstein Research(伯恩斯坦)在12月初發佈了一份中國GPU市場份額的分析報告《China AI accelerators market share》,報告分析了中國市場2025年各家的GPU的市場份額,以及預測了2026年的市場情況。報告顯示,2025年華為以102.68億美金銷售額,佔據國內AI加速器市場份額的40%,與輝達的101.98億美金基本持平,斷層領先於其他國產GPU廠商。圖中深綠色的應該是寒武紀,沒有標記出他的名字,寒武紀以9.99億美金銷售額與海光的11.18億美金的銷售額並列第三,阿里平頭哥、百度崑崙芯、AMD等緊隨其後。這份報告的具體資料可能跟IDC的資料會有出入,特別是除華為外的其他國產廠商的份額佔比情況,與筆者瞭解到的市場情況不完全吻合,不過報告顯示的總體趨勢應該還是可以作為參考的。首先就是華為在國產廠商中的遙遙領先,輝達份額的逐年降低,這兩點應該是市場公認的。AMD產品在國內一直以來沒有成為主流,這裡的2%的份額也算是比較合理。剩下的就是寒武紀、海光、阿里平頭哥、百度崑崙芯四家,是目前國內除了華為外,AI加速市場中主要的出貨廠商,這個也跟當前市場的實際體感相吻合。至於最近因上市熱度較高的摩爾線程、 沐曦和壁仞,他們在消費級市場的表現不是很瞭解,在資料中心AI加速器市場的確相比其他幾家要弱一些。另外,報告還預測了2026年國內AI加速器市場的情況,其中預測華為將以50%的市場份額成為國內Top1,其他國產廠商的市場份額則是有不同程度的上漲,而輝達的市場份額將降低至8%。不過這裡應該是沒有將H200的變數算進來。至於報告中提到的AMD在2026年的市場份額將會從2%提升到12%成為國內第二,這是一個較大的不確定性。AMD相比輝達最大的優勢應該是同等算力下的性價比,但是這點在美國的算力限制政策下是否成立值得懷疑。且從目前的市場表現來看,AMD產品的可靠性和可用性都還有很大的提升空間。但這兩天傳出Ali要購買5~6萬片AMD GPU的小作文,讓這個事情增加了更多的變數。總體來看,這份報告對2026年的預測更多的還是僅參考。另外,報告也預測預計到2028年,國產AI加速器產品的供需比將達到104%,也就說2028年開始,國產AI晶片將供大於求。如果這個預測準確,那國內AI晶片廠商預計還有2~3年的黃金發展期,到2028年以後,國產AI晶片廠商將進入優勝劣汰階段,PPT產品、性能落後的產品將逐步被淘汰。這將非常考驗國內目前這些廠商的產品迭代能力。無法持續迭代,或者無法跟上友商迭代節奏的廠商將慢慢離開牌桌。 (AI人工智慧行業動態)
壁仞登陸港股,暴漲!崑崙芯也衝刺IPO
壁仞科技今日成功在港交所主機板上市,成為2026年港股首隻上市新股。盤初漲幅擴大至118.78%,報42.88港元,市值突破1000億港元。壁仞科技此次IPO每股定價19.60港元,公開發售獲2347.53倍認購。壁仞科技本次發行反響火爆,香港公開發售部分已吸引47.1萬人認購,是過去一年港股市場中最多散戶搶購的新股。此次IPO是香港上市規則18C章節實施以來募資規模最大的項目。根據招股書,壁仞科技成立於2019年,專注於開發GPGPU晶片及基於GPGPU的智能計算解決方案以提供AI所需的基礎算力。通過整合自主研發的基於GPGPU的硬體及專有的BIRENSUPA軟體平台,該公司的解決方案支援從雲端到邊緣的廣泛應用中AI模型的訓練及推理。值得一提的是,截至2025年12月15日,壁仞科技手執訂單總價值約12.41億元,包括5份框架銷售協議和24份銷售合同。本次上市募集的資金,將成為壁仞科技加速技術突破與生態建構的核心動力。根據規劃,募資淨額中約85%將用於研發投入,重點推進下一代產品迭代與技術創新,約5%用於商業化拓展,10%用作營運資金及一般公司用途,清晰的資金用途規劃彰顯了壁仞科技的未來戰略。下一代旗艦晶片BR20X計畫2026年商業化上市,其單卡運算能力、記憶體容量、互連頻寬均實現大幅升級,同時增強對FP8、FP4等更廣泛資料格式的原生支援,將進一步提升大模型訓練與推理效率。用於雲訓練及推理BR30X及用於邊緣推理BR31X產品已進入初步研發階段,預計2028年上市,持續迭代的產品管線將不斷打開增長空間。與此同時,百度宣佈拆分崑崙芯在香港上市。崑崙芯也將上市百度公司今天宣佈,其擬議的分拆並單獨上市Kunlunxin (Beijing) Technology Co., Ltd.(“崑崙芯”),即公司在香港交易所主機板上市H股的計畫(“擬議分拆”)。崑崙芯為公司的非全資子公司。擬議分拆旨在獨立展示崑崙芯的價值,吸引專注於AI晶片領域的投資者,並利用其單獨上市來提升市場形象,拓寬融資管道,更好地將管理層的責任與業績掛鉤。這也支援了釋放百度AI驅動業務價值的努力。據介紹,目前的方案為建議分拆擬通過崑崙芯股份的全球發售進行,包括向香港公眾發售及向機構和專業投資者配售。目前,崑崙芯已通過聯席保薦人以保密形式向香港聯交所提交上市申請表格(A1表格)。然而,全球發售的規模、結構及百度集團持股比例的減少幅度尚未最終確定。分拆需待香港聯交所批准、中國證監會備案完成,以及百度集團與崑崙芯的最終決定後方可落實。此舉旨在提升崑崙芯在客戶、供應商及潛在戰略合作夥伴中的形象,並增強其在業務談判中的地位,使百度集團可通過持有的股份受益於崑崙芯的增長。此外,分拆將使崑崙芯能夠獨立進入股權及債務資本市場,從而最佳化百度集團的財務資源配置。同時,分拆有助於明確管理層職責,提升企業治理效率。公司認為,建議分拆在商業方面對公司及崑崙芯均有利,且符合股東整體利益:第一、建議分拆可更全面地反映崑崙芯集團基於自身優勢的價值,並提升其營運及財務透明度,令投資者能清晰區分崑崙芯集團與保留集團,獨立評估及衡量崑崙芯集團的表現及潛力;第二、崑崙芯的業務將吸引專注於通用 AI計算晶片及相關軟硬體系統業務的投資者群體;第三、崑崙芯集團的業務憑藉其規模已足以尋求上市地位,且公司認為該地位將對公司及崑崙芯有利,因為建議分拆將提升崑崙芯在其客戶、供應商及潛在戰略合作夥伴中的形象,並提高其協商及爭取更多業務的地位,從而令保留集團可透過其於崑崙芯的持股受益於崑崙芯的增長;使崑崙芯能在未來有需要時直接且獨立地進入股權及債務資本市場,從而令保留集團能更有效地配置財務資源;更直接地將公司與崑崙芯雙方管理層的職責及問責與彼等各自的營運及財務表現掛鉤,進而加強管理層專注度及企業管治。 (半導體行業觀察)
大模型的盡頭是開源
大模型的戰爭,正悄然換牌。閉源一度是頂尖玩家的主流選擇,視為堅實護城河。然而,2025年9月,阿里、騰訊、百度等大廠幾乎同一時間,將模型開源大舉擺上牌桌,集中且密集的動作令人關注。從能看圖、能對話,到能寫程式碼、能做3D建模,大廠幾乎將壓箱底的招數一股腦甩出來。過去以技術封閉建構壁壘的模式正在被打破,取而代之的是將核心模型技術對外開放,結合開發者的集體智慧進行迭代最佳化,並快速佔領開發者心智。眼下,各類AI需求被拆得越來越細,落地場景也五花八門,而開源也不再是某種技術該不該開放的問題,而是直接成了大廠們硬碰硬的底層功夫。這就像在一場大牌局裡,底牌幾乎都已經翻出來了,大家手裡的牌面差不多,真正決定最後輸贏的,就不再是有沒有牌,而是誰能打得更巧,誰能留在桌上。開源別做選擇題當騰訊、阿里、百度紛紛甩出大招,將重量級模型陸續擺上檯面,重點不僅在於模型本身,更在於大廠們大都選擇了開源路線。表面上看似動作上的巧合,但深入分析,這更像是大廠對市場需求變化所做出的一種共識性反應。開源已不再是可選的附加題,而幾乎是必須正面回答的必答題。誰能答得更漂亮,誰就可能在下一局多佔一份先機。據騰訊混元公眾號及天眼查媒體綜合消息顯示,9月28日,混元圖像3.0正式發佈並開源。騰訊混元公眾號介紹稱,該模型為“首個工業級原生多模態生圖模型,參數規模80B,也是目前測評效果最好、參數量最大的開源生圖模型,效果可對標業界頭部閉源模型。”兩天前的9月26日,混元3D-Omni、混元3D-Part發佈並開源。這一連續出牌,一定程度上可以看作騰訊通過開源來調動外部開發者的力量,讓複雜的3D建模、圖像生成等任務在更大範圍內、更快速地向前推進和完善。然而,各大廠模型越做越龐大,與其一個人握著手裡的牌,不如攤開讓更多玩家一起來出招、共建。這樣一來,原本孤立的牌面,就可能被拼接成更厚實的成果,推動整場牌局不斷升級。據《新京報》9月24日報導,阿里巴巴在雲棲大會上一口氣發佈了7款模型,包括旗艦模型Qwen3-Max、下一代基礎模型架構Qwen3-Next及系列模型等。據通義千問Qwen公眾號消息,其已率先開源視覺理解模型Qwen3-VL系列的旗艦模型Qwen3-VL-235B-A22B,同時包含Instruct與Thinking 兩個版本。▲圖:通義大模型公眾號而面對多元的產業需求,開源也成為推動技術更快進入實際應用的有效路徑。據《上海證券報》9月23日報導,百度智能雲千帆宣佈推出全新視覺理解模型Qianfan-VL,並全面開源。該系列模型包含3B、8B和70B三個尺寸版本,面向企業級多模態應用場景,可以說是進行了深度最佳化的視覺理解大模型。Qianfan-VL具備基礎通用能力,也針對產業落地中的高頻需求,如OCR和教育垂直場景做了專項強化。這裡釋放出的訊號是,模型本身是工具,決定能否落地的,是可得性和成本可控性。百度通過對企業級多模態應用場景的需求深挖,某種程度上凸顯了其自身的技術攻堅能力,也在降低應用門檻上,讓更多企業可以以較低成本接入。從研發端的集體迭代,再到產業應用的快速落地,一系列動向表明,同時作用於研發和產業兩端的開源策略,其戰略價值不言而喻,也正逐漸成為大廠發展的關鍵動力之一。在研發層面,開源將分散的嘗試匯成合力。在產業層面,開源則讓更多企業能夠跨過門檻,將模型真正用起來。驅動未來的引擎當開發者與企業客戶習慣於在某個開源生態中進行開發時,其產生的龐大算力需求、對更高性能的付費版本以及配套的雲服務與行業解決方案的依賴,有望自然匯入大廠的商業河流。開源,就這樣從一張亮出的牌,變成了整個牌局繼續運轉的引擎。技術演進與應用落地的雙輪驅動,牌桌的規則正被改寫,對於旨在建構廣泛生態的大廠而言,開源似乎已無懸念,真正的問題是能開源到什麼程度。大廠選擇將底牌攤得更大、更全,不是炫技,而是試圖讓市場與產業習慣於圍繞自己的生態來運轉。共識既已形成,接下來的賽點是比較誰開放原始碼的尺度更為拉滿,給的是更多乾貨。拉滿,不是單純將參數堆到天花板,而是將模態、場景和應用儘可能覆蓋;乾貨,也不是象徵性地開放幾個版本,而是擺出一整套可落地的模型能力組合。這樣的開源,不是讓開發者挑不出缺口,而是要讓上下游產業明確感受到,這是一種確定性的開源,不僅能用,還好用。天眼查媒體綜合資訊顯示,阿里通過提供大規模、多模態的模型矩陣,滿足不同開發者的需求。其戰略意圖或在於,讓阿里的模型庫成為開發者的優先選擇。據《經濟觀察網》9月29日報導,阿里通義系列已經累計開源超過300個模型,下載量突破6億次,衍生模型超過17萬個。騰訊和百度則有所分化。從騰訊混元公眾號公開的消息內容看,騰訊的開源重點看上去是放在了展現其差異化能力上。進而,無論是複雜的3D生成,還是高語義要求的圖像創作,這一開源舉措,有助於騰訊在專業創作者和相關企業客戶心中建立強關聯。百度則給人一種主打軟硬一體組合拳的陣勢,將模型與自研崑崙芯P800計算卡深度繫結。據《上海證券報》,崑崙芯P800提供了強大的算力支撐,確保模型能夠高效處理海量資料與複雜演算法,同時支援單任務5000卡規模的平行計算。▲圖:百度智能雲千帆官方公眾號報導指出,“在通用能力基準測試中,Qianfan-VL系列模型(3B、8B、70B)展現出顯著核心優勢。從視覺理解到專業領域問答,模型性能隨參數規模增大提升顯著”。儘管大廠們開源策略各有側重,但體現出明確的行業趨勢,開源不再是點到為止的小修小補,而是大廠們拋出全乾貨的開放姿態。看似風格各異,實則目標同一。大廠們力求儘可能將開源尺度拉滿,不只是實力的展示,也是信心的釋放。然而,將乾貨拱手相授,只是上半場的局。真正決定成敗的下半場,在於誰能將這些開放原始碼的能力轉化為產業入口和使用黏性,讓開發者、企業客戶在不知不覺間依賴於大廠的雲基礎設施、API以及深度定製的企業級服務。大廠競技換牌桌隨著頂尖模型能力通過開源逐漸成為公共資源,大廠們的戰爭,悄然更換了牌桌。技術層面的准入差距正在縮小,行業的焦點急劇轉移,接下來的比拚,不再是技術本身的優劣,而是生態的廣度和深度。要在這場新的生態競爭中勝出,阿里打造龐大模型矩陣的長期目標,或可能是將通義模型庫打造為AI開發的基礎性平台。例如,開發者在處理相關任務時,是否會習慣性地前往其模型庫尋找解決方案。不同於阿里,騰訊的做法或是依託於其龐大的內容生態與社交應用積累,在相關領域建立優勢。譬如,其在遊戲、社交等領域擁有深厚的根系,對高複雜度、高表現力的3D內容和圖像有著天然的內生需求。而通過將開源重點放在3D生成和圖像創作上,或是要將其差異化能力擺上桌。▲圖:騰訊混元公眾號這不僅是技術實力的展示,更像是一種生態的順勢而為。當外部開發者,尤其是遊戲開發者、動畫師和設計師,如果將混元模型深度嵌入其創作流程時,騰訊或將在某種意義上實現從工具提供者到數字內容生產規則制定者的躍遷。這種路徑一旦站穩,所帶來的使用者黏性和生態壁壘往往更難被替代。而百度的路徑,看上去是要基於其作為搜尋巨頭和AI先行者對算力與穩定性的長期優勢,將模型開源與自研崑崙芯P800計算卡深度繫結,形成技術路線的自然延伸。進而,打造從晶片、框架到模型應用的完整生態,這對政務、金融、教育等百度早已佈局的重要場景而言,相對更為友好。換言之,百度要做的,或是將經過深度最佳化的模型能力和可靠高效的算力支撐同步開放給目標客戶和開發者,降低試錯和整合成本。通過這種生態建構,百度的競爭力便也不再停留在模型層面,而是在產業服務上紮根更深。這些差異化的佈局,說明大廠們的大模型競爭正轉換風向,它們並非在全新的戰場上從零開始,而是將自身固有的核心優勢,通過開源戰略投射和放大到大模型的疆域之中。過去看誰的團隊更大、投入更多,如今比的是誰能將自身優勢轉化為生態吸引力,讓開發者在特定場景下最先想到“就用它”。開發者一旦習慣了某套開源模型,企業客戶在搭建應用時自然就會跟上,這套系統便有望成為事實上的“王牌”。寫在最後從開源是否做選擇題,到日趨尺度拉滿的乾貨,再到牌桌換新的生態競爭,中國大廠的大模型路徑已經顯現出某種確定感。大廠不再滿足於單一產品的比拚,而是通過一次次開源,將競爭延伸到更廣闊的開發者社群與行業場景中。儘管閉源在特定領域仍有價值,但就建構廣泛產業影響力而言,開源無疑已成為大廠大模型戰略的必然歸宿和主戰場。未來幾年,大模型的競爭會愈演愈烈,開源讓技術門檻降低,但也讓競爭提前白熱化。真正的勝負,不是今天誰先開源了多少,而是誰能在開放之後,將開發者、行業客戶和應用場景都拉進自己的生態之中。惟其如此,才能在新的牌桌上佔據主動。大廠的大模型之戰,終究不是看誰先出完手裡的牌,而是誰能讓更多人心甘情願地跟著出牌。 (零態LT)
阿里PPU、百度崑崙芯,中國AI迎「華為時刻」
國內AI晶片市場正在經歷一場深刻的變革,“去輝達化”成為熱詞。這場變革的核心在於,以阿里巴巴和百度等為代表的中國科技巨頭,正積極推動AI晶片的自主研發,試圖挑戰輝達在國內AI晶片領域的壟斷地位。9月以來,國產AI晶片捷報頻傳:阿里巴巴、百度等網際網路巨頭相繼宣佈,其核心AI模型的訓練將部分採用自研晶片。與此同時,阿里平頭哥和華為昇騰的新一代產品性能曝光,性能追趕甚至部分超越了輝達。資本市場對此反應積極。除了多家投行上調阿里、百度等國內科技巨頭的估值外,華爾街明星基金經理“木頭姐”更是四年來首次買入阿里巴巴。股票表現上,自8月底以來,百度和阿里巴巴的港股股價累計漲幅均在50%左右。圖:阿里巴巴和百度港股表現    資料來源:wind,36氪整理那麼,國內AI晶片從外購到自研背後究竟出於何種原因?國產晶片加速“去輝達化”這場“去輝達化”運動,背後最直接的動力源於日益緊張的地緣政治,以及由此引發的對AI供應鏈穩定性和安全性的深層擔憂。今年4月,美國政府一度禁止輝達向中國銷售H20晶片,儘管7月恢復出口,卻附加了15%的收入上繳條件。面對美國的限制,中國的反制也接連升級:7月底H20被曝“漏洞後門”遭到約談,8月中旬一度傳出停產消息,而近期的反傾銷調查更是將這場風波推向高潮。圖:2025年AI晶片相關動態資料來源:中原證券,36氪整理兩國博弈的升級,加劇了海外AI晶片的供應鏈風險。對需要長期穩定投入的AI玩家來說無疑是致命的。出於對風險的考量,越來越多的中國科技巨頭意識到晶片自主可控的重要性,由此掀起了一場浩大的“去輝達化”浪潮。這場浪潮的演進,給輝達帶來了明顯的負面衝擊。今年第一財季,輝達就因對H20的出口限制計提了約45億的存貨減值。而隨著風暴的愈演愈烈,輝達來自中國大陸的收入持續銳減。財報顯示,2026財年第二季度,其來自中國大陸的收入銳減至27.7億,環比下滑了近50%,佔比下滑至6%,同期美國、新加坡和台灣地區的收入增速則均有提升。圖:輝達中國大陸收入及佔比    資料來源:wind,36氪整理與輝達的困境形成鮮明對比的是,浪潮之下國產定製AI晶片正在快速崛起。8月21日, DeepSeekV3.1發佈,宣佈使用FP8架構增強國產晶片適配性。9月16日《新聞聯播》意外曝光了阿里平頭哥的PPU晶片。其在視訊記憶體容量和片間頻寬上已超越輝達A800,比肩H20。更關鍵的是,根據招銀國際的資料,得益於國產7nm工藝與2.5D封裝,PPU單卡成本較進口H20下降40%。圖:國產AI晶片資訊   資料來源:山西證券,36氪整理在PPU曝光僅兩天后,9月18日,華為罕見地公佈了昇騰晶片未來三年的詳細演進路線。通過支援低精度計算、混合架構、互聯頻寬和算力翻倍增長,華為正從技術上實現全面追趕。不止於單卡性能,更重要的是,基於自研互聯協議“靈衢”和昇騰950系列晶片的Atlas950 SuperPod,可以形成百萬級規模的統一算力底座,各項性能超過輝達下一代NVL144和2027年的NVL576,成為全球最強算力叢集。圖:華為昇騰晶片進展   資料來源:長城證券,36氪整理而產品性能的突破也加速了國內算力基建國產化解決方案的部署。8月底,百度崑崙芯在中國移動集采中拿下三個標包第一,中標規模達到10億級。這更像一面鏡子,清晰地折射出本土AI晶片廠商正在加速蠶食輝達的市場份額。IDC資料顯示,2024年,輝達在中國的市佔率從85%降至70%,而本土 AI 晶片品牌的出貨量超過 82 萬張,市場份額顯著提升至30%。圖:輝達中國市佔率持續下滑  資料來源:IDC,36氪整理而Bernstein預測,2025年輝達在中國AI晶片市場的份額將進一步降低到54%,同期本土廠商份額顯著增長,且呈現百花齊放、多元競爭的新格局。圖:國內AI晶片市場格局演變   資料來源:Bernstein,36氪整理歷史的鏡像:手機晶片的“通用”到“定製”之路當前中國AI晶片的定製化浪潮,與過去十餘年手機晶片的發展歷程極為相似。在智慧型手機發展的早期,晶片的主導者是高通、聯發科等通用晶片廠商。這些晶片方案的優勢是具備高度的相容性和標準化特性,可以大幅降低手機廠商的研發門檻,使其可以快速佈局智慧型手機業務,搶佔市場先機。然而,隨著行業的迭代,通用晶片的弊端也開始顯現。一是,手機晶片長期被高通、聯發科等少數企業壟斷,導致手機廠商在供應穩定性上長期受制於人,並需要承擔高昂的額外費用,對利潤造成擠壓。以“高通稅”為例,蘋果每售出一台iPhone就需要交付高通售價5%的專利費,2016年蘋果支付的專利費用高達28億美元,佔當年利潤的6%。二是,通用晶片的架構設計無法完全匹配手機廠商的產品迭代規劃和定製化需求,導致產品性能提升滯後,且難以形成軟硬體一體的協同效應,弱化了使用者的使用體驗。三是,核心硬體上的趨同使得手機廠商只能針對攝影機、螢幕等外部環節做“堆料”創新,難以形成真正的差異化壁壘和品牌溢價,阻礙了品牌的高端化進展。正是基於這些明顯的缺陷,以蘋果為代表的頭部廠商走上了晶片自研之路,推動智慧型手機晶片從“通用”向“專用”的過渡。2010年,蘋果推出首款自研晶片A4,奠定了此後 iPhone 在智慧型手機領域的王者地位。A系列晶片採用自研架構和先進製程工藝,並與IOS系統調度邏輯緊密配合,實現了軟硬體的全面最佳化。不僅保證了iPhone硬體性能的持續領先,也形成了基於軟硬協同的獨特技術生態,讓iPhone的使用體驗上一騎絕塵,為蘋果構築了難以複製的護城河,成為其長期穩居高端智慧型手機第一梯隊的關鍵。在蘋果取得成功後,華為也緊隨其後開啟了自研晶片之路。2013年,華為通過海思半導體自研麒麟晶片,整合了華為在通訊、AI和影像處理方面的核心技術,不僅最佳化了整體性能也使其在5G時代具備了先發優勢。更重要的是,麒麟晶片與鴻蒙系統的深度融合,為華為手機建構了強大的生態護城河,讓其徹底擺脫了手機“組裝廠”的標籤,憑藉差異化優勢在國內高端市場站穩了腳跟。而更深遠的影響在於,依靠定製化晶片兩家公司減少了對外部供應商的依賴,從根本上最佳化了成本結構。而且以此所形成的“軟硬一體”生態優勢,也使其品牌溢價持續提升,為其帶來了更可觀的利潤空間。2024年,蘋果iPhone業務毛利率接近40%,遠高於行業平均毛利率水平。國產AI晶片的“華為時刻”當前,中國AI晶片的“去輝達化”浪潮,正是對手機晶片發展歷程的一次深度復刻。從本質上看,AI晶片的國產化和定製化,既是出於供應鏈安全性的考量,更是AI從訓練轉向推理後,行業的必然選擇。隨著大模型迭代速度的趨緩,市場需求正從“瘋狂堆算力”轉向更務實的商業化應用落地。這種背景下,AI的重心也從“訓練”轉向“推理”。根據輝達 CEO 在 2026 財年第一財季業績會時的發言,AI 推理 token 的生成量在過去一年激增了 10 倍。與訓練相比,推理任務對算力需求有所降低,但對成本、功耗和延遲的要求更高。輝達的通用GPU雖然性能強大,但其成本高、能效低,且存在高延時問題,因此並不能完美匹配推理任務需求,尤其是國內閹割版較高的成本致使其性價比大打折扣。這種市場需求的變化,直接推動了國內晶片行業的定製化之路。從適配度上看,與通用 GPU 相比,定製晶片去除了大量冗餘功能從而在執行特定任務時,能在功耗、成本和延遲上實現數量級的最佳化。對於需要大規模、高並行、低延遲的AI 推理任務來說,效率遠高於通用 GPU。圖:通用晶片與定製晶片的對比   資料來源:民生證券,36氪整理而本土晶片設計及供應鏈的進一步成熟,也為國產晶片性能加速追趕國際水平提供了底氣,使得AI算力基建轉向國產解決方案成為可能。正如智慧型手機時代的蘋果和華為,中國的AI玩家已經不再滿足於僅僅購買輝達的通用GPU,而是開始嘗試外購+自研兩條腿走路。一方面,在訓練領域,依靠國際先進晶片的高性能實現模型迭代,為進一步的自主化保留時間窗口;另一方面,加速自研定製化晶片並積極適配國內外主流大模型,在能效、特定場景最佳化等方面尋求差異化優勢,並通過軟硬體的深度協同,最佳化效率和成本。這預示著,中國AI產業正從單純的算力消費者,轉變為自主的生態建構者。這不僅是應對外部壓力的防禦性策略,更是中國科技產業邁向更高價值鏈的必然選擇。 (36氪財經)
寒武紀暴跌!來看看寒武紀以及崑崙芯這些⼤客戶近期的真實反饋與需求
今日市場出現比較大幅度的下跌,陳果今天群裡說:四個月慢牛後的一個快速急跌調整,沒有實質利空衝擊牛市邏輯(沒有類似四月的關稅衝擊利空),大機率後面還有新高,但一般來說這種調整之後結構上會有切換。這幾天外資的會議比較多,花旗和JPM科技、媒體和通訊會議正在進行,所有人的目光都聚焦於本周的科技與網際網路巨頭會議,所以最近的科技行業的調研以及報告也會非常多,我持續給大家更新。昨天開了一場關於國內晶片的電話會,邀請一位ASIC專家。下午還開了一場關於國內大廠AI的資本開支問題,我挨個給大家梳理:1、國內大廠開支近況•阿里:上半年怒砸30萬張H20訂單,結果只到貨22萬張,缺口全靠“海外代購”和算力租賃硬撐。自家PPU晶片(推理專用)還在持續推進中,但產能卡在中芯國際12nm工藝上,今年只能勉強產出2萬張。•海外採購:阿里、騰訊、字節囤GB200(輝達最新卡),但海外管道也緊俏,全年能拿到3萬張就算燒高香。•算力租賃:杭鋼、潤建等公司突然成了香餑餑,承包了30%的算力缺口,價格水漲船高。(畢竟租比買不到強啊!)關鍵矛盾:國產卡性能不夠,海外卡買不到,租賃成本高——大廠們集體陷入“算力焦慮”!2、再就是寒武紀和崑崙芯誰能上位?寒武紀:•字節是親爹,包圓了80%訂單(今年11萬張裡8萬張歸字節),阿里想插隊?抱歉,產能優先給“金主爸爸”。•性能短板:跑大模型MFU(利用率)只有70%,被昇騰(90%)吊打,但勝在軟體團隊“貼身服務”,專治客戶各種不服。•國產化版:年底推出中芯國際工藝的690晶片,性能打8折,價格卻不打折…(懂的都懂)崑崙芯(百度親兒子):•P800在字節、騰訊測試表現亮眼,性價比超輝達1.5倍,但主要用來跑小模型推理(比如視訊剪輯)。•訓練能力:目前唯一能訓練文心大模型的國產卡,但其他模型效果拉胯,被吐槽“偏科嚴重”。3. 未來風向:自研、租賃、出海“三件套”•自研加速:阿里放話“明年70%採購國產卡”,但中芯國際產能是最大瓶頸。(畫餅容易,量產難啊!)•算力租賃:潤澤、海南華鐵這些“二道販子”賺翻了,未來可能吃掉一半市場。•出海淘金:阿里、騰訊在墨西哥、中東狂建資料中心,理想、比亞迪的自動駕駛算力需求也在暴漲。4、最近大家關心的大模型DeepSeek V4/R2或合⼆為⼀於近期公佈1.版本迭代:•V3.1為過渡版本,效果被認為不如R1•V4/R2可能於10月發佈,重點改進文字窗口長度、程式設計能力和多模態支援(初級版)•多模態功能將基於早期實驗版本(Sora-like)進行簡單增強2.技術創新:•開發自訂UE8M0 FP8格式(非標準FP8),需下一代國產晶片原生支援•目前海光、摩爾等僅支援輝達標準FP8,崑崙芯、壁仞等需重新設計支援 (Alpha外資風向標)