中美算力,站在2000億美元的分岔路口

“全球人工智慧投資規模2025年或將接近2000億美元。”高盛8月份的一份報告中寫道。

雖然爭奪算力是追逐超級智能的明牌項,但中、美這兩個最大的玩家,卻站在分岔路口:中國這邊不斷地在性能上追分,美國那邊雖沒有被算力困住,卻被能源所“卡脖子”。

時針撥回到2023、2024年,搶算力成為“全球共識”——無論矽谷巨頭、主權基金,無不寄希望從輝達的手裡,搶到更多的H100產能。

但是站在2025年年末回看,儘管搶算力的趨勢沒有根本改變,但各大雲廠下單為了計算總擁有成本,已經把計算器按冒煙

在輝達的身後,Google十年磨一劍,在Gemini 3的訓練上讓自研晶片TPU脫穎而出,為專用積體電路(ASIC)贏得極其重要的話語權。

在Google身後,亞馬遜、Meta、微軟一眾老巨頭,以及OpenAI、xAI這樣的新貴,無一例外的下場自研。

資本市場隨即給出結論:輝達市值上限5兆美金。

2025年下半年之前,泡沫並不是主旋律,但隨著山姆·奧特曼拿出1.4兆美元的龐大基礎設施建設計畫,尤其是背後的循環交易、舉債融資,引發外界對泡沫的擔憂

泡沫理應關注,但在先進算力禁運的背景下,泡沫顯然不是中國算力、大模型的重點

相比矽谷,中國AI產業走的非常曲折、艱難,但成果也頗豐——我們有世界頂級的開源模型,有成熟的應用生態,更有數倍於矽谷明星公司的Tokens使用量。

在有限的空間裡,過去中國大模型一直使用輝達供應的“閹割版”次等晶片,但今年開始,這個趨勢將慢慢得到改變——機構伯恩斯坦的資料顯示,中國本土AI晶片品牌滲透率已從2024年的約29%,快速提升至接近60%。

同期,中國輝達們紛紛衝刺上市,背後是中美科技競爭加劇和國產替代需求的爆發。

在這個大環境下,越來越多的中國晶片企業試圖通過“超節點”的形式,以繞開單晶片性能不足的問題,這反映出中國人工智慧產業的智慧和韌性。

矽谷大佬們注視著沙盤上的伺服器和核電站,圖片由AI生成

01. 矽谷巨頭從CapEx到CapEx+TCO

回望2023與2024年,全球AI算力市場的主旋律是恐慌與搶購,在那兩年裡,無論是矽谷巨頭還是主權基金,唯一的KPI就是搶到儘可能多的H100。

根據UBS的資料,2025年全球AI晶片市場規模雖然預計將突破2000億美元,但增長的內驅力已發生質變。

現在的雲廠商在下單前,不再只盯著性能參數,而是開始拿著計算器審視TCO(總擁有成本)。

今年美國主要雲服務提供商如亞馬遜AWS、微軟Azure和Google雲,正以前所未有的激進姿態加大資本開支(CapEx)。

高盛預測,2025年五大巨頭的資本支出將達到3800億美元,用於AI基礎設施擴張和資料中心建設,以應對爆炸式增長的計算需求。到2027年,總規模將超過5400億美元。

雲長的投資反映了激烈的競爭,但和以往不同,所有人都不得不考慮效率問題,不得不精打細算考慮經濟帳。

在這個過程中,還有一個值得關注的訊號:2025年的算力市場不再是單純的“賣卡”生意,資料中心的基建進入了機架級時代。

如今,交付到雲廠商的是整合了計算、高速互聯、甚至液冷系統的完整機櫃。與此同時,由於單機架功耗普遍突破100kW,電力供應已成為限制2025年算力總量釋放的物理天花板,而非晶片產能本身。

今年AI產業的另一一個顯著的標誌就是推理的需求越來越多。算力中心的工作負載正從“暴力堆算力跑訓練”轉向“大規模、高並行的推理調度”。

大摩預測,2026年推理算力需求將超過訓練需求。

這意味著,市場對晶片的要求不再僅僅是單卡極致的算力峰值,而是單位成本下的Token輸出效率。

這種需求偏移,也變相給了非輝達陣營更多生存空間,因為在推理側,性價比往往比絕對生態優勢更具殺傷力。

當然,推理需求的暴漲也給廣大的“賽博玩家”一記暴擊——儲存價格暴漲。

02. 輝達是“一超”,Google領銜“多強”

2025年,資料中心AI晶片市場呈現典型的“一超多強”格局。

憑藉Blackwell架構的領先性能、NVLink互聯生態和大規模部署,輝達佔據主導地位,市場份額約佔80%以上,憑藉年度旗艦GB200&GB300系列,繼續以“一超”的姿態,主導訓練和推理領域

AMD、Google、亞馬遜、微軟和Meta作為“多強”,通過自研ASIC加速器,積極最佳化內部雲基礎設施、降低成本並逐步向外部開放,挑戰輝達的壟斷。

這些公司主要從自身大規模AI需求出發,開發專用晶片,強調能效、規模化和特定工作負載最佳化。

AMD通過Instinct MI系列在資料中心市場快速崛起,已吸引Meta、微軟和Oracle等客戶。

2025年MI350系列已大規模可用,在某些MoE模型上性價比突出。MI400系列計畫2026年推出,支援更大規模機架級整合。

亞馬遜AWS的自研Trainium系列針對資料中心訓練和推理,Trainium3 採用3nm工藝,支援144晶片整合,峰值超362 PFLOPS,專門針對Agent代理、推理和視訊生成等下一代應用最佳化,支援PyTorch/JAX無縫遷移,可擴展至百萬晶片超大規模叢集。

亞馬遜策略是垂直整合Bedrock平台,吸引Anthropic等客戶,顯著降低token成本,在AWS生態內提供高性價比替代

Meta的MTIA系列專注內部資料中心推薦和排名模型,核心策略是基礎設施自主化,減少成本,主要內部使用(如Facebook/Instagram推薦),尚未外部開放,但正擴展至生成AI訓練。

2025年下一代MTIA(基於5nm)已測試並部署,提供3.5倍密集計算和7倍稀疏計算提升,記憶體頻寬翻倍,效率較GPU高2倍。MTIA與下一代GPU協同,支援Llama系列推理。

和其他巨頭一樣,微軟過去兩年也在推動自研Maia系列,但一直“掉鏈子”。

Maia系列的首款產品Maia 100在2023年底發佈,被視為微軟進軍自研晶片的標誌性動作,不過參數遠不及同行同期的產品。Maia 200更是一波三折:原計畫2024年完成流片,但設計過程中出現多個技術問題,導致流片延遲至2024年底,2025年才啟動量產。

根據SemiAnalysis的資訊,Maia 200的性能未達預期,被內部評估為失敗項目,即便量產也難以支撐核心AI工作負載。而計畫在2027年部署的Maia 300,雖然瞄準 2nm工藝,目標是接近內部性能預期。

在“多強”的陣容當中,不得不提的是Google十年磨一劍的TPU。

Google的TPU系列專注雲端資料中心,最新的第七代Ironwood支援高達9216晶片的節點規模,提供超過4倍於前代Trillium的單晶片性能。

都在說ASIC在慢慢趕超GPU,但對輝達來說,真正意義上的變數還要數GoogleTPU

長期以來,TPU作為Google內部AI工作負載的核心支撐,主要服務於搜尋推薦、廣告等業務,即便 2018 年通過Google雲對外開放,也未推進全面商業化。

近幾個月,這一局面發生根本性轉變:Google調動全技術堆疊資源,通過 “雲端服務+硬體直售” 雙路徑開放TPU能力,正式以硬體供應商身份入局AI算力市場

這一戰略轉型已取得顯著成效:Anthropic、Meta、OpenAI、xAI等頭部機構陸續加入TPU採購佇列,其中Anthropic與Google的合作堪稱標竿——不僅部署規模超 1GW 的TPU計算叢集,更簽訂100萬個TPU的合作協議,分兩階段落地40萬個直供TPUv7 Ironwood和60萬個GCP租用 TPUv7,對應訂單金額超520億美元。

訂單背後,關鍵支撐在於:Gemini 3、Opus 4.5這些業界領先模型,均基於該晶片訓練,所謂“好不好看療效”。

不過,TPU的過去10年研發路,也不是一帆風順,TPUv4、v5的計算吞吐量曾顯著落後於同期輝達旗艦產品,直到TPUv6通過將脈動陣列規模從128×128 提升至 256×256,實現算力翻倍且能耗降低。TPUv7則沿用3D環面(3D Torus)架構,在實際場景中展現出更優的 TCO 表現。

現在,很多網友們都在討論TPU進入國內的可能性,有兩個關鍵問題:其一是性能超規,這很好理解;其二是生態問題。

生態問題上,即便在北美,大家都是租用Google雲上的TPU算力,如果雲廠自己買回去建TPU叢集,會增加非常多的偵錯時間,而且還要學會使用TPU的軟體生態,在沒有Google的支援下,難度可想而知。

03. “中國輝達”上市潮超節點與華為昇騰

2025年,對於中國的AI晶片來說,是不平凡的一年。

寒武紀在今年走出了一波大行情,市值最高一度突破6000億,成為A股AI晶片龍頭標竿。摩爾線程和沐曦也成功在科創板上市。

其他幾個耳熟能詳的國產AI廠商,比如壁仞科技、天數智芯、遂原科技、崑崙芯也基本都在上市的路上。

這一輪國產AI晶片上市潮背後,是中美科技競爭加劇和國產替代需求的爆發——美國對高端GPU的出口管制,推動國內巨頭和初創企業加速自主研發,同時資本市場對AI算力的追捧,讓這些高研發投入的公司迎來融資窗口期。

儘管多數企業仍處於虧損階段,但高估值反映了投資者對未來國產晶片在智算中心、大模型訓練等領域的期待,這一潮湧不僅帶來了資金活水,也標誌著中國AI晶片產業從“跟跑”向“並跑”邁進的關鍵轉折。

之所以說是關鍵轉折,原因在於,2023年輝達憑藉其CUDA生態和領先的GPU性能,幾乎壟斷了全球和中國AI算力市場,市場份額一度高達80%以上,尤其在資料中心和訓練大模型領域,輝達的H100和A100系列晶片成為不可或缺的核心,國產廠商難以撼動其地位。

受美國出口管制的持續影響,特別是對先進AI晶片的禁售,輝達在中國市場的份額急劇下滑,這為國產GPU提供了絕佳的滲透機會

根據伯恩斯坦的資料,本土AI晶片品牌滲透率已從2024年的約29%快速提升至2025年的59%以上,特別是在智算中心和雲服務領域,國產晶片的採用率顯著上升。

轉變得益於“國產替代”的強勢推動和產業鏈的加速成熟。

具體來說,華為的Ascend系列性能已接近輝達H200的80%,並在多家資料中心大規模部署;其他廠商如阿里的PPU、崑崙芯、寒武紀、壁仞、天數智芯和燧原,也通過異構計算和生態相容性提升,逐步蠶食市場空白。

整體而言,中國AI晶片市場正從輝達“一超獨大”的壟斷格局,向“百花齊放”的多強競爭演變。

預計到2026年,國產GPU在國內滲透率將進一步突破,這不僅降低了供應鏈風險,還推動了AI算力的自主可控和成本最佳化。

單晶片性能在不斷追趕,整個算力產業都湧向“超節點”,以規避單晶片性能還不足的問題,更體現了中國人的智慧。

超節點是將大量AI加速卡通過高速互聯整合成邏輯上統一的“巨型電腦”,有效解決傳統叢集通訊延遲高、擴展性差等問題,支援兆參數模型高效訓練和推理。

目前,中國已推出多款商用超節點產品,單節點規模從128卡到640卡不等,技術路線涵蓋電互連、光互連和開放架構。

互聯技術是國產超節點的核心突破,傳統乙太網路和PCIe難以滿足萬卡級通訊需求,頭部廠商自研高速協議成為標配:華為“靈衢”協議單晶片互聯頻寬達2TB/s、卡間延遲僅2.1微秒;海光/曙光HSL協議支援112G高速互聯,並通過專用交換晶片實現節點內全頻寬點對點互聯,避免出節點轉發,這種低延遲、高頻寬設計極大降低了分佈式訓練中的通訊開銷。

目前,已有多個超節點項目落地,但大規模商用預計2026年真正爆發,所以我們也常說,2026年將迎來“超節點戰爭”。

儘管超節點可以部分補齊單晶片算力不足的問題,但挑戰仍然存在,包括軟體生態最佳化、先進製程與HBM產能瓶頸。關於國產算力,不得不提的是華為。根據IDC的資料,明年昇騰的出貨量將佔比中國AI晶片總出貨量的一半。

9月份的全連接大會上,華為直接亮出了昇騰系列路線圖。

根據規劃,2026年至2028年,華為將分階段推出四款新晶片:2026年第一季度發佈昇騰950 PR(專注推理Prefill和推薦場景);2026年第四季度推出昇騰950 DT;2027年第四季度推出昇騰960;2028年第四季度推出昇騰970。

昇騰AI晶片路線圖

這一路線圖延續了昇騰從910系列(2018年起)到910C(2025年推出)的迭代路徑,結合Atlas超節點技術,支援大規模叢集部署。

關於昇騰的950 PR,最近大家在網上都能看到一些性能參數,對華為來說,其目前的核心並不是在訓練上要去掉輝達,而是讓自己的晶片被更多的使用者使用起來。有可能會被忽視的關鍵資料:在950 PR中,增加了SIMT/FP8/F4,這些都對推理有明顯的改善。

04. 有泡沫,那就擠掉

當奧特曼的1.4兆美元投資重塑AI產業格局,當輝達市值一路飆升至5兆美元,當AI概念股成為資本市場的香餑餑,關於AI是否處於泡沫的爭論變得異常激烈。

有人將當前的資本狂熱比作 2000年網際網路泡沫的重現,也有人堅信這是技術革命的必然序曲,這些都是基於不同視角、立場得出的洞察,都有存在的合理性。

樂觀派堅定看好AI的長期價值,認為當前的高投入與高估值並非炒作,強調AI將創造20兆美元的經濟價值,僅生成式AI就有望提升勞動生產率15%,這種技術賦能的潛力足以支撐資本的熱情。

從資料來看,以輝達為代表的龍頭企業並非空談概念,其憑藉GPU技術佔據AI價值鏈35-40% 的資本支出份額,2025年營收預計超2000億美元,紮實的盈利能力成為估值的重要支撐。

謹慎派則認為市場存在潛在的風險,企業對債務融資的依賴度不斷上升, 五大AI超大規模企業現金資產佔比已從2021年底的29%降至2025年二季度的15%,債券與私人信貸成為主要融資管道。

更值得關注的是,AI產業呈現明顯的結構性失衡:上游算力硬體景氣度高漲,但中游多數初創模型企業缺乏商業化能力,下游80%部署AI的企業尚未實現淨利潤提升。

換句話說,源源不斷地投錢,卻沒有在商業收入上高效轉化。

判斷AI是否處於泡沫,不能僅憑市場熱度,而需從估值水平、盈利支撐、產業邏輯三個核心維度理性分析。

從估值來看,當前美國科技巨頭的估值並未達到歷史泡沫峰值。

被稱為“美股七姐妹” 的核心科技股當前市盈率約31倍,遠低於2000年網際網路泡沫時期的極端水平。

更重要的是,這些企業大多具備強勁的現金流和造血能力,與當年缺乏盈利支撐的網際網路初創企業有本質區別。

從產業邏輯來看,美國AI硬體投資自2023年已增長2000-3000億美元,資料中心、算力基礎設施的建設雖然存在局部過熱跡象,但背後是真實的產業需求支撐。GoogleTPU晶片對外供貨引發的“鯰魚效應”,更證明AI產業正從壟斷走向多元共生。

關於部分企業“閉環買賣”的模式——輝達投資xAI後xAI隨即採購其晶片,微軟投資OpenAI後獲得巨額雲服務訂單——可能導致估值虛高,進而帶來局部泡沫,尤其是美國前十大科技股佔全球股市近25%的極高集中度,也讓市場波動的傳導風險不容忽視。

但市場不是從來就是二八分化,優勢資源集中在20%的機構手裡?

從我們的視角來看,所謂AI泡沫:只是短期利益與長期價值、資本狂歡與技術本質的博弈

即便是真有泡沫,擠掉就是。 (騰訊科技)