115萬片晶圓,決定2026年的“晶片戰”,蘋果、聯發科、OpenAI火線入局

“未來六個季度資料中心收入5000億美元。”黃仁勳在GTC25上說。

2026年1月6日開幕的CES 2026,老黃又宣稱90%的ASIC項目會失敗,這實際上是對此前GoogleTPU為代表的ASIC晶片(專用積體電路)的口頭“討伐”,一場針對ASIC的全面圍獵已經悄悄開始。

很多人會關心,GPU、ASIC競爭的終局如何?答案是取決於半導體戰爭的終極彈藥庫——台積電CoWoS先進封裝產能

這意味著,只要對台積電CoWoS產能預訂、分配情況,進行顆粒度拆解,就能精確測算出2026年AI算力晶片的出貨格局。

可以說,2026年“晶片戰”,繫於台積電115萬片CoWoS晶圓產能。

GPGPU與ASIC陣營對壘,圖片由AI生成

01

戰爭的起源

我們先對GPU和ASIC的戰爭背景做一些鋪墊(有行業基礎可跳過本部分)。

人工智慧對算力的需求擴張是共識,但必須明確:更先進的計算架構、工藝製程和先進封裝,是三個關鍵路徑

關於架構,談到最多的是GPGPU(通用圖形處理器),輝達在這條路上,借助CUDA生態的20年鋪墊,成為通用平行計算的絕對王者。

硬體層面,輝達的核心武器有兩個:HBM記憶體極高的頻寬、GPGPU大規模流處理器陣列。從H200、GB200到2026年1月推出的“Vera Rubin”,都是這條路徑的產物,性能提升直接與視訊記憶體頻寬、NVLink互連規模掛鉤。

GPGPU之外,以GoogleTPU為代表的ASIC晶片,探索出了另一條更精準、定製化的架構——雲端推理側的負載日益固化,為特定演算法(如Transformer)定製的ASIC晶片,能夠展現出碾壓級的能效比,即每瓦性能和總擁有成本(TCO)優勢。

Google的TPU、亞馬遜的Trainium都是這條路徑的先鋒。博通、Marvell、Al chip等設計公司,正是通過為這些雲巨頭定製ASIC晶片,撕開了AI晶片兆市場的一道口子。

相比架構競爭,工藝製程這條路徑顯得更好理解,從7nm、5nm、3nm到2025年底量產的2nm,每一次製程躍進都意味著電晶體密度和能效的提升。

不過,工藝製程是一條高門檻的路徑:進化速度越來越慢,成本越來越貴,2nm晶圓代工價格高達3萬美元,入場費已非所有玩家都能承受。此外,工藝製程的微縮還將面臨“功耗牆”和“儲存牆”。

架構、製程之外,第三個關鍵路徑是先進封裝,以CoWoS(Chip on Wafer on Substrate)為代表的先進封裝是台積電為高性能計算打造的“皇冠上的明珠”。

CoWoS封裝概念圖,來源:台積電

CoWoS的精髓在於異構整合將多個小晶片,例如計算芯粒(GPU/ASIC核心)、高頻寬記憶體(HBM)、I/O芯粒等,通過中介層進行超高密度、超高頻寬互連,整合在一個封裝內

表1:CoWoS中介層面積變化趨勢

這種方式可以突破單晶片光罩(掩範本)尺寸限制,中介層面積當前可達2800mm²,直接好處就是電晶體更多,HBM視訊記憶體更高

另外,由於CoWoS採用了矽中介層,上面的微凸塊(μBump)間距極小,芯粒間通訊頻寬激增,延遲和功耗大幅降低。

正因如此,無論是追求極致性能的輝達GPU,還是追求最佳總擁有成本的雲巨頭ASIC,但凡涉足頂級AI算力,都離不開CoWoS。

所以,在2026年這個時間點上,當製程進入2nm深水區,成本高企,架構路線出現根本性分叉時,CoWoS先進封裝的產能分配,就成了決定算力版圖的最關鍵變數,沒有之一。

02

產能圖譜:台積電CoWoS的供給格局

表2:台積電CoWoS產能爬坡情況

從我們掌握的情況來看,過去三年,台積電CoWoS產能一路從單月12K晶圓,逐步爬升至2025年底的80K/月,2026年年底的預估目標是120K/月左右。

取一個全年有效平均值:96K/月,即2026年台積電CoWoS總有效產能約為:96K/月 × 12個月 = 1150000片晶圓,這是AI晶片戰的總彈藥基數。

產能分配原則

這1150000萬片晶圓如何分配,背後是一場基於技術、商業、地緣的複雜棋局。

按照優先順序,輝達作為CoWoS最早期、最大膽的共同定義者和投資者,其架構(如NVLink)與台積電CoWoS工藝深度耦合,毫無意外可以拿到最多。

按客戶層級,由於 蘋果、輝達、AMD是台積電前三大VVIP級客戶,其巨額預付款和長期協議鎖定了基礎產能。不過,蘋果要到2028年才有自研AI晶片。另外,博通、Marvell因承接Google、AWS、Meta等雲巨頭天量ASIC訂單,已躋身頂級VIP客戶行列。

另外,對台積電來說,除了ASIC以外,AMD、英特爾乃至中國客戶,都是制衡輝達、分散客戶風險的重要力量,也會分得一部分產能。

產能分配明細

總體來看,產品需求最旺、單價最高、技術最領先的輝達有望拿到其中近60%的產能;AMD的預定量在90K左右,佔比接近8%,相比2025年有64%的增量,增幅幾乎與輝達一致。

當然單一客戶CoWoS訂單激增,也包含了中介層放大的因素,但對於業績的貢獻必然是正面的。不過也要強調,更複雜、整合度更高的封裝(如整合更多HBM、更大中介層)初期良率較低,實際有效產出需打折。

表3:CoWoS產能整體預訂和分配情況

整個ASIC陣營,大致可以劃分為博通、世芯(AI Chip)、Marvell和聯發科幾家,其中博通是領頭羊。

博通2026年預定量大幅增至200K,同比增122%,主要受GoogleTPU外供拉動,但博通主要負責TPU v6p以及v7p,偏向推理的v7e由聯發科負責,會在2026年下半年推出。未來TPU v8還是會遵循v7的模式,由博通與聯發科兩家下單CoWoS。

博通的200K預定量,按客戶預訂情況大致拆分如下:

  • 第一大客戶GoogleTPU預計分得200K當中60~65%
  • 第二大客戶Meta的MTIA大約佔博通預訂量的20%左右
  • 第三大客戶OpenAI將於年底推出內部代號Titan晶片,台積電N3製程,預計佔今年博通預訂量的5-10%,2027年將達到20%+
  • 2028年,蘋果的AI ASIC晶片Baltra也將面世,目前由博通負責高速互聯,SerDes IP以及後端布線,預計2026年上半年進入流片階段。
表4:ASIC陣營的CoWoS產能預訂和分配情況

相比之下,由於AWS下一代Trainium 3轉單世芯(Al chip),Marvell顯得比較失意,主要客戶還是AWS的Trainium 2,好在新客戶微軟採用N3E製程的Maia 200加入,才避免了下滑,CoWoS預定量與2025年持平。

世芯由於拿到了AWS Trainium 3訂單,CoWoS預訂量上升到60k,同比增加200%,大部分預定產能為N3製程的Trainium 3 Anita,加上Inferentia 2、微軟Maia 100以及少量的Intel Gaudi 3。

Annapurna作為AWS的子公司,一直承擔AI ASIC開發任務,同時也向台積電直接預定CoWoS產能,Trainium 3的Mariana版本有別於Al chip的Anita版本,同時在台積電投片。

聯發科是台積電2026年CoWoS的新進客戶,目前已調撥大量人力支援ASIC業務——未來將成為聯發科的重點類股——2026年下半年主要承擔側重推理的TPU v7e的出貨,並在2027年作為出貨主力年,同時2027年將疊加TPU v8e的訂單,有機會出現600%的CoWoS同比增幅。

根據我們瞭解到的情況,聯發科目前已將AI ASIC視為未來核心業務,作為行業巨頭,其佈局AI晶片將很大影響目前ASIC設計的行業格局。

剩下的台積電CoWoS客戶的量級都小於1萬片,其中微軟自研ASIC Athena的早期設計與流片還是微軟自己的團隊在小批次推進中。

有了產能的分配資料,基於矽中介層面積,大致就能算出來,2026年,各家能夠出多少顆GPU/ASIC晶片。

我們假設輝達的660000片晶圓當中,10%分配給Hopper架構,即6.6萬片,按單片切29顆來計算,預計今年整體H200的產出量可以達到190萬顆

回看整體台積電整體產能分配,拿下總共75萬片CoWoS產能的GPGPU陣營(NV+AMD),在面對還只有37萬片產能的ASIC陣營時,還是擁有絕對的火力優勢,甚至輝達一家的火力就超過全球其他企業的總和。

03

算力、營收:GPGPU具備碾壓優勢

CoWoS是一個關鍵變數,但僅比較CoWoS還是會誤判戰局——不同的封裝方案,比如single-die以及dual-die方案,將導致中介層面積出現很大的不同。

以Hopper為例,由於採用single-die,一片CoWoS晶圓可以切29顆,到了Blackwell由於採用dual-die方案,每片晶圓只能切14顆。

所以,台積電CoWoS的產能增幅,不能單純定義為AI晶片出貨量的增加,也要考慮CoWoS矽中介層面積不斷放大的增量。

從CoWoS到SoW,光罩面積及中介層變化,來源:台積電

前面表1有提到,矽中介層面積越來越大的變化趨勢,是AI晶片明確的技術路線,目前中介層面積是光罩面積的3.3x,2026年的Rubin將提升到是4~5.5x,而2027年4-die合封的Rubin Ultra將達到9~9.5x。

因此,以CoWoS的產能(消耗面積)增、減幅度來計算企業營收增、減幅度更為準確。

所以,這場AI晶片戰爭的主導因素,除了要看誰消耗了更多的CoWoS產能,也要看誰貢獻了更多的算力,以及誰創造了更多的營收和利潤

算力維度的比較非常直觀,一顆輝達B300的FP8算力達10PFLOPS,而一顆定製推理ASIC的算力可能僅為其幾分之一,即便是最強的TPU v7p也只有輝達B300的一半,這沒有將今年要推出的Rubin考慮在內。

就在2026年1月6日開幕的CES上,老黃說Rubin的性能比Blackwell在推理提升5倍,訓練提升了3.5倍,言外之意是GPU與ASIC的性能差距並沒有縮小。

從算力維度可以得出結論——即使CoWoS切出來的晶片顆數接近,GPGPU陣營的總算力很可能仍大幅領先,這是GPU通用架構的“蠻力”優勢——來自CoWoS消耗面積(電晶體)的多寡。

價值維度的比較則更為殘酷,輝達單顆GPU售價高達3萬美元以上,未來會提升到4-5萬美元。雲巨頭自研ASIC晶片的“成本”即便與GPU接近,“內部結算價”肯定賣不到GPGPU的市場價格。

以Anthropic向博通採購210億美元的100萬顆TPU為例,扣除伺服器等諸多配置,單顆對外售價在1.5萬美元以下,不到輝達Blackwell系列的一半。

結合算力和價值兩個點,可以更明確的得出結論——AI晶片是多維度的比拚,不單單比摩爾定律、比晶片工藝製程,還要比誰的面積更大,能放進更多電晶體,最終表現在性能上的差別,也決定了價格。

輝達用60%的CoWoS產能,創造整個AI加速晶片市場70%以上的收入和90%以上的利潤,這才是文章開頭黃仁勳“6個季度,5000億美元”的底氣。

04

ASIC的本質:最佳化財務報表

輝達的優勢,CUDA就不必說了,經常被忽略掉的是搭配的NVLink、NVSwitch所構成的系統級優勢,使用者買的不是晶片,而是一整套最強的“交鑰匙”解決方案。

作為對比,ASIC晶片優勢在於,雲廠這類超大規模使用者,當其軟體棧完全自控且工作負載高度特化且穩定(如搜尋推薦、廣告排名、語音識別推理),自研能帶來極致的總擁有成本(TCO)最佳化。

可以這樣說:AISC要講的故事——專用化換取“去輝達化”,最終最佳化財務報表。所以,能不能用ASIC的關鍵只有一點,規模(量)夠不夠大,沒有其他。

首先,自研ASIC的資金、人力投入巨大;其次,便宜的TPU可不是買來就直接能用的,像Anthropic向博通採購210億美元直接採購GoogleTPU的方案,背後也需要配置一支極為強大的底層系統工程師團隊,並不斷進行深度遷移及適配。

所以,僅僅開支這一項,也決定了ASIC只有超大型雲廠、超大規模企業才會使用,但即便是購買現成ASIC晶片,也就能拓展到Anthropic這體量的大模型企業,很難再往下了。

再者,目前頭部AI叢集的功耗已從幾十千瓦邁向兆瓦級,未來晶片功耗將飆升至數千瓦,普通客戶無法承受這種規模。而且,在風冷已到極限,液冷(包括冷板、浸沒式)成為標配的背景下,資料中心的物理設計和最大叢集規模,都是必須綜合考量的因素。

另外,GPGPU與AISC兩者的較量也不限於單晶片,基於CPO共封裝來解決“功耗牆”和“互連牆”,這種系統級的方案,以及華為的384顆NPU互連的CloudMatrix 384這種系統架構創新,也都至關重要。

所以,CoWoS只是起點,更上層的互連網路(NVLink, CXL, UCIe)、光引擎(CPO)都是競爭的關鍵變數。

而這些變數所需要的巨額資本支出,都不是小廠可以承受的。

05

終局推演:軍火商大贏家

現階段輝達為代表的GPGPU(通用圖形處理器)市場,雖然部分被侵蝕,但隨著物理AI這些領域的推進,在可見的3-5年,輝達仍將統治AI訓練市場和高性能通用計算市場(訓練、新興應用、中小企業、科研)。

但是,推理佔據未來AI算力實際消耗的大頭,且工作負載更固定,正是ASIC的用武之地,ASIC的勢頭只會越來越好。

所以大家會看到,為了加固“護城河”,輝達斥資200億美元收購Groq,意圖將LPU融入自己的技術矩陣中。

與此同時,輝達也在通過推出更細分領域的產品,如推理專用晶片、更靈活的訂閱模式(DGX Cloud)、以及更強大的系統級解決方案(如NVL144/288/576),來應對ASIC的“包圍”。

目前的輝達依舊處於有利位置,依舊掌握著“AI晶片戰爭”的主動權,他們要解決的核心問題——市佔率與毛利的平衡。

只要輝達不堅守極高的毛利率,願意犧牲毛利換取市場,他還是無堅不摧的王者。

ASIC生態下,GoogleTPU外供,標誌著ASIC從“概念”和“試點”正式邁入“規模化部署”,其增長直接與這些雲巨頭的資本開支繫結。

只要巨頭們持續投資AI基礎設施,且自研晶片的TCO優勢持續存在,ASIC晶片對CoWoS需求就會持續增長。博通,聯發科,Marvell作為頂級設計服務商將持續受益。

很多人會關注,GPGPU和ASIC對CoWoS產能需求變化?

從產品進化的角度來看,2026年的Rubin架構產品,率先採用5.5x光罩面積的中介層,2027年很快會推進到9.5x,ASIC產品的絕對性能沒有GPGPU那般極致要求,2026年預估也就在3.3x,甚至在2027年也大機率還如此。所以結論基本也是明確的:未來GPGPU對CoWoS產能的預定量會大幅度增長。

而回到最終晶片的數量上,由於ASIC晶片的中介層普遍在2500mm²,單片CoWoS晶圓切出來的晶片數量,是GPGPU的兩倍,而GPGPU目前CoWoS預定量是ASIC的兩倍,所以今年兩種類型AI晶片的全球出貨量,也就大體相當

至於企業營收,那就與CoWoS出貨量成正比了,因為性能與面積(電晶體總數)成正比,同製程雙顆的dual-die性能必然高於single-die的晶片。

所以,未來我們更可能看到的是一個 “GPU+ASIC”的混合算力世界:雲巨頭用輝達GPU進行前沿模型研發和訓練,同時用自研ASIC進行成本敏感的大規模推理部署。

換句話說,這場戰爭並非一場你死我活的殲滅戰,而是一場持久且複雜的“劃界戰爭”。

但不管兩種生態格局如何,作為這場晶片戰共同且唯一的“軍火商”,台積電坐擁CoWoS產能的定價權,將是無論那一方獲勝都不可或缺的終極大贏家。 (騰訊科技)