“未來六個季度資料中心收入5000億美元。”黃仁勳在GTC25上說。2026年1月6日開幕的CES 2026,老黃又宣稱90%的ASIC項目會失敗,這實際上是對此前GoogleTPU為代表的ASIC晶片(專用積體電路)的口頭“討伐”,一場針對ASIC的全面圍獵已經悄悄開始。很多人會關心,GPU、ASIC競爭的終局如何?答案是取決於半導體戰爭的終極彈藥庫——台積電CoWoS先進封裝產能。這意味著,只要對台積電CoWoS產能預訂、分配情況,進行顆粒度拆解,就能精確測算出2026年AI算力晶片的出貨格局。可以說,2026年“晶片戰”,繫於台積電115萬片CoWoS晶圓產能。GPGPU與ASIC陣營對壘,圖片由AI生成01戰爭的起源我們先對GPU和ASIC的戰爭背景做一些鋪墊(有行業基礎可跳過本部分)。人工智慧對算力的需求擴張是共識,但必須明確:更先進的計算架構、工藝製程和先進封裝,是三個關鍵路徑。關於架構,談到最多的是GPGPU(通用圖形處理器),輝達在這條路上,借助CUDA生態的20年鋪墊,成為通用平行計算的絕對王者。硬體層面,輝達的核心武器有兩個:HBM記憶體極高的頻寬、GPGPU大規模流處理器陣列。從H200、GB200到2026年1月推出的“Vera Rubin”,都是這條路徑的產物,性能提升直接與視訊記憶體頻寬、NVLink互連規模掛鉤。GPGPU之外,以GoogleTPU為代表的ASIC晶片,探索出了另一條更精準、定製化的架構——雲端推理側的負載日益固化,為特定演算法(如Transformer)定製的ASIC晶片,能夠展現出碾壓級的能效比,即每瓦性能和總擁有成本(TCO)優勢。Google的TPU、亞馬遜的Trainium都是這條路徑的先鋒。博通、Marvell、Al chip等設計公司,正是通過為這些雲巨頭定製ASIC晶片,撕開了AI晶片兆市場的一道口子。相比架構競爭,工藝製程這條路徑顯得更好理解,從7nm、5nm、3nm到2025年底量產的2nm,每一次製程躍進都意味著電晶體密度和能效的提升。不過,工藝製程是一條高門檻的路徑:進化速度越來越慢,成本越來越貴,2nm晶圓代工價格高達3萬美元,入場費已非所有玩家都能承受。此外,工藝製程的微縮還將面臨“功耗牆”和“儲存牆”。架構、製程之外,第三個關鍵路徑是先進封裝,以CoWoS(Chip on Wafer on Substrate)為代表的先進封裝是台積電為高性能計算打造的“皇冠上的明珠”。CoWoS封裝概念圖,來源:台積電CoWoS的精髓在於異構整合,將多個小晶片,例如計算芯粒(GPU/ASIC核心)、高頻寬記憶體(HBM)、I/O芯粒等,通過中介層進行超高密度、超高頻寬互連,整合在一個封裝內。表1:CoWoS中介層面積變化趨勢這種方式可以突破單晶片光罩(掩範本)尺寸限制,中介層面積當前可達2800mm²,直接好處就是電晶體更多,HBM視訊記憶體更高。另外,由於CoWoS採用了矽中介層,上面的微凸塊(μBump)間距極小,芯粒間通訊頻寬激增,延遲和功耗大幅降低。正因如此,無論是追求極致性能的輝達GPU,還是追求最佳總擁有成本的雲巨頭ASIC,但凡涉足頂級AI算力,都離不開CoWoS。所以,在2026年這個時間點上,當製程進入2nm深水區,成本高企,架構路線出現根本性分叉時,CoWoS先進封裝的產能分配,就成了決定算力版圖的最關鍵變數,沒有之一。02產能圖譜:台積電CoWoS的供給格局表2:台積電CoWoS產能爬坡情況從我們掌握的情況來看,過去三年,台積電CoWoS產能一路從單月12K晶圓,逐步爬升至2025年底的80K/月,2026年年底的預估目標是120K/月左右。取一個全年有效平均值:96K/月,即2026年台積電CoWoS總有效產能約為:96K/月 × 12個月 = 1150000片晶圓,這是AI晶片戰的總彈藥基數。產能分配原則這1150000萬片晶圓如何分配,背後是一場基於技術、商業、地緣的複雜棋局。按照優先順序,輝達作為CoWoS最早期、最大膽的共同定義者和投資者,其架構(如NVLink)與台積電CoWoS工藝深度耦合,毫無意外可以拿到最多。按客戶層級,由於 蘋果、輝達、AMD是台積電前三大VVIP級客戶,其巨額預付款和長期協議鎖定了基礎產能。不過,蘋果要到2028年才有自研AI晶片。另外,博通、Marvell因承接Google、AWS、Meta等雲巨頭天量ASIC訂單,已躋身頂級VIP客戶行列。另外,對台積電來說,除了ASIC以外,AMD、英特爾乃至中國客戶,都是制衡輝達、分散客戶風險的重要力量,也會分得一部分產能。產能分配明細總體來看,產品需求最旺、單價最高、技術最領先的輝達有望拿到其中近60%的產能;AMD的預定量在90K左右,佔比接近8%,相比2025年有64%的增量,增幅幾乎與輝達一致。當然單一客戶CoWoS訂單激增,也包含了中介層放大的因素,但對於業績的貢獻必然是正面的。不過也要強調,更複雜、整合度更高的封裝(如整合更多HBM、更大中介層)初期良率較低,實際有效產出需打折。表3:CoWoS產能整體預訂和分配情況整個ASIC陣營,大致可以劃分為博通、世芯(AI Chip)、Marvell和聯發科幾家,其中博通是領頭羊。博通2026年預定量大幅增至200K,同比增122%,主要受GoogleTPU外供拉動,但博通主要負責TPU v6p以及v7p,偏向推理的v7e由聯發科負責,會在2026年下半年推出。未來TPU v8還是會遵循v7的模式,由博通與聯發科兩家下單CoWoS。博通的200K預定量,按客戶預訂情況大致拆分如下:第一大客戶GoogleTPU預計分得200K當中60~65%第二大客戶Meta的MTIA大約佔博通預訂量的20%左右第三大客戶OpenAI將於年底推出內部代號Titan晶片,台積電N3製程,預計佔今年博通預訂量的5-10%,2027年將達到20%+2028年,蘋果的AI ASIC晶片Baltra也將面世,目前由博通負責高速互聯,SerDes IP以及後端布線,預計2026年上半年進入流片階段。表4:ASIC陣營的CoWoS產能預訂和分配情況相比之下,由於AWS下一代Trainium 3轉單世芯(Al chip),Marvell顯得比較失意,主要客戶還是AWS的Trainium 2,好在新客戶微軟採用N3E製程的Maia 200加入,才避免了下滑,CoWoS預定量與2025年持平。世芯由於拿到了AWS Trainium 3訂單,CoWoS預訂量上升到60k,同比增加200%,大部分預定產能為N3製程的Trainium 3 Anita,加上Inferentia 2、微軟Maia 100以及少量的Intel Gaudi 3。Annapurna作為AWS的子公司,一直承擔AI ASIC開發任務,同時也向台積電直接預定CoWoS產能,Trainium 3的Mariana版本有別於Al chip的Anita版本,同時在台積電投片。聯發科是台積電2026年CoWoS的新進客戶,目前已調撥大量人力支援ASIC業務——未來將成為聯發科的重點類股——2026年下半年主要承擔側重推理的TPU v7e的出貨,並在2027年作為出貨主力年,同時2027年將疊加TPU v8e的訂單,有機會出現600%的CoWoS同比增幅。根據我們瞭解到的情況,聯發科目前已將AI ASIC視為未來核心業務,作為行業巨頭,其佈局AI晶片將很大影響目前ASIC設計的行業格局。剩下的台積電CoWoS客戶的量級都小於1萬片,其中微軟自研ASIC Athena的早期設計與流片還是微軟自己的團隊在小批次推進中。有了產能的分配資料,基於矽中介層面積,大致就能算出來,2026年,各家能夠出多少顆GPU/ASIC晶片。我們假設輝達的660000片晶圓當中,10%分配給Hopper架構,即6.6萬片,按單片切29顆來計算,預計今年整體H200的產出量可以達到190萬顆。回看整體台積電整體產能分配,拿下總共75萬片CoWoS產能的GPGPU陣營(NV+AMD),在面對還只有37萬片產能的ASIC陣營時,還是擁有絕對的火力優勢,甚至輝達一家的火力就超過全球其他企業的總和。03算力、營收:GPGPU具備碾壓優勢CoWoS是一個關鍵變數,但僅比較CoWoS還是會誤判戰局——不同的封裝方案,比如single-die以及dual-die方案,將導致中介層面積出現很大的不同。以Hopper為例,由於採用single-die,一片CoWoS晶圓可以切29顆,到了Blackwell由於採用dual-die方案,每片晶圓只能切14顆。所以,台積電CoWoS的產能增幅,不能單純定義為AI晶片出貨量的增加,也要考慮CoWoS矽中介層面積不斷放大的增量。從CoWoS到SoW,光罩面積及中介層變化,來源:台積電前面表1有提到,矽中介層面積越來越大的變化趨勢,是AI晶片明確的技術路線,目前中介層面積是光罩面積的3.3x,2026年的Rubin將提升到是4~5.5x,而2027年4-die合封的Rubin Ultra將達到9~9.5x。因此,以CoWoS的產能(消耗面積)增、減幅度來計算企業營收增、減幅度更為準確。所以,這場AI晶片戰爭的主導因素,除了要看誰消耗了更多的CoWoS產能,也要看誰貢獻了更多的算力,以及誰創造了更多的營收和利潤。算力維度的比較非常直觀,一顆輝達B300的FP8算力達10PFLOPS,而一顆定製推理ASIC的算力可能僅為其幾分之一,即便是最強的TPU v7p也只有輝達B300的一半,這沒有將今年要推出的Rubin考慮在內。就在2026年1月6日開幕的CES上,老黃說Rubin的性能比Blackwell在推理提升5倍,訓練提升了3.5倍,言外之意是GPU與ASIC的性能差距並沒有縮小。從算力維度可以得出結論——即使CoWoS切出來的晶片顆數接近,GPGPU陣營的總算力很可能仍大幅領先,這是GPU通用架構的“蠻力”優勢——來自CoWoS消耗面積(電晶體)的多寡。價值維度的比較則更為殘酷,輝達單顆GPU售價高達3萬美元以上,未來會提升到4-5萬美元。雲巨頭自研ASIC晶片的“成本”即便與GPU接近,“內部結算價”肯定賣不到GPGPU的市場價格。以Anthropic向博通採購210億美元的100萬顆TPU為例,扣除伺服器等諸多配置,單顆對外售價在1.5萬美元以下,不到輝達Blackwell系列的一半。結合算力和價值兩個點,可以更明確的得出結論——AI晶片是多維度的比拚,不單單比摩爾定律、比晶片工藝製程,還要比誰的面積更大,能放進更多電晶體,最終表現在性能上的差別,也決定了價格。輝達用60%的CoWoS產能,創造整個AI加速晶片市場70%以上的收入和90%以上的利潤,這才是文章開頭黃仁勳“6個季度,5000億美元”的底氣。04ASIC的本質:最佳化財務報表輝達的優勢,CUDA就不必說了,經常被忽略掉的是搭配的NVLink、NVSwitch所構成的系統級優勢,使用者買的不是晶片,而是一整套最強的“交鑰匙”解決方案。作為對比,ASIC晶片優勢在於,雲廠這類超大規模使用者,當其軟體棧完全自控且工作負載高度特化且穩定(如搜尋推薦、廣告排名、語音識別推理),自研能帶來極致的總擁有成本(TCO)最佳化。可以這樣說:AISC要講的故事——專用化換取“去輝達化”,最終最佳化財務報表。所以,能不能用ASIC的關鍵只有一點,規模(量)夠不夠大,沒有其他。首先,自研ASIC的資金、人力投入巨大;其次,便宜的TPU可不是買來就直接能用的,像Anthropic向博通採購210億美元直接採購GoogleTPU的方案,背後也需要配置一支極為強大的底層系統工程師團隊,並不斷進行深度遷移及適配。所以,僅僅開支這一項,也決定了ASIC只有超大型雲廠、超大規模企業才會使用,但即便是購買現成ASIC晶片,也就能拓展到Anthropic這體量的大模型企業,很難再往下了。再者,目前頭部AI叢集的功耗已從幾十千瓦邁向兆瓦級,未來晶片功耗將飆升至數千瓦,普通客戶無法承受這種規模。而且,在風冷已到極限,液冷(包括冷板、浸沒式)成為標配的背景下,資料中心的物理設計和最大叢集規模,都是必須綜合考量的因素。另外,GPGPU與AISC兩者的較量也不限於單晶片,基於CPO共封裝來解決“功耗牆”和“互連牆”,這種系統級的方案,以及華為的384顆NPU互連的CloudMatrix 384這種系統架構創新,也都至關重要。所以,CoWoS只是起點,更上層的互連網路(NVLink, CXL, UCIe)、光引擎(CPO)都是競爭的關鍵變數。而這些變數所需要的巨額資本支出,都不是小廠可以承受的。05終局推演:軍火商大贏家現階段輝達為代表的GPGPU(通用圖形處理器)市場,雖然部分被侵蝕,但隨著物理AI這些領域的推進,在可見的3-5年,輝達仍將統治AI訓練市場和高性能通用計算市場(訓練、新興應用、中小企業、科研)。但是,推理佔據未來AI算力實際消耗的大頭,且工作負載更固定,正是ASIC的用武之地,ASIC的勢頭只會越來越好。所以大家會看到,為了加固“護城河”,輝達斥資200億美元收購Groq,意圖將LPU融入自己的技術矩陣中。與此同時,輝達也在通過推出更細分領域的產品,如推理專用晶片、更靈活的訂閱模式(DGX Cloud)、以及更強大的系統級解決方案(如NVL144/288/576),來應對ASIC的“包圍”。目前的輝達依舊處於有利位置,依舊掌握著“AI晶片戰爭”的主動權,他們要解決的核心問題——市佔率與毛利的平衡。只要輝達不堅守極高的毛利率,願意犧牲毛利換取市場,他還是無堅不摧的王者。ASIC生態下,GoogleTPU外供,標誌著ASIC從“概念”和“試點”正式邁入“規模化部署”,其增長直接與這些雲巨頭的資本開支繫結。只要巨頭們持續投資AI基礎設施,且自研晶片的TCO優勢持續存在,ASIC晶片對CoWoS需求就會持續增長。博通,聯發科,Marvell作為頂級設計服務商將持續受益。很多人會關注,GPGPU和ASIC對CoWoS產能需求變化?從產品進化的角度來看,2026年的Rubin架構產品,率先採用5.5x光罩面積的中介層,2027年很快會推進到9.5x,ASIC產品的絕對性能沒有GPGPU那般極致要求,2026年預估也就在3.3x,甚至在2027年也大機率還如此。所以結論基本也是明確的:未來GPGPU對CoWoS產能的預定量會大幅度增長。而回到最終晶片的數量上,由於ASIC晶片的中介層普遍在2500mm²,單片CoWoS晶圓切出來的晶片數量,是GPGPU的兩倍,而GPGPU目前CoWoS預定量是ASIC的兩倍,所以今年兩種類型AI晶片的全球出貨量,也就大體相當。至於企業營收,那就與CoWoS出貨量成正比了,因為性能與面積(電晶體總數)成正比,同製程雙顆的dual-die性能必然高於single-die的晶片。所以,未來我們更可能看到的是一個 “GPU+ASIC”的混合算力世界:雲巨頭用輝達GPU進行前沿模型研發和訓練,同時用自研ASIC進行成本敏感的大規模推理部署。換句話說,這場戰爭並非一場你死我活的殲滅戰,而是一場持久且複雜的“劃界戰爭”。但不管兩種生態格局如何,作為這場晶片戰共同且唯一的“軍火商”,台積電坐擁CoWoS產能的定價權,將是無論那一方獲勝都不可或缺的終極大贏家。 (騰訊科技)