2026年全球半導體展望(ㄧ) 從CoWoS看GPU與ASIC的AI世紀大戰

2025年,黃仁勳在GTC上擲地有聲的「未來六個季度資料中心收入5000億美元」預言,不僅是對市場的強心針,更是對整個算力產業鏈的總動員令。

然而,硝煙從未散去。2026年開局的CES,老黃直言90%的ASIC可能都會失敗。

如此一來,戰局愈發清晰,以輝達為首的通用GPU陣營,與以博通(承載GoogleTPU、Meta Mtia等)、Marvell(承載AWS Trainium等)為代表的定製化ASIC陣營,在台積電CoWoS先進封裝產能這一終極戰略資源上,展開了寸土必爭的爭奪。

本報告將以CoWoS產能為唯一錨點,精確測算2026年AI算力晶片的出貨格局,並首次進行系統性覆盤,驗證此前預測的成敗得失。

同時,我們將深入剖析CES上黃仁勳與蘇姿丰描繪的技術藍圖,探討「物理AI的ChatGPT時刻」對戰局的深遠影響,以及輝達收購Grop這一關鍵棋步背後的戰略意圖。

結論將揭示:這場對決不僅是算力的比拚,更是生態、架構與供應鏈掌控力的全面戰爭。

第一章. 復盤2025

在深入2026年戰局前,必須對我們2025年的預測進行一次嚴苛的覆盤。所有的預測不去檢討不去復盤那都是妥妥的胡扯與耍流氓。

先來看看預言精準之處:

1. CoWoS產能是絕對瓶頸與勝負手:

2025原文開篇即點出,2023年輝達因應AI爆發向台積電緊急加單CoWoS,但產能仍嚴重不足,並精確追蹤了2023年台積電與Amkor第二供應源的總出貨量(約63K/片)。

以CoWoS為核心稀缺資源進行供需測算的分析框架,在2025年同樣被完全驗證。

無論是輝達Blackwell的放量,還是博通承接的GoogleTPU、Meta Mtia等ASIC大單,其出貨上限無一不受制於台積電CoWoS的產能爬坡速度。

2025原文中「CoWoS的產能增幅,對應的不只是AI晶片出貨量數量的增加,還疊加了Interposer面積不斷放大的增量」這一判斷,成為理解後續GPU與ASIC出貨量與營收增速差異的關鍵。

這一點也是從晶片製造端瞭解未來AI晶片必須建立的基礎認知。

2. ASIC陣營增速將超越GPU: 這是筆者2025年原文最核心、也最具前瞻性的判斷。

2025原文筆者的模型基於CoWoS booking資料推測:『2024到2027年將進入ASIC的超級增長周期,三年80%的複合增長率』,25年原文明確指出博通的ASIC業務(AI業務中扣除交換器業務)將從2024年的80億美元增長至2027年的400億美元。

如今看來,2025單單ASIC業務大約增長50%到120億,當初預測2027年400億將是打底的數字,目前樂觀可以看到500億以上,也就是說2026-2027年都是博通ASIC的超高增長年,這一點我們從文章的2026-27 CoWoS booking資料也能看出端倪。

博通ASIC業務增長率(不含交換機)

事實證明,2025年1月筆者當初公佈的模型極具前瞻的洞察力。

2025年,博通接連拿下Anthropic超210億美元、OpenAI超百億美元的ASIC大單,其AI相關營收暴增,股價與市值一路飆升,完全印證了ASIC賽道在推理市場爆發下的強勁增長。

原文中「2024-2027年ASIC的CoWoS消耗量複合增長率將達80%高於GPGPU」的判斷,這一點在2026年博通 CoWoS booking 100%+的年增量遠高於輝達的65%增量上完全驗證,根據筆者的一手訊息,博通2027年的CoWoS增量將繼續超越輝達。

3.輝達面對ASIC的挑戰將尋求策略轉變:

2025原文大膽預測:『NV的業績在2025年將突破2000億美元,來到2100億美元…但在2026年增幅下降』、『如果維持現有死守訓練端的高毛利策略,2027年將出現業績零增長的可能』。

所以,2025年原文,筆者也預見性地指出:「ASIC必然是NV現階段不想做(低毛利)但未來卻不得不做的業務」、「NV不可能坐以待斃…如果市場到了沒辦法再繼續維持超高毛利的階段,輝達手上的武器一個一個放出來都是王炸」。

2025年的市場走勢與輝達的動向完美呼應了筆者所有判斷,輝達2025財年營收確如預期突破2100億美元大關,但市場已開始擔憂其2026年增長率。

更重要的是,筆者在2025年一月文章中,預測輝達一定會針對ASIC採取針對性行動,他不能也不會只死守訓練高毛利市場。

隨後,在2025年1月的CES首先推出GB10的桌面工作站晶片,3月GTC推出DGX Spark,9月推出搭載GDDR的Rubin CPX,全部都是針對推理市場的專用晶片。

10月份的GTC,老黃又扔出開放生態的NVLink Fusion,這猶如攻入ASIC腹地的特洛伊木馬。

12月份以200億美元的超高溢價收購Groq,意圖直取ASIC高能耗效比的命門。

這一系列動作,明確展現出輝達進軍定製化、低毛利市場以對抗ASIC侵蝕的戰略意圖,與筆者2025年1月的原文的預判完全一致。

當然筆者在2025年1月無法預測輝達會採取什麼手段,只能做出輝達一定會有針對ASIC的戰略轉向與調整的預言。

4.出貨量(顆數)與營收(價值)的背離:

2025年原文深刻指出,由於ASIC的Interposer面積通常小於GPU,因此「採用不同方案的不同晶片,一片CoWoS能切割出的晶片數量天差地別」。

這導致在消耗相同CoWoS面積(產能)的情況下,ASIC可以產出更多的晶片顆數。因此,比較出貨顆數時ASIC可能快速逼近甚至超越GPU,但在營收和利潤上,單價高昂的GPU仍將佔據主導。

這一細微但關鍵的區分,是理解GPU與ASIC市場份額之爭的基石。

預測偏差部分:

1. GPU增長韌性超呼筆者的預期:

2025原文對2026年GPU增長「陡降」的判斷可能過於悲觀。

從2025年底至2026年初的產業動態看,由於「物理AI」、機器人等新興應用的強勁需求,以及輝達Rubin等新一代平台帶來的性能飛躍,訓練端需求並未如預期般快速見頂,反而保持了強勁勢頭。

這使得GPU在2026年的CoWoS消耗佔比和營收增長,比25年的原文預期的更為堅挺。

2. 技術路線融合加速:

2025年原文的特點就是從晶片製造等物理層面,將GPU與ASIC視為兩條相對平行的賽道去分析,是整個網路上唯一用晶片製造的視角去看待與分析AI格局演變的文章。

但實際上架構,軟體,生態等技術融合趨勢不斷再加劇。

輝達通過NVLink Fusion等技術開放生態,試圖將ASIC納入其體系;而一些ASIC也在增強可程式設計性。

兩者的界限正在模糊,未來的競爭可能更多是「可程式設計通用加速器」與「高度定製化專用加速器」在不同場景下的混合架構之爭。

2026年的展望系列,我們還是會從晶片製造的硬體視角出發,並結合軟體層面,更全面的來看待未來AI晶片的市場格局。

復盤結論:

總體而言,筆者2025年初的預測文章,在核心邏輯(CoWoS為王、ASIC增速將超越GPU、輝達需戰略轉型)和關鍵資料推演上,展現了極高的精準性和前瞻性。

成功地預見了博通等ASIC設計公司的崛起,以及輝達面臨的增長拐點與戰略抉擇。

儘管在輝達2026增長曲線的斜率上存在細微偏差,但文章建立的「以CoWoS產能為錨,穿透出貨量與價值背離」的分析框架,依然是研判2026年乃至更長期AI算力格局最有力的工具。

第二章:戰爭的底層邏輯 - AI算力需求大爆炸

要理解今天在CoWoS產能上的寸土必爭,必須回到一切的起點:AI

不只是近年興起的大語言模型(LLM),目前多模態,AI Agent甚至物理世界模擬,讓AI對算力近乎貪婪的渴求。

面對每年5倍增長的token衍伸出的算力需求,依靠摩爾定律兩年翻一倍電晶體數量的算力增長已經完全跟不上節奏。

因為AI的出現,整個半導體行業迸發了無窮的潛力,在後摩爾定律時代竟然電晶體增加速度遠超以前,記得數年前許多人云亦云的網民,高喊著摩爾定律已死,現在看來甚是可笑,誰知道再過幾年又有啥新科技出現呢?

從晶片製造層面,面對AI恐怖的算力增長需求,晶片製造領域唯有不斷縮小單位線寬同時不斷加大晶片面積,一縮一放的加乘效果才能勉強跟上AI的節奏。

當然增加出貨量也是一個辦法,但這裡就遇到了前段製程與CoWoS產能的瓶頸。

傳統的CPU架構在平行矩陣運算面前效率低下,也催生了專用加速晶片的黃金時代。

最終,AI的出現推動半導體技術演進沿著三條相互交織又彼此競爭的路徑展開:

1. 架構路徑:從通用到專用,生態與效率的終極對決

GPGPU的霸權之路: 輝達的CUDA生態,將圖形處理器鍛造成了通用平行計算GPGPU的絕對王者。

其核心武器是極高的記憶體頻寬(通過HBM)和大規模流處理器陣列。

從H200、GB200到今年即將推出的“Vera Rubin”,都是這條路徑的產物,性能提升直接與視訊記憶體頻寬、NVLink互連規模掛鉤。輝達構築的,是一個從硬體到軟體(CUDA、AI軟體棧)的封閉而強大的帝國。

正如老黃在CES演講所說,物理AI的ChatGPT時刻來了,AI的第二拐點,從理解語言到理解物理世界,將還是由通用型GPGPU主導。

ASIC的精準革命: 當AI工作負載,尤其是雲端推理側的負載日益固化,為特定演算法(如Transformer)定製的ASIC便展現出碾壓級的能效比Performance per Watt,和總擁有成本(TCO)優勢。

Google的TPU、亞馬遜的Inferentia/Trainium、微軟的Athena,以及中國的華為Ascemd,寒武紀MLU都是這條路徑的先鋒。

它們通過犧牲通用性,換取在特定戰場上的極致性價比。而博通、Marvell、Al chip等設計公司,正是通過為這些CSP雲巨頭定製ASIC,撕開了兆市場的一道口子。

2.製程路徑:奈米尺度的軍備競賽

摩爾定律的延續是性能提升的物理基礎。從7nm、5nm、3nm到2026年量產的2nm,每一次製程躍進都意味著電晶體密度和能效的提升。

2024年3月份台積電的劉德音與黃漢森在IEEE發表的文章 , 計算出不用十年 , 人類就可以製造出一兆顆電晶體的GPU單晶片。

未來不再只是通過光刻等製程微縮這單一手段來提升電晶體數量 , GAA、CFET等立體結構的最佳化、2D新材料以及先進封裝每一個技術都能有效並持續的提升電晶體數量。

然而,單純靠微縮已面臨“功耗牆”和“儲存牆”。2nm晶圓的代工價格傳聞高達3萬美元,這已非所有玩家都能承受的賭桌入場費。

3.封裝路徑:超越摩爾,系統級創新的主戰場

當製程微縮邊際效益遞減且成本飆升,“超越摩爾”(More than Moore)成為新的增長引擎。其核心就是先進封裝,而CoWoS正是台積電為高性能計算打造的“皇冠上的明珠”。

CoWoS的精髓在於異構整合。它不再追求製造一個巨大且良率堪憂的單片晶片,而是將多個小晶片,例如計算芯粒(GPU/ASIC核心)、高頻寬記憶體(HBM)、I/O芯粒等,通過Interposer進行超高密度、超高頻寬互連,整合在一個封裝內。

CoWoS帶來了三大降維打擊優勢:

*突破光罩板極限: 製造遠超單個光刻機視場尺寸的超大晶片成為可能。

*混合搭配,最優解: 可以整合不同工藝節點、不同功能的芯粒,實現性能、成本、功耗的最佳平衡。

*極致互連性能: 矽中介層上的微凸塊(μBump)間距極小,使得芯粒間通訊頻寬激增,延遲和功耗大幅降低。

正因如此,無論是追求極致性能的輝達GPU,還是追求最佳TCO的雲巨頭ASIC,但凡涉足頂級AI算力,都離不開CoWoS。它從一項“使能技術”,變成了決定最終產品出貨量的戰略瓶頸資源。

後摩爾定律時代,More than Moore成為主角,各種型態的先進封裝技術孕育而生

我們從下面的例子可以清楚看出,後摩爾定律時代利用多種手段的電晶體推進速度。

2022年輝達採用N4製程的Hopper的電晶體數量為800億。

2024年採用N4P製程+D2D Chiplet的Blackwell電晶體數量為2080億。

2026年輝達將推出N3P製程的Rubin晶片,單die預計在1680億電晶體左右,雙die為3360億電晶體。

2027年整合度更高的CPO,以及CoWoS的極限4 die合封,Rubin ultra晶片電晶體總量將達到6720億。

2028年輝達將推出Feynman,採用A16製程,4 die合封的電晶體總數將達到8000億左右。

2030年輝達的更新一代晶片將採用A14製程,再加上利用CoPoS技術做到8die合封,電晶體總量達到2兆。

所以利用晶片製程不斷的微縮,加上不斷放大面積的interposer,單顆晶片的電晶體數量增長比摩爾定律時代更高。

2022年的800億,提升到2030年的2兆,8年25倍的提升,比摩爾定律每2年翻1倍,8年16倍還來得更驚人。

全球CoWoS產能

對於CoWoS產能,儘管OSAT以及英特爾、三星等都在大力投資,但2026年的有效產能主要由2025年的投資決定,彈性有限。

更重要的是,壟斷CoWoS市場的台積電,在2028年將推出方型基版的CoPoS取代CoWoS,屆時佔CoWoS產能一半以上的輝達將率先轉入新技術,這將導致這兩年為了滿足市場剛擴產的CoWoS產能因被替換而大量閒置。

所以目前台積電對CoWoS的產能建設趨於保守,這對AI晶片客戶來說不是一個好消息,目前得應對之策就是將短期外溢的訂單轉給OSAT或者精度要求不高的低端ASIC考慮英特爾EMIB。

從現況來看,2026-2027年CoWoS產能,將出現2023-2024年高度緊張度狀態,從筆者一手訊息來看,2026年Q3開始台積電CoWoS的稼動率將回到100%以上,直到CoPoS產能開出後又將迅速跌落。

目前台積電內部對這兩年的CoWoS產能建設有很大的分歧。

因此,分析2026年的戰局,必須首先看清CoWoS這座「軍火庫」的儲備與分配。

未來AI晶片的競爭,是架構、製程、封裝“三維戰爭”。

到了2026年,當製程進入2nm深水區,成本高企,架構路線(GPU vs. ASIC)出現根本性分叉時,再度緊缺的CoWoS先進封裝的產能分配,就成了決定算力版圖的最關鍵變數,沒有之一。

第三章:2026年CoWoS產能沙盤推演

基於筆者的訊息,我們對2026年台積電CoWoS產能及預訂Booking情況進行建模分析。

根據筆者模型,台積電CoWoS產能近幾年的爬坡如下:

2023年底:約 12K/月

2024年底:約 36K/月

2025年底:約 80K/月

2026年底(目標):達到 ~120K/月。

對於2026年台積電CoWoS產能逐月提升過程,我們取一個不樂觀也不保守的全年有效平均值:94K/月。

即 2026年台積電CoWoS總有效產能約為:94K/月 × 12個月 約 1,120,000片。這是本次測算的總彈藥基數。

CoWoS產能分配的邏輯推演:

台積電的產能分配是一場基於技術、商業、地緣政治的複雜棋局。

核心考量如下:

技術繫結與生態深度: 輝達是CoWoS最早期、最大膽的共同定義者和投資者,其架構(如NVLink)與台積電CoWoS工藝深度耦合,享有最高優先順序。

訂單規模與戰略押注: 蘋果、輝達、AMD是台積電前三VVIP大客戶,其巨額預付款和長期協議鎖定了基礎產能。不過蘋果要到2028年才有自研AI晶片,這兩年不需要CoWoS產能。

博通、Marvell因承接Google、AWS、Meta等雲巨頭天量ASIC訂單,已躋身頂級VIP客戶行列。

地緣政治與第二供應鏈: 美國對華技術限制,迫使中國頭部AI公司,透過第三方等各種方式全力爭取任何可能的CoWoS產能。

同時,ASIC以及AMD、英特爾乃至中國客戶,都是台積電制衡輝達分散客戶風險的重要力量。

產品迭代與良率: 更複雜、整合度更高的封裝(如整合更多HBM、更大中介層)初期良率較低,實際有效產出需打折。

下圖清晰展示了各主要玩家的爭奪格局:

2026年台積電CoWoS產能分配:

輝達:2026年6*萬片。年增*%,依舊保持高增長。

儘管面臨競爭,但其產品需求最旺、單價最高、技術最領先,仍將佔據最大份額。

輝達接近台積電CoWoS總產能*%的預訂量,遙遙領先其他AI晶片企業,幾乎不受ASIC崛起而稀釋,繼續保持絕對主導的份額。

當然輝達的CoWoS預訂的增量,有很大一部分是來自Interposer面積放大的結果,2026年推出的Rubin達到5.5x reticle,比Blackwell的3.3x reticle大了1.6倍。

也就是輝達在晶片出貨數量不變的情況下,就必須增加1.6倍的CoWoS產能,或者說從輝達在Rubin時代增加60%的CoWoS產能,晶片出貨量與Blackwell時代相比是沒有增加的。

當然整個2026年Blackwell還是出貨主力,輝達65%的CoWoS增量,必然是出貨數量以及單價的雙雙齊漲的局面。

AMD:2026年*萬片,年增*%。

多款Mi300系列已證明AMD的競爭力,剛剛開幕的CES,蘇大媽正式官宣Mi400系列的來勢洶洶,預計下半年開始出貨。

從CoWoS booking數量來看,與25年相比有*%的增量,與輝達的增幅幾乎一致。這也標示著AMD對Mi455的信心十足。

Broadcom博通:2026年*萬片,年增*%。

主要客戶GoogleTPU開始對外銷售,對博通是利多,不過博通主要負責TPU v6 以及 v7p,偏向推理的v7e會在2026年下半年推出,由聯發科負責流片。

下一代的TPU v8 還是會遵循v7的模式,由博通與聯發科兩家分別下單台積電CoWoS。

2026年博通向台積電預定的CoWoS產能有60~65%給到TPU

第二大客戶Meta的Mtia晶片,今年今年將推出第三代產品,Mtia v2 & v3大約佔博通CoWoS預訂量的20%左右。

未來的大客戶Open AI將於2026年底推出內部代號Titan晶片,採用台積電N3製程,預計佔今年博通預訂量的5-10%,2027年將達到20%。

2028年蘋果的AI ASIC - Baltra也將面世,目前由博通負責高速互聯,SerDes IP以及後段布線,預計2026年上半年進入TO階段。

很顯然,博通是未來ASIC崛起的最大贏家。

Marvell美滿:2026年*萬片,年增*%。

2026年CoWoS預定數量與2025年持平,幾乎是AI晶片最失意的廠家。主要是出貨主力AWS下一代的Trainium 3轉由Al chip設計。

2026年主要客戶還是AWS的Trainium 2 ,新客戶Microsoft採用N3E製程的Maia 200 加入,避免了下滑。

Al chip世芯:2026年*萬片,年增*%。

2026年CoWoS 200%的增幅,主要是拿下AWS的Trainium 3 訂單

2026年出貨包含少量Trainium 1 ,決大部分為N3製程的Trainium 3 Anita,加上Inferentia 2 以及少量的Intel Gaudi 3,以及微軟上一代的-Maia 100。

Al chip的客戶數量比博通還多,但出貨量級都不高。

AWS已暫停Inferentia 3的開發,轉向以Trainium統一承擔推理跟訓練的工作負載,目前未見Inferentia 3的TO訊息。

Annapurna:2026年2.4萬片,年增64%。

作為AWS的子公司,Annapurna一直承擔AWS AI ASIC的開發任務,同時也向台積電直接預定CoWoS產能,Trainium 3的 Mariana版本有別於Al chip的Anita版本,同時在台積電投片。

MTK 聯發科:2026年2萬片。

作為台積電CoWoS的新進客戶,目前聯發科已調撥大量人力支援ASIC業務,AI ASIC未來將成為聯發科的重點業務。

2026年下半年主要承擔TPU v7e的出貨,2027年為出貨主力年,同時2027年將疊加TPU v8e的訂單,2027年MTK有機會出現5~600%的CoWoS同比增幅。

聯發科目前已將AI ASIC最為為來核心業務,作為行業巨頭,聯發科的加入也將很大影響ASIC設計的市場格局。

聯發科這兩年的ASIC業務雖然這兩年高歌猛進,但由於只是做後段布線,缺乏博通強大的IP,雖然增幅大,但單價較低,對於體量本就不小的全球第三fabless巨頭來說,並不能帶來營收的大幅度增長。

當然從CoWoS增量來看,聯發科在AI以及端側的佈局非常積極,又有ASIC業務的高增長加持,將是這兩年除了博通之外,ASIC陣營的最大受益者。

剩下的台積電CoWoS客戶的量級就都是小於1萬片,其中微軟自研ASIC-Athena 還是由內部團隊在台積電投片小批次的不斷迭代推進。

GUC創意還是小型AI晶片初創企業在CoWoS流片的首選,也是國內AI的重要第三方,畢竟GUC是台積電的親兒子。

Xilinx這個最早的CoWoS客戶,因為CoWoS不斷漲價,FPGA又不如AI晶片的利潤那麼高,已經逐漸放棄高成本的CoWoS,改由成本更低的IoFO_LSI方案。

剩下的兩家交換機廠家思科與中興微,因為其高端交換機有採用HBM,所以一直以來也都是台積電CoWoS客戶,只是預定量只有幾千片的水平。

至此,我們得到了2026年各陣營的“彈藥”配額:

再加上FPGA、Switch的 2萬多片,即時2026年台積電CoWoS的出貨總量。

從彈藥分配來看,拿下整個CoWoS產能65%的GPGPU陣營還是擁有絕對的火力優勢,甚至輝達一家的火力就超過全球其他企業的總和。

第四章:超越數量 - 價值、生態與功耗的深層次博弈

然而,僅比較CoWoS還是會誤判戰局。雖然CoWoS數量與面積是一切的根本,但不同的封裝方案,比如single-die以及dual-die方案,將導致Interposer面積出現很大的不同,每片CoWoS可切割數量有很大差別。

其中最顯而易見的就是Hopper時代的每片切29顆,到了Blackwell時代的每片14顆,這正是Interposer不斷放大的結果。

所以台積電CoWoS的產能增幅,對應的不只是AI晶片出貨量數量的增加,還疊加了Interposer面積不斷放大的增量。

又比如2026年Google的TPU v7p是dual-die的D2D方案,interopser size 在2400mm2左右,一片CoWoS可切割16顆左右。

而同一代針對推理的TPU v7e,採用single die設計,interposer size只有1500mm2左右,每片CoWoS可切數量超過30顆以上。

AI晶片的Interposer越來越大的尺寸是明確的技術路線,目前Interposer是3.3x的reticle size,2026年的Rubin是4~5.5x,而2027年4-die合封的Rubin Ultra將達到9~9.5x。

所以不斷放大的Interposer面積也是台積電CoWoS不斷大幅度擴產的一大主因。

正因如此,以CoWoS的產能(消耗面積)增減幅度來計算企業AI營收增減幅度,會比企業的AI晶片出貨顆數量增減來的更為準確。

AI晶片戰爭的勝負,除了CoWoS消耗面積以外,還要在兩個維度上評判:

算力維度:

一顆輝達B300的FP8算力達10 PFLOPS,而一顆定製推理ASIC的算力可能僅為其幾分之一,即便是最強的TPU v7p也只有輝達B300的一半,這還是不考慮今年與TPU v7同台競技的Rubin的差距,如果用Rubin來對比差距將更大。

剛開幕的CES老黃說Rubin的性能將比blackwell在推理提升了5倍,訓練提升了3.5倍,GPU與ASIC的性能差距並沒有縮小,反而是在擴大中。

因此,即使顆數接近,輝達陣營輸出的總算力(TFLOPS) 很可能仍大幅領先。這是GPU通用架構的“蠻力”優勢。

總算力領先的物理基礎就是來自CoWoS消耗面積(電晶體)的多寡。

價值維度:

這是最殘酷的差距。輝達單顆GPU售價高達3萬美元以上,未來會提升到4-5萬美元。

而云巨頭自研ASIC的“成本”僅體現為台積電的代工費用和博通的設計服務費,即便成本相差無多,但ASIC其“內部結算價”必然遠低於GPU售價。

即便ASIC對外銷售,我們可以用Anthropic向博通採購210億美元的TPU為例,百萬顆的TPU v7p 扣除伺服器等諸多配置,單顆對外售價在1.5萬以下。

目前最強的ASIC是採用最先進N3P製程的TPU v7p,製程領先輝達Blackwell一個世代,但其對外售價不到Blackwell的一半,這與剛才我們計算的TPU v7p的算力只有B300的一半,算力與售價差距大致上是對等。

從這一點來看,完全證明我們文章剛才所說,AI晶片是多維度的比拚,不單單比摩爾定律比晶片製程,還要比誰的面積更大,能放進更多電晶體,最終表現在性能上的差別也決定他的最終價格。

因此,輝達用60%的CoWoS產能,創造了整個AI加速晶片市場70%以上的收入和90%以上的利潤。

這正是黃仁勳“6個季度,5000億美元狂言”的底氣 — 他賣的是“黃金”,而ASIC陣營在為自己鍛造“精鋼武器”。

生態鎖死 vs. 專用解放:

輝達的帝國城牆: CUDA軟體棧、龐大的開發者社區、最佳化的AI框架(TensorRT、Triton),以及NVLink、NVSwitch構成的系統級優勢,構成了幾乎無法踰越的生態壁壘。使用者購買的是一整套最強的“交鑰匙”解決方案。

ASIC的破局邏輯: ASIC的優勢在於,對於CSP這類超大規模使用者,當其軟體棧完全自控,從TensorFlow/PyTorch框架到推理服務Triton,且工作負載高度特化且穩定(如搜尋推薦、廣告排名、語音識別推理)。

所以自研ASIC能帶來極致的TCO(總擁有成本)最佳化和能效比。

它們用“專用化”換取“去輝達化”的戰略自由和長期成本節約。最終直指CSP採用自研晶片最佳化財務報表的內在動力。

這也說明了一個侷限,ASIC只有超大型CSP或者大模型等超大規模企業會使用,首先ASIC的資金以及人力投入巨大,但這兩點已經確定了客戶範圍,所有用量不大的中小型使用者都不可能使用ASIC。

即便是購買現成的ASIC,我們以Anthropic向博通採購210億美元的TPU為例,這背後需要養一隻極為強大底層系統工程師團隊不斷的進行深度遷移以及適配。

單這一項開支,就足以說明這並非普通企業所能承受的,當然目前GPU高昂的價格,讓市場更願意採用各種降本方案,可即便是購買現成ASIC的模式,大概也就能拓展到Anthropic這體量的大模型企業,很難再往下拓展。

系統級創新與功耗牆

功耗即成本,散熱即極限: AI叢集的功耗已從幾十千瓦邁向兆瓦級,未來晶片功耗將飆升至數千瓦。風冷已到極限,液冷(包括冷板、浸沒式)成為標配。

這不僅關乎電費,更決定了資料中心的物理設計和最大叢集規模。

ASIC的能效優勢: 專用電路在執行特定任務時,能效通常遠高於通用GPU。這意味著在相同的供電和散熱預算下,可以部署更多ASIC算力單元。

互連與封裝創新: 戰爭遠不止於單顆晶片。

CPO共封裝光學是突破“功耗牆”和“互連牆”的關鍵,CPO展示了系統級互連的競爭。

系統架構創新,如華為的384顆NPU互連的CloudMatrix 384,來挑戰輝達NVLink全互連系統的思路。

CoWoS只是起點,其上的互連網路(NVLink, CXL, UCIe)、光引擎(CPO)的競爭同樣激烈,而且每一個技術領先都有決定性的作用,目前輝達在每一個維度上的表現都處於行業領先地位。

第五章:GPU的技術反擊與生態擴張:

2026年開年CES,黃仁勳與蘇姿丰的演講,清晰地勾勒出GPU陣營未來的技術路線圖和反擊策略,特別是對「物理AI」這一新戰場的定義,將深刻影響GPU與ASIC的競爭格局。

輝達在CES宣告的戰略意圖:

1.下一代「Rubin」架構正式亮相:

基於台積電N3P製程,並將interpose面積放大1.4~1.6倍,首次實現整合超過3000億個電晶體的單一GPU,電晶體總數達3360億,較上一代電晶體數量提升1.6倍。

並搭載下一代 HBM4 記憶體,單GPU容量直奔 288GB 甚至更高,儲存頻寬突破 22TB/s,較上一代Blackwell提升2.8倍,可見HBM4相對於HBM3e,在介面頻寬以及logic base die的提升可謂相當驚人。

互連技術 NVLink 6.0 將提供超過 3.6TB/s 的GPU間直連頻寬,較上一代Blackwell提升1.8倍。

推理性能比Blackwell高出5倍,訓練的性能高出3.5倍。

Rubin不僅是性能的躍升,更是輝達鞏固其在訓練和複雜推理市場絕對領導地位的利器。

2. 物理AI的ChatGPT時刻 :

這是黃仁勳演講中最具震撼力的宣言。他認為,AI的下一個前沿是理解和模擬物理世界,應用於機器人、自動駕駛、數字孿生、科學發現(如氣候模擬、藥物研發)等領域。

這些應用需要處理海量、多模態的感測器資料,進行複雜的物理模擬和即時決策,工作負載極度複雜、演算法迭代快速。

為何老黃會這樣說,因為「物理AI」恰恰是通用GPU的絕對主場。

定製化ASIC在處理固定、已知的模型推理時效率極高,但面對物理AI所需的持續學習、多工處理、快速演算法適配等場景,其架構僵化的劣勢將被放大。

GPU憑藉其無與倫比的可程式設計性和龐大的CUDA生態,能夠靈活適應從計算流體力學到機器人控制等各種新興物理AI任務。

因此,「物理AI的ChatGPT時刻」極大地擴展了GPU的應用邊界和市場總量,為其增長提供了全新的可開發疆域,這是ASIC現有技術難以切入的賽道。

3.收購Groq:對ASIC的「釜底抽薪」之舉。

2025年底,輝達宣佈收購專注於低精度推理和極低延遲語音模型的初創公司Groq。這筆收購遠不止是技術補充,而是對ASIC陣營的戰略性反擊。

Groq的技術核心在於其LPU(語言處理單元)架構,在特定推理任務(如大語言模型對話)上能實現遠超GPU和傳統ASIC的能效和速度。

輝達通過收購Groq,直接獲得了在ASIC最具優勢的「高能效推理」領域的尖端技術和產品。這使得輝達能夠以「內部ASIC」的方式,正面迎戰博通、Google等的定製化推理晶片。

這不僅是產品線的補充,更是商業模式的轉變,從單純銷售通用GPU,轉變為提供「通用GPU + 特定領域最佳化加速器(如LPU)」的全端解決方案。

這將有效遏制ASIC在推理市場的侵蝕,並可能奪回推理市場市佔率的重要武器。

此舉加劇了AI加速器市場的融合與競爭。未來的界限不再是簡單的GPU對ASIC,而是「全端生態公司」與「專項設計公司」的對決。

輝達正在利用其資本和生態優勢,將潛在的顛覆性技術收編入自身體系,戰場的主導權還是掌握在輝達手上。

AMD則在CES公佈MI400系列的細節,正式發佈基於3nm增強版製程的 「AMD Instinct MI400」 加速器。核心參數瞄準超越輝達當前旗艦,宣稱在關鍵AI訓練和推理工作負載上,實現相比MI300系列100%的性能提升,並強調其能效比優勢。

AMD持續推廣其開放式軟體棧ROCm,並通過與微軟Azure、Oracle Cloud等雲服務商的深度合作,以更開放且更具性價比的方案爭奪輝達之外的市場份額。

蘇姿丰強調,未來的AI計算將是多元化的,AMD將為客戶提供「第二選擇」。

總而言之,2026年的GPU陣營,並非消極防守。輝達通過定義「物理AI」新戰場、收購Grop補強推理短板,正在從技術和生態兩方面建構更深的護城河。

AMD則堅定地走開放與性價比路線,蠶食市場。

GPU的增長故事,正從單純的「大模型訓練」擴展到更廣闊的「物理世界智能化」,這為其對抗ASIC的專用化攻勢提供了戰略縱深。

第六章:超越產能 - 生態、功耗與終局之戰

CoWoS產能決定了「彈藥」數量,但戰爭的勝負還取決於「彈藥」的效率、協同和最終產生的價值。

1. 生態系統的終極壁壘:

輝達的CUDA生態依然是其最堅固的堡壘。數百萬開發者、龐大的軟體庫、從訓練到部署的全端工具鏈,構成了極高的遷移成本。

儘管Google的TensorFlow、PyTorch等框架也在努力實現對不同硬體後端的支援,但在易用性、性能和社區支援上,仍與CUDA有差距。

ASIC陣營的優勢在於『垂直整合』,Google可以為TPU深度最佳化TensorFlow,Meta可以為MTIA定製模型。

但對於廣大的企業和開發者而言,輝達全面且最優的「交鑰匙」方案仍然是最佳選擇。

收購Groq後,輝達有望將這一生態優勢進一步延伸到特定推理場景。

2. 功耗牆與成本牆:

隨著單晶片功耗突破千瓦級,資料中心的供電和散熱成本已成為不可忽視的因素。

ASIC憑藉其專用架構,在能效比(Performance per Watt)上通常有顯著優勢。這也是雲巨頭在規模化部署推理服務時傾向採用自研ASIC的核心經濟動因。

輝達需要通過製程與封裝技術的進步、架構創新(如稀疏計算、低精度推理)以及系統級最佳化(如液冷、CPO共封裝光學)來對抗ASIC的能效優勢。

Rubin架構和收購Groq,正是其在性能和能效兩端同時發力的體現。

3. 未來的融合與分野:

長遠來看,GPU與ASIC的界限會進一步模糊。輝達可能會推出更多「可配置」或「領域專用」的加速器(類似收購Groq後的產品線)。

而ASIC設計公司(如博通)也可能會為不斷強化ASIC的性能,並給客戶提供更具靈活性的平台化方案。

未來的競爭,將是「高度最佳化的通用平台」與「深度定製但具有一定可程式設計性的專用平台」之間的競爭。

CoWoS產能依然是基礎,但在此之上,軟體生態、能效表現、總擁有成本(TCO)和對新興應用的適應能力,將成為決勝的關鍵。

2026,對峙與滲透的拐點

綜上所述,基於對CoWoS產能的沙盤推演、對2025年預測的覆盤以及對最新技術動向的分析,我們對2026年GPU與ASIC的對決格局得出以下結論:

1. CoWoS分配格局固化,輝達主導地位難撼:

2026年,輝達仍將消耗台積電過半的CoWoS先進產能,這確保了其在高端訓練和複雜推理市場的供給優勢,並在ASIC固守的推理市場不斷的嘗試進攻。

ASIC陣營份額依舊維持快速增長,主要來自CSP掌握的大量推理算力的增量和生力軍頭部大模型企業的加入,短期內依然無法動搖輝達的根基,但卻能在固守方陣內不斷壯大與繁榮。

2. ASIC在推理市場不斷壯大,實現規模化突破,但GPU開闢「物理AI」新戰線:

ASIC憑藉成本和能效優勢,將在雲巨頭的大規模、固定模式推理場景中確立主流地位,並開始向Open AI以及Anthropic等頭部大模型公司滲透。

然而,輝達通過定義「物理AI」這一全新、複雜且快速演進的賽道,為GPU找到了下一個爆發性增長點,有效避險了ASIC在傳統推理市場的衝擊。

3.競爭從「硬體對抗」升級為「生態與系統級對抗」:

輝達收購Groq標誌著戰術的轉變,從單純防守轉向「以彼之道,還施彼身」,用定製化能力反擊定製化。

未來的競爭將是全端能力的競爭:從晶片、互連、封裝、系統到軟體和開發者生態。擁有更完整生態和更強系統整合能力的玩家將贏得最終優勢。

結 論

以2026年台積電約115萬片CoWoS產能為沙盤推演,我們測算出:ASIC陣營(37.5萬片)達到GPGPU陣營(75萬片)剛好50%的水平,這個資料2024年為52%,2025年為45%,2026年為50%。

也就是說2026年ASIC對比GPGPU的CoWoS佔比提高了5%。

這再次印證,筆者2025年原文所稱,2024-2027年為ASIC超級增長周期,其中2026-2027年將是周期高峰,大家可以再次翻閱2025年全球半導體展望中原文的模型。

面對ASIC基數較低的超高增長,GPGPU在基數龐大的情況下,CoWoS佔比也沒有大幅度的下滑,比筆者一年前預測的更有韌性,這除了輝達GPGPU持續熱銷以外,還有GPGPU更願意採用最新技術有較大關係,比如2026年的Rubin率先採用4~5.5x reticle的interposer,2027年很快推進到9~9.5x,這個變數將直接翻倍。

而ASIC的絕對性能沒有GPGPU那般的極致要求,2026年ASIC的Interposer在2.9~3x ,在2027年也還是停留在3.3x的水平。

GPGPU是面積快速放大但出貨數量微幅增長,ASIC是出貨數量快速放大而面積微幅增長,最終勝敗就表現就在CoWoS預定資料,ASIC在出貨數量增幅遠高GPGU 15%以上,但在CoWoS產能的佔比則是從45%,提升5個點到50%。

根據筆者模型,2027年ASIC將來到GPGPU的58%,ASIC佔比持續增加,意味著2026-2027筆者早早預測的ASIC迎來超級增長周期,增長率超過GPGPU。

至於企業營收,那自然與CoWoS出貨量成正比,晶片性能與面積(電晶體總數)成正比,同製程雙顆的dual-die性能必然是高於single-die的晶片,文前有比較過性能與售價成同比例漲跌(TPUv7與B300),也就是性能高兩倍,單價大概也會高兩倍。

這裡面多少nm製程與多大的面積都對性能(電晶體數量)有決定性的影響。

ASIC的代表GoogleTPU,除了CSP自研自用以外,開始向外提供,這標誌著ASIC從正式邁入“規模化部署”以不斷蠶食GPGPU領地。

然而,在商業價值(營收/利潤)和算力總量上,輝達憑藉其極高的單價和通用算力優勢,在2026年及之後一段時間內,仍將保持王者地位。

輝達的帝國,將繼續統治需要靈活性、創新性和全端解決方案的廣闊疆域(訓練、新興應用、中小企業、科研)。

ASIC的諸侯國,將在超大規模資料中心內部,在推理、推薦、搜尋等成熟且量大的固定戰場上,建立起基於極致TCO和能效比的自治領地。

未來,我們更可能看到的是一個 “GPU+ASIC”的混合算力世界:雲巨頭用輝達GPU進行前沿模型研發和訓練,同時用自研ASIC進行成本敏感的大規模推理部署。

戰爭的號角早已吹響,2026年的CoWoS產能分配表,就是這場世紀算力大戰最真實、最殘酷的兵力部署圖。

ASIC群雄時代結束,Google/博通已成為共主,圍獵與反圍獵已經開始,而輝達帝國依然強大。這場好戲,還在後頭!

而更接近未來事實的是,這場戰爭並非一場你死我活的殲滅戰,而是一場持久且複雜的“劃界戰爭”。

隨著戰爭的推進,各方勢力意圖提高競爭力去打敗對手的同時,不斷提高的技術能力,導致技術外溢,其產生的結果不一定是打敗對手,而是如哥倫布一般,隨著航海技術的提升,發現更為廣闊的新天地。

AI世界還有太多未知的疆域需要更高的技術才能去探索與挖掘。

未來GPGPU以及ASIC可能都是贏家。2026-2027年ASIC的增幅將繼續高於GPGPU,2028年融合了LPU的Feynman有沒有可能帶領輝達在ASIC堅守的領地攻城拔寨,目前言之過早,未來誰主沉浮猶未可知?

而GPGPU以及ASIC在整體算力需求不斷上漲的雙贏背後,卻始終站著一位終極大BOSS,更大的幕後贏家不動聲色冷眼旁觀。台積電作為這場戰爭共同且唯一“軍火商”,坐擁CoWoS產能的絕對定價權,將是無論那一方獲勝都不可或缺且毫無疑問的終極大贏家。


(梓豪談芯)