26年1月15號,台積電發表了逆天的業績,昨天咱們已經解讀並預測未來3-5年台積電的財務資料與走勢。今天我們將從foundry,儲存,AI,CPO等多個技術維度,全面頗析在未來的半導體技術演變中,台積電到底扮演什麼角色?台積電倒底是真王還是假王?1. 晶片製程進入3nm節點,後摩爾定律全新時代正式開啟。2026年半導體進入2nm時代,傳統摩爾定律的定義早以力不從心,其實早在2016年運行了50年之久的國際半導體技術發展路線圖IRTS就不再更新,2017年改用IRDS,2024年正是IRDS預計的COMOS傳統微縮告一段落的一年。IRDS規劃的路線圖是2025-2040年進入半導體第三階段,3D與功耗微細化階段。與1975-2002的幾何微細化的第一階段以及2002-2024年的等效微細化的第二階段不同,不斷的依靠縮小晶矽間距,金屬互聯間距與電路單元高度的傳統方式將終結。取而代之的是more moor以及more than moor 主要依靠管芯3D結構,層間緻密互聯,異質異構整合,器件低功率化”等方案來變相實現微細化,藉以延續晶片性能增長的第三階段技術發展設想。2026年全球半導體將進入2nm時代,台積電在2nm也正式採用GAA的新型態3D結構,開始了IRDS路線圖2025到2040年的第三階段。這一階段的開局王者是台積電,是否能延續第一階段開場的TI以及橫貫第一階段中末期和第二階段的英特爾,成為稱霸整個世代當之無愧的領頭羊。從3nm開始台積電不在公佈其每個工藝節點的電晶體密度,而改以PPAC(性能、功耗、面積、成本)來表述與上一代製程的提升幅度。台積電N2工藝將比上一代的N3在電晶體密度上提升15%,甚至每個節點開始出現細化,比如3nm工藝分為N3B、N3E、N3P以及針對高性能的N3X還有針對汽車的N3A,台積電針對製程的闡述方式跟隨IRDS以PPAC以及功能性來闡述。前幾年我們還可以根據MTr也就是每平方毫米百萬電晶體數量來對比各家不同工藝,利用MTr對比得出三星3nm(150)遠不如台積電5nm(180)的結論,避免被廠家宣傳忽悠。如今最直觀的MTr對比在2nm以後也將失去唯一指標的地位,英特爾18A的電晶體密度,不到台積電3nm的水平,結結實實的落後一個世代,但英特爾非得用自己測試的PPA資料去碰瓷台積電N2,以證明他還有競爭力。當然廠家這些文字遊戲只能忽悠非業內的網民只有宣傳意義,fabless客戶要不要下單自然是實際評估過的。未來即便英特爾、三星繼續玩文字遊戲,最終也同樣無法獲得訂單,畢竟需要電晶體密度來維持競爭力以及市佔率的客戶,不可能會陪三星或英特爾玩文字遊戲,擁有市場最好的製程工藝,才能獲的競爭力,不採用業界最先進工藝,就意味著失去市場佔有率。贏家通吃的邏輯在最先進製程的演繹得淋漓盡致。唯有那些不需要追求性能的次旗艦或者成熟晶片才會被其他foundry瓜分。在未來可預知的15年內,半導體製程將持續並如期的推進到1.4nm、1.0nm、0.7nm、0.5nm、0.3nm等等節點,但這些節點的意義與早期的摩爾定律,每兩到三年電晶體密度提升一倍已不可同日而語。2026年是進入IRDS的半導體技術發展第三階段的初始年,2nm先進製程不再以光刻微縮為唯一推進手段,GAA/CFET技術,背供電技術,2D材料技術將越發重要,再疊加上後段的各種先進封裝技術,混合鍵合的異質異構整合技術將給系統級晶片帶來無限可能。單以COMOS來說,2030年以前將出現兆晶體數量的單晶片,摩爾定律以全新的形式繼續引領科技創新。我們從下面的例子可以清楚看出,後摩爾定律時代利用多種手段的電晶體推進速度。2022年輝達採用N4製程的Hopper的電晶體數量為800億。2024年採用N4P製程+D2D Chiplet的Blackwell電晶體數量為2080億。2026年輝達將推出N3P製程的Rubin晶片,單die預計在1680億電晶體左右,雙die為3360億電晶體。2027年整合度更高的CPO,以及CoWoS的極限4 die合封,Rubin ultra晶片電晶體總量將達到6720億。2028年輝達將推出Feynman,採用A16製程,4 die合封的電晶體總數將達到8000億左右。2030年輝達的更新一代晶片將採用A14製程,再加上利用CoPoS技術做到8die合封,電晶體總量達到2兆。所以利用晶片製程不斷的微縮,加上不斷放大面積的interposer,單顆晶片的電晶體數量增長比摩爾定律時代更高。2022年的800億,提升到2030年的2兆,8年25倍的提升,比摩爾定律每2年翻1倍,8年16倍還來得更驚人。半導體製造的這場技術變革,將會由台積電獨領風騷,原本的兩位競爭對手Intel與三星將很難跟進,並因為缺乏訂單無法再持續投入龐大且極其昂貴的產能軍備競賽,而逐漸在先進製程競爭中被淘汰,先進製程贏家通吃的局面將在競爭者無力投入之後更加嚴重。即便美國政府投入大量資金與政策傾斜,也無法從根本上改變英特爾的技術頹勢。未來台積電的對手我想只剩下反壟斷法,沒有其他。進入後摩爾時代,微縮不再是唯一重點,依靠其他方法也能維持晶片競爭力,所以台積電的競爭對手是否有機會跟上呢?很顯然現在看起來機會越來越小,從最基礎的微縮工藝上,台積電已經領先競爭對手一個世代以上,再到先進封裝技術,不論CoWoS或是SoIC台積電已經早競爭對手投入十年,更令人絕望的是的台積電下一代的CoPoS預計兩年後可量產。與對手的差距不斷在擴大。再到異質異構整合,台積電不斷最佳化的CPO技術將會是各大矽光方案不可或缺的唯一生產平台,他將提供各式各樣的異構整合方案,讓形形色色充滿創意的方案的工程化量產成為可能,甚至繫結其他先進製程與先進封裝方案,讓客戶一個也跑不掉。英特爾早期在3-5族的CPO積累與專利幾乎被台積電給繞開,而台積電的方案是建立在可規模量產與成本的完美平衡基礎之上,而非英特爾那些看起來唬人卻無法有效落實的空中閣樓。最後是產能的建構,綜觀全球頂級Foundry,目前唯有台積電敢在沒有任何訂單之前就投入重資興建龐大的產能,要知道一座fab的興建需要四年以上。原本7nm每萬片投資額在25億美元左右,而到2nm則高達70億美元以上,台積電Fab20A規劃120k產能,單單一座工廠就必須投入近千億美元,往後的節點投資額越來越大。試問,必需在四年以前開始規劃並逐步投入千億美元,每兩年就要再蓋一座下一世代新工廠,永遠不能停止,有那一個foundry敢在沒有任何客戶訂單的情況下,提前四年就投入鉅資?可是如果你沒有在四年以前投入鉅資,即便你工藝很好有客戶願意下單,你最後也會因沒有產能,無法供貨而丟失訂單,所以並非製程領先才有訂單,敢事先投入鉅資,到點有足夠產能供貨,同樣是半導體foundry行業的重中之重,更是關鍵護城河之一。目前我們看到的是,三星以及英特爾在先進製程採取保守策略,也就是僅維持每個世代2萬片的mini line投入,比如最近火熱的英特爾18A,確保工藝有競爭力之後再加大投入。但如此一來將永遠落後節奏。半導體建設周期實在太長,如果有一天英特爾製程回歸榮光追上台積電,趕緊給裝置商下訂單,開建新產能,那也得兩年時間,這兩年只有原本的20k產能,別說與台積電競爭訂單,就是英特爾自己的晶片也得下單給台積電,產能對落後的競爭者將是一個無解的惡性循環,這是半導體foundry行業的一個重要特點。所以未來台積電的地位更難以撼動,因為以前只需要PK製程工藝,而現在除了製程,還要PK先進封裝,還有CPO異質異構整合,最終還有龐大產能這無可撼動的護城河。而這些要素,無一例外,台積電全部遙遙領先,而且每一項的差距還在擴大中,不是其中一兩項而是所有環節都在擴大領先優勢。筆者對台積電的樂觀,並非簡單的認知,而是經過長時間追蹤且多層面對比與詳細分析的結果,甚至做過某個環節被競爭對手追上的反面推演,最終還是得出某一個環節被追上,也無法撼動台積電在矽基半導體的市場地位。必須是一個全新的技術與業態才可能改變目前台積電壟斷的市場格局,目前我們還看不到中短期有任何改變機會,這猶如英特爾在70年代末打敗TI,仙童,摩托羅拉,定義了CPU與摩爾定律,奠定了霸主地位後,對半導體行業長達30多年無可撼動的恐怖統治。所以IRDS規劃的半導體發展第三階段,2025年2040年半導體先進製造,將由台積電領軍,至少在十年的維度,筆者實在找不出有任何新競爭者與新技術路線可以與之匹敵。對於台積電,筆者更關心的是非矽基以及量子計算的發展態勢,雖然這些技術的興起並非完全取代矽基,更多是截長補短,各自有擅長的應用領域,但也確實會影響矽基半導體的長期發展,不過這都是十年以上的故事,目前並不需要擔心。儲存技術發展儲存領域,傳統的DRAM以及NAND跟新型態的高頻寬HBM將各自在不同領域持續發光發熱。DRAM的平麵線寬微縮也將無以為繼,1c已經於2025年推出,之後的1d工藝已經在開發中,與邏輯的GAA類似DARM也必須往4F2的3D結構發展。NAND目前最先進產品為3xx,2025年海力士321層的QLC NAND已經正式向AI客戶供應企業級SSD,在技術路線推進上超過1000層的產品也計畫在2032年推出。HBM基於DRAM微縮的基礎上還加上堆疊封裝,所以推進速度會高於DRAM。2026年海力士基於1c的12hi HBM4為業界最領先工藝,未來層數將會推進到16hi,由於高度限制,16hi再往上的空間有限,未來必須在cell結構上下功夫。HBM4e開始將會與邏輯GPU合封,成為高度客制化產品,不再是以往的標準儲存晶片,這將會改變市場格局,三星什麼都具備的一條龍服務沒有任何競爭優勢,反而形成拖累,因為是否一條龍能力根本不重要。AI晶片的要求必然是每個環節都是最優的結合,GPU要有最好的先進製程,HBM有最好的性能,再加上最優秀的2.5d或3d封裝技術,三者缺一不可。三星雖然具備三者的一條龍服務,但三者每一項都與競爭有差距,對於客戶來說三者在同一家製作或者分開三家沒有太大區別,唯一要素就是三者都必須是最頂尖的結合,三星弱上加弱的一條龍服務,自然無法與台積電與海力士的強強聯合相比。2024年台積電利用其主導地位阻止三星HBM進入NV供應鏈歷歷在目,未來台積與海力士組合還將繼續主導未來AI領域GPU/ASIC的製造。在與GPU die共封的客制化HBM4e時代,GPU與HBM生產廠家將會有一番主導權爭奪,最終擁有無可替代的先進邏輯工藝的台積電將拿下主導權,而非金額更大數倍的HBM供應商,主要還是可替代性,HBM4e的製造商將還是維持三家的格局,而先進邏輯與先進封裝製造商只有台積電一家。未來的半導體製造競爭不再是簡單的摩爾定律微縮這單一戰場,而是多維度的技術競爭,台積電已經取得無庸置疑的多維度領先地位,甚至在與HBM爭奪未來存算共封的新一代GPU/ASIC上也佔據主導地位。與台積電強結盟的海力士在這幾年嘗到甜頭之後,雙方會有更緊密的聯合,這又加強了海力士面對其對手三星與美光的競爭力,尤其是在未來進入客制化的HBM時代,用那一家,什麼規格都是事先確認好的。三星則必須採取守勢,而非浪費精力拉長戰線,在邏輯與台積電,儲存與海力士多點作戰。強力捍衛其傳統DRAM的技術優勢是三星的重中之重,畢竟DRAM龐大基本盤才是安身立命的根本,如果這一塊因為海力士獲得HBM優勢之後,慢慢蠶食DRAM市場,無法維持DRAM技術優勢對三星來說將是滅頂之災。當然在儲存超級周期中,擁有最大產能的三星,必然也是最大獲利者之一,筆者說的是長期趨勢,這一兩年儲存大周期的帶動,三星隨便買也能隨便賺。美光則繼續坐穩千年老三,永遠都是儲存市場景氣轉換周期中表現相對較差的那一個,但架不住這一波的儲存超級周期,美光在2026年自然也能狠狠的大賺一筆,身處美股也是投資市場唯一可選擇的儲存晶片標的,跟隨儲存景氣高周期,AI+HBM熱點,又是市場大部分資金可選標地,股價想不好也難。未來儲存的王者在前兩年已初露鋒芒,2026年會明確奠定地位那就是海力士,未來的儲存之王。總結未來的半導體製造領域,邏輯與儲存領域,近幾年表現強勢的台積電與海力士,已確定了其優勢地位,可以預見的未來,他們將與競爭對手拉大差距,我們沒有看到任何競爭對手在中短期有拉近差距的可能性,他們將是未來五年半導體製造的唯二最優選,沒有其他。二. AI繼續主導整個半導體行業增長與創新。圍繞AI的半導體硬體創新進入下一新篇章,主要分為以下幾個方向,GPU die更高的電晶體密度,GPU更大的封裝尺寸,垂直3D封裝,HBM更高的儲存密度以及頻寬,存算合封,以及CPO/OIO的異構整合。移動終端的SOC因受限體積以及電池,只能死嗑電晶體密度以及3D先進封裝。未來AI對端側的算力需求以及各類將爆發的MR產品的算力需求,都意味著手機必須要有更高的算力才足以支援。這讓我想起國內大行其道的一句話,手機晶片28nm足矣,或者7nm跟3nm晶片使用起來沒有區別,殊不知歷來各式各樣的技術演變,都是基於更高的算力,基於摩爾定律的不斷推進,才讓原本不可能的技術,慢慢變成可能,而國內輿論這些似是而非的論調大行其道,實乃行業之悲。無論如何,半導體行業這幾年由於AI出現了大型化的技術路線,與幾十年來晶片越來越小的技術趨勢出現分歧,這個分歧主要是功能性的分歧,不代表整個半導體發展趨勢,不受體積限制的伺服器晶片大型化,受體積限制的應用如移動端則持續小型化。2026台積電獨攬全球CoWoS以及SoIC業務,這樣的壟斷勢頭未來將繼續維持。2026年台積電CoWoS產能將繼續大幅度攀升,年產能將從2025的720k,增長到2026年的1120k。SoIC的月產能2023年到2026年,分別為2k、5k、8k、16k,預計2027年也能保持50%以上的增長。進入2025年,CoWoS+SoIC的封裝形式將被AI晶片廣泛應用,隨著先進封裝的門檻又提高,這又增加了台積電的無可替代性。我們從2024台積電技術研討會上公佈的進展來看,2026年將會出現5.5倍reticle的interposer,比現行輝達的Blackwell的3.3-ret有1.65倍的增長。我們要知道一個,現有的光刻技術能支援的最大曝光區域面積,一個shot是26mm*33mm,也就是858mm2。Blackwell是3.3倍ret也就是2500mm2左右,有兩個800mm2的GPU die 再加上8個HBM,以及各單元的框線,最終在70659mm2的矽晶圓或有機材料(CoWoS-L)上,扣除圓周邊緣無法利用的區域,最終可以切出16顆GPU,並放在6400mm2的substrate基板上,要知道上一代輝達Hoper的interposer面積在1800mm2左右,一片晶圓可以切出29顆。2026年推出的Rubin 大約可切10~11顆,2027年的Rubin ultra ,四個die以及12顆HBM的合封,interposer size超過8000mm2,一片CoWoS只能切出5顆。這也是CoWoS技術的最終章,2028年就換上310mm * 310mm方形基板的CoPoS,切割效率直接翻兩倍,未來還有510*510的基板,切割效率又在第一代CoPoS上翻了2.5倍。2026年推出的下一代GPU Ruby,從台積電的技術路線圖知道最大可支援5.5倍ret ,目前已知大約是4倍,interposer 在3500mm2,除了兩個GPU die,再加上12個HBM,在巧妙的layout之下,一次最多隻能切割11顆。2027年的Rubin ultra ,四個die以及12顆HBM的合封,interposer size超過8000mm2,一片CoWoS只能切出5顆。這也是CoWoS技術的最終章,2028年就換上310mm * 310mm方形基板的CoPoS,切割效率直接翻兩倍,未來還有510*510的基板,切割效率又在第一代CoPoS上翻了2.5倍。我們以Ruby ultra為例,傳統CoWoS方案只能切割5顆,而CoPoS方案可以一次切割30顆,這是在經過相同的工藝流程之後,一次可切割的數量,這將導致成本的天差地別。未來除了基板變成510*510的方形以外,材料也會從CoWoS-L有機材料變成玻璃基板,這一個技術趨勢也是明確了,玻璃基板有更好的熱穩定性以高平整度兩大優勢,確實是下一代高性能運算的優選,目前主要難題是在加工的易碎性。預計隨著上下游產業鏈不斷的努力,一整套完整的加工方案也將越發成熟,2027年或許在其他更小型的應用上玻璃基板與相應的TGV技術可能推出。下圖我們也可以看到博通的未來方案,2027年博通也將推出3.5D XDSiP平台,最多6000mm2的3D堆疊以及12個HBM,並將於2028年隨TPU v9問世。博通的這個平台,正是基於台積電的CoWoS-L+SoIC技術,博通自研的銅混合鍵合HCB以F2F(有別於傳統F2B方案)的bumpless技術,直接連接上下晶片的金屬層解決方案。未來不論輝達或AMD的第三方GPGPU或者各家自研的ASIC都離不開台積電的製造技術,也就是說台積電研發的各種製造技術,讓全世界所有fabless在其基礎上最佳化自己的解決方案,但無論你如何最佳化,都離不開台積電的製造技術。上述總總就是台積電的3D Fabric先進封裝技術聯盟,屬於台積電OIP開放創新平台聯盟的六個分支之一,OIP聯盟,包含EDA聯盟,IP聯盟,雲聯盟等等,全球所有相關領域的頂尖公司都在台積電OIP聯盟之下,連競爭對手三星與英特爾也必須尋求加入。從上圖可以看出,OIP聯盟的其中一支,3D Fabric聯盟提供的技術支援,分為3D 矽堆疊與先進封裝兩大分項,技術平台分為SoIC、SoWoS、InFO三大類。上述博通的3.5D XDSiP平台的F2F技術就是來自於台積電3D Fabric中凸塊式SoIC-P的技術。而SoIC技術也可以搭配CoWoS或InFO,比如AMD的Mi300晶片採用的CoWoS+SoIC,這也是未來輝達Ruby以及博通等ASIC廠家的未來技術趨勢。又比如,Cerebras與特斯拉採用台積電的InFO-SoW技術,在一片12”晶圓上製作一顆晶片,由於晶片是方形,在70659mm2的原型晶圓上極限只能做出46225mm2的方形晶片,接近35%的面積被浪費了。所以Cerebras的三代WSE面積都是46225mm2,在面積不變的情況下,2019年的WSE-1採用台積電N16工藝,1.2億電晶體以及18GB的片上SRAM記憶體。2021年的WSE-2採用台積電N7+工藝,2.6兆電晶體+40GB SARM 。 2024推出的最新WSE-3,採用N5工藝,4億電晶體+44GB SARM。特斯拉DOJO晶片也是採用台積電InFO-SoW技術,已推進到第二代,不過特斯拉最新方案是放棄DOJO改由AI6這樣更小面積的晶片來拼接與組網。2027年台積電還將在InFO-SoW的基礎上推出結合SoIC的CoW-SoW,這很可能改變未來GPGPU以及ASIC的技術演變。基於台積電所提供千變萬化的製造可能性,未來業界將有更多新型態的GPU面市,這對不論是如輝達或者是如博通等fabless都將是另一個新挑戰,再加上第一點所提及的台積電CoPoS以及CPO等新技術,台積電無遠弗屆的製造平台,將如鴉片一般令不論那一家fabless都無法自拔。上述的3D Fabric先進封裝,只是台積電OIP聯盟六個分支之一,包含早就是行業領頭地位的EDA與IP聯盟,OIP聯盟的成功是台積電軟實力的殺手剪,也是未來台積電第三代掌門人,現職台積電副營運長,台灣半導體公會理事長侯永清嘔心瀝血的傑作,因為OIP的成功,侯永清成為台積電未來掌門人的第一候選人。絕大部分人無法理解OIP聯盟的作用,但他正是台積電成為現今半導體霸主的重要因素,相關細節探討,筆者令文說明,這就不再闡述。CPO/OIO2025的半導體行業重大熱點之一無非就是CPO。將結束的IDEM 2025 ,台積電再一次展示了肌肉其COUPE矽光平台筆者認為CPO是圍繞在海外半導體製造生態發展來的技術,這自然是對國內光模組廠家不利,而且在3.2T可插拔遇到上限之後的技術路線明確是CPO,這對整個國內的光模組行業自然是不利,甚至是滅頂之災。畢竟在光模組領域我們中國有無可替代的製造優勢,CPO的即將到來咱們將如何應對,事實上CPO並非洪水猛獸,也並非瞬間取代光模組,也是用很緩慢的逐年提升CPO滲透率來慢慢取代。而且CPO是在2027年以後的3.2T時代才會慢慢發揮作用,大量AI應用,不論Scale out還是Scale up ,800G跟1.6T還是擁有最大出貨量。而且通訊領域以及傳統資料中心,依賴龐大產業鏈生產足夠便宜的光模組還是主角,況且很多場景根本不需要1.6T如此高的傳輸速率,甚至800G都觸及不到。光模組在2026年業績,毫無疑問將繼續突飛猛進,紮紮實實的業績落地,不過估值可能會慢慢回落。2025至2026年也就是跟隨NV Blackwell這一代,高單價的1.6T可插拔自然是讓光模組廠家業績噌噌往上的動力。2027年,隨著下一代Ruby ultra的推出,正式進入3.2T時代,光模組可能開始被逐,不過CPO一開始的滲透率不會太高,但無可否認2028年以後,CPO將正式進入快速發展時代。CPO是明確的技術方向,其實發展的也挺久了,主要還是因為電訊號傳輸的物理極限,所以採用光互聯自然是突破I/O功耗牆極限的最好辦法,CPO讓這一切成為可能。發展初期,各家自己研發自己的技術,交換晶片廠家中思科,博通,邁威爾,CPU IDM的英特爾,GPU廠家的輝達都是早早佈局。矽光器件主要玩家在經歷多年之後,湧現不少初創公司或者專注某個領域的小型公司被併購與傳統玩家形成聯盟。以博通,英特爾、NV+Mellanox、英特爾+Ayar lab、Juniper+Tower行程各自小集團,其中英特爾還投資了Teramount這類通用光子耦合器廠家,可謂重兵佈局並滿手全產業鏈IP。但這些多年發展出的技術集團似乎將被台積電給打破。台積電與Intel不同之處,就是利用自己在半導體製造的領先優勢,通過開放平台與全行業廠家合作,逐步建構起自己一套以矽光為核心的生態鏈。比如博通、輝達、邁威爾、思科與Intel是競爭關係,Intel挾強大CPU統治力以及垂直整合的全環節製造能力,打造出不少專利,但終究雙拳難敵四手。更何況英特爾在CPO領域不論在IP或者整合製造技術也並非全部都是最優解,更失去當初Wintel時代規則制定的統治力,所以Intel重兵投入並寄與厚望的CPO矽光互聯技術,在台積電推出完全開放的 iOLS整合光學互聯系統平台之後,可以明確失去競爭力。現在幾乎所有CPO廠家全部投入台積電COUPE環抱。英特爾統治半導體行業30多年來的核心就是先進製造能力,永遠領先對手推進摩爾定律,遙遙領先的先進製造晶片技術,讓他可以制定行業規則,比如X86架構以及主導各種介面規格,整個行業形成以他為中心的生態。擁有全球最先進的工藝,英特爾打造業內最完善的技術與專利,每個專利看起來都很牛,但並非無可替代,唯有最領先的製造工藝才是其他人無法取代的,很多人看英特爾的衰敗,找這問題看那原因,大部分人都沒明白這個最根本的核心。所以英特爾在工藝製程被台積電趕上之後,英特爾長期以自己為中心的封閉生態一步一步崩塌。很可惜的是,在上上任CEO科再奇任內14nm擠牙膏失去先機之後,英特爾錯失最後機會,啟用了其傳奇CEO葛洛夫的信奉者曾經的CTO基辛格,他們都信奉技術偏執。基辛格上任前董事會對是否放棄晶圓製造爭論不休,隨著基辛格上任代表董事會最終還是決定在晶圓製造上放手最後一搏,開啟4年5節點的瘋狂計畫,但即便是葛洛夫的愛徒基辛格也無法力挽狂瀾。現任接手的陳立武,正嘗試利用基辛格的遺產intel 18A製程試圖找回公司復興之路。因為趨勢無法扭轉,台積電在開放的平台上越走越好,接觸了全世界各式設計方案,更多訂單反哺台積電不斷打磨其製造能力,不斷的最佳化其工藝上的缺點。英特爾是一個封閉的惡性循環,台積電則是一個開放的良性循環,這樣的模式之下,勝敗已成定局。往回看技術狂人基辛格的上台是悲劇,確實,如果在21年英特爾完全放棄製造,如今將不可同日而語,至少工廠當時可以賣出天價,無數人搶著接手,但這純屬馬後炮。在那時當下,任誰都不可能有如此遠見,拚最後一次是決大部分人會作出的決定,此時自然是以為這麼幹是進可攻退可守的良策,殊不知正因如此導致無法快刀斬亂麻,失去了先機,這個過程我想可以讓企業經營者們好好思考。英特爾這話題岔遠了,拉回到CPO其實Intel在CPO領域的眾多牛比專利,單拿出一個都是王炸,但問題就出在剛才說的,這些並非舉世無雙,無可替代,比如英特爾在3-5族材料的矽光方案沉浸多年,建立了專利障礙,但台積電在剛剛結束的EIDM上發佈了COUPE 2.0,其中PDK模型器件庫的Si/SiN平台與有源/無源器件說明了製造技術的多樣可能。更重要的是所有CPO廠家已經接受台積電提供工藝設計包準備進入正式量產階段。台積電在CPO發力主要依靠其 iOLS(整合光學互聯系統平台)展現在兩部分,一個是COUPE 2.0也就是光引擎的製造與封裝,第二部分是CI (複合式中介層),五花八門的interposer ,完全滿足簡單到複雜的多種封裝。參考電光夜談也是行業大神湯總的說法,台積電COUPE 2.0 解決了PIC與光纖耦合的難題。與博通,英特爾以及Senko的方案不同,台積電直接在PIC晶圓上做文章,從根本上解決耦合的難題,與以色列Teramount與IMEC合作的方案一樣,容差高且支援3D的高密度耦合。台積電的CPO方案一個重要特點是mirco-ring Modulator方案,沒有傳統的MZM以及MZI器件。MRM的特點是製造技術最難,但面積非常小,製造成本以及OE頻寬密度的優勢明顯,幾乎是CPO最終極的製造方案。直接取消了三五族的半導體光放大器SOA,強化APD,可以說是很好的給未來的OIO技術鋪路。MRM微環方案其實就是CPO與OIO的大一統方案,主要還是得益於台積電分子級的製程控制精度才得以實現。台積電在iOLS平台上解決了微環、光纖耦合、PIC/EIC混合鍵合、並提供相關pdk給第三方的話,則CPO switch門檻將大幅度降低,這將大大地促進矽光子技術的發展。上述矽光技術平台再結合台積電獨步天下的IC製造能力,將徹底顛覆上述原本的CPO行業格局,讓CPO成為與IC製造一樣,全行業圍繞台積電製造技術自行設計相關產品。fabless專心致力於自己設計端的IP,製造技術由台積電落實,大家在台積電平台上與台積電共同開發新的製造技術,這又繞回到了台積電DTCO設計與製程協同最佳化技術平台上,未來晶片製造技術真的是一環扣一環,台積電將如同狗皮膏藥一般想甩都甩不掉。2026年CPO switch的落地將由博通以及NV引領,最終在2027年開始應用不斷提升滲透率。而博通與NV正是AI GPU以及ASIC的兩大領軍企業,他們的新一代方案都將在上述台積電先進封裝以及CPO平台中展開,兩大強勢廠家的支援,讓台積電以製造技術為導向建構的生態將更加完善與夯實,不論未來GPU與ASIC誰上誰下,台積電永遠穩坐釣魚台。第三章. GPU與ASIC的AI世紀大戰要理解今天在輝達與博通等廠家在台積電CoWoS產能上的寸土必爭,必須回到一切的起點:AI不只是近年興起的大語言模型(LLM),目前多模態,AI Agent甚至物理世界模擬,讓AI對算力近乎貪婪的渴求。面對每年5倍增長的token衍伸出的算力需求,依靠摩爾定律兩年翻一倍電晶體數量的算力增長已經完全跟不上節奏。因為AI的出現,整個半導體行業迸發了無窮的潛力,在後摩爾定律時代竟然電晶體增加速度遠超以前,記得數年前許多人云亦云的網民,高喊著摩爾定律已死,現在看來甚是可笑,誰知道再過幾年又有啥新科技出現呢?從晶片製造層面,面對AI恐怖的算力增長需求,晶片製造領域唯有不斷縮小單位線寬同時不斷加大晶片面積,一縮一放的加乘效果才能勉強跟上AI的節奏。當然增加出貨量也是一個辦法,但這裡就遇到了前段製程與CoWoS產能的瓶頸。傳統的CPU架構在平行矩陣運算面前效率低下,也催生了專用加速晶片的黃金時代。最終,AI的出現推動半導體技術演進沿著三條相互交織又彼此競爭的路徑展開:1. 架構路徑:從通用到專用,生態與效率的終極對決GPGPU的霸權之路: 輝達的CUDA生態,將圖形處理器鍛造成了通用平行計算GPGPU的絕對王者。其核心武器是極高的記憶體頻寬(通過HBM)和大規模流處理器陣列。從H200、GB200到今年即將推出的“Vera Rubin”,都是這條路徑的產物,性能提升直接與視訊記憶體頻寬、NVLink互連規模掛鉤。輝達構築的,是一個從硬體到軟體(CUDA、AI軟體棧)的封閉而強大的帝國。正如老黃在CES演講所說,物理AI的ChatGPT時刻來了,AI的第二拐點,從理解語言到理解物理世界,將還是由通用型GPGPU主導。ASIC的精準革命: 當AI工作負載,尤其是雲端推理側的負載日益固化,為特定演算法(如Transformer)定製的ASIC便展現出碾壓級的能效比Performance per Watt,和總擁有成本(TCO)優勢。Google的TPU、亞馬遜的Inferentia/Trainium、微軟的Athena,以及中國的華為Ascemd,寒武紀MLU都是這條路徑的先鋒。它們通過犧牲通用性,換取在特定戰場上的極致性價比。而博通、Marvell、Al chip等設計公司,正是通過為這些CSP雲巨頭定製ASIC,撕開了兆市場的一道口子。2.製程路徑:奈米尺度的軍備競賽摩爾定律的延續是性能提升的物理基礎。從7nm、5nm、3nm到2026年量產的2nm,每一次製程躍進都意味著電晶體密度和能效的提升。2024年3月份台積電的劉德音與黃漢森在IEEE發表的文章 , 計算出不用十年 , 人類就可以製造出一兆顆電晶體的GPU單晶片。未來不再只是通過光刻等製程微縮這單一手段來提升電晶體數量 , GAA、CFET等立體結構的最佳化、2D新材料以及先進封裝每一個技術都能有效並持續的提升電晶體數量。然而,單純靠微縮已面臨“功耗牆”和“儲存牆”。2nm晶圓的代工價格傳聞高達3萬美元,這已非所有玩家都能承受的賭桌入場費。3.封裝路徑:超越摩爾,系統級創新的主戰場當製程微縮邊際效益遞減且成本飆升,“超越摩爾”(More than Moore)成為新的增長引擎。其核心就是先進封裝,而CoWoS正是台積電為高性能計算打造的“皇冠上的明珠”。CoWoS的精髓在於異構整合。它不再追求製造一個巨大且良率堪憂的單片晶片,而是將多個小晶片,例如計算芯粒(GPU/ASIC核心)、高頻寬記憶體(HBM)、I/O芯粒等,通過Interposer進行超高密度、超高頻寬互連,整合在一個封裝內。CoWoS帶來了三大降維打擊優勢:*突破光罩板極限: 製造遠超單個光刻機視場尺寸的超大晶片成為可能。*混合搭配,最優解: 可以整合不同工藝節點、不同功能的芯粒,實現性能、成本、功耗的最佳平衡。*極致互連性能: 矽中介層上的微凸塊(μBump)間距極小,使得芯粒間通訊頻寬激增,延遲和功耗大幅降低。正因如此,無論是追求極致性能的輝達GPU,還是追求最佳TCO的雲巨頭ASIC,但凡涉足頂級AI算力,都離不開CoWoS。它從一項“使能技術”,變成了決定最終產品出貨量的戰略瓶頸資源。2026年CoWoS產能沙盤推演基於筆者的訊息,我們對2026年台積電CoWoS產能及預訂Booking情況進行建模分析。根據筆者模型,台積電CoWoS產能近幾年的爬坡如下:2023年底:約 12K/月2024年底:約 36K/月2025年底:約 80K/月2026年底(目標):達到 ~120K/月。對於2026年台積電CoWoS產能逐月提升過程,我們取一個不樂觀也不保守的全年有效平均值:94K/月。即 2026年台積電CoWoS總有效產能約為:94K/月 × 12個月 約 1,120,000片。這是本次測算的總彈藥基數。CoWoS產能分配的邏輯推演:台積電的產能分配是一場基於技術、商業、地緣政治的複雜棋局。核心考量如下:技術繫結與生態深度: 輝達是CoWoS最早期、最大膽的共同定義者和投資者,其架構(如NVLink)與台積電CoWoS工藝深度耦合,享有最高優先順序。訂單規模與戰略押注: 蘋果、輝達、AMD是台積電前三VVIP大客戶,其巨額預付款和長期協議鎖定了基礎產能。不過蘋果要到2028年才有自研AI晶片,這兩年不需要CoWoS產能。博通、Marvell因承接Google、AWS、Meta等雲巨頭天量ASIC訂單,已躋身頂級VIP客戶行列。地緣政治與第二供應鏈: 美國對華技術限制,迫使中國頭部AI公司,透過第三方等各種方式全力爭取任何可能的CoWoS產能。同時,ASIC以及AMD、英特爾乃至中國客戶,都是台積電制衡輝達分散客戶風險的重要力量。產品迭代與良率: 更複雜、整合度更高的封裝(如整合更多HBM、更大中介層)初期良率較低,實際有效產出需打折。下圖清晰展示了各主要玩家的爭奪格局:詳細資料請加入知識星球瞭解2026年台積電CoWoS產能分配:輝達:2026年6*萬片。年增*%,依舊保持高增長。儘管面臨競爭,但其產品需求最旺、單價最高、技術最領先,仍將佔據最大份額。輝達接近台積電CoWoS總產能*%的預訂量,遙遙領先其他AI晶片企業,幾乎不受ASIC崛起而稀釋,繼續保持絕對主導的份額。當然輝達的CoWoS預訂的增量,有很大一部分是來自Interposer面積放大的結果,2026年推出的Rubin達到5.5x reticle,比Blackwell的3.3x reticle大了1.6倍。也就是輝達在晶片出貨數量不變的情況下,就必須增加1.6倍的CoWoS產能,或者說從輝達在Rubin時代增加60%的CoWoS產能,晶片出貨量與Blackwell時代相比是沒有增加的。當然整個2026年Blackwell還是出貨主力,輝達65%的CoWoS增量,必然是出貨數量以及單價的雙雙齊漲的局面。AMD:2026年*萬片,年增*%。多款Mi300系列已證明AMD的競爭力,剛剛開幕的CES,蘇大媽正式官宣Mi400系列的來勢洶洶,預計下半年開始出貨。從CoWoS booking數量來看,與25年相比有*%的增量,與輝達的增幅幾乎一致。這也標示著AMD對Mi455的信心十足。Broadcom博通:2026年*萬片,年增*%。主要客戶GoogleTPU開始對外銷售,對博通是利多,不過博通主要負責TPU v6 以及 v7p,偏向推理的v7e會在2026年下半年推出,由聯發科負責流片。下一代的TPU v8 還是會遵循v7的模式,由博通與聯發科兩家分別下單台積電CoWoS。2026年博通向台積電預定的CoWoS產能有60~65%給到TPU第二大客戶Meta的Mtia晶片,今年今年將推出第三代產品,Mtia v2 & v3大約佔博通CoWoS預訂量的20%左右。未來的大客戶Open AI將於2026年底推出內部代號Titan晶片,採用台積電N3製程,預計佔今年博通預訂量的5-10%,2027年將達到20%。2028年蘋果的AI ASIC - Baltra也將面世,目前由博通負責高速互聯,SerDes IP以及後段布線,預計2026年上半年進入TO階段。很顯然,博通是未來ASIC崛起的最大贏家。Marvell美滿:2026年*萬片,年增*%。2026年CoWoS預定數量與2025年持平,幾乎是AI晶片最失意的廠家。主要是出貨主力AWS下一代的Trainium 3轉由Al chip設計。2026年主要客戶還是AWS的Trainium 2 ,新客戶Microsoft採用N3E製程的Maia 200 加入,避免了下滑。Al chip世芯:2026年*萬片,年增*%。2026年CoWoS 200%的增幅,主要是拿下AWS的Trainium 3 訂單2026年出貨包含少量Trainium 1 ,決大部分為N3製程的Trainium 3 Anita,加上Inferentia 2 以及少量的Intel Gaudi 3,以及微軟上一代的-Maia 100。Al chip的客戶數量比博通還多,但出貨量級都不高。AWS已暫停Inferentia 3的開發,轉向以Trainium統一承擔推理跟訓練的工作負載,目前未見Inferentia 3的TO訊息。Annapurna:2026年2.4萬片,年增64%。作為AWS的子公司,Annapurna一直承擔AWS AI ASIC的開發任務,同時也向台積電直接預定CoWoS產能,Trainium 3的 Mariana版本有別於Al chip的Anita版本,同時在台積電投片。MTK 聯發科:2026年2萬片。作為台積電CoWoS的新進客戶,目前聯發科已調撥大量人力支援ASIC業務,AI ASIC未來將成為聯發科的重點業務。2026年下半年主要承擔TPU v7e的出貨,2027年為出貨主力年,同時2027年將疊加TPU v8e的訂單,2027年MTK有機會出現5~600%的CoWoS同比增幅。聯發科目前已將AI ASIC最為為來核心業務,作為行業巨頭,聯發科的加入也將很大影響ASIC設計的市場格局。聯發科這兩年的ASIC業務雖然這兩年高歌猛進,但由於只是做後段布線,缺乏博通強大的IP,雖然增幅大,但單價較低,對於體量本就不小的全球第三fabless巨頭來說,並不能帶來營收的大幅度增長。當然從CoWoS增量來看,聯發科在AI以及端側的佈局非常積極,又有ASIC業務的高增長加持,將是這兩年除了博通之外,ASIC陣營的最大受益者。剩下的台積電CoWoS客戶的量級就都是小於1萬片,其中微軟自研ASIC-Athena 還是由內部團隊在台積電投片小批次的不斷迭代推進。GUC創意還是小型AI晶片初創企業在CoWoS流片的首選,也是國內AI的重要第三方,畢竟GUC是台積電的親兒子。Xilinx這個最早的CoWoS客戶,因為CoWoS不斷漲價,FPGA又不如AI晶片的利潤那麼高,已經逐漸放棄高成本的CoWoS,改由成本更低的IoFO_LSI方案。剩下的兩家交換機廠家思科與中興微,因為其高端交換機有採用HBM,所以一直以來也都是台積電CoWoS客戶,只是預定量只有幾千片的水平。至此,我們得到了2026年各陣營的“彈藥”配額:再加上FPGA、Switch的 2萬多片,即時2026年台積電CoWoS的出貨總量。從彈藥分配來看,拿下整個CoWoS產能65%的GPGPU陣營還是擁有絕對的火力優勢,甚至輝達一家的火力就超過全球其他企業的總和。4. 超越數量 - 價值、生態與功耗的深層次博弈然而,僅比較CoWoS還是會誤判戰局。雖然CoWoS數量與面積是一切的根本,但不同的封裝方案,比如single-die以及dual-die方案,將導致Interposer面積出現很大的不同,每片CoWoS可切割數量有很大差別。其中最顯而易見的就是Hopper時代的每片切29顆,到了Blackwell時代的每片14顆,這正是Interposer不斷放大的結果。所以台積電CoWoS的產能增幅,對應的不只是AI晶片出貨量數量的增加,還疊加了Interposer面積不斷放大的增量。又比如2026年Google的TPU v7p是dual-die的D2D方案,interopser size 在2400mm2左右,一片CoWoS可切割16顆左右。而同一代針對推理的TPU v7e,採用single die設計,interposer size只有1500mm2左右,每片CoWoS可切數量超過30顆以上。AI晶片的Interposer越來越大的尺寸是明確的技術路線,目前Interposer是3.3x的reticle size,2026年的Rubin是4~5.5x,而2027年4-die合封的Rubin Ultra將達到9~9.5x。所以不斷放大的Interposer面積也是台積電CoWoS不斷大幅度擴產的一大主因。正因如此,以CoWoS的產能(消耗面積)增減幅度來計算企業AI營收增減幅度,會比企業的AI晶片出貨顆數量增減來的更為準確。AI晶片戰爭的勝負,除了CoWoS消耗面積以外,還要在兩個維度上評判:算力維度:一顆輝達B300的FP8算力達10 PFLOPS,而一顆定製推理ASIC的算力可能僅為其幾分之一,即便是最強的TPU v7p也只有輝達B300的一半,這還是不考慮今年與TPU v7同台競技的Rubin的差距,如果用Rubin來對比差距將更大。剛開幕的CES老黃說Rubin的性能將比blackwell在推理提升了5倍,訓練提升了3.5倍,GPU與ASIC的性能差距並沒有縮小,反而是在擴大中。因此,即使顆數接近,輝達陣營輸出的總算力(TFLOPS) 很可能仍大幅領先。這是GPU通用架構的“蠻力”優勢。總算力領先的物理基礎就是來自CoWoS消耗面積(電晶體)的多寡。價值維度:這是最殘酷的差距。輝達單顆GPU售價高達3萬美元以上,未來會提升到4-5萬美元。而云巨頭自研ASIC的“成本”僅體現為台積電的代工費用和博通的設計服務費,即便成本相差無多,但ASIC其“內部結算價”必然遠低於GPU售價。即便ASIC對外銷售,我們可以用Anthropic向博通採購210億美元的TPU為例,百萬顆的TPU v7p 扣除伺服器等諸多配置,單顆對外售價在1.5萬以下。目前最強的ASIC是採用最先進N3P製程的TPU v7p,製程領先輝達Blackwell一個世代,但其對外售價不到Blackwell的一半,這與剛才我們計算的TPU v7p的算力只有B300的一半,算力與售價差距大致上是對等。從這一點來看,完全證明我們文章剛才所說,AI晶片是多維度的比拚,不單單比摩爾定律比晶片製程,還要比誰的面積更大,能放進更多電晶體,最終表現在性能上的差別也決定他的最終價格。因此,輝達用60%的CoWoS產能,創造了整個AI加速晶片市場70%以上的收入和90%以上的利潤。這正是黃仁勳“6個季度,5000億美元狂言”的底氣 — 他賣的是“黃金”,而ASIC陣營在為自己鍛造“精鋼武器”。生態鎖死 vs. 專用解放:輝達的帝國城牆: CUDA軟體棧、龐大的開發者社區、最佳化的AI框架(TensorRT、Triton),以及NVLink、NVSwitch構成的系統級優勢,構成了幾乎無法踰越的生態壁壘。使用者購買的是一整套最強的“交鑰匙”解決方案。ASIC的破局邏輯: ASIC的優勢在於,對於CSP這類超大規模使用者,當其軟體棧完全自控,從TensorFlow/PyTorch框架到推理服務Triton,且工作負載高度特化且穩定(如搜尋推薦、廣告排名、語音識別推理)。所以自研ASIC能帶來極致的TCO(總擁有成本)最佳化和能效比。它們用“專用化”換取“去輝達化”的戰略自由和長期成本節約。最終直指CSP採用自研晶片最佳化財務報表的內在動力。這也說明了一個侷限,ASIC只有超大型CSP或者大模型等超大規模企業會使用,首先ASIC的資金以及人力投入巨大,但這兩點已經確定了客戶範圍,所有用量不大的中小型使用者都不可能使用ASIC。即便是購買現成的ASIC,我們以Anthropic向博通採購210億美元的TPU為例,這背後需要養一隻極為強大底層系統工程師團隊不斷的進行深度遷移以及適配。單這一項開支,就足以說明這並非普通企業所能承受的,當然目前GPU高昂的價格,讓市場更願意採用各種降本方案,可即便是購買現成ASIC的模式,大概也就能拓展到Anthropic這體量的大模型企業,很難再往下拓展。系統級創新與功耗牆:功耗即成本,散熱即極限: AI叢集的功耗已從幾十千瓦邁向兆瓦級,未來晶片功耗將飆升至數千瓦。風冷已到極限,液冷(包括冷板、浸沒式)成為標配。這不僅關乎電費,更決定了資料中心的物理設計和最大叢集規模。ASIC的能效優勢: 專用電路在執行特定任務時,能效通常遠高於通用GPU。這意味著在相同的供電和散熱預算下,可以部署更多ASIC算力單元。互連與封裝創新: 戰爭遠不止於單顆晶片。CPO共封裝光學是突破“功耗牆”和“互連牆”的關鍵,CPO展示了系統級互連的競爭。系統架構創新,如華為的384顆NPU互連的CloudMatrix 384,來挑戰輝達NVLink全互連系統的思路。CoWoS只是起點,其上的互連網路(NVLink, CXL, UCIe)、光引擎(CPO)的競爭同樣激烈,而且每一個技術領先都有決定性的作用,目前輝達在每一個維度上的表現都處於行業領先地位。5. GPU的技術反擊與生態擴張:2026年開年CES,黃仁勳與蘇姿丰的演講,清晰地勾勒出GPU陣營未來的技術路線圖和反擊策略,特別是對「物理AI」這一新戰場的定義,將深刻影響GPU與ASIC的競爭格局。輝達在CES宣告的戰略意圖:1.下一代「Rubin」架構正式亮相:基於台積電N3P製程,並將interpose面積放大1.4~1.6倍,首次實現整合超過3000億個電晶體的單一GPU,電晶體總數達3360億,較上一代電晶體數量提升1.6倍。並搭載下一代 HBM4 記憶體,單GPU容量直奔 288GB 甚至更高,儲存頻寬突破 22TB/s,較上一代Blackwell提升2.8倍,可見HBM4相對於HBM3e,在介面頻寬以及logic base die的提升可謂相當驚人。互連技術 NVLink 6.0 將提供超過 3.6TB/s 的GPU間直連頻寬,較上一代Blackwell提升1.8倍。推理性能比Blackwell高出5倍,訓練的性能高出3.5倍。Rubin不僅是性能的躍升,更是輝達鞏固其在訓練和複雜推理市場絕對領導地位的利器。2. 物理AI的ChatGPT時刻 :這是黃仁勳演講中最具震撼力的宣言。他認為,AI的下一個前沿是理解和模擬物理世界,應用於機器人、自動駕駛、數字孿生、科學發現(如氣候模擬、藥物研發)等領域。這些應用需要處理海量、多模態的感測器資料,進行複雜的物理模擬和即時決策,工作負載極度複雜、演算法迭代快速。為何老黃會這樣說,因為「物理AI」恰恰是通用GPU的絕對主場。定製化ASIC在處理固定、已知的模型推理時效率極高,但面對物理AI所需的持續學習、多工處理、快速演算法適配等場景,其架構僵化的劣勢將被放大。GPU憑藉其無與倫比的可程式設計性和龐大的CUDA生態,能夠靈活適應從計算流體力學到機器人控制等各種新興物理AI任務。因此,「物理AI的ChatGPT時刻」極大地擴展了GPU的應用邊界和市場總量,為其增長提供了全新的可開發疆域,這是ASIC現有技術難以切入的賽道。3.收購Groq:對ASIC的「釜底抽薪」之舉。2025年底,輝達宣佈收購專注於低精度推理和極低延遲語音模型的初創公司Groq。這筆收購遠不止是技術補充,而是對ASIC陣營的戰略性反擊。Groq的技術核心在於其LPU(語言處理單元)架構,在特定推理任務(如大語言模型對話)上能實現遠超GPU和傳統ASIC的能效和速度。輝達通過收購Groq,直接獲得了在ASIC最具優勢的「高能效推理」領域的尖端技術和產品。這使得輝達能夠以「內部ASIC」的方式,正面迎戰博通、Google等的定製化推理晶片。這不僅是產品線的補充,更是商業模式的轉變,從單純銷售通用GPU,轉變為提供「通用GPU + 特定領域最佳化加速器(如LPU)」的全端解決方案。這將有效遏制ASIC在推理市場的侵蝕,並可能奪回推理市場市佔率的重要武器。此舉加劇了AI加速器市場的融合與競爭。未來的界限不再是簡單的GPU對ASIC,而是「全端生態公司」與「專項設計公司」的對決。輝達正在利用其資本和生態優勢,將潛在的顛覆性技術收編入自身體系,戰場的主導權還是掌握在輝達手上。AMD則在CES公佈MI400系列的細節,正式發佈基於3nm增強版製程的 「AMD Instinct MI400」 加速器。核心參數瞄準超越輝達當前旗艦,宣稱在關鍵AI訓練和推理工作負載上,實現相比MI300系列100%的性能提升,並強調其能效比優勢。AMD持續推廣其開放式軟體棧ROCm,並通過與微軟Azure、Oracle Cloud等雲服務商的深度合作,以更開放且更具性價比的方案爭奪輝達之外的市場份額。蘇姿丰強調,未來的AI計算將是多元化的,AMD將為客戶提供「第二選擇」。總而言之,2026年的GPU陣營,並非消極防守。輝達通過定義「物理AI」新戰場、收購Grop補強推理短板,正在從技術和生態兩方面建構更深的護城河。AMD則堅定地走開放與性價比路線,蠶食市場。GPU的增長故事,正從單純的「大模型訓練」擴展到更廣闊的「物理世界智能化」,這為其對抗ASIC的專用化攻勢提供了戰略縱深。6. 超越產能 - 生態、功耗與終局之戰CoWoS產能決定了「彈藥」數量,但戰爭的勝負還取決於「彈藥」的效率、協同和最終產生的價值。1. 生態系統的終極壁壘:輝達的CUDA生態依然是其最堅固的堡壘。數百萬開發者、龐大的軟體庫、從訓練到部署的全端工具鏈,構成了極高的遷移成本。儘管Google的TensorFlow、PyTorch等框架也在努力實現對不同硬體後端的支援,但在易用性、性能和社區支援上,仍與CUDA有差距。ASIC陣營的優勢在於『垂直整合』,Google可以為TPU深度最佳化TensorFlow,Meta可以為MTIA定製模型。但對於廣大的企業和開發者而言,輝達全面且最優的「交鑰匙」方案仍然是最佳選擇。收購Groq後,輝達有望將這一生態優勢進一步延伸到特定推理場景。2. 功耗牆與成本牆:隨著單晶片功耗突破千瓦級,資料中心的供電和散熱成本已成為不可忽視的因素。ASIC憑藉其專用架構,在能效比(Performance per Watt)上通常有顯著優勢。這也是雲巨頭在規模化部署推理服務時傾向採用自研ASIC的核心經濟動因。輝達需要通過製程與封裝技術的進步、架構創新(如稀疏計算、低精度推理)以及系統級最佳化(如液冷、CPO共封裝光學)來對抗ASIC的能效優勢。Rubin架構和收購Groq,正是其在性能和能效兩端同時發力的體現。3. 未來的融合與分野:長遠來看,GPU與ASIC的界限會進一步模糊。輝達可能會推出更多「可配置」或「領域專用」的加速器(類似收購Groq後的產品線)。而ASIC設計公司(如博通)也可能會為不斷強化ASIC的性能,並給客戶提供更具靈活性的平台化方案。未來的競爭,將是「高度最佳化的通用平台」與「深度定製但具有一定可程式設計性的專用平台」之間的競爭。CoWoS產能依然是基礎,但在此之上,軟體生態、能效表現、總擁有成本(TCO)和對新興應用的適應能力,將成為決勝的關鍵。2026,對峙與滲透的拐點綜上所述,基於對CoWoS產能的沙盤推演、對2025年預測的覆盤以及對最新技術動向的分析,我們對2026年GPU與ASIC的對決格局得出以下結論:1. CoWoS分配格局固化,輝達主導地位難撼:2026年,輝達仍將消耗台積電過半的CoWoS先進產能,這確保了其在高端訓練和複雜推理市場的供給優勢,並在ASIC固守的推理市場不斷的嘗試進攻。ASIC陣營份額依舊維持快速增長,主要來自CSP掌握的大量推理算力的增量和生力軍頭部大模型企業的加入,短期內依然無法動搖輝達的根基,但卻能在固守方陣內不斷壯大與繁榮。2. ASIC在推理市場不斷壯大,實現規模化突破,但GPU開闢「物理AI」新戰線:ASIC憑藉成本和能效優勢,將在雲巨頭的大規模、固定模式推理場景中確立主流地位,並開始向Open AI以及Anthropic等頭部大模型公司滲透。然而,輝達通過定義「物理AI」這一全新、複雜且快速演進的賽道,為GPU找到了下一個爆發性增長點,有效避險了ASIC在傳統推理市場的衝擊。3.競爭從「硬體對抗」升級為「生態與系統級對抗」:輝達收購Groq標誌著戰術的轉變,從單純防守轉向「以彼之道,還施彼身」,用定製化能力反擊定製化。未來的競爭將是全端能力的競爭:從晶片、互連、封裝、系統到軟體和開發者生態。擁有更完整生態和更強系統整合能力的玩家將贏得最終優勢。結論以2026年台積電約115萬片CoWoS產能為沙盤推演,我們測算出:ASIC陣營(37.5萬片)達到GPGPU陣營(75萬片)剛好50%的水平,這個資料2024年為52%,2025年為45%,2026年為50%。也就是說2026年ASIC對比GPGPU的CoWoS佔比提高了5%。這再次印證,筆者2025年原文所稱,2024-2027年為ASIC超級增長周期,其中2026-2027年將是周期高峰,大家可以再次翻閱2025年全球半導體展望中原文的模型。面對ASIC基數較低的超高增長,GPGPU在基數龐大的情況下,CoWoS佔比也沒有大幅度的下滑,比筆者一年前預測的更有韌性,這除了輝達GPGPU持續熱銷以外,還有GPGPU更願意採用最新技術有較大關係,比如2026年的Rubin率先採用4~5.5x reticle的interposer,2027年很快推進到9~9.5x,這個變數將直接翻倍。而ASIC的絕對性能沒有GPGPU那般的極致要求,2026年ASIC的Interposer在2.9~3x ,在2027年也還是停留在3.3x的水平。GPGPU是面積快速放大但出貨數量微幅增長,ASIC是出貨數量快速放大而面積微幅增長,最終勝敗就表現就在CoWoS預定資料,ASIC在出貨數量增幅遠高GPGU 15%以上,但在CoWoS產能的佔比則是從45%,提升5個點到50%。根據筆者模型,2027年ASIC將來到GPGPU的58%,ASIC佔比持續增加,意味著2026-2027筆者早早預測的ASIC迎來超級增長周期,增長率超過GPGPU。至於企業營收,那自然與CoWoS出貨量成正比,晶片性能與面積(電晶體總數)成正比,同製程雙顆的dual-die性能必然是高於single-die的晶片,文前有比較過性能與售價成同比例漲跌(TPUv7與B300),也就是性能高兩倍,單價大概也會高兩倍。這裡面多少nm製程與多大的面積都對性能(電晶體數量)有決定性的影響。ASIC的代表GoogleTPU,除了CSP自研自用以外,開始向外提供,這標誌著ASIC從正式邁入“規模化部署”以不斷蠶食GPGPU領地。然而,在商業價值(營收/利潤)和算力總量上,輝達憑藉其極高的單價和通用算力優勢,在2026年及之後一段時間內,仍將保持王者地位。輝達的帝國,將繼續統治需要靈活性、創新性和全端解決方案的廣闊疆域(訓練、新興應用、中小企業、科研)。ASIC的諸侯國,將在超大規模資料中心內部,在推理、推薦、搜尋等成熟且量大的固定戰場上,建立起基於極致TCO和能效比的自治領地。未來,我們更可能看到的是一個 “GPU+ASIC”的混合算力世界:雲巨頭用輝達GPU進行前沿模型研發和訓練,同時用自研ASIC進行成本敏感的大規模推理部署。戰爭的號角早已吹響,2026年的CoWoS產能分配表,就是這場世紀算力大戰最真實、最殘酷的兵力部署圖。ASIC群雄時代結束,Google/博通已成為共主,圍獵與反圍獵已經開始,而輝達帝國依然強大。這場好戲,還在後頭!而更接近未來事實的是,這場戰爭並非一場你死我活的殲滅戰,而是一場持久且複雜的“劃界戰爭”。隨著戰爭的推進,各方勢力意圖提高競爭力去打敗對手的同時,不斷提高的技術能力,導致技術外溢,其產生的結果不一定是打敗對手,而是如哥倫布一般,隨著航海技術的提升,發現更為廣闊的新天地。AI世界還有太多未知的疆域需要更高的技術才能去探索與挖掘。未來GPGPU以及ASIC可能都是贏家。2026-2027年ASIC的增幅將繼續高於GPGPU,2028年融合了LPU的Feynman有沒有可能帶領輝達在ASIC堅守的領地攻城拔寨,目前言之過早,未來誰主沉浮猶未可知?而GPGPU以及ASIC在整體算力需求不斷上漲的雙贏背後,卻始終站著一位終極大BOSS,更大的幕後贏家不動聲色冷眼旁觀。台積電作為這場戰爭共同且唯一“軍火商”,坐擁CoWoS產能的絕對定價權,將是無論那一方獲勝都不可或缺且毫無疑問的終極大贏家。(Techcoffee)