內容概括
瑞穗管道調研把 2028 年 TPU 出貨推到 3500 萬顆以上,較 2026 年約 430 萬顆、2025 年約 240 萬顆繼續放大,並提出 2026-2028 年 TPU 累計出貨可能接近 5000 萬顆。這個數字最重要的地方,不是單純給博通再加一個看多理由,而是把市場的審題從“博通本季 AI 半導體收入夠不夠驚豔”改成“雲廠自研 ASIC 的出貨斜率是不是被系統性低估”。一旦這個斜率成立,Broadcom、MediaTek、HBM、台積電、伺服器 ODM、先進封裝、PCB/ABF、液冷和電源都會被重新納入同一條需求鏈。
本文的核心判斷是:ASIC 不是 GPU 的反面,而是推理經濟學進入規模化階段後,超大雲廠降低單位 token 成本、爭取供應鏈選擇權和鎖定專屬工作負載的工具。訓練仍然偏向輝達平台,長尾開發者仍然依賴 CUDA/PyTorch 生態;但在 Google TPU、OpenAI/OAI Nexus、Meta MTIA、AWS Trainium、Microsoft Maia 和 ARM AI ASIC 等大客戶場景裡,只要工作負載足夠穩定、軟體團隊足夠強、規模足夠大,定製矽就會不斷吃掉增量推理利潤池。
投資上,博通仍是最清晰的主錨,因為它同時拿到 custom silicon、Ethernet networking、SerDes、交換和機櫃級網路價值;但結論不能停留在“博通又強了”。更有價值的判斷,是把博通放在一條擴散鏈裡看:第一層是 ASIC 設計和網路,第二層是 HBM/HBM4e 和先進封裝,第三層是伺服器整機櫃、液冷、電源與 PCB,第四層是軟體效率和模型壓縮對硬體強度的反向校驗。若 2028 年 TPU/ASIC 曲線兌現,最強彈性不一定只在博通,也可能在美光、台積電、聯發科、緯穎以及一批被 ASIC 伺服器放量帶動的亞洲供應鏈環節。
一、瑞穗把問題改了:從“博通財報復盤”變成“TPU 曲線重估”
博通 2026 財年二季度財報以後,市場原本圍繞兩個問題交易:第一,AI 半導體收入是否繼續高增;第二,下一季度指引是否足夠超過過高預期。Citi 的復盤口徑顯示,博通當季總收入和每股收益大致符合預期,7 月季度 AI 銷售指引略低於部分樂觀模型,但公司仍重申 2027 財年 AI 半導體銷售額超過 1000 億美元,2028 財年繼續增長;同時 2026 財年 AI 銷售額約 560 億美元,且下半年較上半年繼續加速。這個框架仍然重要,但它已經不是最新分歧的全部。
瑞穗管道調研提供的新變數,是把 TPU 出貨量的上限明顯抬高。市場此前更習慣用“博通約 10GW、OpenAI/Meta/其他客戶逐步貢獻、Google TPU 穩定放量”的方式看博通;瑞穗口徑則把 2028 年 TPU 出貨提到 3500 萬顆以上,並把 2026-2028 年累計 TPU 出貨拉到接近 5000 萬顆。這個口徑如果成立,意味著此前圍繞 Broadcom ASIC 出貨約 700 萬顆的部分保守假設可能偏低,AI custom silicon 不是某幾家雲廠的小眾補充,而是正在成為高規模推理基礎設施的核心增量。
這條線索改變了市場定價的重心。6 月 4 日的博通財報已經驗證 AI 半導體和網路需求,6 月 7 日的新變數則把問題推進到 TPU 出貨曲線。博通仍然在中心,但中心的含義變了:它不是只在財報季兌現一次收入,而是在一個可能持續到 2028 年的定製矽上修周期裡,承擔設計、網路、交換、SerDes 和部分機櫃級價值。更重要的是,博通之外的鏈條開始變得可交易:TPU 對 HBM/HBM4e 的拉動,聯發科在後續 TPU/ASIC 項目中的價值量提升,伺服器 ODM 的整機櫃交付,PCB/ABF/液冷/電源的二階彈性,都會因為出貨曲線抬高而重新進入模型。
這裡要保持克制。瑞穗管道調研目前更像“新催化”,不是可以直接替代完整模型的唯一底稿。正式判斷仍要靠幾類材料交叉驗證:Citi 對博通 FY26-FY28 AI 收入和客戶部署的分解,高盛對 OpenAI 10GW 和每 GW 收入機會的測算,Morgan Stanley 對 TPU/GPU/HBM/ASIC 全鏈條的框架,Evercore 對 GPU vs ASIC 推理經濟學的管道檢查,高盛伺服器模型對 ASIC 伺服器佔比和整機櫃出貨的測算,以及聯發科報告對亞洲設計服務價值量提升的驗證。只有這些證據放在一起,TPU 海嘯才不是一句熱鬧口號。
二、為什麼 ASIC 這次更像主線:推理經濟學開始改採購指標
過去兩年 AI 加速器的主線是訓練。訓練要最大 FLOPs、最大頻寬、最成熟軟體棧和最少執行風險,輝達自然擁有最高平台溢價。這個階段,客戶願意為 GPU、NVLink、InfiniBand/NVLink Fusion、CUDA、庫、參考架構和交付確定性支付高毛利,因為錯過訓練窗口的機會成本遠高於硬體溢價。
現在問題開始變化。Evercore 的 1Q26 AI 管道調研問了 25 位以上 AI 工程師和行業專家,方向相當清楚:2025 年仍偏訓練,但到 2026 年底,推理可能成為計算工作負載的主要部分,部分受訪者把推理佔比看至 50%-60%。推理不是訓練的反面,而是採購指標的切換:客戶不再只看最大頻寬和峰值性能,而是看 cost-per-token、功耗、散熱、利用率、SLA、軟體調優成本和總擁有成本。
這正是 ASIC 變得更重要的原因。雲廠不需要讓 ASIC 在所有場景取代 GPU,只需要在足夠大、足夠穩定、足夠可最佳化的推理工作負載裡,把單位 token 成本降下來。大客戶有能力為 TPU、Trainium、Maia、內部 ASIC 或 AMD 平台配置專門的軟體團隊;Evercore 的管道反饋甚至提到,Anthropic、xAI、OpenAI、Google 這類客戶為每個硬體平台配置 20-30 人做最佳化是合理投入。這個規模門檻把市場分成兩層:長尾企業仍需要輝達平台,大客戶會不斷把一部分負載遷到更便宜或更可控的專用硬體上。
因此,結論不能落在“ASIC 打敗 GPU”這個二元框架裡。更準確的判斷是:輝達仍然是最大、最強、最通用的平台,但推理經濟學會讓它的增量份額和毛利率接受更嚴格的 TCO 檢驗。雲廠 ASIC 不是為了追求所有指標最強,而是為了在內部大規模場景裡降低成本、減少單一平台依賴,並讓模型服務、雲產品和客戶合同的關係更緊。
這也是為什麼 TPU 曲線被抬高後,市場反應不應只停留在博通。TPU 放量本身說明 Google 和 Anthropic 這類客戶願意在 Google 棧內接受更深的軟體和硬體一體化;OpenAI/OAI Nexus 說明前沿模型公司也在尋求 GPU 之外的大規模定製矽路徑;Meta MTIA 說明廣告、推薦和內部推理負載有足夠規模支撐 ASIC;ARM AI ASIC 則說明 CPU/IP 生態也在尋找進入 AI 加速器價值鏈的路徑。GPU 仍是基準資產,但 ASIC 已經從“替代品”變成“第二來源和成本槓桿”。
三、博通的正確位置:不是單顆 ASIC,而是 custom silicon + 網路雙收費
博通的優勢,在於它不是只賣一顆定製晶片。高盛在 OpenAI 合作報告裡把 10GW custom-designed AI accelerators 與 networking products 放在一起分析,認為 Broadcom 與 OpenAI 的合作包括加速器和 Ethernet 解決方案,面向 scale-up 和 scale-out 網路。高盛的每 GW 框架顯示,1GW AI 資料中心部署可能對應 100 億-150 億美元等級的 Broadcom 收入機會,其中既有 custom silicon,也有 AI networking。這個框架不一定能機械套到每個客戶,但它解釋了博通為什麼估值能高於普通 ASIC 設計服務商。
Citi 的博通復盤也強化了同一件事。公司預計 2027 年 10GW 發貨可能偏下半年,但 2028 年仍有強勁延伸;OpenAI 2027 年 1.3GW 是更大 10GW 部署的一部分,Meta 到 2028 年底可能部署 3GW,另有兩個客戶預計 2026 年末開始出貨並在 2027 年加速,相關採購訂單約 60 億美元。Citi 還提到,博通 AI networking 與 XPU 的長期 attach rate 約 30%,且 HBM 成本上漲可向客戶傳導。這些資訊共同指向一個結論:博通的 AI 收入不是單一晶片 ASP,而是“XPU + 網路 + 高速介面 + 客戶鎖定”的組合。
博通真正的護城河來自三件事。第一是客戶規模。Google、OpenAI、Meta 這類客戶的工作負載足夠大,可以承擔定製晶片、編譯器、軟體棧和長期最佳化成本。第二是網路能力。ASIC 越多,叢集越大,scale-up 和 scale-out 網路越重要,博通可以同時賣晶片和網路。第三是長期路線圖。Google TPU 已經演進多年,未來 v7/v8/v9/v10 不只是晶片代際,而是 HBM、製程、封裝、網路、伺服器和軟體棧的一整套遷移。
但博通也有高預期風險。Citi 復盤裡就能看到,AI 收入指引強,但沒有明顯高過最激進市場預期,股價仍可能承壓。原因是博通已經被市場當作 AI 定製矽第一股定價,單季“好”並不夠,必須持續證明 2027-2028 年大客戶部署沒有延期、每 GW 內容量沒有被壓縮、網路 attach 沒有被替代、HBM 成本能夠傳導。如果 3500 萬顆 TPU 的曲線只是管道過度外推,博通估值會先反應。
所以,博通在這篇報告中的位置應該是“核心主錨,但不是唯一答案”。它是判斷 ASIC 上修周期是否真實的第一隻股票;但如果出貨曲線成立,投資機會會從博通外溢到 HBM、先進封裝、設計服務、伺服器、PCB/ABF 和液冷。真正的深度報告不能唯寫 AVGO 一家公司,否則會錯過“TPU 海嘯”對供應鏈的二階傳導。
四、TPU 路線圖的關鍵:Broadcom 與 MediaTek 可能輪流吃到價值量
Morgan Stanley 的 AI 半導體報告給了一個很重要的框架:無論 GPU 還是 ASIC 贏,台積電作為先進製程和先進封裝供應商都會受益;而在雲廠自研晶片裡,Google TPU 是最成熟的樣本之一。報告把 TPU 路線分成多個代際:TPU v7 Ironwood/Sunfish 與 Broadcom 相關,TPU v8 Zebrafish 與 MediaTek 相關,TPU v9 Pumafish 又回到 Broadcom,TPU v10 Humufish 與 MediaTek 相關。不同報告對命名和客戶責任的具體口徑可能存在差異,但核心資訊很清楚:Google TPU 不是一次性項目,而是多代迭代的體系工程。
這對聯發科非常關鍵。高盛台股報告把聯發科 AI ASIC 上行周期明顯上修:管理層把 2026 年 AI ASIC 收入指引從超過 10 億美元上修到 20 億美元,並對 2027 年“數十億美元”規模保持信心;更重要的是,管理層把 AI ASIC TAM 從此前 2028 年 700 億美元,上修到 2027 年 700億-800 億美元。高盛據此維持 2027 年聯發科 AI ASIC 收入約 123 億美元,並把 2028 年 AI ASIC 收入模型從 190 億美元上調到 480 億美元,佔總收入 66%。
這組數字看起來很激進,但它背後的邏輯不是“手機晶片公司突然變 AI 公司”,而是價值量位置改變。聯發科的下一代 AI ASIC 項目預計 2027 年底量產,管理層強調新一代晶片更大、更強,聯發科在 silicon、packaging 和 SerDes IP 中獲得更高價值量,未來可能從 I/O dies 擴展到 compute dies 設計流程。換言之,聯發科的重估不只是多賣一顆 ASIC,而是從傳統無線/手機 SoC 資產,遷移到雲廠 AI 定製矽價值鏈。
這也解釋了為什麼 TPU 海嘯不能唯寫成博通故事。如果 2028 年 TPU 出貨真的上到 3500 萬顆以上,Google 不可能只依賴一個供應商、一個代際、一個封裝方案。Broadcom 與 MediaTek 的輪替,台積電先進製程和 CoWoS/SoIC 的供給,ASE/日月光、測試、基板、良率和電源散熱都會成為風險和機會。聯發科的多頭邏輯來自“價值量上移”,風險也來自同一件事:一旦先進封裝、良率、客戶路線或項目時間表出問題,估值會按高 beta 回撤。
對 A 股和港股投資者來說,這部分還要避免簡單對應。不是所有“ASIC 概念”都能受益,真正受益的公司必須滿足兩條:第一,能進入大客戶量產鏈,而不是只做概念驗證;第二,價值量能隨代際提升,而不是在激烈價格競爭中只賺一次性 NRE 或低毛利設計費。TPU 曲線越陡,供應鏈篩選越要看客戶、節點、封裝、良率和產能。
五、HBM 的第二導數:ASIC 不是削弱記憶體,而是把 HBM 需求多核化
市場容易把 ASIC 和 GPU 對立起來,從而誤以為 ASIC 放量會削弱 HBM。這個判斷太粗。Morgan Stanley 的報告顯示,2026 年 HBM 消耗可能達到 320 億 Gb 等級,輝達仍然是最大需求方,但 AI ASIC 已經納入 HBM 需求模型,包括 TPU v7p、TPU v7e、TPU v8、AWS Trainium、Meta MTIA 等多個項目。瑞穗管道調研也強調,隨著下一代 ASIC 遷移到 HBM4e,ASIC 對 HBM 市場份額的貢獻可能提高。
這裡的關鍵不是“ASIC 用不用 HBM”,而是用多少、用那一代、誰供應、良率如何。訓練 GPU 仍然是 HBM 最大單一驅動,但云廠 ASIC 放量會讓 HBM 需求從單一輝達鏈條擴散到多個客戶和多個平台。對美光來說,這尤其重要。過去市場更習慣用輝達認證、HBM3e/4 進度和三星/SK 海力士競爭來給美光定價;如果 TPU、MTIA、Trainium、OAI ASIC 都開始向 HBM4/HBM4e 遷移,美光的需求來源會更分散,議價和產能分配也可能更有彈性。
這部分最容易出現兩種錯誤。第一種錯誤是“ASIC 放量等於 HBM 更強,所有儲存都無腦受益”。並不是。HBM 受益要看具體代際、客戶認證、堆疊能力、封裝配合、長協價格和良率;普通 DRAM/NAND 的傳導路徑更長,不能直接照搬 HBM 邏輯。第二種錯誤是“模型壓縮會殺死硬體需求”。也不是。TurboQuant 這類壓縮或記憶體最佳化技術能把部分模型運行記憶體大幅壓低,說明軟體效率始終是硬體牛市的校驗項;但在超大規模雲廠推理中,單位成本下降往往也會刺激更多呼叫,最終影響的是需求彈性和利潤分配,而不是簡單削減所有硬體需求。
更合理的結論是:HBM 是 TPU/ASIC 曲線的第二導數。第一導數是 Broadcom/MediaTek 這些 ASIC 設計和網路供應商收入上修;第二導數是 HBM、封裝、基板、散熱和測試是否因為多平台放量而持續緊缺。如果 2028 年 TPU 出貨曲線兌現,美光、SK 海力士、三星不只是輝達鏈條的供應商,也會成為雲廠 ASIC 多核化的共同受益者。
六、伺服器與整機櫃:ASIC 放量最終要落到機櫃、液冷、電源和 PCB
高盛全球伺服器模型把 ASIC 伺服器的重要性說得很直接:AI 伺服器中的 ASIC 晶片佔比預計從 2025 年 38%、2026 年 40% 提升到 2027 年 50%,而全球 AI 晶片需求從 2025 年約 1100 萬顆、2026 年約 1600 萬顆提升到 2027 年約 2100 萬顆。這個口徑不等於瑞穗 3500 萬 TPU 口徑,兩者定義和樣本範圍不同,但方向一致:ASIC 不再是邊緣增量,而是在伺服器和機櫃層面逐步成為主流配置之一。
高盛還把整機櫃平台納入伺服器 TAM:2025-2027 年 rack-level servers 約 1.9 萬、5.5 萬、8 萬櫃,且非輝達整機櫃平台開始進入模型。AI full racks 的擴張意味著價值量不只在晶片,還在伺服器、主機板、背板、線纜、光模組、液冷、電源、機櫃導軌、PCB/CCL 和測試。ASIC 的出貨量再高,如果不能轉成可交付的伺服器和資料中心容量,也只是模型裡的數字。
這張圖的投資含義是:如果寫“TPU 海嘯”,文章必須從晶片往機櫃寫。雲廠真正採購的是 capacity,不是單獨一顆晶片。Google、Meta、OpenAI、AWS 或 Microsoft 要把 ASIC 投入生產,必須經過晶片設計、晶圓代工、HBM、封裝、基板、整機伺服器、機櫃、電力、液冷、資料中心並網和軟體部署。任何一個環節卡住,出貨曲線都會延後;任何一個環節持續緊缺,都會形成二階定價機會。
這也是為什麼緯穎這類 ASIC 伺服器材料值得放進輔助證據。它們不一定是這篇文章的主角,但能驗證 ASIC 已經從晶片故事進入系統故事。伺服器 ODM 的利潤率通常不如晶片設計商,但在整機櫃放量、客戶指定配置、液冷和高端板材比例提升時,它們能提供供應鏈體感:訂單是不是真的下來了,拉貨節奏是不是在加快,BOM 有沒有升級,良率和交付有沒有問題。
七、軟體效率是反向約束:硬體牛市不能忽視壓縮和調度
同一批資訊裡出現了一個看似不相關的訊號:TurboQuant 通過壓縮把某些模型運行記憶體需求從 31GB 降到 4GB,雖然有輕微有損,但質量仍可接受。這類技術不能直接拿來否定 ASIC、HBM 或 GPU 需求,卻能提醒投資者一件事:AI 硬體需求不是 token 數量的線性函數,軟體效率、模型壓縮、量化、快取、調度和專家路由都會影響硬體強度。
硬體牛市裡最危險的外推,是把所有模型能力提升都等同於晶片和記憶體等比例增長。現實更複雜。單位推理成本下降,會讓更多應用變得可行,從而擴大總需求;但同樣的成本下降也會改變不同硬體環節的利潤分配。如果壓縮和調度減少了單次呼叫的記憶體佔用,HBM 單位需求可能低於簡單外推;如果更低成本刺激更多 agentic workflows,總 token 產出又可能超過原先預期,反而帶來更多伺服器、電力、網路和儲存需求。
這正好與 Evercore 的管道調研相互印證。ASIC 的瓶頸不只是硬體 tape-out,而是軟體棧能否把硬體優勢暴露給開發者。Google 的 JAX/OpenXLA、AWS Neuron、PyTorch/Triton、ROCm、Modular/Mojo 等工具鏈,決定了客戶是否能把工作負載穩定遷移到 TPU、Trainium、AMD 或內部 ASIC。硬體便宜但軟體調不出來,理論 TCO 優勢會被工程成本吞掉;軟體足夠成熟,ASIC 才能從戰略備胎變成真實利潤池。
所以,本文的多頭結論不是“硬體越多越好”,而是“推理經濟學會獎勵能把硬體、軟體和客戶規模同時跑通的供應商”。博通的優勢在客戶和系統價值,聯發科的彈性在價值量上移,HBM 的機會在多平台擴散,伺服器和液冷的機會在物理交付;但所有這些都要接受軟體效率的檢驗。
八、投資排序:先找確定性主錨,再找二階彈性
這條主線的投資排序不能按單一漲幅想像排,而要按確定性、彈性和證偽速度分層。第一層是確定性主錨,代表是博通。它擁有最清晰的大客戶 ASIC 和 AI networking 收入框架,也最容易被市場拿來驗證 TPU/ASIC 曲線是否真實。第二層是 HBM 和先進封裝,代表是美光、SK 海力士、三星、台積電和相關封裝測試鏈。它們不是每個單季都跟 ASIC 股同步,但如果多平台 ASIC 遷移到 HBM4/HBM4e,需求曲線會更紮實。第三層是亞洲 ASIC 設計服務和伺服器鏈,代表是聯發科、緯穎、廣達、鴻海、ABF/PCB、液冷與電源。它們彈性更高,也更依賴項目和客戶確認。
博通的交易方法,要從“漲不漲”改成“預期還剩多少”。如果市場已經把 FY27/FY28 大部分上修計入估值,單季好消息未必帶來上漲;但一旦看到 OAI Nexus、Meta MTIA、Google TPU 或 ARM ASIC 任何一個項目超預期推進,博通仍是最直接表達。它適合作為主題主錨,而不是最高 beta。
美光的彈性來自 HBM 第二導數。儲存股不應只按傳統 DRAM 周期看,而要看 HBM4/HBM4e 認證、長協價格、產能分配和 ASIC 客戶擴散。如果下一代 ASIC 對 HBM 的單位消耗提高,美光可能同時吃到輝達 GPU 和雲廠 ASIC 兩邊的需求;如果軟體壓縮降低單次記憶體強度,或者 HBM4e 認證/良率不及預期,估值彈性會被推遲。
聯發科更像高 beta 資產重估。它的核心不是手機 SoC 復甦,而是 AI ASIC 價值量進入 compute die、封裝、SerDes 和更高 ASP。高盛模型把 2028 年 AI ASIC 收入提到 480 億美元,佔總收入 66%,這會把公司資產屬性徹底改寫;但這個數字也意味著估值對項目延期極其敏感。聯發科適合寫成“下一條曲線”,不適合寫成已完全兌現的確定性。
伺服器、PCB、液冷和電源是最後確認層。它們未必擁有最高毛利率,但能驗證訂單是否真的變成機櫃。ASIC 伺服器放量以後,價值會從晶片向背板、主機板、線纜、CDU、電源、機櫃和測試擴散。這裡更適合用“拉貨節奏、客戶認證、毛利率改善、產能利用率”跟蹤,而不是只看概念標籤。
九、三個情景:3500 萬顆 TPU 是牛市上限,不是基準保證
最需要防止的是把管道調研上限直接當成基準。3500 萬顆以上 TPU 出貨如果兌現,是牛市情景;基準情景應該更保守地承認項目會有代際切換、封裝爬坡、客戶資本開支和軟體遷移的不確定性。更穩妥的判斷,是把三種情景攤開,而不是只押一句“TPU 海嘯”。
牛市情景下,TPU/ASIC 變成 2026-2028 年 AI 半導體最強主線之一。博通不只是獲得更多 XPU 收入,還能通過 AI networking 提升每 GW 內容量;美光和其他 HBM 廠商因為多平台 HBM4/HBM4e 需求獲得更高可見度;聯發科從手機 SoC 資產遷移到 AI custom silicon;伺服器 ODM、先進封裝、PCB/ABF 和液冷成為機櫃交付的必要條件。
基準情景下,博通仍是主錨,但二階彈性需要篩選。部分雲廠 ASIC 項目會延期,部分客戶會繼續依賴輝達 GPU,部分工作負載會被軟體最佳化和模型壓縮吸收。這個情景不是看空,而是提醒投資人不要用最高出貨口徑給所有公司估值。能被確認的訂單、能量產的項目、能傳導價格的供應商,才值得上修。
證偽情景下,最先下修的是高 beta 環節。博通可能因為已有客戶和網路價值相對抗跌,但聯發科、部分設計服務、伺服器拉貨和 HBM 多平台彈性會先被市場重估。輝達則會被重新證明為最強通用平台,尤其如果非輝達軟體棧進展慢、客戶遷移成本高、或雲廠對自研 ASIC 的部署節奏低於預期。
十、未來四個季度跟蹤指標
這條主線必須用指標跟蹤,不能靠故事延續。最重要的不是單條管道資訊,而是接下來四個季度裡,博通、Google、Meta、OpenAI、AWS、Microsoft、聯發科、美光、台積電和伺服器供應鏈是否給出互相印證的資料。
如果這些指標形成同向驗證,TPU 海嘯就會從管道催化變成投資主線。如果只有博通一家繼續給強指引,而 HBM、聯發科、伺服器和封裝沒有同步證據,這條主線就更像單公司交易。如果軟體效率大幅提升但總推理需求沒有同步擴張,硬體強度也會被重新下修。真正的判斷要靠交叉驗證,而不是靠一個數字興奮。 (404K)
