OpenAI 的 COO Brad Lightcap 最近說了一句話,把整個 AI 行業的焦慮方向擰了 180 度:
"現在的瓶頸是儲存,過去是電力。"
過去兩年,所有人都在擔心 AI 資料中心沒電用。微軟簽 20 年核電協議,Google買風電場,亞馬遜投清潔能源——能源焦慮是 AI 圈的主旋律。
然後突然,儲存晶片斷了。
HBM 漲價 260%,三大儲存廠全年產能售罄,新單排到 2027 年 Q1 之後。你有錢也買不到貨。
但故事沒完。儲存缺完, CPU 又缺了。 AMD 的 EPYC 伺服器 CPU 交期從 8 周暴漲到 6 個月,英特爾和 AMD 計畫下半年再漲價 8%-17%。
一個缺完輪下一個。這不是偶然,這是規律。
第一棒:儲存——AI 算力的"糧倉"先空了
HBM (高頻寬記憶體),你可以把它理解為 AI 晶片的"短期記憶"——GPU 算得再快,資料喂不進去就是空轉。
2026 年, HBM 的供需缺口高達 50%-60%。
這不是誇張。看資料:
•SK 海力士 12 層 HBM3 價格暴漲 260%,兩年累計漲幅超 5 倍
•三大儲存廠 2026 年全年產能全部售罄,新單排到 2027 年 Q1 之後
•SK 海力士庫存僅 4 周,遠低於 8-12 周安全線
•美光毛利率飆到 74.9%,營收同比增長 196%
為什麼這麼缺?因為 HBM 不是普通記憶體。每顆 HBM 晶片由 12-16 層 DRAM 裸晶片堆疊而成,通過數千個矽通孔精準對位連接。生產一顆 HBM 消耗的晶圓產能,相當於 3-4 顆標準 PC 記憶體晶片。
更致命的是擴產速度。晶圓廠從規劃到量產需要兩年,當前擴產要到 2028 年後才集中釋放。 SK 海力士會長崔泰源在 GTC 大會上直言:儲存晶片短缺可能持續到 2030 年。
OpenAI 已經和三星、 SK 海力士簽署長期協議,鎖定到 2029 年的 HBM 產能。輝達黃仁勳的態度更直接——"有多少產能全包"。
第二棒: CPU——被忽視的"指揮官"也斷了
所有人盯著 GPU 和 HBM 的時候, CPU 悄悄成了新瓶頸。
2026 年初,一個反直覺的現象出現了:在 GPU 算力軍備競賽的喧囂中,曾被預測將"邊緣化"的 CPU ,反而成了資料中心最緊缺的硬通貨。
資料很硬:
•AMD EPYC 伺服器 CPU 交期從 8 周暴漲到 6 個月,部分型號"不知道什麼時候有貨"
•英特爾、 AMD 計畫下半年再漲價 8%-17%
•亞馬遜自研 Graviton CPU 直接售罄,連自己都不夠用
•Google被迫和英特爾簽多年長約——不是看好英特爾,是怕等不到 AMD 的貨
為什麼 CPU 也會缺?
因為 AI 智能體( Agent )大規模落地後,每個 AI 任務都需要 CPU 做調度、編排、資料預處理。 GPU 負責算, CPU 負責指揮。指揮官不夠,再多的士兵也只能原地待命。
台積電 3nm 產能是另一個卡點。 2026 年月產能僅 12-13 萬片,需求缺口 20%-30%。輝達一家就預訂了約 60%的份額,留給 CPU 的產能被嚴重擠壓。
第三棒:下一個缺什麼?
儲存缺完, CPU 缺。 CPU 缺完呢?
按照 AI 算力供應鏈的"稀缺輪動"邏輯,瓶頸永遠出現在上一個瓶頸解決後暴露的下一個環節。就像修高速公路:路修好了發現車不夠,車夠了發現加油站不夠,加油站夠了發現停車場不夠。
目前行業資料顯示,下一個最可能缺的環節有三個:
1. 先進封裝( CoWoS )——缺口 40%
輝達等晶片廠商最大的供應鏈痛點,已經不是晶片本身,而是封裝。 CoWoS ( Chip on Wafer on Substrate )是 AI 晶片的核心封裝技術,當前缺口約 40%。台積電 CoWoS 產能滿載,擴建要到 2027 年中才能緩解。
2. IC 載板(封裝基板)——比晶片更貴的"卡脖子"
IC 載板是連接晶片和 PCB 板的關鍵部件。 AI 晶片對載板要求極高——更大面積、更高布線密度、更好散熱。目前全球高端 IC 載板產能被日本和台灣廠商壟斷,交期已經拉長到 30 周以上。
3. 電力與液冷——終極瓶頸
微軟 CEO 說過一句話:"有 GPU 但沒電插。"一個萬卡級智算中心的年用電量相當於一座中等城市。 2026 年全球 AI 伺服器液冷市場規模從 89 億美元飆升至 170 億美元。當儲存、 CPU 、封裝都解決後,電力和散熱就是物理極限。
稀缺輪動的底層邏輯
為什麼 AI 算力的瓶頸會一個接一個地輪動?三個原因:
第一, AI 需求是"全鏈路吞噬"。 單台 AI 伺服器對 DRAM 的需求是傳統伺服器的 8-10 倍,對 NAND 的需求是 3-5 倍。這不是某一個環節的需求增長,而是整條供應鏈同時被拉爆。
第二,產能擴張有"時間差"。 晶圓廠建設 18-24 個月,封裝產線 6-12 個月,電力基礎設施 3-5 年。每個環節的擴產速度不同,永遠有某個環節在"等"其他環節。
第三,資源會向最緊缺環節集中。 三大儲存廠把 70%新增產能轉向 HBM ,消費級記憶體被擠壓。台積電把 3nm 產能優先給輝達, CPU 被擠壓。解決一個瓶頸的方式,就是製造下一個瓶頸。
AI 算力的稀缺,不是某個晶片缺貨的問題。
它是一條供應鏈的"打地鼠"遊戲——按下去一個,冒出來另一個。
儲存、 CPU 、封裝、電力……誰先解決,誰就暴露下一個短板。
這場輪動,至少還要持續三年。 (ETHEREAL AI視角)
