摩根士丹利:2026年人工智慧(AI)趨勢展望報告

AI 2026八大趨勢深度解析

趨勢一:AI算力需求結構根本性轉向——從訓練到推理的跨越

2026年,AI半導體市場進入“推理時代”。在雲端AI半導體市場裡,推理晶片佔比從2024年的約30%躍升至2030年的80%,主流雲服務商月度處理的Token數量,呈現指數級增長,預計到2025年底,將達到數兆等級。推理需求出現爆發狀況,從而對晶片架構提出了新的要求,與訓練晶片側重於追求極致的算力密度不一樣,推理晶片更加注重能效比、低延遲以及成本最佳化,這種情況為定製晶片也就是ASIC開啟了巨大的空間。

趨勢二:定製晶片(ASIC)全面崛起,挑戰GPU霸權

摩根士丹利作出預測,定製AI晶片市場在2024年至2029年複合增長率將會達到65%,且此增速大大超過通用GPU的增速。GoogleTPU已經迭代到了第七代,也就是Ironwood,AWS Trainium3、Meta MTIA、微軟Maia等產品正加速進行跟進。核心驅動力在於,頭部雲廠商年資本開支常常達到數百億美元,自研晶片能夠節省百分之三十到百分之四十的成本。而且,定製架構針對特殊工作負載比如介紹系統、大語言模型推理可達成兩倍至三倍的能效提升。至2026年,包括Broadcom、Marvell等在內的ASIC設計服務商的具有晶片組裝優勢的產能分配明顯增多,證實這一趨向從規劃邁向量產。

趨勢三:先進封裝成為算力競爭的核心戰場

有一項名為CoWoS也就是Chip-on-Wafer-on-Substrate的產能,它是二零二六年最為緊缺的資源之一。台積電打算把CoWoS產能從二零二五年的七十萬片每月擴充到二零二六年的一百二十五萬片每月 ,然而依舊面臨著供不應求的狀況。其中關鍵的變化在於:輝達至今仍舊佔據著百分之六十以上的產能 ,不過AMD、Broadcom以及雲端ASIC客戶的份額正在急劇快速提升 ;封裝技術自身朝著CoWoS-L也就是大型基板和SoIC也就是系統級整合的方向演進 ,以此用來支援更大規模的晶片互連。封裝環節之中,價值量有著顯著的提升,單顆AI晶片的封裝成本佔比能夠達到30%至40%,ASE、Amkor等這類OSAT廠商正在加速進行擴產,然而技術差距和台積電相比仍然存在2至3年。

趨勢四:HBM記憶體供需緊平衡,技術迭代加速

預測在2026年HBM的需求量,將會預計突破到320億GB,而輝達依舊佔有54%的份額。有三大趨勢是值得去加以關注的:首先,HBM4進入到了量產周期,其堆疊層數朝著12 - 16層邁進,單顆容量達到36GB以上;其次,OpenAI等新興勢力直接鎖定了韓廠產能,從而打破了傳統採購模式;最後,國產HBM2e通過了驗證,華為Ascend 910C等晶片達成了128GB HBM配置。記憶體廠商的資本開支朝著HBM傾斜,DDR4等傳統產品的產能出現收縮,進而導致了結構性短缺,而這種情況恰恰就是Winbond、Nanya等利基型記憶體廠商所面臨的投資機遇。

趨勢五:中國AI晶片生態"自力更生"進入驗證期

開源模型DeepSeek等的爆發,致使中國推理算力需求急劇增加,然而供應端卻面臨著複雜的狀況。摩根士丹利作出預測,2024年中國GPU的自給率僅僅為34%,到2027年有希望提升至50%。華為Ascend 910C的性能能夠與輝達H200相媲美,CloudMatrix 384超節點在特定的指標方面超過了NVL72,可是SMIC 7nm(N+2)工藝的良率以及產能依舊是瓶頸所在。更為貼近實際狀況的情景呈現為“分層替代”:於訓練這一環節依賴經由走私途徑獲取的或者屬於降級版本的H20/B40晶片,在推理環節則加快推進引入國內產業方案。諸如字節跳動、阿里等這類廠商的資本支出在2026年將會達到4450億元人民幣,在這其中佔據相當比例的部分朝著本土的供應鏈方向流動。

趨勢六:"電力牆"倒逼能效革命,CPO與先進供電成必選項

AI資料中心的能耗問題已從成本議題變為物理約束。單叢集功耗朝著GW級邁進,致使行業要從三個維度去突破,在晶片層面,台積電2nm節點致使能效提升了15%至20%,背面供電技術讓IR壓降得以降低,系統層面,CPO把光引擎跟交換晶片整合在一起,功耗降低到可插拔方案的十分之一,延遲減少了一個數量級,在2026年進入量產窗口,在基礎設施層面,800V高壓直流供電、GaN功率器件滲透速度加快。客戶採購時,核心考量不再是峰值算力,而是被能效指標(Performance per Watt)所取代。

趨勢七:邊緣AI蓄勢待發,手機與眼鏡成關鍵載體

受雲端算力緊張以及隱私需求的作用,促使AI朝著邊緣側進行滲透。摩根士丹利作出預計,在2023年至2030年這個時間段內,邊緣AI半導體的復合增速為22%,略微超過雲端。然而,分化顯著:因換機周期以及殺手級應用的缺失,AI PC的增長比預期要慢;AI眼鏡(Meta Ray-Ban模式)成為了新的增長點,帶動了低功耗ISP、NPU以及連接晶片的需求;在智慧型手機端,蘋果A20處理器採用了台積電N2nm以及WMCM封裝,Android陣營的聯發科天璣系列持續進行升級,不過,“端側大模型”的體驗突破仍有待等待。邊緣AI的真正爆發,取決於模型壓縮技術與應用場景的耦合。

趨勢八:供應鏈"再全球化"與地緣政治常態化

從裝置材料方面來看,在2025年10月,中國半導體裝置進口出現了同比增長的情況,增長幅度為17%,其中荷蘭的DUV光刻機以及日韓的刻蝕/沉積裝置依舊是主力軍,然而美國和荷蘭針對對華出口的管制不斷地收緊,這就反過來促使國產替代的速度加快,像北方華創、中微公司等這類廠商在成熟製程的份額得到了提升。在製造層面,台積電位於亞利桑那州的工廠正在進行產能爬坡,不過其成本相較於台島而言要高出30%以上,客戶對於分散佈局的意願和實際的經濟性之間存在著矛盾。在設計層面,RISC - V架構在AIoT以及定製晶片當中實現了滲透,進而降低了對ARM的依賴。地緣政治,其性質已然從短期衝擊,轉變成為結構性成本,在此情形之下,企業的供應鏈韌性建設,已然步入深水區。

(TOP行業報告)