高盛：智能體將引爆Token需求 AI產業有望迎來利潤率拐點

2026/05/08

•

高盛在最新研報中指出，隨着人工智能（AI）行業從「聊天機器人時代」進入「智能體（Agent）時代」，這一變化不僅意味着Token（詞元）消耗的爆炸式增長，更可能推動整個AI產業鏈迎來利潤率拐點。

據高盛分析師預測，到2030年，全球Token消耗量將較2026年增長24倍，達到每月約120 quadrillion（120千兆）tokens。其中，企業級智能體將成爲最大推動力。

報告預計，到2030年，全球每天AI查詢量將從2025年的約50億次增長至230億次。其中，大約30%的查詢將由智能體完成。

具體而言，到2030年，消費級智能體每月將消耗約60千兆tokens，企業級智能體每月將消耗約56千兆tokens，全球整體Token消耗較當前增長24倍。

高盛強調，推動Token爆炸的並非聊天機器人，而是「持續在線（Always-on）」的智能體。

傳統聊天機器人屬於「間歇式使用」，用戶問一次，AI答一次，任務結束。

但智能體不同，它需要持續監控環境，並不斷讀取上下文。智能體會自動調用工具，反覆驗證結果，多輪循環執行任務。

因此，Token消耗量會出現數量級躍升。

據高盛測算，普通聊天機器人每次會話約消耗1000 tokens，嵌入式Copilot每天可能消耗5000 tokens以上，而持續在線的智能體每天Token消耗可能超過10萬。

儘管消費級智能體更容易被普通用戶感知，但高盛認爲，真正決定AI產業規模的，最終還是企業市場。

企業智能體的Token密度遠高於消費端，且推理需求遠高於普通消費者聊天。

企業級應用正從簡單的摘要編寫轉向複雜的工作流替代。隨着智能體滲入編程、法律研究、供應鏈管理等領域，Token消耗將從「人機互動」轉變爲「機機互動」，後者沒有疲勞感，且消耗速度遠超人類輸入。

高盛預計，到2040年，企業智能體將推動全球Token消耗達到當前的55倍。

高盛還指出，企業級智能體目前仍處於非常早期階段，真正大規模部署的不到25%，目前主要集中在客服、IT運維、銷售支持以及內部知識庫等領域，且大多還是「Copilot輔助」，而非完全自主Agent。

高盛重點研究了企業部署智能體後的經濟回報（ROI），報告發現，隨着Token成本下降，越來越多企業工作流開始進入「經濟可行區間」。例如，一個編程Agent每天可能消耗700萬tokens，但成本僅約13美元。

由於編程屬於高價值、文本密集型任務，因此AI編程智能體已經開始快速落地。相比之下，客服智能體由於涉及實時語音推理，目前每天成本仍接近93美元，因此尚未完全具備替代人工客服的經濟性。

不過，高盛表示，隨着推理成本繼續下降，越來越多企業工作流都將實現正ROI。

過去兩年，市場對AI最大的擔憂之一，是科技公司資本開支（CapEx）不斷膨脹，卻未必能獲得匹配的回報。

市場此前一直擔憂，AI使用越多，推理成本越高，雲廠商和模型公司的利潤率就會持續承壓。但高盛認爲，這種邏輯正在發生變化。

一方面，過去幾年Token價格持續暴跌，但如今已經開始趨於穩定，部分甚至出現上漲。另一方面，底層算力成本卻仍在快速下降。

據估算，在輝達、AMD、谷歌TPU以及亞馬遜Trainium等芯片的推動下，單Token計算成本每年下降約60%-70%。

與此同時，領先模型的Token市場價格在經歷了初期的價格戰後，已經開始走穩甚至在某些高質量領域出現回升。

高盛預測，超大規模雲服務商（Hyperscalers）和模型提供商有望在2026年上半年迎來毛利率的轉正。當計算成本下降速度快於價格下降速度時，Token消耗量的爆發將直接轉化爲可觀的利潤增長。

面對市場關於「AI是否會毀滅SaaS行業」的爭論，高盛給出的答案是：不會。

恰恰相反，AI智能體可能會進一步擴大軟件行業的市場規模（TAM）。

報告指出，軟件行業的收費模式正在發生變化，從按座位收費（seat）轉向按生產力、工作成果以及勞動產出收費。

高盛預計，到2030年，智能體相關的軟件市場規模將快速擴張。

儘管前景廣闊，但報告也提醒了潛在風險，主要分爲三方面。

競爭風險：如果模型高度同質化，價格戰可能再次爆發，削減利潤。

治理風險：智能體的「自主性」可能導致錯誤擴散，企業在部署時面臨嚴峻的合規與安全挑戰。

效率風險：智能體經濟的效能取決於企業內部數據的質量和打通程度。若引導不當，智能體可能適得其反，消耗大量資源卻回報甚微。 (富途牛牛)