高盛在最新研報中指出,隨着人工智能(AI)行業從「聊天機器人時代」進入「智能體(Agent)時代」, 這一變化不僅意味着Token(詞元)消耗的爆炸式增長,更可能推動整個AI產業鏈迎來利潤率拐點。
據高盛分析師預測,到2030年,全球Token消耗量將較2026年增長24倍,達到每月約120 quadrillion(120千兆)tokens。其中,企業級智能體將成爲最大推動力。
Token消耗即將爆炸式增長
報告預計,到2030年,全球每天AI查詢量將從2025年的約50億次增長至230億次。其中,大約30%的查詢將由智能體完成。
具體而言,到2030年,消費級智能體每月將消耗約60千兆tokens,企業級智能體每月將消耗約56千兆tokens,全球整體Token消耗較當前增長24倍。
高盛強調,推動Token爆炸的並非聊天機器人,而是「持續在線(Always-on)」的智能體。
傳統聊天機器人屬於「間歇式使用」,用戶問一次,AI答一次,任務結束。
但智能體不同,它需要持續監控環境,並不斷讀取上下文。智能體會自動調用工具,反覆驗證結果,多輪循環執行任務。
因此,Token消耗量會出現數量級躍升。
據高盛測算,普通聊天機器人每次會話約消耗1000 tokens,嵌入式Copilot每天可能消耗5000 tokens以上,而持續在線的智能體每天Token消耗可能超過10萬。
企業級智能體是主要驅動力
儘管消費級智能體更容易被普通用戶感知,但高盛認爲,真正決定AI產業規模的,最終還是企業市場。
企業智能體的Token密度遠高於消費端,且推理需求遠高於普通消費者聊天。
企業級應用正從簡單的摘要編寫轉向複雜的工作流替代。隨着智能體滲入編程、法律研究、供應鏈管理等領域,Token消耗將從「人機互動」轉變爲「機機互動」,後者沒有疲勞感,且消耗速度遠超人類輸入。
高盛預計,到2040年,企業智能體將推動全球Token消耗達到當前的55倍。
高盛還指出,企業級智能體目前仍處於非常早期階段,真正大規模部署的不到25%,目前主要集中在客服、IT運維、銷售支持以及內部知識庫等領域,且大多還是「Copilot輔助」,而非完全自主Agent。
高盛重點研究了企業部署智能體後的經濟回報(ROI),報告發現,隨着Token成本下降,越來越多企業工作流開始進入「經濟可行區間」。例如,一個編程Agent每天可能消耗700萬tokens,但成本僅約13美元。
由於編程屬於高價值、文本密集型任務,因此AI編程智能體已經開始快速落地。相比之下,客服智能體由於涉及實時語音推理,目前每天成本仍接近93美元,因此尚未完全具備替代人工客服的經濟性。
不過,高盛表示,隨着推理成本繼續下降,越來越多企業工作流都將實現正ROI。
AI行業利潤率開始改善
過去兩年,市場對AI最大的擔憂之一,是科技公司資本開支(CapEx)不斷膨脹,卻未必能獲得匹配的回報。
市場此前一直擔憂,AI使用越多,推理成本越高,雲廠商和模型公司的利潤率就會持續承壓。但高盛認爲,這種邏輯正在發生變化。
一方面,過去幾年Token價格持續暴跌,但如今已經開始趨於穩定,部分甚至出現上漲。另一方面,底層算力成本卻仍在快速下降。
據估算,在輝達、AMD、谷歌TPU以及亞馬遜Trainium等芯片的推動下,單Token計算成本每年下降約60%-70%。
與此同時,領先模型的Token市場價格在經歷了初期的價格戰後,已經開始走穩甚至在某些高質量領域出現回升。
高盛預測,超大規模雲服務商(Hyperscalers)和模型提供商有望在2026年上半年迎來毛利率的轉正。當計算成本下降速度快於價格下降速度時,Token消耗量的爆發將直接轉化爲可觀的利潤增長。
AI不會毀滅軟件行業
面對市場關於「AI是否會毀滅SaaS行業」的爭論,高盛給出的答案是:不會。
恰恰相反,AI智能體可能會進一步擴大軟件行業的市場規模(TAM)。
報告指出,軟件行業的收費模式正在發生變化,從按座位收費(seat)轉向按生產力、工作成果以及勞動產出收費。
高盛預計,到2030年,智能體相關的軟件市場規模將快速擴張。
風險
儘管前景廣闊,但報告也提醒了潛在風險,主要分爲三方面。
競爭風險:如果模型高度同質化,價格戰可能再次爆發,削減利潤。
治理風險:智能體的「自主性」可能導致錯誤擴散,企業在部署時面臨嚴峻的合規與安全挑戰。
效率風險:智能體經濟的效能取決於企業內部數據的質量和打通程度。若引導不當,智能體可能適得其反,消耗大量資源卻回報甚微 。 (富途牛牛)
