#Token
大摩科技閉門會:Token超額使用爭議下,AI 算力需求會不會被證偽?
這場討論的核心,其實不是“AI 需求還在不在”,而是更細的一層:當企業開始管理 Token 預算、把不同任務分流到不同模型時,AI 算力需求到底是在被削弱,還是進入更成熟的使用階段。 摩根士丹利主題研究主管、AI電力領域專家Stephen Byrd,討論近期圍繞“Token超額使用”的爭議:市場上陸續出現一些評論,稱 Uber、Meta、Amazon、Microsoft 等大型客戶過去在 Token 上投入過猛,現在正試圖削減、最佳化或重新分配相關支出。與此同時,OpenRouter 等資料也顯示,中國開源模型和低成本模型正在獲得更多呼叫份額。這個邏輯之所以棘手,是因為它不像傳統的“需求放緩”那麼直白,而是直指 AI 產業鏈的核心假設:如果 Token 價格下降、模型路由更高效,超大規模雲廠商的資本開支還會繼續上行嗎? Stephen Byrd 的回答相對清楚:短期看,這更像是傑文斯悖論的正常展開,而不是 AI 需求見頂。單位成本下降之後,企業會使用更多 AI;同時,企業也會把高端任務留給前沿模型,把低價值、低複雜度任務交給便宜模型。真正需要警惕的,不是預算最佳化本身,而是低成本模型能否通過編排層拼接出前沿模型的能力。如果這一點被證明成立,價值分配才可能發生實質變化。 先說結論:這不是 AI CapEx 被證偽,更像是 Token 使用進入精細化階段