Googletoken消耗量一年增長50倍，已經是微軟/ChatGPT的6倍

2025/06/18

•

今天巴克萊一篇對比Google和微軟在推理流量上token消耗的對比，非常有意思，甚至有些出乎意料的內容。“免費”帶來需求暴增，而且推理成本比預期的低不少。

Alphabet在1Q25共推理≈634萬億（634T）tokens，而Microsoft約100T；到2025年4月，月度推理量已升至480T，較一年前的9.7T激增50倍，顯示Google在AI推理流量上具備6倍於Azure/ChatGPT的規模優勢。

推理量暴漲主要來自Search的AIOverviews等免費場景；GoogleSearch使用者基數約為ChatGPT的5–6倍，免費AItoken增速（50×）遠超付費大模型收入增速（3–4×），凸顯Google先以使用者與資料壁壘為先、後續再尋求變現。

按Gemini2.5費率估算，1Q25推理成本約7.5億美元，僅佔搜尋收入的≈1%（佔COGS+Opex1.6%）；即便token按4倍速度繼續攀升，也仍低於搜尋核心基礎設施成本（≈18%收入），緩解市場對利潤率下滑的擔憂。

GoogleAI計算CAPEX中約90%仍投向訓練與新模型，推理對應的晶片CAPEX在1Q25僅6.2%（≈6億美元）。若按480T月度run-rate估算，2Q25推理CAPEX也僅升至≈14%，顯示資金仍主要押注長期模型演進。

採用50/50Pro與Flash模型、15%ActiveParameters假設，Google僅用≈270kTPUv6（ASP≈4,500美元）即可覆蓋1Q25推理負荷，體現自研加速器在功耗與成本端的優勢。

尚未全面放量的通用AI助手（ProjectAstra）、瀏覽器代理（Mariner）和視訊生成模型（Veo）預計將進一步推高token基數，Google已提前把Compute CAPEX提升到總CAPEX的>50%，為2026年後AI需求埋下增量彈性。

(硬AI)