阿里、騰訊、百度集體調價,Token第一股年內狂飆547%,算力漲價潮來了
中國雲端運算進入“算力通膨”時代。
4月15日,阿里雲宣佈自7月15日起,DDoS高防(中中國地)彈性95費用上調50%(從每兆瓦月100元漲至150元),這是阿里雲一個月內第三次調價。
這一輪全球漲價潮由海外率先引爆——亞馬遜AWS年初率先上調AI算力價格,Google雲隨後跟進,最高漲幅達100%。騰訊雲、百度智能雲也同步跟進。騰訊雲4月9日宣佈AI算力、容器、EMR全線上調5%;百度智能雲AI算力與儲存上調5%~30%。
漲價背後最根本的驅動力,是Token消耗的爆發式增長。國家資料局局長劉烈宏在3月24日的國新辦新聞發佈會上披露:“到今年3月,中國日均Token的呼叫量已超過140兆,相比2024年初的1000億增長了1000多倍,相比2024年底的100兆,三個月時間又增長了40%多。”
對於“Token”,國家資料局已正式將其定名為“詞元”。它正從AI技術的計量單位,加速轉變為智能時代的產業“貨幣”,其消耗規模的激增直接推高了算力需求,進而帶動雲端運算服務價格上漲。
Token熱度也蔓延到資本市場,去年底登陸港交所的“Token第一股”迅策僅用100天市值突破1000億港元,年內漲幅達547%。
港股雲巨頭們近日也迎來股價大反彈,4月16日盤中,百度集團漲超7%,阿里巴巴漲近5%,騰訊控股漲超2%。
Token消耗激增
OpenClaw是這輪Token需求爆發的核心因素之一。據OpenRouter平台資料,2026年3月16日至22日當周,平台接近四分之一的Token消耗由OpenClaw貢獻。另據國金證券電腦行業周報,截至2026年3月9日至15日的周度資料,OpenRouter平台內20%的Token消耗由OpenClaw貢獻,OpenClaw單周Token消耗量已相當於2025年第四季度全平台周均Token消耗量的60%。
Token消耗量的快速攀升,首先暴露了一個深層矛盾:消耗量增長,並不等同於智能水平同步提升。智能體與傳統Chatbot的業務邏輯存在本質差異。傳統Chatbot遵循使用者提問到模型回答的單輪互動模式,Token消耗與對話輪次呈線性關係。而智能體具備感知、決策、執行的閉環能力,需要自主拆解複雜任務、呼叫外部工具、多輪迭代驗證,直至任務完成。這種業務邏輯的差異,直接導致了Token消耗量的數量級放大。
這個問題在商業層面已經產生了真實衝突。2026年4月初,Anthropic停止了訂閱使用者通過OpenClaw等第三方工具接入ClaudeAPI的許可。Anthropic官方解釋稱,部分重度使用者每月僅支付200美元訂閱費,卻消耗了價值5000美元的算力資源,給公司帶來巨大成本壓力。一個OpenClaw代理運行一天,消耗的算力成本在1000美元到5000美元之間,受影響使用者需切換至按用量付費的API模式。
商業模式與智能體算力消耗現實之間的核心矛盾已然爆發。智能體場景下的Token消耗不可預測,沒有歷史資料可以參考,任何固定月費都在對一個無法建模的變數做猜測。問題的根源不在於定價策略本身,而在於Token消耗的底層邏輯正在被智能體技術徹底改寫。
今年3月下旬,火山引擎總裁譚待在接受21世紀經濟報導等媒體採訪時也指出,目前探索中的Token有一大半都是無謂的探索。他舉例說,很多使用者反饋智能體產品Token消耗快,核心問題不是單Token貴,而是它完成任務時的大量無效嘗試——為了找到最終解法,超過一半的Token都消耗在探索中。如果單Token成本低但模型能力不足,需要消耗10倍甚至20倍的Token還無法完成任務,最終只會造成更大的浪費。
這標誌著,智能體的普及正在以遠超預期的速度消耗算力資源,而現有的計費體系和效率管理機制仍有完善空間。
近期,小米集團MiMo負責人羅福莉在社交平台發文指出,從宏觀角度看,全球計算資源增長的腳步已跟不上Agent帶來的Token需求增長。真正的出路不是提供更便宜的Token,而是讓“更高效的Agent框架”ד更強大且更高效的模型”協同演進。
算力持續緊缺
當前,推理正在取代訓練成為算力消耗的主戰場。德勤在2026年1月發佈的《2026科技、傳媒和電信行業預測》報告中指出,2026年AI推理將佔算力三分之二,主要在近5000億美元新資料中心及企業伺服器進行。
而推理算力需求佔比近七成之後,競爭規則正在改寫。單Token成本、部署密度、能效比取代單純峰值算力,成為客戶選型的關鍵考量因素。
與此同時,算力供給的結構性缺口正在放大。根據半導體研究機構SemiAnalysis發佈的資料,H100一年期租賃合同價格從2025年10月的低點1.70美元/小時/GPU飆升至2026年3月的2.35美元/小時/GPU,漲幅近40%。該指數基於對100多家雲服務商、算力買家與賣家的月度直接調查建構。儘管價格上漲,相關GPU租賃容量已全部售罄,2026年初尋找新GPU算力資源的難度被比喻為“預訂最後一班航班的機票”,不僅價格高昂且幾乎無餘量可選。
緊張的並不只有GPU。據報導,2026年3月下旬,英特爾與AMD相繼通知客戶上調處理器價格。過去幾個月,CPU作為AI伺服器調度與推理核心被雲廠商大量採購,兩大巨頭2026年伺服器CPU產能目前已基本售罄。
與此同時,頭部網際網路公司正在大幅加碼資本支出。財報資料顯示,騰訊資本支出在2024年迅速增加到768億元,同比增長221%,2025年進一步增至792億元;阿里巴巴資本支出從2023年244億元增長至2025年的1039億元,突破千億。據媒體公開報導,字節跳動2026年資本支出計畫約1600億元,約一半投向AI晶片和資料中心。
算力緊張的另一個側面,是中國AI晶片市場格局正在發生深刻變化。據IDC資料,2025年中國市場AI加速卡總出貨量約為400萬張。輝達出貨約220萬張,市場份額55%;AMD出貨約16萬張,市場份額4%。中國本土廠商合計出貨約165萬張,市場份額約41%。
在中國廠商陣營中,華為處於領先地位。據IDC資料,2025年華為出貨約81.2萬顆AI晶片,約佔整體市場20%,接近中國供應商總出貨的一半。阿里巴巴旗下平頭哥以約26.5萬顆居次,市場份額約7%。百度崑崙芯與寒武紀各約11.6萬顆,並列第三。
中信證券指出,Agent&多模態等應用爆發驅動Token呼叫量井噴,進而導致中國算力荒,中國國產大模型在推理端積極適配為中國國產算力廠商帶來加速放量機遇,預計2026年中國國產算力晶片出貨量至少實現翻倍以上增長,將為算力設計公司、先進製程、先進封裝、先進儲存以及配套產業鏈帶來強勁增長動能。
本土廠商的崛起,正在逐步改變中國AI晶片市場的供給格局,為緩解算力缺口提供了新的可能。
商業模式重構
Token經濟的最後一塊拼圖是商業模式。當Token消耗量從兆級邁向百兆級,如何定價、如何收費,直接關係到產業的商業閉環能否跑通。
回顧行業發展,2024年下半年至2025年初,中國大模型市場深陷價格戰,字節豆包報價低至0.0008元/千Tokens,智譜自己也曾將GLM-4-Plus大幅降價。
但這一格局在2026年正在發生根本性變化。智譜成為中國國產頭部模型廠商中首個在推出新模型的同時,執行實質性提價的公司。2月發佈GLM-5時,CodingPlan套餐價格上調30%起,3月發佈GLM-5-Turbo時再漲20%,相對GLM-4.7累計漲幅達83%。
漲價並未抑制需求。據智譜公開披露,2026年一季度API呼叫定價提升了83%,呼叫量反而增長400%。智譜MaaSAPI平台ARR約17億元,在過去12個月提升60倍。截至2026年3月,平台註冊使用者已突破400萬,覆蓋全球218個國家和地區。智譜CEO張鵬表示,當模型足夠強,API本身就是最好的商業模式,定價權是由技術實力以及長期趨勢所帶來的領先地位決定的。
當前,Token計費正成為行業標準。今年3月,劉烈宏在中國發展高層論壇年會上指出,一套以詞元(Token)計費為基礎的新型商業邏輯正在加速演進,圍繞詞元的呼叫、分發與結算,一套新的價值體系正在加速演進形成。
但Token定價面臨的真正難題,不在於收費標準,而在於智能體場景下的Token消耗目前高度不可預測。與電力或鋼鐵等傳統生產要素不同,Token具備獨特的可程式設計性。輝達創始人兼CEO黃仁勳在2026年3月的一篇署名文章中,將Token定義為現代AI的基本單位,並指出它同時具有兩種屬性:作為語言,它是計算過程的原子;作為貨幣,它是價值流通的媒介。
譚待在受訪時指出,判斷行業階段可以用終局倒推——看所有Tokens未來能產生的收入規模,再對比當前全球行業的實際收入,可以看出所處位置。目前OpenAI、Anthropic等企業的收入已知,全球行業收入大概是這些企業收入的三倍。
整體來看,AI算力與Token經濟仍處於極早期階段,定價機制、效率管理、供給能力等方面,仍有巨大的完善和提升空間。 (21世紀經濟報導)