Token成為“吞金獸”,大廠算力漲瘋了

有沒有發現,這半年AI圈的畫風變得有點快?

去年這個時候,大家還在為算力降價狂歡。阿里雲帶頭喊出“最高降幅60%”,騰訊雲、華為雲、百度雲齊刷刷跟上,那陣仗,簡直像雙十一大促。創業群裡天天有人曬帳單:“看,我這一百萬Token才花了幾毛錢!”那會兒人人都覺得,AI創業的春天來了,算力跟白菜一樣便宜,誰還做不起大模型應用啊?

結果呢?打臉來得太快。

就上個月,風向一百八十度大轉彎。Google、亞馬遜、騰訊、阿里、百度,10天之內全發了漲價公告。漲多少?普遍30%到50%。最狠的是騰訊雲,有個核心產品直接漲了400%。

從“跳樓大甩賣”到“坐火箭式漲價”,前後不到一年。到底發生了什麼?誰在背後推著價格往上走?更重要的是,這波漲價潮裡,誰最慘,誰在偷笑?

去年還在“打骨折”,今年為什麼集體漲價?

先簡單回顧一下這出“反轉大戲”。

2025年4月,阿里雲率先扔出一顆重磅炸彈:核心產品最高降價60%。這可不是小打小鬧,是實打實的“腰斬再打折”。緊接著,京東雲說“隨便降,我跟”,騰訊雲、華為雲、百度雲全部跟進。一時間,算力市場硝煙瀰漫,價格戰打得那叫一個熱鬧。

那會兒的口號是什麼?“讓AI用得起”“算力普惠”。很多創業公司真的信了,開始大張旗鼓地燒Token、跑模型。

然而,免費的午餐從來吃不長久。

2026年1月,亞馬遜AWS悄悄幹了件事——沒有任何發佈會,沒有任何預告,直接把EC2伺服器價格上調了15%左右。別看幅度不大,意義可大了:這是雲服務行業近二十年來第一次漲價。要知道,過去二十年,AWS降價的次數超過一百次,從來只有往下走,沒有往上調的道理。

這一下,像是推倒了多米諾骨牌。

3月11日,騰訊雲跟進,旗下Tencent HY2.0 Instruct模型輸入價格從0.0008元/千tokens漲到0.004505元/千tokens——漲幅463%,四倍多。3月18日,阿里雲宣佈算力卡產品上漲5%到34%,百度智能雲也跟著漲了5%到30%。那些之前免費公測的大模型,比如GLM 5、MiniMax 2.5、Kimi 2.5,全部結束“白嫖期”,轉入正式計費。

從“搶著降價”到“搶著漲價”,為什麼變化這麼快?

表面看是雲廠商扛不住了。GPU晶片越買越貴,資料中心的電費佔營運成本的40%到60%,再加上2025年下半年儲存晶片也開始漲價,成本端的壓力實實在在地壓過來了。但真正讓漲價變成“不得不做”的,是另一個更根本的原因——算力,真的不夠用了。

誰在瘋狂“吃”Token?140兆的真相

之前不是說算力過剩嗎?怎麼突然就不夠用了?

答案是:Token被“吃”得太快了。

根據國家資料局局長劉烈宏在今年3月披露的資料:到2026年3月,中國每天的Token呼叫量已經突破了140兆。

這個數字有多誇張?給你兩個參照:

· 2024年初,這個數字只有1000億。兩年時間,漲了一千多倍。

· 2025年底,這個數字是100兆。也就是說,僅僅過去三個月,又漲了40%——光這三個月新增的量(40兆),就是2024年初全天的400倍。

這不是線性增長,這是海嘯。

那麼問題來了:誰在瘋狂消耗Token?

答案就一個詞:智能體(Agent)。

去年開始,以開源智能體OpenClaw(江湖人稱“龍蝦”)為代表的產品火得一塌糊塗。AI從一個只會“聊天”的機器人,變成了一個能“幹活”的助手——幫你訂機票、寫程式碼、做PPT、分析資料……聽起來很酷對吧?但代價是,智能體幹一件簡單的事,消耗的Token量是普通對話的10倍到100倍。

舉個例子:讓AI幫你寫一個爬蟲指令碼。如果是普通對話,它給你一段程式碼,你複製走人,消耗幾百個Token。但如果是智能體,它要自己跑程式碼、報錯、偵錯、再跑、再調……來來回回十幾輪,Token消耗直接奔著幾萬去了。

更別提視訊生成這種“吞金獸”。有分析指出,生成1分鐘的視訊大約要消耗10兆Token。而現在的視訊模型,生成5秒的視訊才收你幾毛錢到幾塊錢——這那是賺錢,這分明是賠本賺吆喝。但架不住用的人多啊,視訊、音樂、程式碼、資料分析……每個方向都在瘋狂“吃”Token。

供給跟不上需求,算力自然就漲價了。這不是陰謀,是赤裸裸的供需失衡。

算力排位賽:大廠吃肉,小玩家連湯都喝不上

漲價這件事,對不同的人,意味完全不同。

對雲廠商來說,漲價其實是好事。有券商算過一筆帳:阿里雲每提價1%,它的利潤率就能提升1個百分點。所以你看到的資料是,阿里雲的份額不降反升,已經佔到了中國AI雲市場的36%。而在AI呼叫量這個更細的賽道里,火山引擎(字節旗下)更是佔了將近50%——也就是說,全中國一半的Token呼叫,走的是火山引擎的管道。

與此同時,華為雲、騰訊雲的份額在微幅下滑。頭部效應越來越明顯:大廠越做越強,資源越聚越集中。

那誰最慘?

中小AI創業公司,以及那些剛入局的小玩家。

原因很簡單:漲價直接推高了他們的營運成本。以前Token便宜的時候,你可以隨便跑實驗、隨便調模型,反正花不了幾個錢。現在價格翻了幾倍甚至十幾倍,每一輪訓練、每一次推理都要掂量掂量。

更麻煩的是,小玩家沒有議價能力。大客戶可以跟雲廠商簽長期協議,鎖定一個相對優惠的價格。你一個初創公司,一年才花幾萬塊錢的算力費,誰跟你談折扣?只能老老實實按漲價後的價格付錢。

很多原本打算做AI應用的項目,算了一筆帳之後,默默擱置了。還有一些已經在做的,要麼縮減規模,要麼自己扛著虧損硬撐。偏偏終端市場競爭又激烈,你不敢輕易給使用者漲價——隔壁家還免費呢,你一收費使用者全跑了。最後所有的成本壓力,只能自己嚥下去。

一位從業者跟我吐槽:“以前覺得算力便宜,創業門檻低了。現在才發現,門檻不是低了,是先讓你進來,再把門關上。”

這其實是一場殘酷的排位賽。過去二十年,雲廠商靠“低價走量、先圈地再盈利”的打法活得很滋潤。但那個時代結束了。算力正式告別補貼期,進入商業化定價階段。未來比拚的不再是誰更便宜,而是誰的服務更穩定、誰的生態更完善、誰能幫企業真正用好每一分算力。

而在這場排位賽裡,小玩家大機率要被甩下車。

回頭看看這一年多的過山車,你會發現一個挺扎心的真相:

算力從“白菜價”到“火箭價”,本質上是AI行業從野蠻生長走向成熟的一個縮影。免費時代結束了,價值競爭開始了。那些靠補貼活著的商業模式會死掉,而那些真正有技術、有場景、有使用者的產品,會在算力成本上升的環境中活下來,甚至活得更好。

AI創業的核心競爭力,從來不是算力有多便宜,而是你拿算力來幹什麼。

算力時代,Token確實貴。但比Token更貴的,是一個知道怎麼用好Token的腦子。 (鋅財經)