未來時代,Token就是印鈔機

【原始碼智能前瞻】:

Open Claw爆火之後,混元宣佈漲價460%,智譜宣佈漲價100%,阿里雲宣佈漲價34%。漲價的理由都是同一個——“Token呼叫量暴漲”。

究其原因,Open Claw發佈後,AI第一次能真正“幹活”,接管電腦、寫程式碼、訂機票、發郵件。隨之,Token消耗邏輯發生了本質變化:以前是問答消耗(幾十Token),現在是任務消耗(幾萬Token),再往後是智能體自主執行消耗(百萬級Token)。中國日均Token消耗半年漲5倍,輝達預測未來幾年年複合增長3000%。

中國廠商已經跟上。雲廠商推出一鍵部署,大模型廠商繫結自家模型,硬體廠商做端側Claw,紛紛爭奪Token的入口和定價權。

黃仁勳在GTC會議上把資料中心叫作“Token工廠”,提出“每瓦Token數”作為新KPI。意思是:算力不再是賣卡,是賣Token。Token正在從技術概念,變成經濟概念。

本文回答四個問題:Token為什麼是計價單位?怎麼消耗?誰在定價?定價和什麼有關?

一、Token為什麼是計價單位?

(一)什麼是Token?

Token是AI處理資訊的最小單元。你問AI一句話,AI回你一段話,這些話在AI模型中都會被拆解成Token。Token數量要看分詞規則,舉個例子,“人工智慧”如果是常見詞,可能直接是1個Token;如果被拆開,可能是“人工”和“智能”2個Token。類比理解,Token就是AI世界的“字節(Byte)”,是模型理解語言的基本單位。

(二)為什麼用Token計價?

為什麼大模型用Token來計價,而不是按次或按時長計價?如果按次計算,一次簡單的問答和一次複雜的程式碼生成,消耗的算力差幾百倍。如果按時長計價,算力消耗不是勻速的,高峰時段和空閒時段差距太大。

用Token計價則解決了以上問題。它是目前能找到的最精確的計量單位,主要原因如下:

第一,消耗量與算力直接相關,每生成一個Token,背後都是一次完整的推理計算。

第二,消耗量與任務價值正相關。金融業務的token比日常對話的token更具價值。

第三,Token可分層定價。廠商可以根據Token的質量定價。

Token已經從技術概念,轉變成為反映算力消耗和商業收入的計量單位。以前Token是大模型訓練過程中的副產品。現在成本重心從供給端(訓練)轉移到需求端(推理)。推理是持續的消耗,Token消耗量開始和費用直接掛鉤。

二、Token是怎麼消耗的?

根據IDC測算,全球Token消耗年複合增長率可達3000%。中國得日均Token消耗已經從2025年中的30兆飆升至2026年2月的180兆,半年增長了5倍之多。

Token消耗與任務複雜度直接相關,呈現出明顯的層級特徵:

為什麼層級間消耗差異如此懸殊?核心在於AI的“思考”方式發生了根本變化。以o1為代表的推理模型,不再採用傳統的“預測下一個詞”模式,而是在內部生成思維鏈,模型會在回答前進行多步推理、試錯、反思,這些內部過程都以Token形式消耗。

Claude Code、Open Claw等智能體框架更進一步。它們將推理能力與工具呼叫結合,實現“思考-執行-驗證”的閉環迭代。一次完整的智能體任務,可能包含數十輪內部推理和外部工具呼叫,單次任務消耗從幾十萬到幾百萬Token不等。

以下是不同使用者消耗量級的直觀對比:

三、誰在給Token定價?

Token從生產到消費,經過四個環節,每個環節的定價權不同。

生產層:輝達定義成本基準。它不直接賣Token,但掌握最底層的定價權。黃仁勳提出“每瓦Token數”——在固定電力下,誰能產出更多Token,誰就能賺更多錢。新一代AI計算平台Vera Rubin平台將生成Token成本降低90%,每瓦性能提升10倍。據財報,輝達60%收入來自前五雲廠商。

煉化層:模型廠商直接面對供需。國聯民生證券研報指出,當推理消耗變成生產資料,模型廠商有機會把“算力稀缺”通過分層定價轉化為毛利。輝達的分層定價印證了這一點,Token的價值由它能幹什麼決定。

分銷層:雲廠商賺管道溢價。3月以來,中國雲端運算產業鏈逐級漲價。優刻得全線漲價,騰訊雲混元漲價超460%,智譜漲20%。但云廠商不只是“二道販子”,它們封裝服務(一鍵部署OpenClaw)、整合生態(阿里串起千問、釘釘、淘寶),賺取溢價和粘性。

消費層:使用者用錢包投票。黃仁勳算過一筆帳:“一個研究員每天用5000萬Token,一天7500美元,但對研究團隊來說根本不是問題——因為Token帶來的價值遠超成本。”也就是說,Token的價格由它能創造的價值決定,而非生產成本。這正是Token從技術參數演變為經濟單位的底層邏輯。

可以看出,輝達掌握底層成本基準,模型廠商掌握直接定價權,雲廠商掌握管道溢價,使用者用錢包進行價值投票。

四、Token定價和什麼有關係?

為什麼有的Token貴,有的便宜?成本、能力、供需、場景共同決定Token定價。過去主要由成本決定,現在正向供需和場景傾斜。未來,場景價值會成為主導因素。

第一,成本驅動。一個1GW的資料中心,電力是物理上限。誰產出更多Token,誰就能把成本攤薄。中國廠商能打價格戰,靠的就是成本優勢:一度電0.2-0.5元(歐美0.8-1.2元),對應單張B200晶片每年能省900美元。

第二,能力分層。同樣是Token,能幫企業做業務的就比閒聊的貴,因為前者價值更大。輝達分層定價正是按能力分層。

第三,供需關係。這是最直接的驅動因素。2026年2月,全球前十AI模型Token總消耗量突破27兆,中國貢獻14兆,佔比超50%,一年半漲了1800倍。但是供給端產能緊張,HBM視訊記憶體、先進製程GPU受限,伺服器成本上升。阿里雲、混元、騰訊、智譜漲價,直接原因就是“全球AI需求爆發”和“供應鏈漲價”。

第四,場景價值。這是未來定價的主導因素。一個Token用在個人寫周報,價值幾毛錢;但用在金融交易、自動駕駛,價值幾百倍。國信證券指出,推理更看重使用者生態和調度效率,定價權正在從“算力供給方”向“場景需求方”轉移。誰的場景價值高,誰就願意付更高價格。

在PC時代,有一個經典的安迪-比爾定律,即硬體提升的性能,很快被軟體消耗掉了,使用者永遠覺得不夠快。

智能時代的“安迪-比爾”正在應驗,輝達每18-24個月性能翻倍,但AI智能體瘋狂消耗Token,算力永遠不夠用。Token不再是技術參數,而是經濟概念。印鈔機已經啟動,誰能掌握定價權,誰就能分到最大一塊蛋糕。 (原始碼悟真投研筆記)