親愛的藏金洞友們:
你以為AI在燒錢,其實它在發行新貨幣
矽谷現在有一種新的炫富方式。
以前炫融資:我融了幾個億。後來炫算力:我買了多少張GPU。現在更離譜:我今天燒了多少Token。
這股風潮有個新名字,叫 Token Maxing。
說白了,就是把AI用量拉到極限。員工一天燒多少Token,團隊能同時調度多少個Agent,公司內部誰是AI超級使用者,正在變成矽谷新的“工牌鄙視鏈”。
以前卷加班,後來卷程式碼,現在卷Token。
你沒燒過幾百萬Token,都不好意思說自己AI Native。
但洞主覺得,這事不能只當成矽谷的新型凡爾賽來看。
因為Token背後,藏著AI時代真正的新戰爭:模型公司在搶定價權,雲廠商在搶通道權,開發者在搶成本優勢,中國模型在搶全球性價比市場。
如果說石油是工業時代的血液,電力是數字時代的底座,那麼Token很可能就是AI時代的新貨幣。
01 Meta員工一個月燒掉60兆Token,大廠為什麼瘋了?
今年4月,Meta被曝內部有一個AI使用排行榜。
這個榜單統計了超過8.5萬名員工的AI使用情況,列出Token消耗量最高的前250名超級使用者。
最近一個月,榜單總使用量突破 60兆Token。
如果按高端模型API價格粗略換算,這是一筆極其誇張的成本。排名靠前的員工,一個人燒掉的Token價值可能就達到數百萬美元。
這消息一出來,矽谷炸鍋了。
支援派說:公司必須鼓勵員工瘋狂使用AI,不然就會被更AI Native的對手淘汰。
反對派說:燒Token不等於生產力,燒得越多,可能只是證明你越不會用AI。
這就像一個人天天去健身房打卡三小時,但大部分時間都在自拍。你確實去了健身房,但肌肉不一定長了。
AI也一樣。
Token燒得多,不代表公司變聰明了。但完全不燒Token,基本說明這家公司還活在舊時代。
真正的問題不是要不要燒,而是:
你燒掉的Token,有沒有變成程式碼、產品、決策、收入和利潤?
02 AI正在改寫軟體行業的成本結構
過去軟體行業最性感的地方是什麼?
邊際成本低。
一個SaaS產品開發出來以後,賣給100個使用者和賣給100萬個使用者,底層成本差別沒那麼大。
所以傳統軟體是越賣越賺。
但AI不一樣。
每一次對話、每一次總結、每一次程式碼生成、每一次Agent呼叫工具,背後都有真實帳單。
使用者不用,產品沒價值。使用者真用,成本又爆炸。
這就很尷尬。
過去軟體公司的夢想是:使用者越多,毛利越高。現在AI公司的噩夢是:使用者越活躍,帳單越嚇人。
尤其到了Agent時代,一個任務不是問一句答一句。
它要拆任務、查資料、讀檔案、調工具、跑程式碼、修錯誤、再總結。
每一步都在燒Token。
所以AI創業公司拿到融資以後,第一件事可能不是招人,也不是租辦公室,而是買API額度、買算力、買Token。
甚至有風投開始考慮:既然創業公司拿錢也是買Token,那我為什麼不直接投Token額度?
看懂了嗎?
Token已經不只是成本項了。它越來越像AI公司的彈藥、燃料和現金流底座。
03 為什麼越貴的模型,反而可能越便宜?
很多人以為Token成本就是單價乘數量。
沒那麼簡單。
一次AI呼叫裡,至少有三種Token:
- 第一種,輸入Token。也就是你發給模型的內容。
- 第二種,快取輸入Token。如果上下文被系統快取過,再次呼叫會便宜很多。
- 第三種,輸出Token。也就是模型生成回答時產生的內容。
一般來說,輸出Token最貴。
因為模型生成答案需要一步步推理和計算,消耗更高。
這就產生一個很關鍵的商業邏輯:
AI真正貴的,不是你問了多少,而是模型答了多少、循環了多少、返工了多少。
便宜模型看起來單價低,但如果它一次做不對,就要反覆重試。
強模型看起來貴,但如果它一次做對,反而總成本更低。
這就像請顧問。
便宜顧問一天1000塊,陪你聊三個月,最後結論是“建議進一步研究”。貴顧問一天10萬塊,三小時指出問題死穴。
你說誰便宜?
所以AI時代的成本,不能只看“每百萬Token多少錢”,而要看:
每一個有效結果到底花了多少錢。
這才是真帳。
04 中國模型為什麼突然香了?
當矽谷開始瘋狂Token Maxing,全球開發者很快遇到一個問題:
美國頂級模型很好,但真的貴。
尤其是Agent工具普及後,Token消耗從幾千、幾萬,直接跳到幾十萬、幾百萬、甚至上千萬。
這時候,開發者自然開始找替代品。
於是中國模型開始在國際開發者市場裡變香。
原因非常簡單:
性價比高。
不是每個任務都需要最強模型。
很多任務並不需要AI像哲學家一樣深沉,只需要它聽話、穩定、便宜、跑得快。
比如格式轉換、批次總結、資訊抽取、客服問答、資料清洗、簡單程式碼任務。
這些場景裡,頂級模型當然能做,但用它就像拿法拉利送外賣。
不是不行,就是有點燒包。
中國模型的機會就在這裡。
美國模型定義智能天花板。中國模型打穿價格地板。
一個賣最強大腦,一個賣極致性價比。
而在全球開發者生態裡,性價比永遠是最硬的通行證。
這背後不只是模型能力問題,還有工程能力、雲廠商補貼、推理架構最佳化和基礎設施效率。
說白了,中國模型正在用當年中國製造的方式切入全球AI市場:
不一定最貴,但足夠好用;不一定最豪華,但極具殺傷力。
05 OpenRouter賣的不是介面,是AI時代的調度權
模型越來越多以後,開發者最頭疼的問題變成了:
到底該用誰?
複雜任務用GPT。長文字任務用Claude。便宜任務用中國模型。程式碼任務用專門模型。某個模型掛了,還要自動切換備用模型。
這時候,OpenRouter這類平台就冒出來了。
它表面上做的是統一介面。
一個入口,接入多個模型。
但它真正值錢的不是介面,而是調度權。
誰便宜,用誰。誰快,用誰。誰穩定,用誰。誰效果好,用誰。誰出問題,馬上換誰。
這很像AI時代的模型交易所。
OpenRouter不只是幫開發者省事,它還掌握了一個極其關鍵的資料:
全球開發者到底在用那些模型?那些模型增長最快?那些任務正在爆發?那些模型正在被替代?
這就是AI應用層的水流圖。
誰掌握水流,誰就掌握未來的分發權。
06 Token套利:下一批賺錢的人,可能是最會省Token的人
只要模型之間有價差,就一定會有套利。
這就是 Token Arbitrage。
翻譯成人話就是:
用便宜模型干大部分活,用貴模型處理關鍵判斷,然後整體打包賣給使用者。
使用者看到的是一個AI產品。背後可能是十幾個模型在分工協作。
簡單問題,小模型回答。複雜問題,強模型處理。格式整理,便宜模型完成。關鍵決策,頂級模型兜底。模型失敗,系統自動切換。
使用者不關心你背後用了誰。
使用者只關心結果好不好、速度快不快、價格能不能接受。
這裡面就有利潤空間。
同樣一個任務,全程用頂級模型,成本可能是10美元。智能路由以後,成本可能降到1美元。使用者願意付5美元,中間就有4美元空間。
這不是簡單倒賣API。
這是一套新的AI成本工程。
未來AI應用公司的核心能力,不只是會不會寫Prompt,而是:
會不會調度Token。
模型是車。Token是油。路由系統是物流網路。
真正賺錢的,未必是最會造車的人,也可能是最會調度車隊的人。
07 Token出海:中國可能出口一種“不出海關”的新商品
最值得重視的,是Token出海。
想像一個場景:
一個倫敦程式設計師呼叫中國模型API。請求從英國發出,傳到中國資料中心。中國GPU開始計算,中國電表開始跳。幾秒鐘後,結果返回英國。帳單完成跨境結算。
這個過程中,沒有任何實物離開中國。
沒有集裝箱。沒有海關。沒有碼頭。沒有報關單。
但中國的電力、算力、模型能力和工程效率,已經通過Token完成了一次出口。
這是一種全新的出口形態。
過去中國出口襯衫、玩具、家電。後來出口太陽能、電動車、鋰電池。未來,中國有沒有可能出口Token?
本質上,Token就是電力、晶片、演算法、資料中心和模型工程能力打包後的數字商品。
它不像傳統商品那樣裝箱上船。它通過API交付,通過帳單結算,通過全球開發者生態擴散。
這就是所謂的“電力出海”“算力出海”“智能出海”。
不是電真的離開了中國。而是電在中國被轉化成Token,然後賣給了全世界。
這事如果做成,意義不亞於中國製造出海。
只不過當年出口的是“便宜好用的商品”,未來出口的是“便宜好用的智能”。
08 真正的戰爭,不是模型戰爭,而是基礎設施戰爭
很多人以為Token價格戰,拼的是模型。
不完全是。
模型只是前台。
後台真正拼的是電力、GPU、資料中心、網路、冷卻系統和基礎設施響應速度。
美國不是沒有電,而是很多地方缺少能快速接入大型資料中心的電力基礎設施。
變電站審批、高壓電接入、土地協調、環保流程,每一項都可能拖慢AI基建。
中國的優勢在於大規模基礎設施組織能力。
西部有新能源,東部有需求,中間有特高壓。雲廠商、地方政府、資料中心、模型公司和供應鏈可以形成一套完整的協同體系。
所以Token價格戰,表面看是模型API價格戰,實際上是算力工業體系的戰爭。
誰能更快建資料中心,誰能更便宜拿電,誰能更高效調度GPU,誰就能擁有Token經濟裡的定價權。
AI拼到最後,還是一門重工業。
別被“智能”兩個字騙了。它的底座,是電網、機房、晶片和冷卻塔。
09 洞主有話說:Token不是技術單位,是AI時代的新帳本
Token正在從一個技術單位,變成AI時代最重要的經濟單位。
它連接了模型能力、算力資源、電力系統和商業收入。
過去石油是工業血液。未來Token可能是智能時代的工業血液。
因為Agent要工作,AI應用要運行,企業要自動化,程式碼要生成,內容要生產,決策要輔助,都離不開Token。
更關鍵的是,Token消耗正在從“人類主動發起”變成“機器自動運行”。
以前是人問一句,AI答一句。未來是Agent自己查資料、自己寫程式碼、自己跑測試、自己改方案、自己交付結果。
人類一天只會問幾十個問題。但一個Agent工作流,一天可以呼叫模型上萬次。
所以Token需求不是線性增長,而可能是指數級增長。
這就是為什麼黃仁勳說Token會成為大宗商品。
圍繞Token,人類過去幾千年發明過的商業模式,都會重新演一遍:
批發零售、平台抽佣、期貨交易、智能路由、套餐計費、價格套利、基礎設施租賃、跨境服務出口。
唯一不同的是,這一次速度更快。
以前石油要從地下挖出來,煉化、運輸、儲存、銷售。現在Token從資料中心生成,幾秒鐘就能跨境交付。
所以AI時代最值錢的公司,未必只有最強模型公司。
還會有三類贏家:
- 能最低成本生產Token的基礎設施公司。
- 能最高效率調度Token的平台公司。
- 能把Token轉化為真實業務結果的應用公司。
說到底,AI時代不是看誰喊AGI最大聲。
而是看誰能回答一個最樸素的問題:
我燒掉的每一個Token,到底換回了什麼?
這才是Token經濟學的底層帳本。 (藏金洞)
