1956年,美國商人麥克萊恩發明了集裝箱。
在集裝箱之前,貨物出口靠的是人力散裝,一件一件靠叉車、吊機搬運,一船要裝卸好幾天,運輸成本裡有一半是裝卸費。集裝箱的出現,讓這一切變了——任何貨物,只要裝進箱子,就能被任何港口的吊車裝卸,被任何貨輪運輸,被任何買家接收。
簡單的發明,卻帶來了非凡的效益:它讓全球貿易的摩擦成本大幅下降,當中國成為“世界工廠”後,中國產能藉著集裝箱滲透到了全球的每一個角落。
七十年後,一個新的“集裝箱”出現了,而這個新的“集裝箱”叫Token。
Token是大語言模型處理文字的最小單位,大致相當於半個中文字。但它的意義不在於這個技術定義,而在於它做到了和集裝箱一樣的事:把原本難以計量、難以交易的東西——智能服務——裝進了一個標準化的容器。
一個問題、一段程式碼、一篇文章,背後消耗了多少算力,全部可以用Token來計量、定價、交易。就像集裝箱讓任何貨物都能被吊車裝卸,Token讓任何智能服務都能被API呼叫、被計費、被出口。
中國第一次有機會大規模出口腦力,而不是體力、礦產、能源。美國人掀起了這場AI浪潮,定義了規則,炒高了價格,卻沒想到,Token這門生意的霸主,正在悄悄換人。
Token,翻譯過來叫詞元,是大語言模型處理文字的最小單位。
「我喜歡吃蘋果」,對人類來說是一個完整的句子。對AI來說,它是「我」「喜歡」「吃」「蘋果」四個Token。英文更複雜,「ChatGPT」會被拆成「Chat」「G」「PT」三個Token。
這種拆分看起來瑣碎,但它讓智能服務第一次變得可以量化,可以被公平地計算,就像集裝箱一般,Token讓任何智能服務都能被計量、被交易、被出口。
一個印度的創業者,打開電腦,呼叫DeepSeek的API,讓它幫他寫一段Python程式碼。他等了不到一秒,程式碼出現了。他付了幾分錢,關上電腦。
這個動作很簡單,但背後發生的事情卻改寫了遊戲規則:他的請求通過光纖傳到了中國某個資料中心,數百塊GPU同時啟動,開始逐字生成那段程式碼。
每生成一個字,就要消耗若干Token,而每個Token背後,卻是真實的電力消耗。甘肅的風電、青海的太陽能、雲南的水電,在這一刻以Token的形式,打包跨越國境,變成印度程式設計師眼前的一行程式碼。
中印之間沒有特高壓輸電線路,但中國的電力,卻實實在在被國外消費了。
這就是Token出口的本質:資料中心燒電,GPU運算,產出Token,賣給全球使用者。電力和算力被隱形地打包進每一個Token,隨著API呼叫流向世界各地。買家買到的是智能服務,但他們實際上消費的,是中國的電力、算力和工程師的智識積累。
這個機制有一個關鍵的特性:它不需要買家在地理上靠近中國,不需要鋪設任何物理管道,只需要一根網線。這是傳統電力出口永遠做不到的事。
中國電力之強大,天下人所共知,2025年,中國太陽能裝機突破3.15億千瓦,佔全國新增發電裝機的57%。
但裝機越快,消納越難,全國新能源消納監測預警中心的資料顯示:2025年上半年,全國太陽能棄電率升至6.6%,風電棄電率5.7%,比2024年同期幾乎翻倍。
西部省份的困境尤其嚴重:2025年1月至11月,西藏太陽能發電利用率僅65.8%,甘肅89.6%,青海83.5%,西藏風電利用率更只有69.3%。大量可再生能源發出來,卻沒有地方消納,白白浪費。
其實浪費了都算好的,帶來的電網波動才是真的難頂。
面對這些過剩的電,最直覺的想法是:直接出口出去不就行了?
嘿嘿,想法不錯,但現實沒那麼簡單。
電不能裝箱,不能儲存,只能靠實體電網點對點輸送。中國西部棄風棄光最嚴重的地方——西藏、甘肅、內蒙古——偏偏與電網基礎設施最薄弱的國家接壤,放眼中國周圍,基本上沒幾個國家擁有全國性的靠譜電網。
雲南通過21條輸電線路與越南、緬甸、寮國聯網,十三五期間累計跨境交易電量176億千瓦時——相比中國每年數兆千瓦時的總發電量,這個數字幾乎可以忽略不計。
再說了,人家窮國也是有主權的,沒有人願意讓本國電力依賴鄰國供應,即便願意把靈魂賣給東大,一度電出口也就五毛錢左右,扣除損耗和交易成本,根本賺不到幾個錢。
因此,傳統電力出口的天花板清晰可見,而且幾乎無解。
但是,如果我們能把電力換個皮,那情況就好辦得多了。
這就是Token的出口——不需要物理電網,不受電力主權約束,價格不被大宗商品市場錨定。這是一條真正可以規模化的新路。
資料中心對電價敏感、對位置不敏感——光纖可以跨越千山萬水。西藏、甘肅、青海的過剩綠電,可以通過資料中心轉化為Token,出口到全球。
這一點,在ToC的市場上尤其意義重大——Toc的意義在於它是最敏感的風向標。中國個人使用者的AI使用習慣正在發生結構性轉變:從「問答」轉向「幹活」。程式設計、寫作、長文件處理,每一類場景的Token消耗都遠高於簡單對話。加上深度推理模式的普及,單個使用者單次呼叫的Token量在快速膨脹——業界把這個現象稱為「Token通膨」。
數字印證了這個趨勢。國家資料局資料顯示,2024年初中國日均Token消耗量為1000億,到2025年6月底已突破30兆,一年半時間增長了300倍。2025年上半年,中國公有雲大模型呼叫總量達到537兆Token,較2024年全年增長近400%。這個增速,遠超任何一個傳統行業的成長曲線。土壤已經肥沃,種子正在發芽。
中國的澎湃電力,正在套上Token外皮,被國內外市場無形卻又瘋狂購買。
其實,“電力換皮出口”這事兒,中國早有先例。
中國是全球最大的電解鋁生產國,但鋁土礦本身大量依賴進口——幾內亞、澳大利亞、印度尼西亞的礦石,漂洋過海運到中國,在西南、西北的電解鋁工廠裡,經過高耗電的冶煉工序,變成鋁錠,再出口到全球。
礦石是進口的,鋁錠是出口的,而最耗電的那個環節,留在了國內。
也就是說,中國出口的鋁錠裡,有相當一部分是電力在換皮出售。只是,這種方式增值倍數不高,一度電變成鋁錠,大約只能增值2到3倍。
生產1噸電解鋁,行業平均耗電約13500度,也就是說1度電大約能煉出73克鋁。鋁錠目前的市場價大約是每噸2萬元,73克鋁價值約1.46元。而這1度電,買入價不過0.3到0.4元。
粗算下來,1度電通過煉鋁增值了3到5倍。
多晶矽也是同樣的邏輯,而且更為典型。
生產1噸多晶矽,綜合電耗約57000度,也就是說1度電大約能生產17.5克多晶矽。目前多晶矽現貨價格約在4萬元每噸,17.5克價值約0.7元。同樣1度電的買入價約0.3到0.35元,煉出多晶矽後增值約2倍。
看起來比電解鋁還低,但這是因為多晶矽行業目前嚴重過剩,2022年高點的時候,17.5克多晶矽可是能賣5元以上的,可以增值10倍。
但是如果你把電力換皮成Token賣出去,那情況可就完全不同了。
H100 GPU在推理場景下,每Token約消耗0.39焦耳,一度電則是360萬焦耳,理論上可產出約920萬Token,考慮到散熱、網路、冗餘等損耗,保守估算一度電實際產出約550萬Token。
Token賣多少錢?DeepSeek輸出定價每百萬Token約2元,OpenAI的GPT-4o定價每百萬Token約70元。
一度電直接出口,賣0.5元,煉成鋁錠賣出去是1.5元,而喂給資料中心跑推理,按DeepSeek的定價,能賣出約11元,是直接賣電的22倍。
更重要的是,鋁錠和多晶矽的工藝早已固定,早就碰到天花板了,但AI還年輕。
Token,是中國迄今為止電力增值效率最高的出口形態。
甚至,這看似暴利的“22倍”係數,還是我們廠商競爭過於激烈、主動壓價的結果,不是能力天花板。
DeepSeek在打市場、搶份額,定價是戰略選擇。DeepSeek-V3的訓練成本僅約3900萬元,用的是H800晶片——國產模型的真實成本,比這個定價還要低得多。即使把價格壓到OpenAI的1/20,中國模型依然有利潤空間。這就是便宜背後的底氣。
說完了中國這邊的帳,再看看美國那邊的帳。
如果說中國Token出口是暴利,那麼美國Token的出口則堪稱是“無本萬利”——Deepseek用一度電轉化出的Token可以賣11元,如果換成OpenAI的定價,同樣則能賣約385元,增值倍數來到了恐怖的“785倍”。
22倍和785倍之間,差著一個數量級。
為什麼中國模型的定價,只有美國模型的1/20到1/30?
最直接的原因是品牌溢價缺失。
這就好比同樣是礦泉水,農夫山泉賣2塊,依雲賣30塊,不是因為依雲的水分子更高級,而是因為它賣的是阿爾卑斯山泉這個故事。
OpenAI也是同樣的道理——它賣的不只是Token,賣的是全球最強AI這個認知。這個認知本身值錢,而且能讓人願意為之多付錢。
Claude Sonnet輸出定價每百萬Token約105元,MiniMax M2.5隻要約8元,相差13倍。
使用者願意為Claude買單,不只是因為Claude測試結果優異,還因為他們相信Claude確實更好——你怎麼樣是一回事,領導怎麼看你,是另外一回事。
中國模型廠商目前還處於農夫山泉的階段,價格透明、童叟無欺,但品牌故事還沒講出來。
其次是模型能力的差距。
DeepSeek在數學、程式設計的基準測試上已經追平甚至超越OpenAI,但基準測試是考場,生產環境是戰場。
在實際的企業應用裡,穩定性、指令遵循的精確度、邊緣情況的處理才是核心。實際的能力差距,直接影響定價天花板——你能解決別人解決不了的問題,才有資格開更高的價。中國模型目前還在追趕高端場景,這個差距縮小一分,定價空間就能打開一分。
第三,則是生態和信任的缺失。
企業客戶選AI供應商,就像選銀行,不只看利率,還要看這家銀行會不會突然倒閉、出了問題有沒有人接電話。
OpenAI和微軟Azure背後有完整的企業服務體系——SLA保障、合規支援、技術文件、售後響應,這套東西是多年積累下來的信任背書。中國模型在工程能力上完全不輸,但這套售後體系還在建設中。
畢竟,歐美在SaaS這塊可是玩兒了幾十年的,熟練程度和在珠三角找五金廠一個感覺。
最後還有一道隱形的壓力:地緣政治折扣。
簡單說就是,很多客戶想用但不敢用,或者用了也要壓價,因為心裡有顧慮——今天能調的API,明天會不會被自己國家的監管叫停?美國聯邦機構停用DeepSeek,德國要求下架,這些新聞每出一條,都會讓潛在客戶的決策再遲疑一下。遲疑折算成價格,就是折扣。
四個原因疊加,形成了一種結構性的定價壓制。
22倍是現在的成績,不是終點。但從22倍走向更高,靠的不是更猛的降價,而是品牌、能力、生態、信任一點一點地積累。
短期內,最明顯的障礙是西方封禁,歐美對中國高科技的打壓始終沒停過,這是咱們早就有的心理預期——今天一個法案,明天一個禁令,早就蝨子多了不嫌咬了。
但說實話,這些封禁更像是在門口立了個牌子,而不是真的堵死了路。
中國Token出口的主戰場從來不是西方發達國家,而是印度、東南亞、拉美、中東——也就是全球南方。DeepSeek在印度、東南亞的擴張沒有受到太大影響。封禁反而幫中國模型做了廣告:被美國封殺的產品,一定有點東西。
真正危險的,其實是內部問題——國內模型廠商,也開始價格戰了。
2024年,字節豆包報價低到每千Token不到0.006元,阿里通義千問GPT-4級主力模型降價97%,智譜把上一代GLM-4-Plus砍了90%。這場價格戰打得像菜市場收攤前甩賣,贏得了使用者,卻虧掉了利潤,壓縮了再投資能力。
好在2025年情況開始逆轉:智譜GLM-5發佈當天宣佈漲價30%,Kimi K2.5發佈不到一個月,海外收入首次超過國內。漲價能成功,說明需求是真實的,市場在成熟。但價格戰留下的諸多後遺症卻需要時間消化。
長期來看,有兩個結構性問題懸在中國AI的頭頂。
第一是算力天花板。
晶片禁令不會消失,美國必然會管得越來越嚴。DeepSeek用H800訓練出了頂級模型,這是一次了不起的工程奇蹟,但奇蹟不能當戰略。就像一支球隊贏了一場經典戰役,不代表它永遠能以少勝多。下一代模型如果需要十萬張H100,而中國只能拿到性能打折的替代品,訓練成本優勢就會被侵蝕。
不過,現在情況應該好了不少,老黃這次來國內拜訪一圈,結果好像一張H200都沒賣出去。
第二個長期問題是資料本地化壓力。
各國對資料主權的限制也在越發收緊,歐盟的GDPR、印度資料本地化法案、中東的合規要求,都在往同一個方向推。
目前中國Token出口依賴的是純境外API呼叫模式,一旦各國要求資料不能出境,就得在當地建資料中心。可若是在本地建中心,那麼土地、電力、維運全部按當地標準來,成本結構就完全變了,也就不那麼“便宜”了。
因此,Token出口的終極形態,可能不是簡單的API呼叫,而是中國技術加本地部署——這對商業模式和營運能力,都是更高的要求。
不論如何,還是要感謝美國AI——感謝他們用真金白銀和大喇叭宣傳,幫中國找到了電力出口的正確姿勢。
OpenAI、Anthropic把Token價格錨定在高位,教育了市場,啟動了需求,卻讓更多企業用不起。中國模型以1/20的價格提供80%的能力,填補了這塊空白。
從賣電到賣Token,中國完成了從體力活到腦力活的躍遷——不需要密集勞動、不需要污染環境、不需要物理電網,不受地緣政治的電力主權約束,價格也不再被大宗商品市場錨定,這是一條真正意義上可以規模化的新路。
美國負責把Token價格炒上去,中國負責把Token價格打下來,“西數東算”的博弈,才剛剛開始。 (功夫財經)