在AI的五層產業鏈上,定價權究竟在誰手裡,又將走向何處。
2026年3月,黃仁勳在GTC大會上說了一句話:「Tokens are the new commodity。」Token是新的大宗商品。
這句話聽起來像是在宣佈Token將會越來越便宜——大宗商品化的結果是價格下行、利潤攤薄。但如果你理解黃仁勳在說這句話時的處境和意圖,就會發現他說的不是「所有人的利潤都會被攤薄」,而是「其他層級的利潤會被攤薄,但我的不會」。
他是在宣佈一場選擇性同質化戰略的勝利——把模型層、基礎設施層的護城河填平,讓Token在這些層面充分競爭、價格下行,而唯獨晶片層的壟斷定價權至少在當下,仍然是整條產業鏈最堅固的那一環。Token越便宜,呼叫量越爆發,所有人越需要買輝達的晶片來生產這些便宜的Token。
Token經濟裡最大的權力博弈,是誰能在五層產業鏈上守住「不可替代」——守住了,就守住了定價權;失去了,就只能在別人劃定的價格里求生存。
這篇文章要拆解的,正是這場隱秘的定價權戰爭:它的戰場在那裡,各方勝算幾何,以及中國在這場戰爭裡站在那裡。
一、「同質化」:輝達最精妙的降維打擊
要理解Token定價權之爭,可以先從理解黃仁勳提出的「五層蛋糕」邏輯開始——因為這套框架,本質上是一張定價權地圖。
五層蛋糕從下到上:能源、晶片、基礎設施、模型、應用。輝達的主戰場在晶片層。但黃仁勳的野心從來不止於此——他想把整張地圖都變成輝達的主場。
邏輯是這樣的:在一個市場裡,如果某一層的產品或服務失去差異化、玩家之間難以區分,利潤就會在充分競爭中被攤薄——行業裡把這個過程叫做「同質化」。一旦某一層被同質化,議價權就會向仍然保持不可替代性的層級集中。
所以輝達的戰略,是主動推動其他層級的同質化,讓利潤向晶片層匯聚。
在基礎設施層,Google雲、AWS議價權變強,輝達就扶持CoreWeave、Nebius這類新興雲廠商來競爭,把基礎設施層的集中度打散。在模型層,OpenAI、Anthropic的頂尖閉源模型有溢價,輝達就大力支援開源模型——GTC大會上,黃仁勳專門組織了全球頂尖開源模型論壇。其中一個關鍵意圖是:如果開源模型能用10%的價格做到閉源模型90%的性能,頂尖閉源模型的議價權就會被打掉,Token價格被壓低,模型層利潤攤薄,所有人最終還是要買輝達的晶片來跑這些模型。
Token越便宜,輝達越賺錢。這個看似反直覺的邏輯,正是輝達整個生態戰略的核心:把別人的護城河填平,讓自己的護城河成為唯一還在的那一條。
這不是市場競爭的自然結果,是刻意設計的戰略佈局。理解了這一點,才能真正理解Token定價權之爭的底層邏輯。
二、五層蛋糕的定價權現狀:逐層拆解
在輝達的戰略框架下,五層蛋糕裡各層的定價權現狀,是這場戰爭的基本盤。
從這張圖可以看出,當前定價權格局的核心矛盾是:晶片層輝達一家獨大,但正在被三股力量挑戰——自研晶片(GoogleTPU、亞馬遜Trainium等)、開源模型(讓模型層同質化的速度超出預期)、能源瓶頸(算力擴張被電力卡脖子)。
輝達以200億美元現金取得Groq的非獨家技術授權,從談判到拍板只用了極短時間。Groq的LPU專為Token逐步序列生成最佳化,恰好補足了GPU在推理解碼階段的短板。輝達不是在擴張,是在補防線。
推理正在取代訓練成為AI算力需求的主引擎。據德勤預測,推理在AI算力中的佔比已從2023年的三分之一升至2026年的三分之二,長期有望超過80%。這個轉變對輝達既是機會,也是威脅——推理晶片對低延遲、高能效的要求,正是專用ASIC晶片的主戰場,GPU的通用優勢在這裡被削弱。
三、中國的位置:一個被低估的結構性優勢
在大多數關於AI定價權的討論裡,中國的敘事是防禦性的:晶片被卡脖子,頂尖模型能力有差距,需要追趕。但這個敘事遮蔽了一個同樣重要的事實。
在Token經濟的定價權版圖裡,中國有一張被嚴重低估的牌:能源。
電力成本佔資料中心營運總成本的60%至70%,是Token全球定價最直接的決定因素。中國西部綠電成本可低至每度0.3元以下。這個成本優勢直接反映在Token價格上:中國模型每百萬Token輸入成本僅需0.5至1.5美元,而美國模型為2.5至10美元——差距達5倍以上。
在Token的「鑄造成本」上,中國有值得關注的結構性優勢。需要說明的是,Token的生產成本由多個因素構成:能源是最大的單一變數,但晶片折舊也是重要組成部分——而高端GPU受出口管制,國內採購成本客觀上高於美國。兩股力量方向相反。但綜合來看,信通院的測算顯示:中國模型每百萬Token的整體成本仍顯著低於美國——這說明能源優勢目前能夠有效避險晶片成本劣勢,且隨著國產晶片推理能力提升,這一優勢有望進一步鞏固。
2026年政府工作報告首次明確提出「算電協同」,將算力與電力的協同發展提升至國家戰略層面。這個訊號意味著:中國正在有意識地將能源優勢轉化為Token定價權的戰略資產。
同時,國產晶片正在加速突破。「國產晶片四小龍」——摩爾線程、沐曦股份、壁仞科技、燧原科技——在2025年末至2026年初密集推進資本化。寒武紀2025年實現營收64.97億元、歸母淨利潤20.59億元,上市以來首次全年盈利。國產推理晶片與輝達的差距,在推理側比訓練側更小——而推理,正是Token經濟的主戰場。
能源牌加晶片追趕,構成了中國在Token定價權博弈中的基本盤。這兩張牌如果打好,中國有機會在Token的「大宗商品化」賽道上佔據有利位置——即便在模型層的頂尖能力上仍有差距。
四、模型層的定價權戰爭:開源不是公益
在五層蛋糕裡,模型層是當前定價權博弈最激烈、最複雜的戰場。而這場戰爭裡,最常被誤讀的一個概念,是「開源」。
大多數人看開源,看到的是技術普惠:把模型程式碼和權重公開,讓更多人用得起AI。這個理解沒有錯,但它只是開放原始碼的表層。在定價權博弈的視角下,開源是一種精密的商業策略,每一個「慷慨」的開源行為背後,都有一個關於「我能從那一層賺回來」的商業計算。
輝達支援開源:如前所述,目的是同質化模型層,把閉源頂尖模型的溢價打掉,讓所有人都還得買晶片。開源越繁榮,晶片需求越大。
Meta開源LLaMA系列:Meta沒有雲業務,在「賣Token」這件事上無法直接獲益。但Meta有廣告業務,有海量使用者資料,有建構AI生態的戰略需求。開源可以讓Meta用極低成本建立開發者生態,把整個行業拉到自己的技術框架上,最終通過廣告和資料飛輪獲益。
DeepSeek開源:背靠幻方量化,不需要靠賣Token盈利。開源換來全球開發者的呼叫和使用,建立了技術聲譽,同時驗證了「低成本高性能」路線的可行性——這本身就是對中國能源和演算法效率優勢的最好背書。
OpenAI堅持閉源:靠能力領先維持溢價,用訂閱和API收入支撐高額研發投入。這條路要求持續保持領先——一旦開源模型追上來,溢價就會坍塌。這是一條越跑越需要加速的跑步機。
開源是定價權策略,不是公益。AI行業裡那些看似「大方」的技術開放行為背後,隱藏的是競爭邏輯。
這場開源與閉源的博弈,還有一個深層的結構性問題:開源模型的能力追趕速度,正在超過所有人的預期。當開源模型能以10%的價格實現閉源模型90%的性能,「頂尖能力溢價」的窗口就在縮小。這對依賴能力領先維持定價權的閉源廠商,是一個持續的壓力。一個可以觀察的資料是:在OpenRouter平台的呼叫統計中,包括DeepSeek在內的中國模型整體佔比份額很高、增長極猛——這是開源策略在全球開發者市場產生真實影響力的具體體現。
五、定價權的兩種終局
把這場博弈的邏輯推到底,Token經濟的定價權最終會走向那裡?
電力是完全同質的,來自風電的一度電和來自煤炭的一度電,對使用者沒有區別;Token天然帶有質量差異——同樣一百萬個Token,由不同模型生成的價值可以相差數十倍。一個能精準完成程式碼重構的Token,和一個只能做簡單問答的Token,根本不是同一種商品。
這意味著Token不可能像電力那樣走向完全的大宗商品化。它更可能走向一種混合格局——底層趨近大宗商品,頂層形成分層市場。兩種終局,不是非此即彼,而是同時存在於不同層級。
終局A:底層大宗商品化。
在通用場景——基礎問答、內容摘要、簡單翻譯——Token的質量差異已經很小,競爭邏輯接近大宗商品:誰的能源最便宜、演算法最高效,誰的Token就最有價格競爭力。這個市場裡,定價權分散,利潤薄,拼的是成本結構。
中國在這條路徑上有真實優勢:西部綠電成本低至每度0.3元以下,DeepSeek已經驗證低成本高性能的可行性,中國模型在OpenRouter平台前十名中已佔據絕對的Token消耗份額。底層大宗商品化,是中國的主場。
終局B:頂層分層壟斷。
在高價值場景——複雜推理、即時程式碼生成、長上下文Agent工作流——Token的質量差異決定了商業價值。這些場景對低延遲、高能效的要求極高,只有最先進的晶片和最強的模型才能服務。黃仁勳在GTC 2026上展示的五層定價體系——從免費層到$150/百萬Token的超高速層——正是為這個市場設計的。Vera Rubin GPU與Groq LPU的異構推理架構,能夠實現每瓦特35倍於純GPU方案的吞吐量,專門解鎖$45到$150這兩個高價值定價層級。
在這條路徑上,定價權集中於兩類玩家:控制頂尖晶片的硬體廠商,以及擁有最強模型能力的閉源廠商。但這個集中是動態的——自研ASIC增速是GPU的近三倍,開源模型的能力追趕速度持續超出預期。
兩種終局同時存在,共同構成Token經濟的定價權地形圖。
對中國而言,戰略選擇需要誠實地分層評估:
在終局A的底層市場,中國有真實的結構性優勢。能源成本低、演算法效率高、已有規模化的全球呼叫份額。這是中國能打且正在打贏的仗。
在終局B的頂層市場,中國面臨的挑戰更大。晶片制裁、CUDA生態壁壘、頂尖模型的能力差距,每一項都不是短期能解決的。國產推理晶片在推理側的追趕比訓練側更有希望,但從”可用”到”最優”之間,仍然需要持續投入。
當然,這個框架有一個它尚未回答的問題:如果入口層——Google的搜尋、蘋果的裝置、字節的超級App——最終成為AI價值鏈中利潤最厚的一環,誰離使用者最近,誰就可能重新定義整場遊戲的規則。但這個問題的展開,已經超出了Token定價權的分析邊界——它指向的是AI時代更深層的權力重組,也是這個系列後續值得追問的方向。
經濟裡,定價權不是一次性的勝利,而是需要持續守護的位置。今天的護城河,可能是明天的陷阱。今天的劣勢,也可能是明天的轉機。 (二進制朋友)
