Token定價權：一場正在進行的隱秘戰爭

2026/06/06

•

AI速讀

本文分析 AI 時代的定價權戰爭，指出輝達透過促使模型層與基礎設施層同質化，旨在強化其晶片層的壟斷地位，使 Token 越便宜，晶片需求反而越爆發。作者提出 AI 市場將走向兩種終局：一是底層大宗商品化，中國憑藉低廉能源成本與高效演算法具備結構性優勢；二是頂層分層壟斷，由控制頂尖晶片與最強模型的玩家掌控。此外，文章揭示開源模型實為一種精密的商業策略，旨在打破對手溢價並建立生態，而非單純的技術普惠。

在AI的五層產業鏈上，定價權究竟在誰手裡，又將走向何處。

2026年3月，黃仁勳在GTC大會上說了一句話：「Tokens are the new commodity。」Token是新的大宗商品。

這句話聽起來像是在宣佈Token將會越來越便宜——大宗商品化的結果是價格下行、利潤攤薄。但如果你理解黃仁勳在說這句話時的處境和意圖，就會發現他說的不是「所有人的利潤都會被攤薄」，而是「其他層級的利潤會被攤薄，但我的不會」。

他是在宣佈一場選擇性同質化戰略的勝利——把模型層、基礎設施層的護城河填平，讓Token在這些層面充分競爭、價格下行，而唯獨晶片層的壟斷定價權至少在當下，仍然是整條產業鏈最堅固的那一環。Token越便宜，呼叫量越爆發，所有人越需要買輝達的晶片來生產這些便宜的Token。

Token經濟裡最大的權力博弈，是誰能在五層產業鏈上守住「不可替代」——守住了，就守住了定價權；失去了，就只能在別人劃定的價格里求生存。

這篇文章要拆解的，正是這場隱秘的定價權戰爭：它的戰場在那裡，各方勝算幾何，以及中國在這場戰爭裡站在那裡。

一、「同質化」：輝達最精妙的降維打擊

要理解Token定價權之爭，可以先從理解黃仁勳提出的「五層蛋糕」邏輯開始——因為這套框架，本質上是一張定價權地圖。

五層蛋糕從下到上：能源、晶片、基礎設施、模型、應用。輝達的主戰場在晶片層。但黃仁勳的野心從來不止於此——他想把整張地圖都變成輝達的主場。

邏輯是這樣的：在一個市場裡，如果某一層的產品或服務失去差異化、玩家之間難以區分，利潤就會在充分競爭中被攤薄——行業裡把這個過程叫做「同質化」。一旦某一層被同質化，議價權就會向仍然保持不可替代性的層級集中。

所以輝達的戰略，是主動推動其他層級的同質化，讓利潤向晶片層匯聚。

在基礎設施層，Google雲、AWS議價權變強，輝達就扶持CoreWeave、Nebius這類新興雲廠商來競爭，把基礎設施層的集中度打散。在模型層，OpenAI、Anthropic的頂尖閉源模型有溢價，輝達就大力支援開源模型——GTC大會上，黃仁勳專門組織了全球頂尖開源模型論壇。其中一個關鍵意圖是：如果開源模型能用10%的價格做到閉源模型90%的性能，頂尖閉源模型的議價權就會被打掉，Token價格被壓低，模型層利潤攤薄，所有人最終還是要買輝達的晶片來跑這些模型。

Token越便宜，輝達越賺錢。這個看似反直覺的邏輯，正是輝達整個生態戰略的核心：把別人的護城河填平，讓自己的護城河成為唯一還在的那一條。

這不是市場競爭的自然結果，是刻意設計的戰略佈局。理解了這一點，才能真正理解Token定價權之爭的底層邏輯。

二、五層蛋糕的定價權現狀：逐層拆解

在輝達的戰略框架下，五層蛋糕裡各層的定價權現狀，是這場戰爭的基本盤。

從這張圖可以看出，當前定價權格局的核心矛盾是：晶片層輝達一家獨大，但正在被三股力量挑戰——自研晶片（GoogleTPU、亞馬遜Trainium等）、開源模型（讓模型層同質化的速度超出預期）、能源瓶頸（算力擴張被電力卡脖子）。

輝達以200億美元現金取得Groq的非獨家技術授權，從談判到拍板只用了極短時間。Groq的LPU專為Token逐步序列生成最佳化，恰好補足了GPU在推理解碼階段的短板。輝達不是在擴張，是在補防線。

推理正在取代訓練成為AI算力需求的主引擎。據德勤預測，推理在AI算力中的佔比已從2023年的三分之一升至2026年的三分之二，長期有望超過80%。這個轉變對輝達既是機會，也是威脅——推理晶片對低延遲、高能效的要求，正是專用ASIC晶片的主戰場，GPU的通用優勢在這裡被削弱。

三、中國的位置：一個被低估的結構性優勢

在大多數關於AI定價權的討論裡，中國的敘事是防禦性的：晶片被卡脖子，頂尖模型能力有差距，需要追趕。但這個敘事遮蔽了一個同樣重要的事實。

在Token經濟的定價權版圖裡，中國有一張被嚴重低估的牌：能源。

電力成本佔資料中心營運總成本的60%至70%，是Token全球定價最直接的決定因素。中國西部綠電成本可低至每度0.3元以下。這個成本優勢直接反映在Token價格上：中國模型每百萬Token輸入成本僅需0.5至1.5美元，而美國模型為2.5至10美元——差距達5倍以上。

在Token的「鑄造成本」上，中國有值得關注的結構性優勢。需要說明的是，Token的生產成本由多個因素構成：能源是最大的單一變數，但晶片折舊也是重要組成部分——而高端GPU受出口管制，國內採購成本客觀上高於美國。兩股力量方向相反。但綜合來看，信通院的測算顯示：中國模型每百萬Token的整體成本仍顯著低於美國——這說明能源優勢目前能夠有效避險晶片成本劣勢，且隨著國產晶片推理能力提升，這一優勢有望進一步鞏固。

2026年政府工作報告首次明確提出「算電協同」，將算力與電力的協同發展提升至國家戰略層面。這個訊號意味著：中國正在有意識地將能源優勢轉化為Token定價權的戰略資產。

同時，國產晶片正在加速突破。「國產晶片四小龍」——摩爾線程、沐曦股份、壁仞科技、燧原科技——在2025年末至2026年初密集推進資本化。寒武紀2025年實現營收64.97億元、歸母淨利潤20.59億元，上市以來首次全年盈利。國產推理晶片與輝達的差距，在推理側比訓練側更小——而推理，正是Token經濟的主戰場。

能源牌加晶片追趕，構成了中國在Token定價權博弈中的基本盤。這兩張牌如果打好，中國有機會在Token的「大宗商品化」賽道上佔據有利位置——即便在模型層的頂尖能力上仍有差距。

四、模型層的定價權戰爭：開源不是公益

在五層蛋糕裡，模型層是當前定價權博弈最激烈、最複雜的戰場。而這場戰爭裡，最常被誤讀的一個概念，是「開源」。

大多數人看開源，看到的是技術普惠：把模型程式碼和權重公開，讓更多人用得起AI。這個理解沒有錯，但它只是開放原始碼的表層。在定價權博弈的視角下，開源是一種精密的商業策略，每一個「慷慨」的開源行為背後，都有一個關於「我能從那一層賺回來」的商業計算。

輝達支援開源：如前所述，目的是同質化模型層，把閉源頂尖模型的溢價打掉，讓所有人都還得買晶片。開源越繁榮，晶片需求越大。

Meta開源LLaMA系列：Meta沒有雲業務，在「賣Token」這件事上無法直接獲益。但Meta有廣告業務，有海量使用者資料，有建構AI生態的戰略需求。開源可以讓Meta用極低成本建立開發者生態，把整個行業拉到自己的技術框架上，最終通過廣告和資料飛輪獲益。

DeepSeek開源：背靠幻方量化，不需要靠賣Token盈利。開源換來全球開發者的呼叫和使用，建立了技術聲譽，同時驗證了「低成本高性能」路線的可行性——這本身就是對中國能源和演算法效率優勢的最好背書。

OpenAI堅持閉源：靠能力領先維持溢價，用訂閱和API收入支撐高額研發投入。這條路要求持續保持領先——一旦開源模型追上來，溢價就會坍塌。這是一條越跑越需要加速的跑步機。

開源是定價權策略，不是公益。AI行業裡那些看似「大方」的技術開放行為背後，隱藏的是競爭邏輯。

這場開源與閉源的博弈，還有一個深層的結構性問題：開源模型的能力追趕速度，正在超過所有人的預期。當開源模型能以10%的價格實現閉源模型90%的性能，「頂尖能力溢價」的窗口就在縮小。這對依賴能力領先維持定價權的閉源廠商，是一個持續的壓力。一個可以觀察的資料是：在OpenRouter平台的呼叫統計中，包括DeepSeek在內的中國模型整體佔比份額很高、增長極猛——這是開源策略在全球開發者市場產生真實影響力的具體體現。

五、定價權的兩種終局

把這場博弈的邏輯推到底，Token經濟的定價權最終會走向那裡？

電力是完全同質的，來自風電的一度電和來自煤炭的一度電，對使用者沒有區別；Token天然帶有質量差異——同樣一百萬個Token，由不同模型生成的價值可以相差數十倍。一個能精準完成程式碼重構的Token，和一個只能做簡單問答的Token，根本不是同一種商品。

這意味著Token不可能像電力那樣走向完全的大宗商品化。它更可能走向一種混合格局——底層趨近大宗商品，頂層形成分層市場。兩種終局，不是非此即彼，而是同時存在於不同層級。

終局A：底層大宗商品化。

在通用場景——基礎問答、內容摘要、簡單翻譯——Token的質量差異已經很小，競爭邏輯接近大宗商品：誰的能源最便宜、演算法最高效，誰的Token就最有價格競爭力。這個市場裡，定價權分散，利潤薄，拼的是成本結構。

中國在這條路徑上有真實優勢：西部綠電成本低至每度0.3元以下，DeepSeek已經驗證低成本高性能的可行性，中國模型在OpenRouter平台前十名中已佔據絕對的Token消耗份額。底層大宗商品化，是中國的主場。

終局B：頂層分層壟斷。

在高價值場景——複雜推理、即時程式碼生成、長上下文Agent工作流——Token的質量差異決定了商業價值。這些場景對低延遲、高能效的要求極高，只有最先進的晶片和最強的模型才能服務。黃仁勳在GTC 2026上展示的五層定價體系——從免費層到$150/百萬Token的超高速層——正是為這個市場設計的。Vera Rubin GPU與Groq LPU的異構推理架構，能夠實現每瓦特35倍於純GPU方案的吞吐量，專門解鎖$45到$150這兩個高價值定價層級。

在這條路徑上，定價權集中於兩類玩家：控制頂尖晶片的硬體廠商，以及擁有最強模型能力的閉源廠商。但這個集中是動態的——自研ASIC增速是GPU的近三倍，開源模型的能力追趕速度持續超出預期。

兩種終局同時存在，共同構成Token經濟的定價權地形圖。

對中國而言，戰略選擇需要誠實地分層評估：

在終局A的底層市場，中國有真實的結構性優勢。能源成本低、演算法效率高、已有規模化的全球呼叫份額。這是中國能打且正在打贏的仗。

在終局B的頂層市場，中國面臨的挑戰更大。晶片制裁、CUDA生態壁壘、頂尖模型的能力差距，每一項都不是短期能解決的。國產推理晶片在推理側的追趕比訓練側更有希望，但從”可用”到”最優”之間，仍然需要持續投入。

當然，這個框架有一個它尚未回答的問題：如果入口層——Google的搜尋、蘋果的裝置、字節的超級App——最終成為AI價值鏈中利潤最厚的一環，誰離使用者最近，誰就可能重新定義整場遊戲的規則。但這個問題的展開，已經超出了Token定價權的分析邊界——它指向的是AI時代更深層的權力重組，也是這個系列後續值得追問的方向。

經濟裡，定價權不是一次性的勝利，而是需要持續守護的位置。今天的護城河，可能是明天的陷阱。今天的劣勢，也可能是明天的轉機。 (二進制朋友)

科技