三枚訊號彈,美國算力過剩了?

Fable 5解禁 · 中國碾壓 · Meta入局

AI權力正在發生什麼轉移?

2026年7月1日,三枚訊號彈幾乎同時升空。單獨看每一枚都不致命。放在一起看,指向同一個拐點。蔡博用說人話的方式,把這三件事串成一條線——前半部分給你講明白發生了什麼,後半部分給需要查資料的人備好完整資料、論證邏輯和30條參考文獻。

📖 前半部分 · 說人話版

01. 這一周,三件事在同一條線上炸了

第一件。美國商務部正式解除對Anthropic Fable 5的出口限制。7月2日起全球恢復訪問。

第二件。中國大模型推理呼叫量連續九周碾壓美國。全球前三,全是中國的。

第三件。Meta宣佈籌建雲基礎設施業務——說白了,自己囤的GPU用不完,準備往外租。

💡 蔡博給你打個比方

把AI產業想像成一場三國演義。美國——最早做大模型的蜀國,五虎上將全在,但糧草(算力)越來越貴,地盤(市場)不斷被蠶食。中國——後起之秀的魏國,武將不比蜀國差多少,關鍵是地盤大、人口多、糧草便宜,而且還在降價。Meta——夾在中間的吳國,本來只管自己練兵,現在發現倉庫裡的糧草多到發霉,乾脆開個糧店賣給別人。

三件事在同一天爆出來,不是巧合。

02. Fable 5解禁——表面贏了安全,骨子裡輸了時間

先看時間線:

6月12日 — BIS禁令,Fable 5全球關停

6月19日 — GLM-5.2開源上線

6月27日 — 有限鬆綁,100+機構可用

6月30日 — 全面撤銷出口限制

7月1日 — Anthropic官宣恢復

19天。中間發生了什麼?GLM-5.2開源後兩周,呼叫量爆漲66%。Coinbase宣佈改用中國開源模型,算力成本減半。

💡 蔡博給你打個比方

就好像你開了一家奶茶店,突然不讓賣招牌款了。你以為隔壁的競爭對手做不出同款,結果人家不僅做出來了,價格只要你三分之一,還免費送配方。關鍵是,客人們排著隊去買。你算了一筆帳——再不把招牌款擺出來,店就要被隔壁吃光了。於是你"有條件地恢復銷售"。但你心裡清楚:最致命的條件不是安全,是市場不等人

"政府連清晰的安全標準都沒定義出來——沒標準的許可制度,讓每一次模型發佈都變成即興談判。"

—— 前白宮AI顧問 Dean Ball

這不是安全框架的成熟,這是競爭邏輯的破產。

03. 中國推理呼叫量——你以為是"偷襲",其實是"圍城"

先上數字。全球一周總呼叫量:46.7兆Token

20.39兆

中國(43.7%)

4.25兆

美國(9.1%)

72%→33%

美國份額一年變化

一年跌了39個百分點。全球呼叫量前三:DeepSeek V4、小米MiMo-V2.5、MiniMax M3。全是中國的。

💡 蔡博給你打個比方

把Token想像成"AI世界的石油消耗量"。一年前,全球每加侖石油,72%是美國車燒掉的。今天,只剩33%。不是美國車變差了——福特、特斯拉仍然是最好的車。問題是:中國造的電動車,80%的路況都能跑,但每公里成本只有美國車的十分之一,還開源送圖紙。於是全世界的司機都在做同一件事:日常通勤開中國車,只有飆越野時才開美國車。這不是中國贏了"發動機大賽"。這是比賽從"誰發動機最強"變成了"誰每公里成本最低"——規則一換,翻了天。

04. Meta入局算力租賃——最大的買家,開始賣貨了

Meta今年的AI資本開支:1250到1450億美元。祖克柏的經典操作:先搶了再說,管他用不用得上。現在他宣佈:多餘的算力,準備出租。

兩條路線:要麼像AWS Bedrock一樣,幫你託管模型收呼叫費;要麼像CoreWeave一樣,直接租裸GPU給你。消息一出,Meta盤前漲了5%以上

💡 蔡博給你打個比方

你家裝修買了一大堆工具——電鑽、切割機、打磨機。一開始你想"以後總用得上",結果發現一年就用了一次。於是你掛到閒魚上:「閒置電鑽出租,日租50。」不是因為你不想用電鑽了。是因為你發現——買多了

Meta告訴市場的事,比任何分析師預測都更誠實:算力過剩了。高盛的警告越來越具體——第一個削減CapEx的巨頭出現時,全市場將重新定價。而Meta正在用行動說:那個"第一個",可能就是我自己。

05. 三件事串起來,就一句話

單看任何一個都不致命。放在一起看,指向同一個拐點:

AI產業的權力中心,正在從"誰有最好的模型"變成"誰有最大的市場和最低的成本"

Fable 5解禁——不是因為安全談妥了,是因為封鎖變成了自我制裁。

中國推理碾壓——不是因為模型更好,是因為中國把"夠用且便宜"規模化了。

Meta入局租賃——不是因為想做雲,是因為囤多了。

💡 蔡博給你打個比方

過去三年,大家玩的遊戲叫"誰家跑車跑得快"。現在換遊戲了,新遊戲叫"誰家停車場最大、停車費最便宜、還免費送地圖"。Fable 5是一輛頂級跑車。但全世界的司機發現——日常通勤用跑車,油費貴得離譜。新規則下,跑車好不好,沒那麼重要了。

📚 後半部分 · 需要查資料的人看這裡

資料一:全球AI大模型周呼叫量(2026年6月22日-28日)

資料二:Fable 5出口解禁時間線

資料三:Meta雲基礎設施業務

資料四:中美模型能力與定價對比

論證邏輯
  1. 底層病理:AI產業競爭範式從"能力密度競爭"轉向"成本+生態覆蓋競爭"
  2. 直接誘因:替代品迭代速度超過封鎖執行速度→解禁是止損
  3. 資料證據:72%→33%的份額崩塌,使用者用腳投票——價格優勢覆蓋了80%場景
  4. 宏觀訊號:最大買家公開承認算力過剩→算力從稀缺品變成可定價商品
  5. 綜合診斷:三者交匯於"推理定價權"的爭奪
方法論爭議
  1. OpenRouter資料是否代表全域? OpenRouter聚合了全球主要模型API,其使用者47%為美國開發者,偏向海外視角。國內實際呼叫量(含企業級、政務級)可能遠超統計口徑。
  2. "呼叫量=實力"的隱含假設。 呼叫量高不一定等於技術領先,可能反映低價策略下的使用者試用。但連續九周碾壓且份額持續擴大,說明"低價→資料→迭代→更好用"的正反饋已經啟動。
  3. Fable 5解禁的多因解釋。 本文強調競爭邏輯是主因,但安全妥協(Anthropic承諾主動檢測、上報)和行業壓力同樣是重要因素。
  4. Meta"算力過剩"的判斷。 Meta有閒置算力≠全域過剩。Google對Meta限流(6/28報導)與Meta宣佈雲業務(7/1)幾乎同時發生,說明"過剩"可能是內部調度問題而非行業特徵。
參考文獻

[1] OpenRouter. (2026-06-29). Weekly Model Usage Data

[2] ExponentialView. (2026-06-25). 2026 AI Economic State Report

[3] POLITICO. (2026-07-01). Trump lifts export restrictions on Anthropic's Fable 5

[4] Bloomberg. (2026-07-01). Meta Plans Cloud Business to Sell AI Computing Capacity

[5] IT之家. (2026-07-01). 消息稱Meta籌建雲服務業務

[6] 華爾街見聞. (2026-07-01). 美國對Fable 5頂尖模型"解禁"

[7] 華爾街見聞. (2026-07-01). Meta籌劃進軍雲端運算市場

[8] 新浪財經. (2026-06-30). 72%跌到33%:美國AI一年丟了半壁江山

[9] Anthropic Official. (2026-07-01). Fable 5 Access Restoration Announcement

[10] U.S. Department of Commerce, BIS. (2026-06-30). Letter to Anthropic

[11] Xi, Z., et al. (2026-06-17). GLM-5.2. Zhipu AI

[12] Financial Times. (2026-06-28). Google restricts Meta's Gemini compute

[13] 智譜AI. (2026-06-29). GLM-5.2安全測試登頂排行榜

[14] SemiAnalysis. (2026-06-26). H100 Ornn Index Report

[15] Dean Ball. (2026-07-01). Comment on Fable 5 export control regime

[16] Coinbase, Brian Armstrong. (2026-06-30). How to keep AI spend flat while token usage grows (蔡博說植物)