破局“後摩爾時代”與“Token危機”

破局“後摩爾時代”與“Token危機”:國產算力的軟硬協同與底層重構

人工智慧與具身智能在過去兩年高歌猛進,然而在其繁榮的表象之下,一堵由物理規律和經濟成本砌成的技術之牆正悄然迫近。具身智能裝置的規模化落地導致全網Token(詞元)需求量迎來指數級爆發,傳統的按Token付費模式與資料離散化拆解,正在讓大模型的運行成本逼近物理上限。行業內部,甚至出現了“Token必須死”的激烈論調。

面對算力高耗能、視訊記憶體頻寬受限、先進製程被外部卡脖子的多重圍城,中國硬科技產業正徹底告別單純“堆晶片”的線性思維。一條從底層理論重構、系統架構創新,到軟硬協同調優的差異化進階路徑,正在後摩爾時代強行破局。

* 配圖由AI生成、 僅作意境表達

# 換道超車:從“幾何縮微”到“時間縮微”的理論破局

長期以來,半導體行業被摩爾定律所代表的“幾何縮微”慣性所統治。人們習慣於認為,只有拿到最先進的奈米節點,才算拿到了高階智能推理的入場券。然而,當極限線寬逼近物理極限,EUV裝置折舊成本飆升,單純依靠縮小電晶體面積帶來的紅利已經趨於平緩。

面對這一制約,華為在2026年5月的國際電路與系統研討會上正式發佈了半導體領域的“韜($\tau$)定律”,提出以“時間縮微”替代傳統“幾何縮微”。

# 何謂“韜定律”?

“韜定律”不再一味盯著“把零件做精細”,而是追求“讓整套系統更聰明”。它將“時間”本身而非面積作為衡量進步的核心指標。通過Logic Folding(邏輯折疊)和3D堆疊技術,在固定的器件節點下實現電晶體密度和能效的跳躍式躍升。

依託這套重構的底層理論,華為在過去6年間低調量產了381款晶片。預計到2031年,基於韜定律的高端晶片電晶體密度將達到等效1.4奈米製程的水平。這種“換道超車”的邏輯證明,不依賴海外頂級先進製程,國產晶片同樣能夠完成商業閉環與性能演進。

資本市場給出了最誠實的反饋。近期,寒武紀市值突破9000億元,一季度首次實現大規模盈利;中芯國際等晶片全產業鏈景氣度拉滿,國產AI晶片已徹底擺脫早期的概念炒作,迎來了業績兌現的黃金周期。

* 配圖由AI生成、 僅作意境表達

# 以存強算:解決視訊記憶體頻寬短板的架構創新

具身智能和通用AI體(Agent)的持續落地,考驗的不僅是算力晶片的算力上限(FLOPS),更是視訊記憶體與頻寬的傳輸極限。在傳統的馮·諾依曼架構下,“資料傳輸速度慢於計算速度”導致的“功耗牆”和“記憶體牆”在國產硬體上表現得尤為突出。

針對這一痛點,清華大學鄭緯民院士團隊提出了自研的Mooncake(月餅)架構

Mooncake架構的核心邏輯在於“以存強算”與“以存換算”。在AI推理服務中,長記憶儲存和記憶體型長序列支援被推到了核心位置。Mooncake通過重新設計AI儲存與算力調度系統,最佳化了海量上下文的視訊記憶體利用率,極大地壓縮了推理成本。它將原本散落的、高能耗的計算邏輯,轉化為可預測的儲存讀取,為本土產業搭建起了一個適配真實應用場景的高效算力底座。

與此同時,SK海力士等儲存巨頭推出的iHBM控溫散熱技術,可讓產品熱阻降低30%以上,同樣在硬體封裝體繫上緩解了AI算力叢集的散熱和部署成本問題。這種從架構到元件的協同創新,正在將算力從“高高在上的實驗室奢侈品”轉化為“民用級可負擔的普惠資源”。

# 軟硬協同:低位元訓練系統的工程落地

如果說晶片理論和硬體架構是“骨架”,那麼軟體框架與大模型演算法的協同就是“血肉”。

此前,行業從業者痛陳“大模型處理離散Token的收費模式讓高階任務成本居高不下,且詞元拆解存在天然的資訊冗餘”。為了殺死這種算力浪費,面壁智能、清華大學與OpenBMB聯合發佈了BitCPM-CANN(昇騰NPU原生低位元訓練系統)

這是國產算力平台上首個公開的、端到端完成1.58-bit(三值量化)訓練並在8B大模型等級上落地驗證的系統成果。

傳統大模型訓練 (FP16/BF16 精度) ────> 視訊記憶體佔用高、頻寬壓力大、成本高昂

(軟硬深度協同協同)

1.58-bit 三值量化訓練 (BitCPM-CANN) ────> 視訊記憶體降低 5/6、推理成本大幅下探

傳統的模型訓練需要16位浮點數(FP16),而1.58-bit訓練系統通過極端量化,讓推理視訊記憶體直接省去五分之六。這套系統實現了國產NPU、國產模型與國產訓練框架的完整閉環。

無獨有偶,國產推理晶片新秀墨芯人工智慧,也依靠其“雙稀疏演算法”最佳化計算模式,在底層剔除無效計算,主打大幅降低AI推理成本。阿里玄鐵9系列處理器同樣完成了Android16的適配,原生支援千億參數大模型。這些案例無一不在揭示一個產業真相:演算法的輕量化重構與硬體的深度適配,能夠讓低精度訓練迸發出等效高精度的工程能量。

* 配圖由AI生成、 僅作意境表達

# 中國AI算力的新常態

過去,國內晶片產業與大模型技術始終處於跟隨狀態,受制於海外裝置與技術壁壘,迭代處處受限。而如今,這一窘境正被全鏈路的自主化升級打破。

從華為“韜定律”對底層規則的重新定義,到鄭緯民院士Mooncake架構對儲存底座的重塑,再到面壁智能低位元訓練系統的軟硬協同閉環,國內科技企業正避開正面技術內卷,用差異化路徑破解卡脖子難題。

後摩爾時代,算力競爭的終局不再是盲目堆砌奈米數字。理論重構、架構創新、軟硬一體、業績兌現——這四大維度的聯動優勢,正讓國產算力走出圍城,為中國AI與具身智能的高速狂奔,築起真正牢固的數字地基。 (智點)