輝達之外,誰在重塑AI算力版圖?

在AI算力的競技場,輝達依舊佔據王座,但在它的陰影之外,一場悄然擴張的產業變革正在發生。新玩家、老對手、本土勢力……他們正以不同方式重構這片高性能計算的戰場。

一、AMD與英特爾:老將的新戰術

AMD:從追趕者到挑戰者

MI300系列佈局高端訓練市場:具備統一記憶體架構(CDNA3 + HBM3),大幅提升頻寬與吞吐效率,劍指H100。

  • 軟體生態補強:ROCm平台加速相容PyTorch、TensorFlow,向開發者靠攏。
  • 開放聯盟戰略:與超算中心、AI初創企業深度繫結,以性價比打開市場缺口。

英特爾:從“芯”出發再度歸來

Gaudi 3重構AI晶片格局:定位成本控制型推理加速器,與AWS等雲服務深度合作。

  • oneAPI推動異構計算標準化:簡化多架構程式碼遷移難題,為異構算力提供統一介面。
  • XPU戰略統一資源:整合CPU、GPU、FPGA、AI晶片能力,逐步建構智能算力全端生態。
輝達的霸主地位雖穩,但挑戰者已經不再仰望,而是正面迎擊。

二、中國力量:從追隨者走向自主創新

晶片層面:國產方案崛起

華為昇騰:昇騰910B與CANN架構緊密協同,已在央企、科研院所規模部署。

  • 寒武紀:思元系列進軍訓練與推理雙市場,逐步拓展高端通用場景。
  • 壁仞科技:BR系列對標A100,在圖像與視訊處理領域表現突出。

系統層面:建構自有平台生態

鵬城雲腦、中國智算中心等本土算力平台崛起:配套自主軟硬體體系,支援國產大模型訓練。

  • 作業系統與調度中介軟體國產化加速:崑崙調度、AIOS等助推整個平台棧國產替代。
不只是“造芯”,中國力量正在重構AI算力的系統性話語權。

三、雲廠商:自研晶片與AI原生基礎設施

海外巨頭

AWS Trainium/Inferentia系列:用於大規模訓練與低成本推理部署,繫結SageMaker生態閉環。

  • GoogleTPU v5e:最佳化Transformer架構執行,支援大模型微調與檢索增強生成(RAG)。

國內巨頭

阿里“倚天710”:基於Arm架構自研通用AI伺服器晶片,目標是“能訓能推、能雲能邊”。

  • 百度崑崙:持續演進中,已支援文心一言等千億參數模型落地。
雲廠商不再只是“算力賣家”,而是AI基礎設施的設計者與主導者。

四、軟體生態:打破輝達封鎖的關鍵一戰

ONNX/OpenXLA普及加快:支援多種後端算力平台的模型格式,讓模型跨晶片運行成為可能。

  • 深度編譯器框架(如TVM、XLA、MLIR)興起:使得不同架構間的適配效率大幅提升。
  • 調度平台開源化:如Ray、HuggingFace Accelerate助力多GPU/多節點部署更加便捷。
軟體的解耦能力,將決定誰能真正走出“輝達相容陷阱”。

短期看,輝達的生態優勢難以撼動,但產業已經顯現多元化的確定性訊號:晶片架構走向異構,平台能力走向自治,生態走向開放。未來AI算力市場的主旋律,或許不是“誰取代誰”,而是“群雄共治”的新格局。

當AI成為下一代通用技術,算力領域的開放與多元,才是推動科技文明演進的關鍵。 (AI算力那些事兒)