比肩輝達H20!阿里自研PPU浮出水面

這款備受業界矚目的PPU,此前已被央視《新聞聯播》曝光,如今正式揭開面紗。

1月29日,阿里巴巴旗下半導體公司平頭哥在官網上線了其高端AI晶 片“真武810E”的詳細資訊。

此次發佈的不僅是單一產品,更是意味著由通義實驗室、阿里雲和平頭哥共同構成的阿里巴巴AI戰略核心——“通雲哥”協同體系的首次公開亮相,展示了阿里在AI時代從底層算力、雲端運算平台到頂層大模型應用的全端自研實力。

(圖源:平頭哥官網)

1. 全端自研,賦能400+行業客戶

“真武810E”是一款實現從硬體到軟體全端自研的高端AI晶片。目前,該晶片已在阿里雲上完成了多個萬卡叢集的規模化部署,並成功服務於國家電網、中科院、小鵬汽車、新浪微博等超過400家行業客戶,覆蓋了科研、能源、汽車、網際網路等多個關鍵領域。

該晶片的核心技術優勢體現在:

先進架構:採用自研的平行計算架構和ICN(Inter-Chip-Network)片間互聯技術,配合全端自研軟體棧,打通軟硬體壁壘。

超大記憶體:整合HBM2e記憶體,容量高達96GB,滿足大模型訓練與推理的海量資料吞吐需求。

高速互聯:支援7個獨立ICN鏈路,片間互聯頻寬達到700GB/s,可靈活配置多卡組合,輕鬆應對大規模叢集擴展。

生態友好:全面相容主流AI生態,並提供原始碼級編譯能力與統一程式設計介面,極大降低了使用者的遷移和二次開發門檻。

2. 實測表現卓越,瞄準核心AI場景

經驗證,“真武810E”在實際應用中表現突出:

  • 自動駕駛:相容超過50個常見模型,泛化性強,絕大多數模型無需特殊適配,既便於客戶自服務,也降低了技術外洩風險。
  • AI訓練:通過軟硬協同最佳化,有效解決大規模訓練中的通訊瓶頸,高效適配各類主流模型、框架與算子庫,顯著加速訓練迭代。
  • AI推理:不僅支援主流推理引擎,還提供自研的專用推理框架和算子庫,為推理場景提供針對性極致最佳化。
  • 多模態生成:結合強大的AI算力與硬體級視訊編解碼能力,在文生視訊、圖文生成等前沿場景的推理與訓練中均展現出卓越性能。
(圖源:平頭哥官網)

“真武810E”的強勁性能,源於其底層採用的創新PPU架構。這是一種專門為AI計算設計的新型晶片架構,它採用了獨特的機率計算方法,能夠在處理複雜的AI任務時實現更高的效率和更低的功耗。外媒“The Information”此前爆料,平頭哥研發的第一代PPU性能可匹敵輝達暢銷的H20,而升級版的PPU性能則比輝達A100更強。另據業內人士透露,相比輝達H20晶片,平頭哥PPU性價比更高、能效高,特別在AI推理場景下表現突出。

3. “芯”路歷程,注入新活力

自2018年9月成立以來,平頭哥作為阿里全資的晶片業務主體,已建構起端雲一體的完整產品線,涵蓋資料中心晶片、IoT晶片等,實現晶片端到端設計鏈路全覆蓋。

2019年,平頭哥推出AI推理晶片含光800,推理性能達到78563 IPS,每秒可處理7.8萬張圖片,創造了當時同類晶片的性能和能效比兩項第一。

2021年,平頭哥發佈阿里首個通用伺服器晶片倚天710,性能超過同期業界標竿20%,能效比提升超50%。

(圖源:平頭哥官網)

此外,在儲存晶片方面,鎮岳 510 SSD 主控晶片已成功落地;在終端側,羽陣IoT晶片已實現數億顆出貨;網路晶片領域,資料中心核心場景的晶片佈局已基本成型。

近期,多方消息顯示,阿里巴巴集團已決定支援平頭哥探索未來獨立上市的路徑。公司計畫先進行內部重組,引入員工持股,再擇機啟動IPO。這一戰略舉措,無疑將為平頭哥在激烈的全球晶片競爭中注入新的活力與發展空間。目前,具體上市時間還未確定。

4. 寫在最後

隨著“真武810E”的正式亮相與“通雲哥”體系的協同發力,阿里巴巴正將其在AI時代的全端自研技術實力清晰呈現,為中國在全球AI算力競賽中增添了重要籌碼。 (芯師爺)