華爾街日報最新消息:
阿里巴巴正在開發的新一代AI晶片聚焦多功能推理場景,核心目標是填補輝達H20退出後的市場空白。該晶片採用國產14nm或更先進製程(由長江儲存等本土代工廠支援),通過異構計算架構整合高密度計算單元和大容量記憶體(預計LPDDR5X頻寬超1TB/s),單卡算力目標達到300-400TOPS(INT8),與H20(約300TOPS)基本持平。
與輝達H20相比,阿里晶片的核心優勢在於全場景相容性:不僅支援FP8/FP16混合精度計算,還通過動態指令翻譯層實現與CUDA生態的無縫對接,工程師可直接復用現有程式碼,遷移成本降低70%以上。例如,阿里雲已在通義千問大模型推理環節部署寒武紀思元370晶片,通過MagicMind工具鏈實現模型轉換效率提升3倍。
面對H20斷供,阿里緊急追加寒武紀思元370訂單至X萬片(數量有爭議)這款基於7nm工藝的晶片採用Chiplet技術,整合390億電晶體,實測算力達300TOPS(INT8),在ResNet-50等典型模型上的性能與H20持平,能效比提升40%。其核心價值在於快速填補算力缺口:截至2025年Q2,思元370已覆蓋阿里雲60%的推理需求,並通過PCIe 5.0介面實現多卡互聯,支撐通義千問的使用者增長。
阿里與長江儲存合作研發的基於國產製程的AI晶片,重點突破儲存瓶頸。長江儲存的294層3D NAND技術已實現20GB/mm²儲存密度和7000MB/s讀寫速度,較上一代提升40%,使AI晶片的本地儲存容量擴大至128GB,減少對外部儲存的依賴。
為確保晶片量產,阿里採用雙代工廠備份策略:
成熟製程:中芯國際14nm產線承擔基礎晶片生產,良率穩定在95%以上,月產能達5萬片。
先進製程:據傳正在與某半導體合作開發7nm工藝,預計幾年以後量產,目標算力突破500TOPS,能效比提升30%。
阿里的晶片的三步走戰略
短期(2025-2026):聚焦7nm/14nm工藝的推理晶片,通過相容生態快速搶佔市場份額。
中期(2027-2028):推出4nm工藝的訓練晶片,支援千卡級叢集互聯,目標算力達1EFLOPS,對標輝達H100。
長期(2030後):探索光子計算、存算一體等顛覆性技術,阿里雲已發佈全球首款商用光子AI晶片,速度較GPU提升1000倍,功耗降低90%。
阿里巴巴的國產算力突圍之路,本質是一場技術攻堅與生態重構的雙重戰役。通過“相容-替代-超越”的三步走策略,阿里正在打破輝達的壟斷格局。儘管面臨性能、生態和地緣政治的多重挑戰,但其與寒武紀、長江儲存等產業鏈夥伴的深度協同,以及對RISC-V、光子計算等前沿技術的佈局,為中國AI晶片的自主可控提供了可行路徑。未來兩年將是關鍵窗口期,若阿里能在2026年前實現4nm訓練晶片量產,有望在全球算力競爭中佔據更主動的地位。 (IT前哨站)