2025 年8 月5 日,無疑是具有里程碑意義的一天。北京昇騰計算產業發展峰會上,華為輪值董事長徐直軍宣佈:昇騰AI核心軟體平台CANN將全面開源。並Mind系列應用套件及工具鏈同步開放,支援開發者深度定製。
華為將CANN程式碼庫向全球開發者敞開,恰如當年Linux打破作業系統霸權。是中國AI 算力產業的一座燈塔,照亮了國產算力突破技術封鎖、實現自主創新的前行道路。徐直軍說,“使能每一位創新者”,正在將算力主權交還人類。
這一決定被業界視為中國AI算力生態的“原子彈時刻”——在輝達CUDA生態壟斷全球AI計算二十年後,中國首次擁有了從晶片、框架到應用的全端開源生態。輝達的“CUDA帝國”似乎聽到了圍牆開裂的聲音。
輝達的護城河從來不是硬體,而是近二十年建構的CUDA開發者生態,在全球數百萬開發者形成的“細胞記憶”,讓即使性能接近的國產晶片也難以撬動市場。華為此次開源,正是瞄準這一核心痛點。打破輝達生態壟斷。
長期以來,輝達憑藉其成熟的CUDA 生態系統,在全球AI 算力市場佔據著近乎壟斷的地位。CUDA 將輝達的GPU 硬體與軟體開發環境緊密結合,為開發者提供了高效的程式設計模型和豐富的工具庫,吸引了全球600 多萬開發者投身其中,建構起了一道難以踰越的技術壁壘。
這一封閉生態雖然推動了AI 技術的早期發展,卻也帶來了高昂的硬體成本、嚴苛的技術鎖定以及潛在的供應鏈風險。2023 - 2024 年間,輝達推出專為中國市場定製的A800/H800 系列,後又將其列入管制清單,2025 年H20 晶片的禁售與解禁反覆,充分彰顯了這場技術博弈的複雜性與激烈性。對中國AI 產業而言,過度依賴輝達技術,猶如在咽喉處懸了一把利刃,嚴重制約著產業的自主可控發展。
CANN 的全面開源開放,為中國AI 產業提供了打破這一壟斷格局的利刃。通過開放其核心技術,使得開發者無需再受限於輝達的技術體系,能夠直接對昇騰硬體的底層算力進行呼叫與最佳化,打破以往依賴輝達GPU 時的性能瓶頸。
在編譯器生態方面,華為畢昇編譯器開放AscendNPU IR 介面,這一舉措更是具有變革性意義。讓國產AI 開發體系擺脫了對國外編譯器技術的依賴,在技術創新的道路上輕裝上陣。
CANN開源不僅是技術事件,更在重構全球AI權力結構,開啟中國AI 算力新紀元。2025 年 CANN 開源,或將成為中國算力生態的“新原點”。
短期看,CUDA仍主導歐美市場,而CANN+昇騰成為中國及新興市場首選,新興國家據成本與政策靈活選擇。多元競爭推動全球算力價格下行,預計五年內AI訓練成本降低30%以上。
2025年中國算力生態正從碎片化走向整合。華為昇騰、沐曦、壁仞科技等國產晶片廠商罕見聯手,避免生態內耗。昇騰已在中國移動AI裝置集采拿下70%份額,並賦能東方國信、直真科技等開發行業方案,邊緣場景開發周期縮短50%。
2024年,華為昇騰910C 在實測中展現出超越輝達H100 的效率,其先進的架構設計與強大的計算能力,為中國AI 算力提供了堅實支撐。天數智芯的天垓 100 晶片在金融領域市佔率突破15%,憑藉對金融場景的深度最佳化,實現了高效的算力輸出。寒武紀思元590 更是以驚人的42.3 倍季度營收增長,印證了國產 AI 晶片的市場競爭力。
據IDC 資料顯示,2025 年上半年國產算力佔比已躍升至42%,較2022 年大幅提升近 30 個百分點,這一資料直觀地反映出國產算力在技術封鎖下的逆襲態勢。
全端自主生態的建構
在晶片設計環節,寒武紀、沐曦、壁仞等企業不斷髮力。寒武紀持續迭代思元系列晶片,在智能安防、智能駕駛等多領域廣泛應用;沐曦推出的曦雲C600 GPU,實現從設計到封裝的 100% 國產供應鏈閉環,性能對標國際旗艦產品;壁仞科技自主原創架構的大算力通用GPU 液冷模組壁勵166L,為超節點建設提供核心動力。
晶片製造層面,中芯國際取得重大突破。通過自研蝕刻補償演算法和對DUV 裝置的改造,在無 EUV 光刻機的情況下成功實現5 奈米工藝驗證,量產良率達92%,超越台積電初代5 奈米水平,為國產AI 晶片製造奠定了堅實基礎,有力保障了晶片供應的自主性與穩定性。
華為昇騰384 超節點在 2025 世界人工智慧大會上驚豔亮相。它整合384 顆升騰NPU 和192 顆鯤鵬CPU,總算力達300PFlops,超越輝達GB200 NVL72 系統。
其創新採用的MatrixLink 全對等互聯技術,將晶片間通訊頻寬提升至 269TB/s,是傳統方案的數倍,有效打破跨機通訊瓶頸,使千億級模型性能提升2.5 倍以上,為大規模 AI 訓練與推理提供了強大動力。
光互連技術也取得重大突破。曦智科技聯合壁仞科技、中興推出全球首款分佈式光交換(dOCS)超節點,採用矽光晶片實現GPU 間光互連。極大提升了算力叢集的靈活性與可擴展性。
新興算力探索同樣成果豐碩。浙江大學研發的“悟空” 類腦電腦,擁有超20 億神經元,規模接近獼猴大腦,運行功耗僅2 千瓦,卻能實現複雜邏輯推理、語言理解等功能,為AI 算力架構提供了全新思路,開闢了類腦計算的新賽道;
本源悟空量子電腦成功完成全球首個十億參數AI 模型微調任務,能耗降低70%,訓練效率提升數百倍,實現量子計算與AI 的深度融合,有望為AI 算力帶來顛覆性變革。
全球格局中的中國力量
在全球AI 算力格局中,中國正從追隨者逐步轉變為引領者。中國智能算力規模預計2025 年達1037.3EFLOPS,全球佔比超25%,2026 年將翻倍至1460.3EFLOPS,成為全球智能算力增長的重要引擎。
牛津大學報告顯示,中國擁有22 座AI 算力工廠,其中3 座完全採用華為晶片,在全球130 座工廠中佔比17%,彰顯了中國在AI 算力基礎設施建設方面的強大實力。
全球變局之下,中國AI 算力全端崛起已成為不可阻擋的趨勢。從技術突破到生態建構,從產業協同到政策支援,中國正全方位打造具有國際競爭力的AI 算力產業體系。 (製造界)