打破輝達壟斷!華為把 AI 晶片核心系統全開源,中國終於有了自己的 "CUDA"

2026年5月的昇騰AI開發者峰會上,最受行業關注的不是新晶片發佈,是華為CANN全面開源開放的消息。

很多人對這個名字陌生,換個說法就懂了。它就是AI晶片的“通用作業系統”,是連接上層AI應用和底層晶片的核心橋樑。過去十幾年,整個AI行業的開發者,都只能用輝達的CUDA這套系統。沒有這套系統,再強的晶片也跑不起來大模型,發揮不出性能。

這也是過去國產AI晶片最大的尷尬。硬體性能追上來了,軟體生態卻跟不上,開發者用起來太麻煩,願意用的人少,晶片再好也沒用。

這次華為把CANN全面開源,就是把自己打磨了多年的這套核心系統,免費開放給全行業用。這件事的影響,遠不止華為一家的生態建設,是整個國產晶片生態的轉折點。

過去國產晶片的難,不在硬體在生態

很多人以為國產AI晶片的瓶頸在製程,在性能。實際行業裡最頭疼的,是開發門檻太高。

同樣一個大模型,在輝達的平台上拿來就能跑,直接用現成的工具和程式碼。換到國產晶片平台上,要重新適配,改程式碼,調性能,少則一兩個月,多則大半年。大部分開發者沒這個時間和精力,最後還是選擇用成熟的國外平台。

不是國產晶片性能不夠,是沒有一套通用、好用的軟體系統,把開發者的使用門檻降下來。晶片造出來沒人用,生態就起不來,生態起不來,就沒人願意繼續投入最佳化,陷入死循環。

過去華為的CANN也只是自己用,只適配自家的昇騰晶片。開發者要想用,就得單獨學一套新的開發流程,和自己平時用的工具不相容。很多人寧願多花錢,也不想折騰。

這次開源,是把核心家底全拿出來了

這次的全面開源,不是開放幾個表面介面,是從底層到上層,全端開放。

目前已經開放了50多個程式碼倉庫,800多個經過深度最佳化的高性能算子。從最底層的驅動、執行階段,到編譯器、任務調度器,再到上層的算子庫、通訊庫,所有核心程式碼全部公開。任何人都可以免費拿到,根據自己的需求修改、最佳化、定製。

最實在的一點,是和大家平時用的開發工具完全打通。現在CANN已經和PyTorch的2300多個API完全對齊,20多個主流大模型拿來就能直接用,不用再做大規模的程式碼修改。習慣了輝達開發模式的開發者,幾乎不用額外學習,就能直接在昇騰的平台上做開發。

華為還配套開放了全套的開發工具鏈,寫算子的難度直接降了一大截。以前開發一個高性能算子要兩周時間,現在用現成的範本,3天就能做完。為了支援開發者,華為每年投入1500P的算力,還有3萬塊開發板,免費給社區使用。

截止到今年2月,已經有60多家企業和客戶,基於開放原始碼的CANN自主開發了420多個高性能算子。不是只有華為自己在做,是全行業都能參與進來一起最佳化。

最直接的變化,開發者不用再做二選一

過去開發者做AI開發,一直要做一道選擇題。要麼用輝達的平台,享受成熟的生態,但是成本高,還隨時有斷供的風險。要麼用國產晶片,成本低,自主可控,但是開發麻煩,生態不完善。

很多企業和開發者,不是不想用國產晶片,是切換的成本太高,承擔不起。

CANN全面開源之後,這道選擇題就不存在了。開發者用自己熟悉的工具,熟悉的開發流程,寫出來的程式碼,既能在輝達的平台上跑,也能在昇騰的平台上跑,還能適配其他的國產晶片。不用再單獨為某一個平台做定製開發,切換成本幾乎為零。

對中小開發者來說,不用再被繫結在某一家的生態裡,有了更多的選擇。對企業來說,不用再擔心被單一供應商卡脖子,算力採購的成本也能降下來。現在昇騰的開發者數量已經超過400萬,合作夥伴超過3000家,這個數字還在快速增長。

這件事,受益的是整個國產晶片行業

很多人覺得,CANN開源只是華為自己的事。其實不是,這件事最大的意義,是給整個國產晶片行業做了一套公共的基礎軟體。

以前每一家國產晶片廠商,都要自己從零開始做軟體棧,做編譯器,做算子庫,投入大,周期長,還做不好。現在CANN全面開源了,所有晶片廠商都可以基於這套開放原始碼的架構,適配自己的晶片,不用再重複造輪子。整個行業的研發成本,能降下來一大截。

過去整個AI行業的標準,都是輝達定的。現在我們有了自己的開源開放的軟體架構,全行業一起參與,一起定義技術標準,一起最佳化性能。不用再跟著別人的規則走,也不用再擔心別人閉源、斷供。

這不是要替代誰,是給整個行業多了一個選擇。一套開放、免費、自主可控的基礎軟體,能讓所有國產晶片廠商都受益,也能讓所有開發者都受益。國產晶片的生態,終於不用再各自為戰,有了統一的基礎。

AI產業的競爭,從來都不是單一晶片的競爭,是整個生態的競爭。CANN的全面開源,不是結束,是國產AI生態真正走向開放共建的開始。 (豚基Wisebase)