2.87倍性能、價格僅四分之一,華為昇騰950攻入韓國,NVIDIA的CUDA壁壘迎來最有力挑戰

從吹風到落地,剛好半年

2026年7月1日,華為中央(Huawei Central)和集邦諮詢新聞(TrendForce News)援引韓聯社、《電子時報》等多家韓媒消息,華為正準備在今年第四季度向韓國市場正式投放昇騰系列AI晶片及Atlas計算平台。

半年前的2025年12月26日,華為韓國CEO王伯良在首爾一場發佈會上對《韓國時報》說:“華為希望明年在韓國推出我們最新的人工智慧晶片,全面進軍本地AI基礎設施市場,目標是成為NVIDIA的替代方案。”

現在,真的兌現中。

2.87倍、四分之一,這帳什麼來頭

核心產品是兩款晶片——昇騰950DT(面向AI訓練最佳化)和昇騰950PR,以及叢集系統Atlas 950 SuperPod,最多可擴展至8192顆昇騰晶片。華為給出的數字很亮眼:昇騰950PR的推理性能,達到NVIDIA H20的2.87倍,價格約為後者的四分之一。

H20是NVIDIA為應對中美科技博弈專門設計的合規特供版GPU,算力經過大幅閹割,僅在中國大陸市場銷售。

而韓國市場用的是NVIDIA完整版H100/B200系列。

但,這是個實事求是的資料,吸引力在於多元體系和地緣新選擇。

昇騰950

昇騰950PR於2026年3月21日隨Atlas 350平台在中國首發,搭載自研達文西3.0架構,單片設計。FP4精度算力1.56 PFLOPS,FP8約1 PFLOPS,112 GB自研HIBL 1.0高頻寬記憶體,記憶體頻寬1.4 TB/s,片間互聯採用靈渠技術,速度2 TB/s,TDP 600W。

與之對比,NVIDIA H20的FP4算力約0.56 PFLOPS,記憶體頻寬4.0 TB/s,TDP約400W。

雙方的取捨完全不同:NVIDIA繼續在記憶體頻寬上大幅領先,這對大模型訓練很吃重;華為則把純算力密度和互聯速度做得更突出,更適合推理與推薦系統這類延遲敏感的場景。一個細節是,昇騰950PR將記憶體訪問粒度從512字節縮減到128字節,專門最佳化Transformer注意力機制裡的小張量運算。上述參數來自公開規格表對比,部分為社區估算。

2026年4月,昇騰910C已進入量產,950PR和950DT也計畫在今年第四季度量產。韓國市場的投放節奏幾乎與國內同步,不存在什麼“拿上代產品敲海外市場大門”的老故事。

搭檔不是三星,是一家安防公司

在韓國,華為選了SK Shieldus做本地分銷合作夥伴。SK Shieldus是安全服務與ICT基礎設施領域的公司,跟華為有長期合作。這步棋很務實:不急求三星或SK海力士這類半導體巨頭的背書,先通過ICT管道商切入,壓低地緣敏感度,測一測市場水溫。

韓國市場為何可能接這張牌

韓國AI市場本身也在膨脹。集邦諮詢去年的一份報告預計,韓國AI市場總規模2024年為54.7億美元,到2025年增至71.7億美元,2032年將達到538.7億美元,年複合增長率33.4%。

另據相關市場研究資料,邊緣AI加速器市場2024年收入8470萬美元,預計2030年達到5.101億美元,CAGR 35%。韓國的製造業、金融、醫療、零售,正在經歷一波AI基礎設施換裝。首爾、仁川松島等地在建高密度GPU叢集——Princeton Digital Group單個園區IT容量規劃500兆瓦,ESR的KR1設施也規劃了80兆瓦。

NVIDIA供貨緊張,全端成本高昂:H100單卡公開報價超過3萬美元,B200超過4萬美元。這讓韓國企業開始有商業上的動機,找一個第二供應商,不全是地緣站隊問題。

坎兒

商業動機只是入場券。華為面前還有二道考驗。

第一道:軟體生態

NVIDIA的CUDA積累十餘年,在全球AI開發者社群里根扎得極深。華為的昇騰生態基於自研CANN計算架構和昇思MindSpore框架,儘管已在DeepSeek V4等系統中實際部署驗證,但第三方應用豐富度、偵錯工具鏈成熟度、社區活躍度,跟CUDA之間肉眼可見的有差距。韓國開發者社群偏向美系技術堆疊,Naver Cloud和Kakao Enterprise的AI雲平台也都圍繞NVIDIA在轉。華為得在韓國搭本地技術團隊,慢慢“養生態”——這比賣晶片本身還磨人。

第二道:華盛頓干預

《首爾經濟》在相關報導中提到,美國商務部已將出口管制延伸至海外子公司,限制中國公司獲取源自美國技術的AI半導體。雖然昇騰系列不含任何美國受限技術,但韓國身為美國盟友,本土企業採購中國AI晶片,會不會在美韓情報協議、技術合作框架下招來華盛頓的不滿甚至間接壓力,這個問題現在還懸著。SK Shieldus這類ICT服務商在商業合同層面能自主決策,但日後若華為想切進韓國三大電信營運商或政府公共資料中心項目,這個話題很難繞得過去。

韓國本身角色也充滿矛盾。它既是美國軍事盟友,又是全球最大儲存晶片產地——三星和SK海力士的HBM3/HBM3e,正是NVIDIA H100和B200的核心元件。現在華為帶著自研HIBL記憶體進入韓國,雖然不直接衝擊兩大儲存巨頭的全球HBM業務,但在AI計算子系統層面,等於在韓國本土給了客戶一條“去NVIDIA化”的選項。這個動作,本身就碰觸了供應鏈結構最敏感的神經。

Q4見真章

美國商務部對華為的打壓自2019年起層層加碼,禁止其獲取先進製程晶圓代工服務和含美國技術的半導體。結果,華為在2026年端出了自研HIBL記憶體、靈渠互聯、達文西3.0架構的全自研AI晶片,並在韓國這個高度依賴NVIDIA的成熟市場擺下擂台。

華為給出的市場定位很清楚:不是在所有場景替代輝達,而是低調表示“在NVIDIA供應緊張時,提供可擴展的AI叢集選項”。但配上2.87倍性能與四分之一價格的宣傳,商業刀鋒已經很利。

韓國需不需要這個選項?本土AI晶片創業公司FuriosaAI在搞低功耗邊緣AI加速器,Nota Inc.做AI模型最佳化平台技術,但這些產品集中在推理和邊緣場景,還沒碰大規模資料中心訓練叢集。華為端上來的是一整套從單卡到萬卡叢集的完整方案,正好填了韓國尚不能自給的空白。

ETNews和韓聯社的報導顯示,華為韓國已開始對本地合作夥伴進行技術培訓和商務路演,同步開發針對韓國市場的專屬品牌策略與行銷方案。華為中央還特意提到,昇騰950PR已在DeepSeek V4等系統中部署——話外音是“國產晶片不是只可宣不可用”。

華為拿四分之一價格、近三倍推理性能的牌入局,打的是對NVIDIA定價權和技術壟斷的正面攻擊。

商業差異化優勢存在,韓國深值於內心也有多元化需求,昇騰晶片到底能否真跑在首爾、仁川的資料中心裡,點亮韓國企業的AI負載,且看今年Q4吧。 (矽基LIFE)