#中國AI晶片
56億昇騰訂單 撕碎輝達CUDA壟斷
2026年4月,華為在深圳正式啟動昇騰950PR大規模量產。 這款單卡FP4算力1.56PFlops的推理晶片,性能是輝達針對中國特供的H20的2.8倍。剛過去的4月底,字節跳動確認拋出56億美元採購單,鎖定約35萬顆,直接創下中國國內AI晶片採購的歷史紀錄。 現在國內AI基建已經徹底從“湊合用的備份”,轉成主動選國產替代的階段。DeepSeek V4的發佈是關鍵轉折點。 這款1兆參數的MoE大模型,原本定在2026年初發,特意推遲了3個月重構,專門適配昇騰950PR和寒武紀的硬體。 阿里雲、騰訊雲在V4發佈當天就完成了全端部署。 全行業都看得懂:硬體性能突破和軟體生態解耦正在同步發生,輝達靠CUDA鎖了十幾年的開發者生態,真的要鬆了。FP4性能反超H20 昇騰產能直接拉滿昇騰950PR直接把國產AI晶片的性能天花板抬了一大截。 FP4精度下1.56PFlops的推理吞吐量,比輝達H20高1.8倍。 它也是目前唯一支援FP4壓縮格式的國產晶片,跑大規模MoE模型的時候,記憶體頻寬消耗更低,能扛更多並行請求。產能兌現的突破比參數更實在。 華為2026年全年計畫出貨75萬顆,單價約1.6萬美元,現在現貨價格已經因為搶貨漲了20%,完全是賣方市場。 75萬顆的年產能,意味著昇騰950PR已經從實驗室樣品變成了工業級基礎設施,足夠扛住全國數百萬並行AI查詢的需求。 字節一家的35萬顆訂單就佔了全年規劃產能的近一半,頭部網際網路廠的算力採購邏輯早就變了。CUDA直接相容 遷移成本砍到零昇騰950PR最有戰略價值的不是硬體性能,是它的CUDA相容軟體棧。 現有基於輝達CUDA開發的AI workload,不用重寫程式碼就能直接遷過去,徹底解決了之前國產晶片落地推廣最大的“移植成本”問題。 之前開發者牴觸非輝達硬體,主要就是改核心程式碼太費人力時間,現在950PR靠二進制相容層做到了幾乎零摩擦遷移。 坊間資料說,2025年國內已經有超過3000個常用大模型完成了昇騰適配,相容層跑起來的效率能到原生CUDA環境的95%以上。DeepSeek V4推遲發佈,剛好印證了這條路線走得通。 開發團隊花了三個月針對昇騰和寒武紀硬體重構模型架構,最終最佳化版本的推理效率,比基於輝達硬體的原始方案還高一點。 這種“模型主動適配硬體”的操作,直接打破了之前“硬體必須遷就主流模型”的慣性。 阿里雲百煉、騰訊雲TokenHub在V4發佈當天就上線了基於昇騰950PR的推理服務,整個行業的遊戲規則已經變了。56億大單鎖半產能 國產替代閉環跑通字節這56億美元的訂單,是中國半導體史上最大的單筆AI晶片採購單。 不僅鎖了華為2026年近半的950PR產能,訊號效應比訂單本身還大。 阿里、騰訊等雲服務商緊跟著就下了大規模預購,全年75萬顆的產能剛公佈就被搶光了。 這種“需求端先給訂單-產能端滿負荷跑-供應鏈快速成熟”的正向循環,直接解了之前國產AI晶片“沒訂單就沒迭代,沒迭代就沒訂單”的死局。價格的變化最能說明市場地位的反轉。 1.6萬美元的單價加上20%的現貨溢價,說明昇騰950PR已經是市場搶著要的硬通貨。 之前國產晶片要靠打折才能搶市場,現在國內企業願意為自主可控的算力付溢價。 這種商業可持續性直接給後續研發喂足了現金流,華為已經公開路線圖,2027年、2028年將分別推出昇騰960、970系列,代際迭代的正循環已經跑通了。DeepSeek V4原生適配 軟硬體協同效率拉滿DeepSeek V4選昇騰950PR當原生最佳化平台,標誌著國內AI產業進入了“軟硬體協同設計”的新階段。 這款1兆參數的MoE模型,每次推理只啟動370億參數,對記憶體頻寬和稀疏計算效率要求極高。 950PR的FP4支援能力和高頻寬記憶體設計,剛好踩中了MoE模型的稀疏啟動特性,推理成本比傳統稠密模型低了近40%。這種協同效應已經在改雲廠商的採購邏輯。 阿里雲、騰訊雲當天就完成部署,不是簡單的軟體適配,是直接基於950PR的硬體特性重寫了推理服務架構。 DeepSeek已經公開說,2026年下半年昇騰950超級節點規模出貨後,V4-Pro的API定價會大幅下調,國產硬體的成本優勢已經開始直接傳導到終端使用者。 對比之下,輝達H200因為中美監管拉扯,至今沒能進中國市場,剛好給國產晶片留足了空間。H200卡殼進不來 國產算力窗口期已到現在的市場格局,剛好踩中了監管的時間差。 輝達H200理論性能確實比昇騰950PR強,也拿到了出口許可,但中美雙方在銷售細則上扯了快半年,至今沒完成對華出貨。 這12到18個月的空窗期,剛好給華為留足了滲透國內雲基礎設施的時間。 950PR靠性能超H20、產能爬坡快、生態無縫遷的三重優勢,已經搶下了國內AI算力新增市場的大半份額。2025年北京就停了輝達H20的進口,剛好接上昇騰950PR的量產節奏。 現在H20徹底買不到,H200又沒影子,國內AI產業已經進入了“後輝達”的過渡階段。 DeepSeek、字節、阿里、騰訊這些產業鏈核心玩家的選擇,正在把過渡期變成不可逆的結構性轉移。 等2026年下半年75萬顆950PR全部部署到位,就算H200之後能進來,市場格局也早就重新洗牌了。2025年國內昇騰開發者數量已經突破120萬,比2024年翻了一倍。 阿里雲2025年Q4的AI算力訂單裡,昇騰佔比已經超過40%。 等今年75萬顆昇騰950PR全部落地,國內AI產業第一次有了完全自主可控、性能對標國際主流、生態無縫銜接的算力基座。 這不是簡單的供應鏈替代,是真真正正把算力主權握在了自己手裡。 (硅基LIFE)
華為被認可了!
大衛·薩克斯的表態,近期在科技圈引發不小震動。這位川普的科技政策顧問,近日接受了彭博電視台採訪。他現任總統科技顧問委員會主席,話語權足夠份量。薩克斯直言,中國AI晶片設計已落後美國僅1.5到2年。更關鍵的是,他預判華為不久後會對外出口AI晶片。這一動作,或將點燃全球技術堆疊主導權的爭奪戰。薩克斯也承認,華為GPU生產仍受限制,但追趕速度驚人。“華為尚未達到頂尖水平,但未來一定會改變。”他如此判斷。他的擔憂很直接,華為若成重要GPU供應商,美企將承壓。川普政府的核心目標,是讓美國技術堆疊成為全球標準。為此,拜登時期的“擴散規則”已被正式放棄。那項規則曾限制美國GPU出口,還要求買家申請許可證。薩克斯解釋,過度限制盟友,反而會錯失鎖定市場的機會。他認為,阻止最先進半導體流向中國合理,但別傷了盟友。過去的法規,無異於“因擔心風險而自傷科技產業的腳”。薩克斯的履歷也印證了他的行業洞察力。他曾是貝寶前COO,還創辦過被微軟收購的Yammer。2024年底,他被川普任命為白宮AI和加密貨幣負責人。華為這邊,任正非近期也有清醒表態。他坦言,自家GPU確實落後美國頂級產品一代。但華為有自己的應對方式,用數學補物理、群計算補單晶片。這種思路下,華為晶片能達到實用水平,滿足多數AI需求。很多AI工作負載,本就不需要最尖端的硬體支撐。只要華為能以合理價格供貨,搭建成熟生態。完全有能力在部分市場,挑戰輝達和AMD的地位。輝達CEO黃仁勳,也曾公開批評美國的出口管制。他直言這些政策“完全錯誤”,只會適得其反。全球一半AI研究人員是中國人,堵不住創新的腳步。美國的限制,還讓輝達損失了巨額中國市場收入。僅H20晶片禁令,就導致其損失55億美元庫存和150億營收。黃仁勳也認可華為的實力,稱其是“世界級科技公司”。薩克斯的判斷,其實藏著美國的戰略焦慮。放棄過度限制,不是妥協,而是想鎖定盟友市場。遏制中國先進晶片,同時鞏固美國技術的全球主導權。華為若真啟動AI晶片出口,格局會發生微妙變化。國產晶片出海,不僅是營收突破,更是生態突圍。中美AI晶片的差距在縮小,競爭只會愈發激烈。華為能否打破壟斷,關鍵看生態搭建的速度和質量。而美國的政策調整,也會持續影響全球半導體格局。這場技術博弈,沒有旁觀者,每一步都關乎未來走向。 (1 ic芯網)
摩根士丹利:2030中國AI晶片市場規模將達670億美元,自給率將達到76%
近日摩根士丹利發佈了《China AI GPUs – Closing the  Gap with the US 》,報告裡提到了關於中國AI晶片一些情況,我們摘取了部分內容,分享給大家。原文連結在文末。一、到2030年中國AI晶片市場規模將達670億美元我們在預測中國 AI GPU 市場時,採用了情景分析法,把供應、需求以及地緣政治方面的風險都考慮進去了。我們估算:到 2030 年,總的可觸達市場規模將達到 670 億美元。這意味著 2024 年到 2030 年間的年複合增長率(CAGR)為 23%。到時候,推理(inference)帶來的需求將超過訓練(training),這部分支出大約會佔到雲廠商總資本支出的 51%。我們的估算是基於主要雲服務商、電信營運商、政府及國企買家,以及其他 AI 相關公司的雲資本支出總和得出的。中國AI晶片市場規模從Morgan Stanley這張圖中我們也可以大致看出:增長初期主要由主權/國企(Sovereign & SOEs)和電信營運商驅動,但長期增長的關鍵在於“商業化應用”(Commercial Usage,主要體現在中國雲服務商CSP的支出上)。從結構上看,中國雲服務商(藍色部分)的支出佔比逐年擴大,從2023年的約60%增長到2030年接近400億美元,成為最大的單一需求來源。這表明AI晶片市場正從政府主導逐步轉向以商業需求為主導的成熟階段。我們預計,國產 AI 晶片的收入將從 2024 年的 60 億美元增長到 2030 年的 510 億美元(年複合增長率 42%),這將把自給率從 33% 提升到 76%。中國AI晶片自給率另外Morgan Stanley也提到了AI晶片在雲資本支援中的比例。AI 晶片佔全球雲資本支出總額的百分比從這張圖中,我們大致可以看出:從 2021 年到 2026 年,雲服務商在 AI 晶片上的花費佔其總資本支出(Capex)的比例從極低水平(約 5% 左右)急劇攀升至 45% 以上。另外Morgan Stanley認為,華為和寒武紀在短期內會領跑AI晶片的市場中國AI晶片廠商市場份額預估2026中國AI GPU市場份額二、十大中國AI晶片廠商與輝達(NVIDIA)的處理器在中國市場的情況相比,國產晶片擁有更低的總體擁有成本(TCO),並且在單個Token的處理成本(針對AI大語言模型推理任務)上具有可比性。Spec overview:中國AI晶片與輝達(NVIDIA)在產品 對比。(萌趣AI小棧)