#昇騰
深度拆解|輝達 Rubin VS 華為昇騰,算力基建電容格局全透視
著眼當下 ,AI 算力狂飆,伺服器功率密度、晶片整合度、機櫃負載階躍性持續刷新行業認知,MLCC、矽電容、超級電容三類核心儲能 / 濾波電容,早已不是簡單的被動元器件堆疊,而是按照納秒、高頻、毫秒 - 秒級三大時間維度,分層承擔起算力系統從晶片核心到整機機櫃的供電穩壓重任。 市場主流分化出兩大算力路線:輝達 Rubin 系列主打單櫃極致算力密度,是當前全球高端 AI 叢集的標竿;華為昇騰路線依託超節點叢集 + 全光互聯 + 國產自主體系,走出差異化突圍路徑。兩條技術路線架構、功耗邏輯、供電方案截然不同,也直接導致三類電容的應用定位、用量規模、價值權重、匯入節奏、產業鏈受益邏輯出現明顯分野。本文從底層分工、路線核心、單品拆解、產業鏈機會四大維度,把兩條算力賽道下三類電容的博弈邏輯、現狀與未來徹底講透。 一、底層邏輯:三類電容並非替代關係,而是算力供電三層 “防護網” 先釐清核心前提:MLCC、矽電容、超級電容不存在互相替代,而是依據部署位置、響應速度,形成三級供電保障體系,分別對應晶片 - 板卡 - 機櫃三大空間層級,以及納秒、超高頻、毫秒至秒級三大時間尺度,這也是兩條算力路線通用的底層架構。
突破!國產晶片完成兆參數模型“後訓練”!
據《南華早報》援引深圳市政府消息,一個由華為技術公司領銜的研究團隊近日聲稱,已使用至少1000顆華為昇騰910C AI晶片組成的叢集,完成了對DeepSeek V4-Pro(1.6兆參數)大語言模型的全參數後訓練。該團隊由華為與深圳環島人工智慧研究院、哈爾濱工業大學(深圳)及深圳巨量資料研究院共同組成。 這一成果標誌著中國本土AI加速器首次在處理訓練類工作負載方面取得實質進展。此前,受美國出口管制限制,中國AI企業在模型訓練環節一直最難脫離輝達硬體。昇騰910C是華為當前的旗艦AI晶片,採用雙die設計,在早期DeepSeek測試中其推理性能約為輝達H100的60%。 所謂的“全參數後訓練”是指在大模型完成海量預訓練(V4-Pro的預訓練語料超過32兆 tokens)之後,通過指令微調、安全對齊和特定任務資料對模型所有權重進行更新的階段。這不同於成本更高、計算量更龐大的預訓練。去年8月曾有報導稱,DeepSeek在R2模型訓練時甚至無法在昇騰晶片上完成一次成功的訓練運行,原因是性能不穩定、片間互聯慢以及華為CANN軟體棧的缺陷,最終只得退回使用輝達GPU進行訓練。今年4月發佈的DeepSeek-V4-Pro是首款從一開始就圍繞昇騰建構的模型。 需要注意的是,深圳方面的聲明未提供任何基準測試資料,未說明此次後訓練耗時多久、與在輝達硬體上執行相同任務相比效率如何,也未給出1000顆叢集的實際利用率。DeepSeek公司本身對此未予置評。
華為半導體首席科學家:華為多年前就意識到單顆晶片比較吃虧,所以開發超節點技術彌補性能差距
在2026年昇騰AI開發者峰會上,華為半導體首席科學家廖恆深度解讀了華為算力技術的破局之路。他坦言,在全球先進半導體賽道中,國內單顆晶片的工藝規格與性能參數,長期存在客觀差距。針對這一行業痛點,華為早在四五年前就提前佈局、精準預判,摒棄了單純追逐單晶片極致性能的傳統思路,全力攻堅超節點互聯技術,憑藉頂尖的系統互聯能力,彌補單芯硬體短板,走出了一條獨具中國特色的算力突破路徑。 回望行業發展節點,華為佈局超節點技術的決策,恰好處於國內半導體產業遭遇外部極限封鎖的關鍵時期。彼時,美國出台嚴苛制裁規則,全面禁止台積電等全球頂尖代工廠為華為代工高端晶片,直接斬斷了華為高端手機晶片、AI訓練晶片的迭代升級通路。終端產品只能依託4G制式驍龍晶片維持更新,AI算力領域更是只能依賴存量老舊晶片支撐訓練業務,國內晶片產業一度陷入單芯突破無望的被動困局。 雪上加霜的是,當時國內半導體製造工藝尚未完成關鍵技術攻堅,7nm及以下先進製程量產能力缺失,無法為國產高端晶片研發、量產提供本土化支撐。內外雙重承壓下,國內企業想要復刻西方“單芯極致迭代”的發展模式,已然行不通。正是在這樣的行業背景下,華為跳出單一硬體攻堅的思維侷限,用系統化思維破解算力難題,而這一核心思路,與錢學森先生提出的系統工程理論高度契合。 1978年,錢學森先生正式提出系統工程核心理論,這套適配全行業、全領域的組織管理技術,凝練出頂層設計、科學管理、自主創新、全域協作、綜合整合五大核心準則。錢老的核心思想始終強調,技術突破不能盲從西方固有路徑,切忌侷限於單一技術模組的迭代最佳化,而是要立足自身產業現狀,從全域維度統籌規劃、整合資源、補齊短板。