#算力超節點
中國算力的開放時刻:超節點邁入萬卡紀元
日前,在崑山的人工智慧創新大會(HAIC 2025)上,中科曙光展示了首個中國萬卡級AI超叢集-scaleX 萬卡超節點真機。這是中國AI算力史上的一個標誌性時刻,超節點真正意義上邁入萬卡紀元。Scale X萬卡超級群的落地,不僅是一次超節點技術的權利交接,更是中國AI算力基礎設施在發展路徑上給出的新答案。超節點之始三年前,國內的AI 算力體系基本上都得靠輝達,不管是GPU 加速卡、NVLink 高速互聯技術,還是CUDA 軟體棧,都是NV的東西。這套方案幾乎成了行業默認標準,也讓整個產業鏈對這一家供應商的依賴越來越明顯。轉折點就出在輝達晶片的出口限制上。高階GPU 一缺貨,再加上CUDA 生態不對外開放、NVLink 技術也不給授權,國內廠商這下不得不琢磨一個現實問題:要是沒了輝達,我們自己能搭起什麼樣的算力體系?最先給出答案的是華為,它走了一條「全端自研」 的路,從底層晶片、互聯技術,到上層框架軟件,全都是自己研發的。後來橫空出世的384 超節點,也延續了這種縱向一體化的思路,晶片、通訊協議、操作系統和框架生態全是自研。靠著系統層面的高度一致性,它的效能相當能打:通訊延遲只有2.1 微秒,單機櫃算力達到300PFlops,PUE 還能穩定在1.1 左右。單看這些參數,確實能和輝達掰手腕。不過和輝達一樣,華為也選擇了「封閉自洽」 的路線。這種模式雖然能把資源效率拉滿,技術把控力也強,但短板也很突出:生態相容性比較受限,整個產業的協同推進速度也會慢一些。走向岔路口在全球AI 算力領域,超節點被視為下一代智慧計算的核心單元。它可以把幾十、幾百甚至上萬張AI 加速卡,整合為一個統一的邏輯節點,將通訊時延壓縮到微秒等級,以此突破傳統算力叢集的通訊瓶頸。這樣的技術優勢,也吸引了許多行業巨頭入局佈局。 2025 年下半年,阿里、浪潮、曙光就先後推出了各自的超節點產品。這三家廠商選擇的技術路線,和華為有所不同。它們以「開放架構」 為核心,走出了一條全新的道路,致力於打造屬於中國的AI 算力底層基礎。其中,發佈時間相對較早的浪潮“元腦SD200” 和阿里“磐久128”,共同搭建起了國產開放架構體系的雛形。浪潮這款產品主打多品牌GPU 異構計算,還創下了8.9 毫秒生成token 的亮眼紀錄;阿里的產品則依靠開放協議整合不同互聯標準,成功搭建出「雲超節點」。而中科曙光在HAIC 大會上推出的scaleX 萬卡超節點真機,也是備受矚目。此系統由16 個scaleX640 超節點互聯組成,總共部署了10240 張AI 加速卡,總算力突破5EFlops。它搭載的自研scaleFabric 高速網絡,帶寬能達到400Gb/s,端側延遲不到1 微秒。同時,曙光採用浸沒相變液冷技術,將單機櫃的PUE 壓低至1.04,堪稱名副其實的算力巨獸。更關鍵的是,這款產品不繫結任何單一晶片廠商。 scaleX640 能夠相容於寒武紀、壁仞、登臨等多個品牌的加速卡,並且已經適配了400 多個主流大模型和AI 框架。這也意味著,中國的AI 算力真正具備了「多晶片共存」 的能力,實現了算力生態的多元化發展。去輝達化隨著國產算力廠商的集體突破,「去輝達化」 早已不是一句口號,而是中國保障算力安全、推進自主創新的共同需求。從2023 年起,美國多次收緊對華高性能GPU 的出口限制,A100、H100 等主力型號相繼被列入管控清單,輝達的超節點NVL72 也是在限制之內。儘管近期美國政府對部分型號的限售政策略有鬆動,但覆蓋範圍也僅限於H 系列。再加上先前有消息指出輝達晶片可能存在安全後門,相關的安全風險進一步凸顯。這一系列變化,倒逼中國AI 產業加速尋找替代方案。但我們的核心目標,不是簡單再造一個類似輝達的企業,而是要搭建一套具備可替代性的完整算力生態系統。目前來看,國內已經湧現出兩套頗具代表性的發展路徑:一條是走封閉全棧的縱向整合路線,以華為昇騰為典型代表;另一條則是主打開放協同,像曙光、浪潮、阿里這些企業都在這條賽道上發力。在落地應用層面,各家的產品也已嶄露頭角。華為的CM384已經發貨很多套,在貴州的數據中心正常使用運營;浪潮的SD200 已經在多個模型推理平台實現商用,成為DeepSeek 與Kimi 等大模型的重要算力支撐;阿里的磐久128 在雲端搭建起大規模叢集,承擔起多模型協作的基礎設施角色;更是已經落地上海、杭州等地的智算中心,也被納入國家級算力調度工程的採購清單。更值得關注的是,開放路線的推進,也帶動了國產晶片的大規模落地應用。曙光的scaleX 體系已經完成了對壁仞BR 系列、登臨、寒武紀MLU 等多款國產加速卡的適配,浪潮和阿里也在為本土GPU 提前預置驅動環境。這意味著,國內的算力基礎設施不再依附於單一的輝達生態,轉而形成了以中國廠商為核心的開放式協作系統。“過去幾年大家都在埋頭造芯,現在終於有地方能讓這些晶片真正跑起來了。” 一位業內人士這樣感慨,“這其實比單純拿到訂單更有價值,它標誌著中國AI 算力體系開始具備自我造血的能力。”2025 年,堪稱中國AI 算力體系發展的「拐點之年」。封閉路線憑藉其技術優勢,佔據著性能高地,代表著極致的算力表現與可靠的可控性,在特定場景中具備不可替代的價值;開放路線則貼合產業發展的現實需求,有力推動了算力普惠與生態繁榮,為行業帶來了更多可能性。國內算力產業的發展邏輯也在悄悄轉變:不再是單一維度的表現比拚,而是更注重不同晶片的高效協同;不再是不同體系間的孤立較量,而是趨向於多元生態下的共生共贏。中國AI 算力的未來,很可能就藏在這兩條路線的共存與平衡之中,被重新書寫與定義。 (傅立葉的貓)
效率提升70%!超節點技術成中國AI算力破局關鍵? 8大廠商全面解析!
自從華為首先推出超節點技術之後,似乎瞬間「超節點」就成為中國國產AI伺服器的「標配」,也成為了國產AI算力領域的超級熱點。在剛結束的“ 2025百度世界大會”,在展區中央擺著一塊黑色的機櫃——這是百度剛推出的的崑崙芯超節點。據說這套搭載64張崑崙芯AI加速卡的系統,已能讓兆參數大模型在幾分鐘內完成推理;並且其已在百度內部實現大規模部署,這一百度自研技術可將單卡性能提升95%,單實例推理性能提升高達8倍。這意味著,包括華為和百度,目前至少有8家廠商推出了自己的「超節點技術」,既有中科曙光、浪潮這樣的傳統伺服器廠商,也有阿里雲這樣的雲端服務廠商。飆叔將這8家公司在超節點領域的佈局和產品狀況做了一個簡單梳理,具體如下:眾所周知的原因,目前國內先進製程高階AI晶片受限的背景之下,超節點技術成為了一種彌補「先進算力」不足的主要武器之一。超節點就是本質而言,是一種通訊技術,就是透過高速互聯技術(如光互連),將成千上萬顆國產AI晶片緊密耦合,大幅提升了叢集的有效算力利用率(MFU)。這相當於用系統架構的創新,彌補了單顆晶片在絕對效能上的不足,是實現「以量補質」或「以架構換性能」的關鍵策略。因而,超節點的規模化部署,為國產AI晶片和軟體棧提供了廣闊的「試驗場」和「磨刀石」。這強力推動了從晶片、模型到應用的整個國產AI生態鏈(即「國芯、國模、國用」)的協同發展和快速成熟。同時,超節點也降低AI應用門檻,其催生了「算力即服務」(CaaS)等新模式。這意味著廣大中小企業無需自建昂貴的資料中心,就可以透過API介面按需呼叫強大的超節點算力,大大促進了AI技術的普及和落地。當然,超節點是一個複雜的系統,其核心部件主要包括計算、互聯、散熱、供電等單元。這也催生或放大了國產AI算力產業的一個獨特市場。在互聯互通單元,其負責節點內高速通訊,包括交換晶片、光模組等;目前在國內受益的主要廠商包括:華為自研的靈衢互聯協議、中興通訊的交換晶片,中際旭創的光模組,光迅科技光模組等。另一個核心零件就是-散熱系統,其主要是應對高密度計算產生的巨大熱量,多採用液冷技術;這一領域中,英維克、高瀾股份、科華資料等都是核心廠商。特別值得一提的是,除了上述的系統整合商和核心供應商之外,一些關鍵的產業鏈上下游也值得關注。尤其是連接器與材料,高速互聯對內部連接器和基礎材料也提出了更高要求。例如,超寬機櫃需要更高規格的PCB(印刷電路板)和CCL(覆銅板)材料,同時,在機櫃內部,銅連接憑藉其成本優勢在短距離高速互聯中依然扮演重要角色。雖然超節點是較新的技術,但在國內越來越受到關注,其背後,不僅超節點技術成為彌補國產AI晶片製程缺陷,同時也是提高晶片叢集效能的重要路徑。因此,隨著摩爾定律即將「失效」已成共識的背景之下,推進晶片製程演進的難度增大,提升單顆晶片的運算效能面臨挑戰,或許超節點將成為持續提升算力的主流解決方案之一。 (飆叔科技洞察)
華為發佈全球最強算力超節點和叢集
今日,華為全聯接大會2025在上海啟幕,華為副董事長、輪值董事長徐直軍發表題為“以開創的超節點互聯技術,引領AI基礎設施新範式”的主題演講,正式發佈全球最強算力超節點和叢集。華為副董事長、輪值董事長徐直軍發表主題演講徐直軍指出:“算力過去是,未來也將繼續是人工智慧的關鍵,更是中國人工智慧的關鍵,”並再次強調:“基於中國可獲得的晶片製造工藝,華為努力打造‘超節點+叢集’算力解決方案,來滿足持續增長的算力需求。”徐直軍認為,超節點在物理上由多台機器組成,但邏輯上以一台機器學習、思考、推理。華為發佈了最新超節點產品Atlas 950 SuperPoD和Atlas 960 SuperPoD超節點,分別支援8192及15488張昇騰卡,在卡規模、總算力、記憶體容量、互聯頻寬等關鍵指標上全面領先,在未來多年都將是全球最強算力的超節點。基於超節點,華為同時發佈了全球最強超節點叢集,分別是Atlas 950 SuperCluster和Atlas 960 SuperCluster,算力規模分別超過50萬卡和達到百萬卡,是當之無愧的全世界最強算力叢集。徐直軍表示,基於全球最強算力的超節點和叢集,華為對於為人工智慧的長期快速發展提供可持續且充裕算力,充滿信心。同時,華為率先把超節點技術引入通用計算領域,發佈全球首個通用計算超節點TaiShan 950 SuperPoD,結合GaussDB分佈式資料庫,能夠徹底取代各種應用場景的大型機和小型機以及Exadata資料庫一體機,將成為各類大型機、小型機的終結者。華為基於三十多年構築的聯接技術能力,通過系統性創新,突破了大規模超節點的互聯技術巨大挑戰,開創了面向超節點的互聯協議靈衢(UnifiedBus),徐直軍宣佈華為將開放靈衢2.0技術規範,歡迎產業界夥伴基於靈衢研發相關產品和部件,共建靈衢開放生態。徐直軍強調:“華為將以基於靈衢的超節點和叢集持續滿足算力快速增長的需求,推動人工智慧持續發展,創造更大的價值。” (華為數字中國)