中國算力的開放時刻：超節點邁入萬卡紀元

2025/12/20

•

日前，在崑山的人工智慧創新大會（HAIC 2025）上，中科曙光展示了首個中國萬卡級AI超叢集－scaleX 萬卡超節點真機。這是中國AI算力史上的一個標誌性時刻，超節點真正意義上邁入萬卡紀元。

Scale X萬卡超級群的落地，不僅是一次超節點技術的權利交接，更是中國AI算力基礎設施在發展路徑上給出的新答案。

超節點之始

三年前，國內的AI 算力體系基本上都得靠輝達，不管是GPU 加速卡、NVLink 高速互聯技術，還是CUDA 軟體棧，都是NV的東西。這套方案幾乎成了行業默認標準，也讓整個產業鏈對這一家供應商的依賴越來越明顯。

轉折點就出在輝達晶片的出口限制上。高階GPU 一缺貨，再加上CUDA 生態不對外開放、NVLink 技術也不給授權，國內廠商這下不得不琢磨一個現實問題：要是沒了輝達，我們自己能搭起什麼樣的算力體系？

最先給出答案的是華為，它走了一條「全端自研」的路，從底層晶片、互聯技術，到上層框架軟件，全都是自己研發的。

後來橫空出世的384 超節點，也延續了這種縱向一體化的思路，晶片、通訊協議、操作系統和框架生態全是自研。靠著系統層面的高度一致性，它的效能相當能打：通訊延遲只有2.1 微秒，單機櫃算力達到300PFlops，PUE 還能穩定在1.1 左右。單看這些參數，確實能和輝達掰手腕。

不過和輝達一樣，華為也選擇了「封閉自洽」的路線。這種模式雖然能把資源效率拉滿，技術把控力也強，但短板也很突出：生態相容性比較受限，整個產業的協同推進速度也會慢一些。

走向岔路口

在全球AI 算力領域，超節點被視為下一代智慧計算的核心單元。它可以把幾十、幾百甚至上萬張AI 加速卡，整合為一個統一的邏輯節點，將通訊時延壓縮到微秒等級，以此突破傳統算力叢集的通訊瓶頸。這樣的技術優勢，也吸引了許多行業巨頭入局佈局。 2025 年下半年，阿里、浪潮、曙光就先後推出了各自的超節點產品。

這三家廠商選擇的技術路線，和華為有所不同。它們以「開放架構」為核心，走出了一條全新的道路，致力於打造屬於中國的AI 算力底層基礎。

其中，發佈時間相對較早的浪潮“元腦SD200” 和阿里“磐久128”，共同搭建起了國產開放架構體系的雛形。浪潮這款產品主打多品牌GPU 異構計算，還創下了8.9 毫秒生成token 的亮眼紀錄；阿里的產品則依靠開放協議整合不同互聯標準，成功搭建出「雲超節點」。

而中科曙光在HAIC 大會上推出的scaleX 萬卡超節點真機，也是備受矚目。此系統由16 個scaleX640 超節點互聯組成，總共部署了10240 張AI 加速卡，總算力突破5EFlops。它搭載的自研scaleFabric 高速網絡，帶寬能達到400Gb/s，端側延遲不到1 微秒。同時，曙光採用浸沒相變液冷技術，將單機櫃的PUE 壓低至1.04，堪稱名副其實的算力巨獸。

更關鍵的是，這款產品不繫結任何單一晶片廠商。 scaleX640 能夠相容於寒武紀、壁仞、登臨等多個品牌的加速卡，並且已經適配了400 多個主流大模型和AI 框架。這也意味著，中國的AI 算力真正具備了「多晶片共存」的能力，實現了算力生態的多元化發展。

去輝達化

隨著國產算力廠商的集體突破，「去輝達化」早已不是一句口號，而是中國保障算力安全、推進自主創新的共同需求。

從2023 年起，美國多次收緊對華高性能GPU 的出口限制，A100、H100 等主力型號相繼被列入管控清單，輝達的超節點NVL72 也是在限制之內。儘管近期美國政府對部分型號的限售政策略有鬆動，但覆蓋範圍也僅限於H 系列。再加上先前有消息指出輝達晶片可能存在安全後門，相關的安全風險進一步凸顯。

這一系列變化，倒逼中國AI 產業加速尋找替代方案。但我們的核心目標，不是簡單再造一個類似輝達的企業，而是要搭建一套具備可替代性的完整算力生態系統。目前來看，國內已經湧現出兩套頗具代表性的發展路徑：一條是走封閉全棧的縱向整合路線，以華為昇騰為典型代表；另一條則是主打開放協同，像曙光、浪潮、阿里這些企業都在這條賽道上發力。

在落地應用層面，各家的產品也已嶄露頭角。華為的CM384已經發貨很多套，在貴州的數據中心正常使用運營；浪潮的SD200 已經在多個模型推理平台實現商用，成為DeepSeek 與Kimi 等大模型的重要算力支撐；阿里的磐久128 在雲端搭建起大規模叢集，承擔起多模型協作的基礎設施角色；更是已經落地上海、杭州等地的智算中心，也被納入國家級算力調度工程的採購清單。

更值得關注的是，開放路線的推進，也帶動了國產晶片的大規模落地應用。曙光的scaleX 體系已經完成了對壁仞BR 系列、登臨、寒武紀MLU 等多款國產加速卡的適配，浪潮和阿里也在為本土GPU 提前預置驅動環境。這意味著，國內的算力基礎設施不再依附於單一的輝達生態，轉而形成了以中國廠商為核心的開放式協作系統。

“過去幾年大家都在埋頭造芯，現在終於有地方能讓這些晶片真正跑起來了。” 一位業內人士這樣感慨，“這其實比單純拿到訂單更有價值，它標誌著中國AI 算力體系開始具備自我造血的能力。”

2025 年，堪稱中國AI 算力體系發展的「拐點之年」。封閉路線憑藉其技術優勢，佔據著性能高地，代表著極致的算力表現與可靠的可控性，在特定場景中具備不可替代的價值；開放路線則貼合產業發展的現實需求，有力推動了算力普惠與生態繁榮，為行業帶來了更多可能性。國內算力產業的發展邏輯也在悄悄轉變：不再是單一維度的表現比拚，而是更注重不同晶片的高效協同；不再是不同體系間的孤立較量，而是趨向於多元生態下的共生共贏。中國AI 算力的未來，很可能就藏在這兩條路線的共存與平衡之中，被重新書寫與定義。（傅立葉的貓）

科技