#算力超節點 | 熱門關鍵字 | 鉅亨號

日前，在崑山的人工智慧創新大會（HAIC 2025）上，中科曙光展示了首個中國萬卡級AI超叢集－scaleX 萬卡超節點真機。這是中國AI算力史上的一個標誌性時刻，超節點真正意義上邁入萬卡紀元。Scale X萬卡超級群的落地，不僅是一次超節點技術的權利交接，更是中國AI算力基礎設施在發展路徑上給出的新答案。超節點之始三年前，國內的AI 算力體系基本上都得靠輝達，不管是GPU 加速卡、NVLink 高速互聯技術，還是CUDA 軟體棧，都是NV的東西。這套方案幾乎成了行業默認標準，也讓整個產業鏈對這一家供應商的依賴越來越明顯。轉折點就出在輝達晶片的出口限制上。高階GPU 一缺貨，再加上CUDA 生態不對外開放、NVLink 技術也不給授權，國內廠商這下不得不琢磨一個現實問題：要是沒了輝達，我們自己能搭起什麼樣的算力體系？最先給出答案的是華為，它走了一條「全端自研」的路，從底層晶片、互聯技術，到上層框架軟件，全都是自己研發的。後來橫空出世的384 超節點，也延續了這種縱向一體化的思路，晶片、通訊協議、操作系統和框架生態全是自研。靠著系統層面的高度一致性，它的效能相當能打：通訊延遲只有2.1 微秒，單機櫃算力達到300PFlops，PUE 還能穩定在1.1 左右。單看這些參數，確實能和輝達掰手腕。不過和輝達一樣，華為也選擇了「封閉自洽」的路線。這種模式雖然能把資源效率拉滿，技術把控力也強，但短板也很突出：生態相容性比較受限，整個產業的協同推進速度也會慢一些。走向岔路口在全球AI 算力領域，超節點被視為下一代智慧計算的核心單元。它可以把幾十、幾百甚至上萬張AI 加速卡，整合為一個統一的邏輯節點，將通訊時延壓縮到微秒等級，以此突破傳統算力叢集的通訊瓶頸。這樣的技術優勢，也吸引了許多行業巨頭入局佈局。 2025 年下半年，阿里、浪潮、曙光就先後推出了各自的超節點產品。這三家廠商選擇的技術路線，和華為有所不同。它們以「開放架構」為核心，走出了一條全新的道路，致力於打造屬於中國的AI 算力底層基礎。其中，發佈時間相對較早的浪潮“元腦SD200” 和阿里“磐久128”，共同搭建起了國產開放架構體系的雛形。浪潮這款產品主打多品牌GPU 異構計算，還創下了8.9 毫秒生成token 的亮眼紀錄；阿里的產品則依靠開放協議整合不同互聯標準，成功搭建出「雲超節點」。而中科曙光在HAIC 大會上推出的scaleX 萬卡超節點真機，也是備受矚目。此系統由16 個scaleX640 超節點互聯組成，總共部署了10240 張AI 加速卡，總算力突破5EFlops。它搭載的自研scaleFabric 高速網絡，帶寬能達到400Gb/s，端側延遲不到1 微秒。同時，曙光採用浸沒相變液冷技術，將單機櫃的PUE 壓低至1.04，堪稱名副其實的算力巨獸。更關鍵的是，這款產品不繫結任何單一晶片廠商。 scaleX640 能夠相容於寒武紀、壁仞、登臨等多個品牌的加速卡，並且已經適配了400 多個主流大模型和AI 框架。這也意味著，中國的AI 算力真正具備了「多晶片共存」的能力，實現了算力生態的多元化發展。去輝達化隨著國產算力廠商的集體突破，「去輝達化」早已不是一句口號，而是中國保障算力安全、推進自主創新的共同需求。從2023 年起，美國多次收緊對華高性能GPU 的出口限制，A100、H100 等主力型號相繼被列入管控清單，輝達的超節點NVL72 也是在限制之內。儘管近期美國政府對部分型號的限售政策略有鬆動，但覆蓋範圍也僅限於H 系列。再加上先前有消息指出輝達晶片可能存在安全後門，相關的安全風險進一步凸顯。這一系列變化，倒逼中國AI 產業加速尋找替代方案。但我們的核心目標，不是簡單再造一個類似輝達的企業，而是要搭建一套具備可替代性的完整算力生態系統。目前來看，國內已經湧現出兩套頗具代表性的發展路徑：一條是走封閉全棧的縱向整合路線，以華為昇騰為典型代表；另一條則是主打開放協同，像曙光、浪潮、阿里這些企業都在這條賽道上發力。在落地應用層面，各家的產品也已嶄露頭角。華為的CM384已經發貨很多套，在貴州的數據中心正常使用運營；浪潮的SD200 已經在多個模型推理平台實現商用，成為DeepSeek 與Kimi 等大模型的重要算力支撐；阿里的磐久128 在雲端搭建起大規模叢集，承擔起多模型協作的基礎設施角色；更是已經落地上海、杭州等地的智算中心，也被納入國家級算力調度工程的採購清單。更值得關注的是，開放路線的推進，也帶動了國產晶片的大規模落地應用。曙光的scaleX 體系已經完成了對壁仞BR 系列、登臨、寒武紀MLU 等多款國產加速卡的適配，浪潮和阿里也在為本土GPU 提前預置驅動環境。這意味著，國內的算力基礎設施不再依附於單一的輝達生態，轉而形成了以中國廠商為核心的開放式協作系統。“過去幾年大家都在埋頭造芯，現在終於有地方能讓這些晶片真正跑起來了。” 一位業內人士這樣感慨，“這其實比單純拿到訂單更有價值，它標誌著中國AI 算力體系開始具備自我造血的能力。”2025 年，堪稱中國AI 算力體系發展的「拐點之年」。封閉路線憑藉其技術優勢，佔據著性能高地，代表著極致的算力表現與可靠的可控性，在特定場景中具備不可替代的價值；開放路線則貼合產業發展的現實需求，有力推動了算力普惠與生態繁榮，為行業帶來了更多可能性。國內算力產業的發展邏輯也在悄悄轉變：不再是單一維度的表現比拚，而是更注重不同晶片的高效協同；不再是不同體系間的孤立較量，而是趨向於多元生態下的共生共贏。中國AI 算力的未來，很可能就藏在這兩條路線的共存與平衡之中，被重新書寫與定義。（傅立葉的貓）

科技

2025/11/15

•

效率提升70%！超節點技術成中國AI算力破局關鍵？ 8大廠商全面解析！

自從華為首先推出超節點技術之後，似乎瞬間「超節點」就成為中國國產AI伺服器的「標配」，也成為了國產AI算力領域的超級熱點。在剛結束的“ 2025百度世界大會”，在展區中央擺著一塊黑色的機櫃——這是百度剛推出的的崑崙芯超節點。據說這套搭載64張崑崙芯AI加速卡的系統，已能讓兆參數大模型在幾分鐘內完成推理；並且其已在百度內部實現大規模部署，這一百度自研技術可將單卡性能提升95%，單實例推理性能提升高達8倍。這意味著，包括華為和百度，目前至少有8家廠商推出了自己的「超節點技術」，既有中科曙光、浪潮這樣的傳統伺服器廠商，也有阿里雲這樣的雲端服務廠商。飆叔將這8家公司在超節點領域的佈局和產品狀況做了一個簡單梳理，具體如下：眾所周知的原因，目前國內先進製程高階AI晶片受限的背景之下，超節點技術成為了一種彌補「先進算力」不足的主要武器之一。超節點就是本質而言，是一種通訊技術，就是透過高速互聯技術（如光互連），將成千上萬顆國產AI晶片緊密耦合，大幅提升了叢集的有效算力利用率（MFU）。這相當於用系統架構的創新，彌補了單顆晶片在絕對效能上的不足，是實現「以量補質」或「以架構換性能」的關鍵策略。因而，超節點的規模化部署，為國產AI晶片和軟體棧提供了廣闊的「試驗場」和「磨刀石」。這強力推動了從晶片、模型到應用的整個國產AI生態鏈（即「國芯、國模、國用」）的協同發展和快速成熟。同時，超節點也降低AI應用門檻，其催生了「算力即服務」（CaaS）等新模式。這意味著廣大中小企業無需自建昂貴的資料中心，就可以透過API介面按需呼叫強大的超節點算力，大大促進了AI技術的普及和落地。當然，超節點是一個複雜的系統，其核心部件主要包括計算、互聯、散熱、供電等單元。這也催生或放大了國產AI算力產業的一個獨特市場。在互聯互通單元，其負責節點內高速通訊，包括交換晶片、光模組等；目前在國內受益的主要廠商包括：華為自研的靈衢互聯協議、中興通訊的交換晶片，中際旭創的光模組，光迅科技光模組等。另一個核心零件就是－散熱系統，其主要是應對高密度計算產生的巨大熱量，多採用液冷技術；這一領域中，英維克、高瀾股份、科華資料等都是核心廠商。特別值得一提的是，除了上述的系統整合商和核心供應商之外，一些關鍵的產業鏈上下游也值得關注。尤其是連接器與材料，高速互聯對內部連接器和基礎材料也提出了更高要求。例如，超寬機櫃需要更高規格的PCB（印刷電路板）和CCL（覆銅板）材料，同時，在機櫃內部，銅連接憑藉其成本優勢在短距離高速互聯中依然扮演重要角色。雖然超節點是較新的技術，但在國內越來越受到關注，其背後，不僅超節點技術成為彌補國產AI晶片製程缺陷，同時也是提高晶片叢集效能的重要路徑。因此，隨著摩爾定律即將「失效」已成共識的背景之下，推進晶片製程演進的難度增大，提升單顆晶片的運算效能面臨挑戰，或許超節點將成為持續提升算力的主流解決方案之一。（飆叔科技洞察）

科技

2025/09/19

•

華為發佈全球最強算力超節點和叢集

今日，華為全聯接大會2025在上海啟幕，華為副董事長、輪值董事長徐直軍發表題為“以開創的超節點互聯技術，引領AI基礎設施新範式”的主題演講，正式發佈全球最強算力超節點和叢集。華為副董事長、輪值董事長徐直軍發表主題演講徐直軍指出：“算力過去是，未來也將繼續是人工智慧的關鍵，更是中國人工智慧的關鍵，”並再次強調：“基於中國可獲得的晶片製造工藝，華為努力打造‘超節點+叢集’算力解決方案，來滿足持續增長的算力需求。”徐直軍認為，超節點在物理上由多台機器組成，但邏輯上以一台機器學習、思考、推理。華為發佈了最新超節點產品Atlas 950 SuperPoD和Atlas 960 SuperPoD超節點，分別支援8192及15488張昇騰卡，在卡規模、總算力、記憶體容量、互聯頻寬等關鍵指標上全面領先，在未來多年都將是全球最強算力的超節點。基於超節點，華為同時發佈了全球最強超節點叢集，分別是Atlas 950 SuperCluster和Atlas 960 SuperCluster，算力規模分別超過50萬卡和達到百萬卡，是當之無愧的全世界最強算力叢集。徐直軍表示，基於全球最強算力的超節點和叢集，華為對於為人工智慧的長期快速發展提供可持續且充裕算力，充滿信心。同時，華為率先把超節點技術引入通用計算領域，發佈全球首個通用計算超節點TaiShan 950 SuperPoD，結合GaussDB分佈式資料庫，能夠徹底取代各種應用場景的大型機和小型機以及Exadata資料庫一體機，將成為各類大型機、小型機的終結者。華為基於三十多年構築的聯接技術能力，通過系統性創新，突破了大規模超節點的互聯技術巨大挑戰，開創了面向超節點的互聯協議靈衢（UnifiedBus），徐直軍宣佈華為將開放靈衢2.0技術規範，歡迎產業界夥伴基於靈衢研發相關產品和部件，共建靈衢開放生態。徐直軍強調：“華為將以基於靈衢的超節點和叢集持續滿足算力快速增長的需求，推動人工智慧持續發展，創造更大的價值。” (華為數字中國)

科技