#中國算力
中國算力基建與AI晶片發展
Q: AI 發展經歷了那些階段,各階段與計算系統有何關聯?A: AI 發展歷經符號主義、控制主義、連結主義三個核心階段,且每個階段的突破都與計算系統的支撐密不可分。第一階段符號主義以邏輯運算與符號操作為核心,依託圖靈機背後的基礎計算系統實現符號的推理與處理,此階段也為AI奠定了早期的理論與實踐基礎;第二階段控制主義的控制機制建立在自控系統的基本演算法之上,這些演算法的運作完全依賴於電腦的運算支援,聚焦於透過明確的控制邏輯解決特定場景問題;第三階段連接主義借助神經網路實現了重大突破,其核心依賴運算系統在平行運算方面的革新,本質是多層神經網路構成的數學模型,具備明確的輸入輸出邏輯,例如在影像判別場景中,輸入人物照片後,模型可輸出判斷為該人物的機率,完美適配複雜場景下的智慧處理需求。Q: AI 晶片類型有那些,GPU 和CPU 在平行運算中的表現如何,中國國內AI 晶片架構選擇情況如何?A: AI 晶片的發展與平行運算架構密切相關,主要包括通用運算晶片、專用晶片以及基於新興架構的晶片類型。其中,GPU 在平行運算中表現極為出色,因其整合了大量運算單元和高速內存,能夠精準適配AI 任務的加速需求,是當前並行運算的核心硬體之一;而CPU 雖具備一定的AI 運算能力,但在平行處理效率上遠低於GPU,難以應付AI 任務中大規模的並行運算需求,僅能承擔部分簡單的輔助運算工作。隨著技術演進,ASIC、FPGA 等專用晶片逐漸興起,ASIC 可針對特定AI 演算法進行深度最佳化,推理晶片多基於這兩種架構開發;新興的非馮・諾依曼架構也衍生出存算一體架構,以及在SoC 上整合CPU 與NPU 的混合架構。國內國產AI 晶片架構選擇呈現多樣化特徵,多數產品基於ASIC 架構打造,部分採用可重構的FPGA 架構以提升彈性,同時也有廠商推出基於通用GPU 架構的產品,滿足不同情境的應用需求。Q: 國內外AI 晶片生態差距體現在那些方面,國內建構狀況如何?A: 國內外AI 晶片生態的差距主要體現在發展歷程、完善程度和技術自主性。輝達自20 世紀90 年代起就基於遊戲闆卡逐步構建生態,經過數十年的積累,其生態系統已極為完善,涵蓋硬體、軟體、演算法、開發者社群等全產業鏈環節。而國內AI 晶片生態建構明顯落後,頭部廠商大多成立於2019 年後,發展歷史僅3-6 年。從建造難度來看,硬體層面的晶片設計可在約1 年內完成,但完整生態的搭建需要大量模型架構師、軟體工程師熟悉硬體特性及驅動開發,周期長、投入大。先前國內頭廠商多依賴類CUDA 或類輝達生態的技術,但2023 年左右輝達對相關技術實施禁令,導致國內廠商無法繼續沿用原有生態,軟體生態和硬體適配均受到顯著影響,進一步拉大了與國際成熟生態的差距。Q: 國內先進製程晶片製造有那些瓶頸,台積電採取了什麼措施?A: 國內在低於7 奈米的先進製程晶片製造領域存在明顯瓶頸。儘管中芯國際等企業已具備一定的先進製程產能,但產品穩定性較差,良率遠未達到台積電等國際頂尖廠商的成熟水平,青島等地的相關先進製程研發與生產嘗試也尚未實現穩定量產。台積電則以限制產能為由,對國內先進製程晶片設計企業(無論是否列入相關名單)的流片需求實施嚴格限制,這直接導致國內企業在5 奈米、7 奈米等先進製程晶片的製造上仍面臨較大困難。在此背景下,國內廠商開始嘗試Chiplet(芯粒)及多芯粒架構等替代方案,但這些方案目前仍面臨高功耗、算力規格不足等技術難題,尚未能完全彌補先進製程製造的短板。Q: 國產化需求對國內AI 晶片發展有怎樣的推動作用,國內廠商採取了什麼措施?A: 國產化需求為國內AI 晶片產業的發展提供了強勁動力,相關政策明確要求算力闆卡等核心硬體的國產化率達到40% 以上,且必須優先使用國產晶片,這一要求倒逼國內AI 晶片企業加速技術研發與產品迭代。為滿足國產化適配需求,實現不同架構晶片之間的高效互聯,國內廠商積極探索異構晶片架構,透過整合多種類型晶片的優勢,嘗試多晶片協同的綜合任務處理模式,突破單一架構在特定場景下的效能限制。這種基於國產化需求的技術探索,不僅推動了國內AI 晶片在架構創新、相容性等方面的進步,也為建構自主可控的AI 產業鏈奠定了基礎。Q: 大模型普及對國內AI 晶片產業有怎樣的驅動作用,以DeepSeek 為例說明?A: 大模型的快速普及為國內AI 晶片產業帶來了強烈的新增需求,成為推動產業發展的核心驅動力之一。大模型在訓練和推理過程中需要處理大量數據,對晶片的算力、記憶體頻寬等性能指標提出了極高要求,直接拉動了高性能AI 晶片的市場需求。以DeepSeek 為代表的大模型,其獨特的多步驟驗證機制(包含反思機制、知識遷移能力等)使得推理過程中的token 用量大幅增加,多步驟驗證的推理token 數量較單步驗證上升10 倍以上,這意味著需要更強大的晶片算力來支撐模型的高效運行。這種需求傳導直接刺激國內AI 晶片企業加大對高算力、高適配性晶片的研發投入,推動晶片產品性能持續升級,以配合大模型的發展節奏。Q: 開源模型對AI 普惠有怎樣的推動作用,DeepSeek 衍生模型情況如何,對AI 應用拓展有何影響?A: 開源模型大大降低了AI 技術的使用門檻,推動AI 普惠進程加速,讓更多企業、開發者乃至科研機構能夠低成本獲取先進的AI 技術與模型,打破了技術壟斷,促進了行業創新活力的釋放。以DeepSeek 為例,其衍生模型數量已達47 萬個,覆蓋全球超170 個國家和地區,形成了龐大的開源生態。這些衍生模型不僅豐富了AI 技術的應用場景,也推動AI 應用從傳統的公共安全、政府部門等領域,廣泛拓展至金融、醫療、教育、工業等20-30 個產業,產業滲透率超過30%。尤其在科學智慧場景中,大模型能夠取代部分科研人員的實驗過程,大大提升了科研效率,同時也產生了龐大的算力需求,進一步帶動了AI 晶片及相關產業的發展。Q: MCP、A to A 等協定對多智能體綜效有怎樣的影響,多智能體協作對算力需求有怎樣的成長?A: MCP、A to A 等協定的出現與應用,顯著增強了多智能體之間的協同效應,使得多智能體能夠高效配合完成複雜任務,逐步取代傳統的單點應用模式。在多智能體協作場景中,單一智能體呼叫模型一次約消耗2000 個token,而多智能體之間的協同互動作用需要處理大量的跨智能體資料傳輸與計算任務,導致算力需求爆發式增長。與單智能體相比,多智能體協作的算力需求倍增,以10 倍的成長幅度估算並不誇張。這種算力需求的成長,不僅對AI 晶片的平行運算能力、資料處理速度提出了更高要求,也為算力基礎設施的升級與擴容提供了重要的市場驅動力。Q: 當前推理算力市場處於什麼階段,從那些數據可以看出,未來算力需求趨勢如何?A: 目前推理算力市場仍處於早期滲透階段,尚未進入大規模普及期。從具體數據來看,2025 年年終座談會的相關統計顯示,阿里雲每月帳面使用推理算力達到1 萬以上的客戶佔比不足5%;同時,國央企雖然在推理端存在明確需求,且透過雲端部署或私有化部署等方式開展相關應用,但整體態度較為謹慎,僅在個別行業實現了大規模普及,尚未形成全行業的普及,尚未形成全行業的普及,尚未形成全行業的普及,尚未形成全行業的普及。基於當前的市場滲透情況和AI 技術的發展趨勢判斷,隨著大模型應用的持續深化、開源生態的不斷完善以及多智能體協同場景的日益豐富,未來推理算力需求將迎來爆發式增長,成為算力市場增長的核心引擎。Q: 東數西算工程在十四五期間的實施情況如何,建成了多少國家級計算中心,資金來源是怎樣的,政策統籌情況如何?A: 東數西算工程是十四五期間國內算力基礎設施升級的核心舉措之一,其核心邏輯是將東部發達地區對算力需求大、能耗較高的訓練任務,轉移至中西部能耗成本低、水電和風電等綠色能源充足的地區進行算力部署,計算完成後再將結果參數傳回東部地區。透過這項工程的實施,國內已成功建成12 個國家級運算中心,建構全國性的算力網路骨幹架構。在資金來源方面,並非由國家全額出資,而是採用多元化的融資模式,包括企業(如華為等科技企業)自主投資、地方政府統籌籌措資金,同時輔以地方債補充資金缺口。政策統籌層面,東數西算工程需要國家發改委與地方發改委協同推進,涉及算力佈局、能耗指標、能效標準等多項審批工作,地方新計算中心通常需要上報至國發改委層面完成最終審批,確保工程實施與國家整體算力規劃、能源戰略相契合。Q: 算力具有怎樣的戰略意義,未來算力規模將有怎樣的變化,中國為何必須持續投入算力基建?A: 算力已從過去的技術支援角色走向台前,成為與電力同等重要的經濟基礎設施,是衡量一個國家科技實力和經濟競爭力的核心指標之一。掌握先進的算力基礎設施,意味著在全球科技競爭中擁有主導權,同時也能獲得推動經濟結構轉型升級、實現高品質發展的核心引擎。從未來發展趨勢來看,隨著AGI(通用人工智慧)、科學智慧及具身智慧等技術的持續演進,資料處理的規模和複雜度將大幅提升,算力規模將從目前的10 萬卡等級快速提升至30 萬張卡等級。算力是實現下一代智慧技術突破的核心前提,對中國而言,持續投入算力基建不僅是應對全球科技競爭的戰略選擇,更是保障產業鏈供應鏈自主可控、推動數位經濟高品質發展的必然要求,因此必須長期堅持並加強投入。Q: 國內主流的AI 晶片頭廠商有那些,是基於什麼排序的?A: 目前國內主流的AI 晶片頭廠商包括華為、寒武紀、沐曦、摩爾線程、壁仞、天數等企業。這項排名是基於個人實測的角度形成的大致排序,主要參考維度包括晶片的實際算力性能、在不同應用場景下的適配能力、軟硬體生態的完善程度、產品的穩定性與良率,以及在市場中的實際應用案例和客戶反饋等多方面因素,綜合反映了各廠商在當前國內AI 晶片市場中的競爭力水平。Q: 未來算力市場規模成長情況如何,2025 年國內智算規模及全球算力市場規模預計為多少,國內2025 年整體服務市場規模及構成情況如何?A: 未來全球及國內算力市場規模都將呈現指數級成長態勢,過去幾年算力市場的年增長率已超過40%,且此成長趨勢將持續。 2025 年國內智算規模已達1000 多EFLOPS(其中1000P 相當於10 的18 次方FLOPS,1P 算力可拆分為兩張卡,規模相當於2×10^6);全球2025 年算力市場規模預計達726 億美元。從國內市場來看,2025 年AI 算力整體服務市場(包含晶片及相關配套服務)規模約為155 億元,其中基礎設施整合規模(涵蓋晶片、伺服器、機櫃、電源配套、網路儲存設備等核心硬體)達到120 億元,年成長超過110%,呈現強勁的成長動力。值得注意的是,目前市場資金正快速向頭部企業集中,產業集中度持續提升,頭部廠商在技術研發、產能供應和生態建構的優勢將進一步擴大。Q: 晶片算力的主要消費主體有那些,國內主要雲廠商和營運商的算力投資情況如何?A: 晶片算力的主要消費主體集中在雲端廠商和營運商,這兩類主體憑藉其業務特性,對算力有著持續且大規模的需求。國內主要雲端廠商中,阿里、騰訊、百度、字節(合稱BATT)是核心採購方,其中阿里已明確宣佈未來在算力領域的投入將超過3800 億元;騰訊的算力相關開支增長超過200%,資金主要集中於晶片採購、伺服器部署和計算叢集搭建。營運商方面,中國移動、中國聯通、中國電信的算力投資未來將至少維持10% 的年均成長,但由於過去幾年已進行了大規模的基礎設施投入,2025 年的實際投入量相對平穩,不會出現爆發式增長。此外,除了頭部雲廠商和營運商,國內其他科技企業也紛紛加大算力佈局,預計將有多家廠商相繼投入千億以上資金用於算力相關的硬體採購和基礎設施建設。Q: 華為新出的昇騰910C 晶片在2025 年WIC 世界人工智慧大會展出情況如何,其技術性能如何?A: 華為全新推出的昇騰910C 晶片在2025 年WIC 世界人工智慧大會上正式展出,引發業界廣泛關注。該晶片在技術性能上表現突出,採用384 卡全光互聯技術,推理效率較行業標竿產品H100 提升超過20%,國產化率達到85%,由中芯國際採用7 奈米過程代工生產,實現了核心硬體的高度自主化。在關鍵參數方面,昇騰910C 支援HBM3 的128G 顯存規格,標準算力達到800T FLOPS,1 至8 卡叢集的算力可達到1500 多TOPS,在當前國產AI 晶片中技術性能排名靠前,能夠充分滿足大模型訓練、複雜推理等高端算力需求,為國內AI 的獨立硬體支撐提供了支援。Q: 沐曦晶片有什麼特點,代表型號是什麼?A: 沐曦晶片的核心特點是原生支援FP8 標準,而FP8 是當前大模型訓練的主流精度標準,這使得沐曦晶片在大模型訓練場景中具備天然的適應優勢。同時,得益於軟硬體的深度適配優化,沐曦晶片的千卡叢集吞吐率較業界平均提升40%,能夠大幅提升大型模型訓練與推理的效率,降低算力消耗成本。沐曦晶片的代表型號為MXCU C600,該型號產品憑藉其高性能、高適配性的特點,已在多個國內大模型項目中得到應用,成為國產高端AI 晶片的重要選擇之一。Q: 計算中心建置需要採購那些設備和服務?普通42U 機櫃最多可容納多少八卡設備,單機櫃功耗一般多少?A: 計算中心建置是一項系統工程,需要購買的設備和服務涵蓋多個維度。核心設備包括伺服器、AI 闆卡、儲存設備等算力核心硬體;配套設備則包括機櫃、電力供應系統、冷卻系統(如暖通空調、液冷設備等)、網路交換設備等基礎設施;此外,還需要專業的運維服務、技術支援服務以及後期的設備升級與維保服務,以保障運算中心的穩定運作。在硬體部署方面,普通42U 機櫃受設備尺寸和安裝規範限制,最多可容納約15 台八卡設備;單機櫃功耗通常不超過12000 瓦,不過部分廠商透過優化設備佈局、採用高效電源和冷卻方案等適配改良措施,可在保證安全的前提下適當提升單機櫃的功耗上限,以滿足高密度算力部署的需求。Q: 光互聯技術有什麼優勢,國內有什麼實務應用?A: 光互連技術作為算力網路中的關鍵支撐技術,具有顯著的效能優勢。與傳統的電互聯技術相比,全光互聯能夠大幅降低節點間的資料傳輸延遲,減少訊號衰減和乾擾,從而提升計算任務的成功率和整體運算效率,尤其適合大規模計算叢集、跨區域算力調度等對傳輸速度和穩定性要求極高的場景。在國內,光互聯技術已進入實際應用階段,以上海為例,當地已在多個資料中心和算力叢集中採用光互聯、光直連(闆卡間直接互聯)技術,透過建構高速、低延時的算力網絡,為大模型訓練、跨區域資料共享等場景提供了高效的傳輸保障,成為國內光互連技術實踐的標竿案例。Q: 國家製訂了那些完整的人工智慧晶片系統標準?A: 國家已針對人工智慧晶片領域制定了完整的系統標準體系,涵蓋AI 晶片從設計、生產到應用的全生命周期關鍵環節。具體包括智慧晶片指令集標準,規範晶片的指令架構,確保軟硬體的相容性;性能功耗測試要求,明確晶片在不同負載下的性能評估指標和功耗控制標準,為產品選型提供依據;軟體算子互聯互通標準,保障不同廠商的晶片與各類AI軟體、演算法的適配性,打破技術壁壘;神經網路模型演算法載入標準,規範模型在晶片上的部署流程與運作機制;以及編譯器相關標準,優化晶片對模型的編譯效率,提升算力發揮水準。這一系列標準的製訂,為國內AI 晶片產業的規範化發展提供了重要保障,推動產業形成統一的技術規範和市場秩序。Q: 根據巴克萊預測,2026 年全球推理算力需求將如何,產業發展方向有那些?A: 根據巴克萊的專業預測,到2026 年,全球推理算力需求將佔總運算需求的70% 以上(此資料不含訓練需求),推理算力將成為算力市場的核心成長極。未來AI 算力產業的發展方向主要集中在兩大領域:一是綠電佈局,透過電算協同的模式,引導算力資源向綠電富集的負極區佈局,實現能源供給與算力需求的精準匹配,既降低算力運行成本,又符合綠色低碳的發展理念;二是十萬卡跨域分佈式跨域分佈式晶片協同作用,萬張,其中國產晶片佔比達50% 以上,未來將進一步推動跨區域、大規模的算力協同,提升整體算力的利用效率與調度彈性。Q: 主流AI 晶片效能參數如何,國內算力需求規模預計是多少,網路廠商需求情況怎樣,從應用場景看訓練與推理佔比如何?A: 主流國產AI 晶片的性能參數各有優勢:華為昇騰910C 的INT8 算力為1500 TOPS,FP16 算力為800T FLOPS,顯存規格128GB;寒武紀690 的FP16 算力為512T FLOPS,顯存容量為1444218697239753;算力約320T FLOPS。從國內算力需求規模來看,未來兩年預計將達到500 萬張卡的總量需求,其中互聯網廠商是核心需求主體,由於其業務涵蓋大模型應用、短視頻處理、智能推薦等多個高算力消耗場景,需求規模較大。從應用情境來看,目前大部分GPU 卡均具備訓練與推理雙重功能,無需嚴格區分場景屬性;若需明確劃分,推理場景的算力需求佔比約為60%-70%,訓練場景佔比約為30%,推理需求已成為算力消耗的主要部分。Q: 適合國內大模型訓練的國產晶片建議型號有那些?A: 適合國內大模型訓練的國產晶片推薦機型包括一系列經過市場驗證、性能穩定的產品:華為昇騰910B、華為昇騰910C、寒武紀690、沐曦MXCU C600、壁仞BR200、天數智芯天垓2000、摩爾線程S80 等。這些晶片均具備高算力、大顯存、高頻寬等大模型訓練所需的核心特性,能夠適應不同規模、不同類型的國內大模型訓練需求。其中,華為昇騰系列憑藉著完善的生態支援和穩定的性能表現,在頭部大模型項目中應用廣泛;寒武紀、沐曦、壁仞等廠商的產品則在特定場景下具備獨特優勢,為國內大模型訓練提供了豐富的國產化選擇,有效降低了對國外晶片的依賴。Q: 華為384 叢集搭載的是920B 還是920C 晶片,該產品大規模出貨情況如何?A: 華為在2025 年展出的384 卡算力叢集搭載的是昇騰920C 晶片,該晶片作為華為推出的新一代高端AI 晶片,在算力性能和互聯技術上均有顯著提升。不過,昇騰920C 晶片目前尚未實現大規模售賣,核心限制因素是代工供貨短缺,當前國內先進製程代工產能的不足,導致該型號晶片的量產規模無法滿足市場的大規模需求。需要注意的是,目前華為在市場上大規模出貨的並非昇騰910C 晶片,而是技術成熟、產能穩定的昇騰910B 晶片,昇騰910B 仍是當前華為AI 晶片的主流出貨型號,能夠滿足大部分客戶的算力需求。Q: 該產品對外宣傳的算力指標是基於920B 還是920C 計算的,市場實際交付情況如何?A: 從業界常規宣傳邏輯來看,產品對外宣傳時通常會採用最先進或最新推出的版本所對應的性能指標,華為384 叢集對外宣傳的算力指標正是基於已流片的新一代晶片昇騰920C 計算的,這能夠更直觀地展現產品的技術實力和未來潛力。但從市場實際交付情況來看,由於昇騰920C 晶片受代工產能限制,尚未實現大規模量產,因此當前市場實際交付的產品仍以昇騰920B 為主。而在華為的整體產品矩陣中,昇騰910B 憑藉穩定的產能、成熟的技術和較高的性價比,成為當前市場的主流交付產品,能夠充分滿足國內大部分AI 項目的算力需求。Q: 910C 與690 兩款產品中,那一款的算力較強,實測效果較優,實測的算力水準分別是多少?A: 在華為昇騰910C 與寒武紀690 兩款產品的比較中,昇騰910C 的算力更強,實測效果更優,更能滿足高端算力需求場景。根據實測數據,昇騰910C 在FP16 精度下的算力達到1500 TOPS,配備128GB HBM 顯存,顯存帶寬和數據處理速度表現出色;寒武紀690 在FP16 精度下的實測算力約為500 TOPS,沐曦同級在FP16 下昇級功率下的實測算功率為華FLOPS,顯存容量為144GB,在實際運行大模型時,昇騰910C 消耗的卡牌數量相對較少,算力利用效率更高,能夠有效降低大規模算力部署的成本。Q: 920B 是否優於590,海光目前是否涉及生產3 號產品?A: 華為昇騰920B 在性能上明顯優於寒武紀590,寒武紀590 作為前一代產品,在算力、顯存頻寬、適配性等核心指標上均落後於昇騰920B,已逐漸退出高端算力市場,僅在部分中低端場景中仍有應用。關於海光的產品佈局,海光的核心產品以CPU 為主,其推出的DPU 產品主要面向大數據處理場景,專注於資料傳輸、儲存最佳化等任務,一般不用於AI 加速運算。目前海光並未涉及所謂「3 號產品」 的生產,其業務核心仍聚焦於CPU 及相關配套晶片的研發與生產,主要應用於國產替代中的CPU 晶片領域,為國內電腦設備提供自主可控的核心處理器支援。Q: 目前國內市場算力晶片以卡片數量計算的整體市場需求量級是多少,其中用於訓練與推理的卡數量分別是多少,該投資範圍僅指特定主體嗎,互聯網廠商的投資規模情況如何,分兩年規劃的500 萬卡中,用於推理與訓練的比例分別是多少?A: 國內算力晶片按卡數量計算的總體市場需求量級可透過區域增量推導得出:上海未來兩年的算力將從當前的30 億FLOPS 增長至55 億FLOPS,增量約25 億FLOPS,對應約10 萬張晶片需求;按全國範圍需求為上海的10 倍總投資,未來兩年國內算力道而網路廠商的算力需求更為龐大,保守估計其投資規模是政府或國有投資資料中心的5 倍,約500 萬張卡,這部分需求主要來自頭部雲廠商和科技企業的算力叢集搭建。從場景劃分來看,目前無需嚴格區分訓練與推理用卡,因為大部分GPU 卡均可相容兩種場景,僅端側設備用卡更側重推理;若需明確區分任務屬性,預計推理用卡佔比約60%-70%,訓練用卡佔比約30%,推理場景仍是算力晶片的主要需求來源。 (大道調查)
對話徐直軍:華為最大的殺招,不是AI晶片
華為以超節點和叢集算力解決方案,讓中國沒有算力之憂。徐直軍終於把他這六年最想說的話說了出來。2025年華為全聯接大會,會場的燈光一點點暗下去,大螢幕上浮現出“昇騰”字樣的那一瞬間,沒有想像中的轟然與熱烈,有人屏住了呼吸,有人眼眶泛紅,大家都知道,昇騰有一天會公開回歸,但真正回歸的那一刻,感慨的情緒壓過了興奮。華為公佈了未來數年完整的AI晶片路線圖——這一刻,距離2018年發佈昇騰310晶片,2019年發佈昇騰910晶片,已經過去了兩千多個日與夜。這時間說長不長,說短也不短,卻足夠讓一家企業經歷生死沉浮。2019年的那個春天,美國的制裁讓供應鏈幾乎在一夜之間緊繃到極限。華為一度樂觀地認為,這種影響不會持續太久,2019年的華為全聯接大會上,華為按照既定節奏推進昇騰910的商用發佈,依舊一副雲淡風輕的模樣。但壓力已經遍佈每一處角落。徐直軍回憶道,“按照當時昇騰910晶片的備貨量,不敢賣給網際網路領域客戶,只賣國計民生領域的客戶。”制裁像驟然降臨的暴風雨,打斷了華為原本昂揚的節奏。從榮光到孤立,從掌聲到質疑,華為的晶片之路幾乎被外界判了“死刑”。度過有史以來最大的難關,需要付出什麼代價,除了華為自己,無人知曉。外界看到的華為,可能是Mate 60“爭氣機”,可能是鴻蒙作業系統,也可能是MetaERP、高斯資料庫以及一系列確保自身生產經營的中介軟體。但更多華為人在蟄伏,海思、雲端運算、資料中心、光通訊等華為大大小小的團隊,都迫不及待要加入一線,AI算力,這是華為未來真正的戰場。今年3月份,華為正式推出了Atlas 900超節點,可以理解為華為AI戰略的預告,滿配支援384卡。384顆Ascend 910C晶片,能夠像一台電腦一樣工作,最大算力可達300 PFLOPS。到目前為止,Atlas 900依然是全球算力最大的超節點,CloudMatrix384超節點,是華為雲基於Atlas 900超節點建構的雲服務實例,也被廣泛應用於大模型的訓推。海外知名分析機構SemiAnalysis,當時以“Huawei AI CloudMatrix 384–China’s Answer to Nvidia GB200 NVL72”為題分析並得出結論,華為的晶片技術落後一代,但其自主研發的雲端超級算力解決方案CloudMatrix 384卻可領先於輝達和AMD當前市售產品一代,直接對標輝達GB200 NVL72系統,在多項關鍵指標上展現出超越輝達機架級解決方案的技術優勢。“以前英特爾允許我們使用CPU晶片互聯協議,後來也被禁止了,我們從光器件、光模組、互聯協議、互聯晶片,全部靠重新定義、設計才能實現,有海外企業一直想把超節點搞一套出去,研究我們為什麼能搞出超節點”徐直軍說。相比於晶片本身,海外更關注超節點,因為目前海外能做出更好的晶片,但做不出如華為一般的超節點。2025年華為全聯接大會,時隔多年之後,華為輪值董事長徐直軍再次與多家媒體對話——晶片不是華為AI算力的全部,“超節點+叢集”算力解決方案是華為在AI領域的核心戰略,靈衢互聯協議是開創新計算架構的新範式。晶片很重要,也沒那麼重要“算力的基礎是晶片,昇騰晶片是華為AI算力戰略的基礎。”徐直軍表示,至2028年,華為開發和規劃了三個系列,分別是Ascend 950系列,Ascend 950PR和Ascend 950DT,以及Ascend 960、Ascend 970系列,更多具體晶片還在規劃中。華為將以幾乎一年一代算力翻倍的速度,同時圍繞更易用,更多資料格式、更高頻寬等方向持續演進,持續滿足AI算力不斷增長的需求。相比Ascend 910B/910C,從Ascend 950開始的主要變化包括:引入SIMD/SIMT新同構,提升程式設計易用性;支援更加豐富的資料格式,包括FP32/HF32/FP16/BF16/FP8/MXFP8/HiF8/MXFP4/HiF4等;支援更大的互聯頻寬,其中950系列為2TB/s,970系列提升到4TB/s;支援更大的算力,FP8算力從950系列的1 PFLOPS提升到960的2 PFLOPS、970的4 PFLOPS;FP4算力從950的2 PFLOPS提升到960的4 PFLOPS、970的8 PFLOPS;自研HBM,記憶體容量逐漸加倍,而記憶體訪問頻寬將翻兩番。晶片本身之外,生態是開發者關注的焦點問題,徐直軍表示,“國內AI企業用昇騰訓練大模型,主要是看他們用不用,就像談戀愛,不談的話,你怎麼知道對方的優缺點,合適不合適,你要談一下,要用一下。在用的過程中有問題解決問題,A能用,為什麼B不能用,就是你用不用的問題。”“當然,我們的生態和整個工具鏈肯定比輝達有差距,原來工程師在輝達應用很熟練,就不願意轉過來,它是工程師的習慣問題,而不是高層的問題。”他補充。業界不少晶片廠商選擇相容輝達CUDA生態,對現有AI開發體系友好,但華為有自己的考量。“我們不相容CUDA生態,一定要搞CANN生態和MindSpore,也是出於長遠考慮,如果我們投如此多的錢相容CUDA生態,而且還是CUDA過去的版本,那天CUDA生態相容不了了怎麼辦?堅定不移研發MindSpore,當時很多專家都反對。現在我們的AI,從達文西到昇騰晶片到一切,所有的軟體、硬體都不依賴於西方生態和供應鏈,長遠考慮必須要把生態建構起來。”徐直軍坦言。如果故事只到這裡,華為充其量實現了“活下來”的任務,很好,但對華為來說遠不夠好。畢竟在昇騰設計之初,就不是為了做一個備份,昇騰910發佈就衝著最強算力的目標,在供應鏈和製程等晶片製造能力落後的情況下,華為昇騰晶片短期內還將處於追趕的狀態。然而,很多人沒有意識到,成就輝達的大模型,其實下一個成就的就是華為,大模型前期,輝達受益於單個GPU卡的性能和CUDA生態,未來隨著AI的演進,華為受益的是“超節點+叢集”,後者已經在頂級大模型圈層得到認可,而普羅大眾的認知不強。超節點+叢集 讓中國沒有算力之憂2022年,輝達曾發佈DGX H100 NVL256“Ranger”平台,但最終未投入量產——該方案因成本過高、功耗巨大且可靠性問題(源於超量光收發器需求及雙層網路架構)而被放棄。在2024年3月,輝達轉而推出基於Blackwell GPU打造的GB200 NVL72超節點產品,規模大幅縮小。回過頭看,輝達的超節點路標已經消失不見,輝達既證明了超節點是未來算力的趨勢,也證明了超節點做起來的難度,華為接過AI算力的下一棒。本次大會上,華為發佈了最新超節點產品Atlas 950 SuperPoD和Atlas 960 SuperPoD超節點,分別支援8192及15488張昇騰卡,在卡規模、總算力、記憶體容量、互聯頻寬等關鍵指標上全面領先,在未來多年都將是全球最強算力的超節點。基於超節點,華為同時發佈了全球最強超節點叢集,分別是Atlas 950 SuperCluster和Atlas 960 SuperCluster,算力規模分別超過50萬卡和達到百萬卡,是當之無愧的全世界最強算力叢集。“除了單顆晶片比它(輝達)的算力小一點,功耗大一點,其他都是優勢。”徐直軍如此評價,“因為AI就是平行計算,所以我們的解決方案就是超節點,超節點做成一台機器,你用5顆,我可以用10顆,那我們用384/8192/15488顆晶片,這還不是最大的。”他進一步解釋道,(華為)不同於大模型公司,也不同於應用公司,作為ICT基礎設施和智能終端提供商,華為充分發揮自身優勢,紮紮實實把基礎設施做好,通過基礎設施掙錢,做超節點、做叢集,公司內部已達成共識,通過昇騰硬體變現,取得商業成功。超節點是一條不得已的道路,也是能夠將華為所有能力融為一體,最大程度發揮華為優勢的道路,更具有決定意義的是,超節點能夠將華為在單晶片的劣勢扭轉為勝勢,超過輝達,實現算力最強。“什麼叫超節點?儘管物理上是多機櫃、多個卡(8192個卡或者是15488個卡)聯接成一個超節點,但是它們能夠像一台電腦一樣工作、學習、思考、推理。叢集是把多個超節點以網路聯結在一起,就像雲服務一樣,相當於用多個伺服器一樣,即把多台伺服器連接在一起,再以軟體層將它調度。”徐直軍說。他進一步表示,華為的核心戰略就是“超節點+叢集”,只有依靠超節點和叢集,才能規避中國的晶片製造工藝受限,才能夠為中國的AI算力提供源源不斷的算力支援和供給。“創新有時是被逼出來的,不是天生想做。我們應對制裁,用非摩爾補摩爾、用數學補物理,不是什麼偉大的事情。歷史上海思靠晶片領先別人一代,現在晶片落後一代、兩代,未來還不知道落後幾代,只有另尋出路。另一條路就在這裡,由於晶片工藝受限,逼著我們創新突破。”徐直軍說。靈衢,以及華為自己的路在徐直軍大會演講的最後,並不是以晶片來收尾,“我們希望和產業界一起,以開創的靈衢超節點互聯技術,引領AI基礎設施新範式;以基於靈衢的超節點和叢集持續滿足算力快速增長的需求,推動人工智慧持續發展,創造更大的價值。”在業內人士看來,靈衢的革命意義可能不亞於AI基礎設施的再造,華為超節點+叢集的成功,很大程度就依賴於靈衢。如果說光刻機是把單晶片的性能持續放大,那麼,靈衢則是將數以萬計的晶片聯接起來。2021年,華為規劃了三個公司等級的戰略項目,其中之一是鴻蒙作業系統,另一個就是靈衢,其戰略意義,可見一斑。輝達或者其他晶片公司的長處在於晶片,超節點卻不是靠簡單堆晶片就能實現大算力,就像大模型訓練算力,在一定範圍內,算力隨著晶片數量的增加線性增長,到了一定瓶頸,晶片增加,邊際效應大幅降低。為大模型而定做的算力叢集中,需要大量的資料高速傳輸,在人類歷史上沒有過這種,正向打滿然後負向再打滿的傳輸需求,低時延、高吞吐的要求都到了嚴苛等級,而且未來的算力不僅僅是當前大模型需要AI算力之間的高速互聯,同時,AI算力和通用算力之間,通算和通算之間,也存在高速互聯的需求。隨著IT產業的發展,PCIE、InfiniBand、RoCE等各種協議平行發展,輝達的NVlink等協議最大化發揮了輝達GPU的算力,靈衢不止是一個替代,它是AI算力互聯標準的重塑,通過靈衢互聯協議,能夠把數萬規模的計算卡,聯接成一個超節點。相較於NVlink協議的封閉,華為宣佈將開放靈衢2.0技術規範,投入如此之大的心力,華為為何要將靈衢開放,其實不難理解,華為的理念是硬體變現,靈衢若只是華為一家之言,那就無法形成生態,更多的企業用靈衢建構自己的算力叢集,產業的雪球才能越滾越大。“我們的路肯定不是輝達的路,現在大家都以輝達的視角看我們的路,不公平。但我們自己不能‘傻’。我是短期痛苦,長期不痛苦。”徐直軍說。華為在AI算力領域走出來了一條自己的路,這是由很多能力建構成的系統。以光通訊技術為例,輝達超節點採用了全銅通訊,優點是技術成熟,成本較低,缺點是只能部署2米以內,否則速度會大幅衰減,因此可聯接晶片數量有限。華為採用了更激進的光通訊策略,光模組帶來了高頻寬和高速率的優勢,損耗低,適合長距離傳輸,因而可聯接更多晶片,部署靈活。但是,在華為之前,沒有一家廠商敢用光模組來實現超節點,光模組故障率高且成本高,方案能不能做成都是未知數,華為憑藉著多年積累的通訊能力,在光晶片和連接技術、故障恢復等方面形成了一套獨一無二的方案,使得超節點成為可能。華為的勝利,是系統的勝利,是所有華為人乃至中國計算產業鏈的勝利。徐直軍表示,“用超節點架構以及支援超節點的靈衢互聯協議,打造超節點和叢集,來滿足中國無窮無盡的算力需求,這既是我們對自己的一個目標,又是對產業界的承諾,更是對國家的承諾。”“把這條路闖出來,把中國產業鏈拉動起來,這條路就成了路。算不上新範式,是被迫出來的範式,是被逼出來的偉大。”徐直軍說,“誰想做別人做過的事情呢?肯定想去開創未來的事情。” (鈦媒體)
中國IT有國家超巨大能量做後盾,發展需要超巨大能量支持的系统,產出高效能AI自然就引來人才。
中國算力大逆轉,華為彎道碾壓輝達、xAI
9月18日,外交部例行記者會。法新社記者提問,據英國《金融時報》報導,中國網際網路監管機構已指示阿里巴巴、字節跳動等公司停止購買輝達RTX Pro 6000D晶片。輝達首席執行官黃仁勳稱,對此表示失望。中方能否證實報導所說情況?對此有何評論?外交部發言人林劍表示,具體問題建議向中方的主管部門瞭解。我們一貫反對在經貿科技問題上對特定國家採取歧視性做法。中方願同各方保持對話合作,維護全球產供鏈穩定。同日,為期三天的華為全聯接大會2025在上海拉開序幕。在元界(ID:Metabod)看來,這場大會是華為官宣在超節點算力、記憶體容量、互聯頻寬等性能上全面碾壓輝達,以及在超節點叢集規模及算力能力全面碾壓馬斯克旗下AI公司xAI算力叢集的歷史性時刻。一方面是外交部對有關中國企業被指示停止購買輝達晶片的報導作出了原則性回應;另一方面是華為發佈了在關鍵性能上顯著領先輝達、xAI的算力基礎設施產品。將這兩則資訊及此前中國官方宣佈對輝達進一步調查的新聞結合起來解讀,歷史終將記住,2025年9月18日,九一八事變94周年紀念日,一個看似尋常的日子,全球AI算力競爭與中美科技博弈正在掀開新的篇章。一年一代、算力翻倍昇騰晶片三年路線圖首次披露9月16日,華為發佈未來10年十大智能技術趨勢。其中第七個趨勢提到,2035年全社會的算力總量將增長10萬倍,計算領域將催生新型計算的全面興起。在18日的演講中,華為輪值董事長徐直軍直言:“算力過去是,未來也將繼續是,人工智慧的關鍵,更是中國人工智慧的關鍵。”在全球AI競賽進入深水區的當下,算力已不僅是技術問題,更是國家戰略資源。美國憑藉輝達GPU在AI訓練領域的絕對優勢,長期主導全球算力格局。而中國在面臨先進製程晶片製造受限的背景下,如何建構可持續、自主可控的算力體系,成為產業發展的關鍵命題。基於此,華為用持續不斷的努力、構架與產品,對國產AI基礎設施路徑做出了系統性回應。華為李鵬:AI時代,如何以新範式實現有效商業增長華為雲張平安:中國 AI 創新道路到底怎麼走?這個觀點必須摒棄掉在本次大會上,徐直軍首次公佈了昇騰AI晶片的未來發展規劃:預計2026年第一季度推出昇騰950PR晶片,四季度推出昇騰950DT,2027年四季度推出昇騰960晶片,2028年四季度推出昇騰970晶片。華為昇騰鮮少披露昇騰晶片進度,這是徐直軍時隔六年再談晶片進展。這一清晰的時間表,是華為在AI晶片研發上的長期投入與戰略定力的體現與結果。昇騰系列晶片自2019年推出以來,已發展為支撐中國AI產業的重要力量。特別是在美國對華實施AI晶片出口管制後,昇騰910B成為國內替代輝達A100/H100的主力選擇,廣泛應用於智算中心、大模型訓練等場景。此次公佈的950PR、950DT等新品,延續了昇騰架構的迭代路徑,其中950PR將採用華為自研的高頻寬記憶體(HBM)技術,標誌著華為在儲存、封裝等關鍵環節的技術突破。定位不同是,950PR專攻“Prefill”性能,後者是AI推理過程中的關鍵階段;950DT則注重提升推理Decode(解碼)性能、訓練性能,並提升記憶體容量和頻寬。徐直軍表示,昇騰960在算力、記憶體訪問頻寬、記憶體容量、互聯連接埠數等各種規格上相比昇騰950翻倍,其將首先支援的產品形態是標卡和超節點伺服器,將在2027年四季度推出。而相比昇騰960,昇騰970的FP8算力、互聯頻寬等要全面翻倍,記憶體訪問頻寬至少增加1.5倍,計畫在2028年四季度推出。昇騰晶片正在以幾乎一年一代、算力翻倍的速度持續推進。全面碾壓輝達、xAI超節點+叢集,重構AI基礎設施範式面對單晶片性能受限的現實,華為選擇從系統架構層面進行創新。徐直軍表示,從大型AI算力基礎設施建設的技術方向看,超節點已經成為主導性產品形態,並正在成為AI基礎設施建設的新常態。超節點事實上就是一台能學習、思考、推理的電腦,物理上由多台機器組成,但邏輯上以一台機器學習、思考、推理。今年3月,華為正式推出Atlas 900超節點,滿配支援384卡,最大算力可達300 PFLOPS。此次推出Atlas 950 SuperPoD和Atlas 960 SuperPoD兩款超節點產品,分別支援8192張和15488張的昇騰AI加速卡,在卡規模、總算力、記憶體容量、互聯頻寬等關鍵指標上全面領先,甚至在未來多年都將是全球最強算力的超節點。他表示,相比輝達將在明年下半年上市的NVL144,Atlas 950超節點卡的規模是其56.8倍,總算力是其6.7倍,記憶體容量是其15倍,達到1152TB;互聯頻寬是其62倍,達到16.3PB/s。即使是與輝達計畫2027年上市的 NVL576相比,Atlas 950超節點在各方面依然是領先的。Atlas 950超節點滿配包括由128個計算櫃、32個互聯櫃,共計160個機櫃組成,佔地面積1000平方米左右,櫃間採用全光互聯。其中,FP8算力可達到8E FLOPS,FP4算力達到16E FLOPS。徐直軍說,互聯頻寬達到16PB/s,這個數字意味著,Atlas 950一個產品的總互聯頻寬,已經超過今天全球網際網路峰值頻寬的10倍有餘。而基於超節點,華為同時發佈Atlas 950 SuperCluster和 Atlas 960 SuperCluster兩個超級節點叢集,其算力規模分別超過50萬卡和達到百萬卡等級,是當之無愧的全世界最強算力叢集。徐直軍表示,Atlas 950 SuperCluster叢集,相比當前世界上最大的叢集xAI Colossus,規模是其2.5倍,算力是其1.3倍,是當之無愧的全世界最強算力叢集。他說,無論是當下主流的千億稠密、稀疏大模型訓練任務,還是未來的兆、十兆大模型訓練,超節點叢集都可以成為性能強悍的算力底座,高效穩定地支援人工智慧持續創新。華為,基於實際可獲得的晶片製造工藝,計算、儲存和網路技術協同創新,開創計算架構,打造“超節點+叢集”系統算力解決方案,彌補單晶片性能差距,實現整體算力的躍升,重新定義了AI基礎設施的範式。“靈衢”互聯協議:打破AI算力傳輸瓶頸大規模算力叢集的核心挑戰,在於互聯。當前電互聯、光互聯技術都不能滿足多機櫃間長距離互聯的需求,傳統網路架構難以支撐超節點間低延遲、高頻寬的資料交換需求。為此,華為基於三十年通訊技術積累,推出面向超節點的互聯協議——“靈衢”(UnifiedBus)。“靈衢”協議正是為解決這一瓶頸而生。它實現了計算、儲存、網路資源的深度融合,顯著提升系統效率。華為通過系統性創新,在互聯協議的物理層、資料鏈路層、網路層、傳輸層等都引入了高可靠機制,重新定義和設計了光器件、光模組和互聯晶片,使光互聯的可靠性提升百倍、且互聯距離超過200米。同時,在大頻寬與時延上,依靠多連接埠聚合與高密封裝技術,以及平等架構和統一協議,華為實現了TB級的超大頻寬,2.1微秒的超低時延。這些技術上的突破令華為能夠將萬卡級晶片整合為一個整體,讓超節點像“一台電腦”一樣工作、學習、思考、推理。華為宣佈開放“靈衢2.0”技術規範,呼籲產業夥伴共同研發相關產品與部件,共建開放生態。此舉意在打破國外在高速互聯技術上的壟斷,建構中國自主的AI基礎設施標準。從晶片競爭到系統博弈生態之爭將成中美AI對決的關鍵當前全球AI算力競爭,已從單一晶片性能比拚,轉向系統級綜合能力較量。美國仍憑藉輝達GPU+CUDA生態佔據領先地位,但其優勢正面臨挑戰。一方面,摩爾定律放緩使得晶片性能提升邊際遞減;另一方面,大模型對算力需求呈指數級增長,迫使業界探索新的架構路徑。中國則在外部壓力下加速自主創新。華為的“超節點+叢集”模式,與GoogleTPU Pods、亞馬遜Trainium叢集等形成差異化競爭。這種以系統整合和架構創新彌補製造短板的路徑,正在成為後摩爾時代的重要方向。徐直軍多次強調“算力的可持續”。這不僅指硬體供應,更包括軟體生態、開發者支援與應用場景適配。昇騰要真正替代輝達CUDA生態,這是一個長期的動態的博弈的過程,仍需在AI框架、工具鏈、模型庫等方面持續投入。相對輝達的厚實、積澱與引領,華為需要走的路還很長。華為全聯接大會2025,本是一場華為超節點及叢集算力能力全面超越輝達和xAI的歷史性時刻,但沒有看到有媒體從此角度佈局謀篇,這或是這場大會高調傳播中的超級低調之處。與此同時,華為提出“不是每個企業都要建設大規模AI算力”,倡導按需選擇模型規模。從十億參數模型滿足端側推理,到千億參數支撐複雜NLP任務,企業應根據業務場景選擇合適方案。這一理念有助於避免資源浪費,推動AI應用理性發展。徐直軍的演講,既是對華為戰略的宣示,也是對中國AI發展路徑的思考。在全球科技博弈加劇的背景下,華為正通過晶片、架構、互聯、生態的全端創新,建構一條自主可控的AI算力之路。這條道路充滿挑戰,但方向清晰:以系統性創新突破外部封鎖,以開放生態凝聚產業合力,為中國人工智慧的未來提供堅實支撐。 (元界)
周末重磅!又一“超級賽道”,傳來大消息!
8月22日至24日,中國算力領域的頂級盛會——2025中國算力大會在山西省大同市舉辦。本屆大會以“算網築基智引未來”為主題,聚焦算力網路新趨勢,共話算力產業新未來。8月23日,工業和資訊化部副部長熊繼軍在致詞中指出,中國算力產業邁向高品質、規模化發展的新階段。截至今年6月底,中國在用算力中心標準機架達1085萬架,智能算力規模達788 EFLOPS,幹線400G端口數量大幅增加至14060個,存力總規模超過1680 EB,全國算力中心平均電能利用效率(PUE)降至1.42。他還表示,工業和資訊化部將有序引導算力設施建設,切實提升算力資源供給質量。推動完善算力佈局政策體系,最佳化佈局算力基礎設施,引導各地合理佈局智能算力設施,持續開展國家綠色資料中心建設。強化企業創新主體地位,推進科技創新與產業創新深度融合。加快突破GPU晶片等關鍵核心技術,擴大基礎共性技術供給。深入開展算力強基“揭榜”行動,聚焦計算、儲存、網路等重點方向,加快新技術新產品應用推廣。持續在北京、上海、海南、深圳做好網際網路資料中心等增值電信業務擴大對外開放試點工作,支援國內算力企業走出去,提升全球化服務能力等。此外,2025中國算力大會主論壇上,國家超算網際網路與七城算力中心“算力互聯互通接入儀式”舉行。隨著國家超級計算太原中心、青島“海之心”人工智慧計算中心、長沙人工智慧創新中心、萬達開先進計算中心等七家算力中心正式接入,國家超算網際網路所連接的骨幹節點型算力中心已突破30家,聯合體成員數量更是突破200大關。超算網際網路是以網際網路的思維營運超算中心,並連接產業生態中的算力供給、應用開發、營運服務、使用者等各方能力和資源,建構一體化超算算力網路和服務平台。2023年4月,科技部啟動國家超算網際網路部署工作。國家高性能電腦工程技術研究中心副主任曹振南介紹超算網際網路最新建設情況時表示,“全國一體化算力網”的建構重心,已經由數字基礎設施佈局,轉為建用並重、以用促建。據介紹,國家超算網際網路依託國產深算智能加速卡,實現了高精度與低精度算力流暢協同,目前已提供1600多款應用軟體、600多個熱門開源大模型、70多個SaaS平台等豐富服務。平台現已吸引64萬多使用者註冊。目前,超算網際網路已入選國家資料局《全國一體化算力網應用優秀案例》,入圍工業和資訊化部算力強基揭榜行動,使用者數、應用數、任務數、算力調度規模不斷創出新高。值得一提的是,多家頭部企業亮相算力大會,展示了其在算網產品、工業網際網路、人工智慧等方面的最新創新成果。比如,中國移動發佈算網大腦3.0,實現從自動化到智能化、資源聚合到智能協同的系統性跨越。該系統對內支援AI IaaS、AI PaaS、MaaS、AI SaaS四層智能調度,對外提供“一句話出成果”的極簡互動體驗。目前,算網大腦已創新打造訓推一體、資料快遞、算電協同等20多項任務式服務,廣泛應用於能源、政務、交通等重點領域,正在向成為賦能“人工智慧+”戰略的超級智能體加速升級。 (e公司)
中國算力平台全面貫通!
《網際網路平台價格行為規則》公開徵求意見23日,國家發展改革委、市場監管總局、國家網信辦就《網際網路平台價格行為規則(徵求意見稿)》公開徵求意見。徵求意見稿圍繞巨量資料定價、價格補貼、價格誠信等方面,對經營者價格行為提出明確規範,保護消費者合法權益。此次公開徵求意見時間為1個月。截至7月底,全國累計發電裝機容量同比增長18.2%國家能源局最新資料顯示,截至7月底,全國累計發電裝機容量36.7億千瓦,同比增長18.2%。其中,太陽能發電裝機容量11.1億千瓦,同比增長50.8%;風電裝機容量5.7億千瓦,同比增長22.1%。網售十類重點產品“一碼溯源”試點工作啟動市場監管總局日前啟動對移動電源、電動自行車、童鞋等十類網售重點產品“一碼溯源”試點工作。要求生產者在產品出廠時將核心資訊進行賦碼,平台內商家進貨驗碼,再經過平台核驗後上架亮碼銷售。消費者一鍵掃碼可查產品圖片、3C證書等關鍵資訊。中國規模最大石化產業基地新增項目建造完成記者從中國海油瞭解到,國家石化產業規劃佈局項目——大榭石化煉化一體化項目在寧波全面建成,標誌著中國規模最大的石化產業基地新增項目建造完成,基地烯烴總產能突破1000萬噸,高端化工材料自主可控能力取得新進展。數字日報以“算網築基 智引未來”為主題的2025中國算力大會23日在山西大同開幕。開幕式上,中國算力平台正式完成山西、遼寧、上海、江蘇等10個省區市分平台接入工作,實現“平台、主體、資源、生態、場景”全面貫通。“十四五”期間,中國算力產業發展迅速,基礎設施規模和水平位居全球前列,智能算力規模達788EFLOPS(每秒百億億次浮點運算,FP16半精度),幹線400G連接埠數量增至14060個,存力總規模超過1680EB,累計徵集“華彩杯”算力應用創新項目超過2.3萬個。截至7月底,中國算力平台營運層註冊企業使用者超1000家,入駐算力服務商逾100家,上架優質算力產品110余項,接入主流基礎大模型和垂類模型90余個,成功承載9000余張離散卡的供應匯聚、購買和即時開通服務,為1000餘名開發者提供了多源多元的線上呼叫服務,累計沉澱數十億條算力監測巨量資料。 (大灣區之聲)
【WAIC 2025】中國國產算力不再“斗參數”
7月26日,世界人工智慧大會(WAIC)在上海正式拉開帷幕。在展會現場,具身智能無疑是最備受矚目的行業。從靈活完成格鬥動作的人形機器人,到能精準執行家務、康復輔助的服務型機器人,這些具備物理互動能力的智能體憑藉流暢的動作、自然的互動賺足了觀眾眼球。然而,在這場科技盛宴中,當人們沉浸在具身智能帶來的震撼體驗時,人工智慧產業的核心底座——以晶片、板卡、伺服器、計算叢集等為核心構成的算力基礎設施,依然是整個行業繞不開的關鍵話題。與往屆大會相比,今年算力基礎設施展區呈現出截然不同的風貌。往年展台上隨處可見的“參數競賽”已悄然淡去,各廠商送展的晶片和伺服器展品中,很少再有將某項極致性能參數用醒目字型刻意標記出來的情況。曾經被重點標註的技術指標,如今更多地融入到具體的產業解決方案中,或是隱藏在真實的應用場景演示裡。現場的討論也多是基於“碎片化算力資源統籌”、“低功耗與低成本”與“垂類產品軟硬體整合”這些非常務實的話題。01全鏈路國產化進行時在算力基礎設施的務實轉型浪潮中,“全鏈路國產化”的推進節奏尤為引人關注。過去幾年,全球供應鏈波動引發的晶片斷供風險,以及核心技術“卡脖子”的現實挑戰,反覆挑動著國內人工智慧產業的神經。在全行業已默契達成“居安思危”共識的背景下,即便部分產品應用尚未受到外部限制,國內算力基礎設施廠商也主動將國產化的邊界從單一晶片突破,拓展至從架構設計、軟硬體生態到產業落地的全鏈路自主可控。這種主動出擊的國產化實踐,在本屆 WAIC 的展台間隨處可見。從晶片底層架構的自主研發,到作業系統、編譯器等軟體工具鏈的國產化適配,再到與本土伺服器廠商、行業應用企業的深度協同,一條貫穿“晶片—軟體—整機—場景” 的國產化鏈條正在加速成型。剛剛提交上市輔導備案的沐曦,算是其中較為典型的代表。本屆展會上,沐曦首次公開展示了其最新研發的訓推一體GPU曦雲C600。據悉,其採用自研的XCORE 1.5架構及指令集,面向雲端人工智慧訓練與推理、通用計算、AI for Science等計算任務,且擁有豐富的標量、向量和張量計算單元,支援多種混合精度計算。雖然現場並沒有關於曦雲C600的性能參數介紹,但據展台工作人員透露,這枚晶片搭載了當前業界前沿的HBM3e視訊記憶體。這一關鍵配置勢必會大幅提高視訊記憶體頻寬,為大模型訓練及推理時的海量資料吞吐提供強力支撐。鑑於曦雲C600在本月剛剛回片,展會上並未出現基於這枚晶片打造的板卡及伺服器。而基於上代產品曦雲C500系列晶片,沐曦在現場展示了PCIe伺服器、OAM伺服器和光互連伺服器解決方案,這些伺服器基本都實現了“全鏈路國產化”,即從編譯器、驅動程式,再到卡間互聯協議完全自研,或是第三方國內合作夥伴打造。還有廠商則展示了不同於GPU的另一條高性能計算路線,比如國內唯一實現TPU量產的中昊芯英。該公司打造的“剎那”系列TPU,採用完全可控的IP核與自研指令集、計算平台,其可重構多級儲存、存算一體的設計,配合Chiplet技術實現2.5D封裝,在相同AI計算任務下能耗可降低三成。另外,該枚晶片還有較強的叢集擴展能力,最高支援1024片晶片高速互聯,基於“剎那”打造的“泰則”計算叢集系統,單叢集最大浮點運算能力在稀疏算力下達400P(TF32)以上,可支撐超千億參數的AI大模型計算。據現場工作人員介紹,目前“泰則”計算叢集系統,已完成對AIGC大模型計算、高級無人駕駛模型訓練、蛋白質結構精密預測在內的各類高強度運算場景的適配。02下沉到場景中在兩個月前的鯤鵬昇騰開發者大會上,作為華為今年來在算力基礎設施上的集大成者,“384超節點”被首次公開,基於昇騰超節點技術,實現了業界規模最大的384卡高速匯流排互聯。本次展會上,“384超節點”真機完成了在公眾面前的首次亮相,而該系統在大模型適配上的進度也令人矚目。據悉,目前業界已基於昇騰適配和開發超過80個大模型,在基礎大模型方面多個技術方向均有積累,如訊飛星火認知、DeepSeek、Qwen、鵬城、LLaMA等。在場景適配上,基於昇騰軟硬體能力、訓練與推理解決方案及開源開放的軟硬體生態,華為聯合夥伴展示網際網路、營運商、金融、政務、醫療、油氣、交通等行業解決方案實踐。另一家國產GPU企業摩爾執行緒,在現場展示的場景適配上則要更加細緻。在摩爾執行緒展位,該公司共帶來了包括生命科學、物理模擬、空間智能、視訊超分在內的12項面對不同行業打造的Demo。令筆者印象較為深刻的是視訊超分技術MTVSR。該技術可在端側提供2-4倍的視訊即時超分,並提供多檔質量設定,能夠顯著提升低解析度視訊在高解析度螢幕下的播放清晰度,且以SDK形式支援播放器、瀏覽器等APP整合呼叫,可為終端使用者提供無縫的視訊超分體驗。不同於一般的行業垂直解決方案,視訊場景中的端則軟體技術,由於其廣泛的應用性,一方面能夠有效調動行業應用,比如降低內容創作者獲取高品質素材的成本,提高內容生產效率;另一方面還能夠有效刺激產業生態建構,主動吸引影片播放軟體、遊戲開發商、監控裝置製造商等多方協同。華為以超節點技術夯實大模型訓練的算力底座,通過廣泛的行業適配建構生態護城河;摩爾執行緒則聚焦細分場景,用輕量化技術方案打通算力應用的“最後一公里”。兩者雖聚焦不同層面,但卻很好地反映出了眼下國產算力基礎設施所呈現出“高低搭配、全域覆蓋”的發展態勢。 (虎嗅APP)
半導體重大併購!3000億國產晶片龍頭、900億智算巨頭“合體”,天津在下一盤大棋
一則大消息轟動中國算力產業,3000億市值國產晶片巨頭海光資訊,即將吞併900億市值算力巨頭中科曙光。智東西5月26日報導,海光資訊與中科曙光昨夜雙雙發佈公告,宣佈擬進行戰略重組:海光資訊將通過向公司全體A股換股股東發行A股股票的方式換股吸收合併中科曙光,同時發行A股股票募集配套資金。雙方自今日起停牌,預計停牌時間不超過10個交易日。中科曙光為中國伺服器及算力基礎設施龍頭企業,於2014年11月6日在上交所主機板掛牌上市。海光資訊為中國CPU及GPU(AI晶片)龍頭企業,於2022年8月12日登陸上交所科創板。兩家企業註冊地址均在天津市。截至上周5月23日休市,中科曙光股價為61.90元/股,總市值為905億元;海光資訊股價為136.13元/股,總市值為3164億元,排名科創板市值第一。2024年,海光資訊總資產為285.59億元,同比增長24.70%;營收為91.62億元,同比增長52.40%;歸母淨利潤為19.62億元,同比增長52.87%;研發投入佔同期營收的比例為37.61%。同年,中科曙光總資產為366.17億元,同比增長15.82%;營收為131.48億元,同比下降8.40%;歸母淨利潤為19.11億元,同比增長4.10%。中科曙光與海光資訊之間的關聯交易頻繁,金額較大。2022年、2023年、2024年,中科曙光與海光資訊的關聯交易金額分別為29.12億元、24.74億元、36.89億元,佔海光資訊收入的較大比例。根據公告,本次重組旨在搶抓資訊技術產業發展新機遇,做大做強主業。海光資訊成立於2014年10月24日,註冊資本為23.24億元,法定代表人是沙超群。截至2024年12月31日,海光資訊前兩大股東分別為中科曙光、成都國資,分別持股27.96%、17.00%。▲海光資訊前六名股東持股情況(圖源:海光資訊2024年年度報告摘要)海光資訊脫胎於中科院,與美國晶片巨頭AMD的合作始於2016年,雙方創辦合資公司,海光獲得AMD的技術授權許可,可開發x86架構通用處理器(CPU)。中科曙光作為海光資訊的參股方,與AMD的合作進一步加強了雙方的技術聯絡和市場競爭力。目前,海光的產品包括通用處理器CPU和協處理器DCU。▲海光產品族(圖源:海光資訊2024年年度報告摘要)海光CPU相容國際主流x86處理器架構和技術路線,既支援面向資料中心、雲端運算等複雜應用場景的高端伺服器,也支援面向政務、企業和教育場景的資訊化建設中的中低端伺服器以及工作站和邊緣計算伺服器。海光DPU屬於GPGPU的一種,採用通用平行計算架構,能夠較好地適配、適應國際主流商業計算軟體和人工智慧(AI)軟體,主要部署在伺服器叢集或資料中心,可全面支援深度學習訓練、推理場景以及大模型場景等,與國內多家頭部網際網路廠商完成全面適配。▲海光CPU及DCU系列產品簡介(圖源:海光資訊IPO註冊稿)今年5月1日,海光資訊宣佈其董事長孟憲棠因個人年齡原因,向公司董事會申請辭去董事長、 董事及董事會專門委員會等職務。中科曙光成立於2006年3月7日,註冊資本為14.63億元,法定代表人是歷軍。中科算源、歷軍是其前兩大股東,分別持股16.36%、2.88%。中科院計算所持有中科算源100%的股份。▲中科曙光前七名股東持股情況(圖源:中科曙光2024年年度報告摘要)中科曙光的產品包括高端電腦(機架式伺服器、高密度伺服器、刀鋒伺服器、超融合一體機產品等)、儲存產品、網路安全產品、雲端運算服務、資料中心、計算服務。▲中科曙光產品(圖源:中科曙光官網)海光資訊與中科曙光本次重組涉及事項較多、涉及流程較為複雜。相關工作若順利推進,將實現產業鏈互補,形成多元算力業務整合,促進資訊技術產業龍頭企業發展,對國產算力格局產生較大影響。
算力大戰“卷”到太空?從12星到2800星的中國“星算”計畫
當馬斯克的星鏈計畫用4.2萬顆衛星編織地球通訊網路時,中國正以更具野心的方式開啟太空競賽新篇章。01當算力競賽“卷”向太空2025年5月14日,隨著長征二號丁運載火箭在酒泉衛星發射中心成功升空,全球首個太空計算衛星星座——由12顆算力衛星組成的“星算計畫”首發星座正式入軌1247121923。這一里程碑事件標誌著中國在太空計算領域實現“零”的突破,也拉開了全球“算力上天”的序幕。此次發射的“星算”計畫首發星座(代號021任務),由國星宇航聯合之江實驗室研製,包含12顆智能計算衛星。單星算力最高達744TOPS,整軌衛星互聯後總計算能力達5POPS(每秒5兆次操作),星間雷射通訊速率突破100Gbps,儲存容量達30TB。與傳統衛星需將資料傳回地面處理不同,這些衛星首次實現“天數天算”——在軌完成資料處理,並通過高頻寬鏈路直接傳回結果。02為何要將算力搬上太空?傳統衛星資料處理模式依賴“天數地算”——即衛星採集資料後傳回地面中心處理,存在傳輸延遲高、頻寬瓶頸和能源消耗大等問題。遙感衛星拍攝的高解析度圖像需數小時甚至數天才能完成分析,難以滿足即時監測需求。而“星算”計畫通過“天數天算”模式,將算力直接部署在太空。每顆衛星搭載星載智算系統和星間高速網際網路絡,可在軌即時處理資料,將響應時間從“天級”壓縮至“秒級”,如林火監測系統可實現秒級預警,低空飛行器定位精度大幅提升,深空探測資料處理效率顯著提高。03“星算計畫”在那些方面進行了突破?不同於傳統衛星僅承擔通訊或遙感功能,星算計畫的核心在於將資料中心“搬上天”。每顆衛星配備定製化AI晶片和抗輻射伺服器,形成“計算-儲存-通訊”三位一體的太空節點。通過星間雷射鏈路,這些衛星能即時共享算力資源,單星座總算力可達1000 POPS(每秒百億億次運算),相當於同時調度10萬台地面伺服器。更顛覆性的是,衛星搭載的AI大模型能直接在軌道處理遙感資料,將原本需要數小時回傳地面分析的火情監測、地質預警等任務縮短至秒級響應。這種“天數天算”模式,首次讓太空裝置從資料採集者進化為決策者。而在地面資料中心因電力、土地資源短缺陷入增長瓶頸時,星算計畫揭示了另一種可能——利用太空近乎無限的太陽能,將能源成本壓縮至地面的1/5。據測算,當2800顆衛星組網完成後,天基算力成本將降至0.1元/GFLOPS,與貴州深山中的超算中心持平。這種成本優勢源於多重創新,採用磁阻隨機儲存器(MRAM)提升資料可靠性,減少維護頻次;通過自適應熱控系統替代傳統製冷裝置,僅此一項每年可節約相當於三峽電站10%發電量的能源。商業航天的市場化運作更將衛星研發周期從5年縮短至18個月,中國民營企業已承擔63%的衛星製造訂單。同時,星算計畫並非孤立的天基系統,而是與地面算力網路深度耦合。中國移動建設的“四算合一”調度平台,每天可完成上億次算力呼叫指令,動態平衡衛星與地面中心的負載。在颱風監測場景中,天基算力即時處理衛星雲圖生成預警,地面中心則呼叫歷史資料訓練災害預測模型,極大提升了天地協同將應急響應效率。這種架構甚至催生了新的商業模式——某自動駕駛公司已租用12顆衛星的閒置算力,使其車輛決策系統獲得毫秒級道路更新能力。04從12星到2800星中國太空算力的“三步走”戰略中國“星算”計畫的太空算力佈局並非一蹴而就,而是通過循序漸進的技術迭代與規模化拓展,逐步建構起覆蓋全球的天地協同智能網路。2025年5月首發的12顆衛星叢集,既是這一戰略的起點,也是驗證天基算力可行性的關鍵節點。這批由四川國星宇航研製的衛星,憑藉單星744TOPS的算力與雷射通訊技術,首次實現了太空資料的即時在軌處理,將傳統遙感資料應用時效從小時級壓縮至分鐘級,完成了從“天數地算”到“天數天算”的範式突破。在技術驗證成功後,中國計畫加速推進衛星組網密度與算力能級。到2030年前,通過多批次發射將衛星數量提升至50顆以上,並與之江實驗室主導的“三體計算星座”深度融合,形成千星規模的天基智能設施,總算力預計突破1000POPS。這一階段的核心目標在於打造“太空雲端運算平台”,通過星間高速互聯與分佈式調度系統,實現算力資源的動態調配,為低空經濟、災害預警等場景提供秒級響應能力。與此同時,地面配套的算力節點將擴展至數十個,初步建構天地協同的算力調度網路。隨著技術成熟與產業鏈協同效應顯現,中國計畫在2032年前完成2800顆衛星的終極組網。屆時,這些衛星將與地面超過100個算力中心深度聯動,形成總規模達80000POPS的天地一體化算力網路。該網路不僅能支援全球即時氣象預報、深空探測任務規劃等高端需求,還將通過開放介面協議吸引全球開發者,建構起覆蓋月球基地、火星探測器的深空算力中繼體系。05點評:算力邊疆的“新太空競賽”當全球科技巨頭仍在地面資料中心“內卷”時,中國通過“星算計畫”率先開闢了太空算力新戰場。從12星的“從0到1”到2800星的全球覆蓋,這場跨越天地的新型基礎設施競賽,不僅關乎算力主導權,更將決定誰能主導下一代人工智慧的制高點, 在這場沒有硝煙的“太空算力大戰”中,中國的每一步突破都在重新定義人類計算能力的邊界。 (壹零社)