2026年,AI基礎設施建設進入了高投入與高損耗並存的矛盾周期。
市場端,中國Token呼叫量兩年激增1400倍,全球AI基礎設施投入規模正向7兆美元邁進;但工程化落地端,效率瓶頸卻愈發顯著。輝達資料顯示,分佈式訓練中的網路擁塞導致算力空轉率普遍超過30%;Gartner則預測,到2027年底,超過40%的企業級智能體項目或將因落地難而被迫取消。
應用層面的反饋更為直觀:據浪潮人工智慧研究院測算,中國智算中心平均算力使用率僅為30%。某千卡規模項目的實際營運情況也印證了這一現狀——不僅“上架率不足50%”,且已上架伺服器的實際利用率也不到30%,年營運成本卻高達3000萬元。
這暴露了當前行業的一個核心癥結:AI基礎設施的建設瓶頸,早已不在單點算力晶片的性能指標,而在於計算、網路、儲存、雲管、安全、維運等環節之間,存在著一條尚未被系統性打通的“隱形斷層”,算力牆、儲存牆、功耗牆……各種說法因此產生。
系統性的“木桶效應”
“如果AI是一輛超級賽車,需要的不僅是強悍的發動機,更需要配置完整、調校優異的整車。”今年5月,在新華三集團的領航者峰會上,總裁於英濤用一個形象的比喻來拆解行業迷思。他直言,當前多數人的做法是不斷換更強的發動機:“但如果變速箱打滑、輪胎漏氣、油路堵塞、這輛車能跑多遠?”
資料不會說謊。根據新華三公開的行業測試報告,萬卡叢集中資料IO瓶頸導致GPU空等時間佔比可達40%以上——這意味著昂貴的算力晶片有近一半時間在等待資料搬運。網路層面的擁塞和丟包,則讓跨節點通訊效率大打折扣。而因安全事件、維護保障或調度失誤導致的訓練中斷,平均恢復時間以天為單位計算。對於千卡級以上的智算叢集,每一次意外停機都意味著數十萬甚至上百萬的直接損失。
“Token的性價比不是一張卡決定的,也不是由某一個單一能力決定的。”於英濤強調。
這並非新華三的一家之言。上海智能算力科技有限公司副總經理辛帥在峰會上分享了從零搭建萬卡叢集的真實歷程。他將挑戰歸結為四個維度:規模之難——萬卡等級意味著任何單點故障都可能演變為全域事故;異構之痛——不同廠商晶片的指令集和通訊庫各自為政,能否協同工作是個巨大問號;維運之繁——故障定位須達毫秒級、鏈路級;演進之惑——今天購買的裝置需適配未來3~5年的模型架構。“四點中任何一點考慮不到,後面都可能推倒重來。”辛帥表示。
一場全端的“押注”
一個愈發清晰的事實是:算力基礎設施的系統協同能力,已嚴重滯後於晶片性能的迭代速度。大量GPU不是“跑不動”,而是“跑不滿”。
面對這一困局,業界分化出了不同的解題路徑。有的企業選擇“往前衝”,以行業智能體打包算力、模型與場景,試圖繞開底層協同的碎片化,直接交付應用價值。有的企業試圖“往深扎”,將AI推理能力注入基站和接入網,死磕連接層的智能化躍遷,為上層應用掃清時延障礙。也有的雲廠商選擇“往後退”,集體轉向“水電煤”式的標準化算力租賃,按需交付彈性資源,但把系統協同的難題留給了客戶自己。
新華三的選擇更為激進——同時攥住計算、網路、儲存、雲、安全、維運六個維度,試圖交出一套全端“交鑰匙”般的系統級方案。
這一思路最直觀的體現在於,既然瓶頸在各環節之間的縫隙,那就把六個維度拉通來做整體最佳化:在算力側,高密液冷方案將6顆CPU整合於1U標準機箱內,單機櫃算力超過3萬核。散熱方案上,整機不依賴風扇,全部由液冷完成熱交換,電能利用效率指標(PUE)可控制在1.04,這意味著電費開支中,真正用於計算的比例遠高於行業平均水平;在儲存層,用“以存換算”的思路把GPU從等待資料的空閒中解放出來,將大模型的歷史上下文快取到擴充記憶體中,將首Token延遲降低90%;在網路層,通過算網協同調度讓頻寬利用率從70%向90%以上爬升。
在今年5月,新華三最新發佈的S80000超節點也印證了他們的技術思路。該產品覆蓋32卡至1024卡全系列,可擴展至萬卡以上叢集,在一個物理單元內完成算、網、存、能的協同。新華三首席技術官張弢表示:“單一能力的簡單疊加無法實現系統最優。”
回顧全端路線在IT行業的演進,其成功往往取決於一個關鍵前提:每個技術層都不能有明顯的短板。對新華三而言,如何在六線並進的局面下保持各層的技術深度,是一個仍需交給時間驗證的命題。
參數之外的答案
驗證一個戰略是否成立,不能只看發佈會上的參數,還要看機房裡的真實表現和客戶的續約率。在這方面,新華三給出了多個維度的落地案例,但也不乏待解之問。
在上海,新華三與上海智能算力科技聯合建設的萬卡叢集已投入實際營運。據辛帥透露,雙方在技術路線上反覆磨合,“2023年我們就和新華三的專家反覆討論,最終堅定選擇了乙太網路,現在證明完全正確”。乙太網路的開放協議帶來了供應鏈安全和系統靈活性的雙重優勢,使得營運方可以將“選擇權始終留在自己手中”。
在杭州、鄭州等十余個城市,新華三推動的“圖靈小鎮”模式已陸續落地。這一模式試圖將算力和模型包裝成像水電一樣的公共設施,降低中小企業使用AI的門檻。據其公佈的資料,目前已有數百家企業入駐。
但產業園區從“簽約入駐”到“真正跑出商業模式”,還有漫長的距離。貴陽貴安圖靈小鎮的AI算力服務中心已建成,預計下半年才能投入使用。其營運方負責人趙文榛在峰會發言中提到,國企投資決策中“過度強調短期經濟帳”,缺乏對產業帶動等長期價值的評估。反映出了“建算力”與“用算力”之間仍橫亙著不小的落地阻力。而新華三的全端路線能否在財務上真正跑通,關鍵指標也尚未完全浮出水面——其AI相關業務的毛利率、客戶留存率,目前還不是公開數字。
在領航者峰會演講的最後,於英濤將開場時的主題詞從“亢奮與焦慮”替換成了“冷靜與激情”。他說,缺了冷靜的激情叫“衝動”,缺了激情的冷靜是“平庸”。
這番話既可以看作對全行業的告誡,也可以視為對新華三自身的提醒。他列出的兩個“冰冷真相”值得思考:一是7兆美元的全球AI基礎設施帳單不會自動轉化為價值,押注不等於回報;二是Gartner預測的超40%智能體項目取消率,不是詛咒,而是提醒——“變革面前,道阻且長”。
對於新華三而言,2026年是一個關鍵節點。公司剛邁過成立十周年的門檻,年收入已達760億元規模,但傳統通訊與IT硬體市場的天花板清晰可見。AI是其必須抓住的戰略級機遇,而選擇“全端築基”這條路徑,意味著要同時承受多重考驗:技術整合的複雜性、研發投入的持續性、以及市場對投資回報周期的耐心。
在這場關乎未來的AI馬拉松中,新華三已選定了自己的配速與跑道。起跑階段的聲勢已經足夠響亮,但真正決定成敗的,是三到五年後客戶機房裡持續運轉的機器轟鳴聲,以及那些今天尚在“試用算力”的企業最終選擇留下的背影。 (中國電子報)
