#算力
【輝達財報】輝達的AI神話,倒在滿分財報裡
這是資本市場對AI算力賽道的集體冷靜,也是對輝達未來增長深層焦慮。連續14個季度業績超預期的輝達,折在了AI商業化前夕?台北時間2月26日,全球晶片巨頭輝達發佈了2026財年第四季度及全年財報。財務資料堪稱完美,但其股價卻應聲大跌超5%,市值一夜蒸發近2600億美元(約合人民幣1.7兆元)。儘管27日,輝達向OpenAI投資300億美元的消息披露,同時雙方還敲定了下一代推理計算能力的合作,但這依然沒能讓輝達的股價止跌回升。截至27日收盤,輝達跌4.16%,市值再度蒸發1871億美元(約合人民幣1.28兆元)。兩天時間,輝達市值蒸發4471億美元。資本市場對AI算力賽道的集體冷靜驟不及防,對輝達未來增長的深層焦慮呼之慾出。業績連續超預期,AI算力成絕對支柱自2023財年第三季度以來,輝達已經連續14個季度營收超過市場預測。最新財報顯示,輝達第四季度營收681.27億美元,同比增長73%,高於分析師此前預測的662.1億美元。淨利潤429.6億美元,同比增長94%,近乎翻番。毛利率維持75%的超高水平,較上年同期提升2個百分點,盈利能力依舊強勁。分析師對其下一季度營收的預期攀升至780億美元,且該資料尚未計入中國資料中心業務收入。主營業務的營收變化,標誌著輝達已完成從遊戲顯示卡廠商到AI算力基礎設施提供商的徹底轉型。第四季度,輝達資料中心部門收入達623億美元的創紀錄水平,同比增長75%,在總營收中的佔比高達91%,成為絕對增長引擎。相比之下,遊戲和AIPC部門收入37億美元,佔比約5%;專業可視化部門收入13億美元,佔比1.9%;汽車與機器人部門收入6.04億美元,佔比約0.9%,後三類業務已處於邊緣位置。資料中心業務的爆發,核心源於全球大模型訓練、AI推理的旺盛需求,以及新一代Blackwell晶片的訂單爆發。輝達首席財務官Colette Kress在財報電話會上表示,AI發展已迎來拐點,算力需求呈爆發式增長,Blackwell晶片自發佈後訂單需求遠超產能,全球主要雲廠商、大模型公司的大額訂單,足以支撐公司下一季度的增長目標。Trend Force集邦諮詢的研究也為其提供了基本面支撐。2026年全球八大雲巨頭的資本支出將突破7100億美元,其中大部分將投入AI算力基礎設施建設,這為輝達資料中心業務的未來營收定下了基礎。業績與股價背離,半導體類股集體受挫與完美的財報形成鮮明對比的是輝達的股價表現。財報發佈當日,其股價盤中一度漲超2%,但隨著財報披露和電話會結束,股價持續走低,最終跌超5%,創下2025年4月以來的最大單日跌幅。這一走勢不僅打破了輝達長期的“財報必漲”魔咒,還形成了新的反常規律——自2024年8月起,無論財報業績是否超預期,其股價在財報發佈次日均會“走低一下”。輝達的股價異動還拖累了整個半導體類股,財報發佈當日,博通股價跌超3%,AMD跌3.41%,台積電跌2.8%,資本市場對AI算力類股的擔憂顯露無遺。即便後續有新消息釋放,也未能止住輝達的跌勢。2月27日,OpenAI宣佈完成1100億美元最新融資,其中輝達出資300億美元,同時雙方還敲定了下一代推理計算能力的合作,但其股價依舊走低,當日收盤報177.19美元/股,跌幅4.16%。市場分析人士認為,此次股價與業績的背離,直接原因是利多出盡後的獲利盤集中兌現,深層則是市場對輝達未來增長的擔憂。Jones Trading首席市場策略師奧羅克直言,投資者的關注點已從“現在有多好”轉向“未來還能好多久”,過度透支的預期讓這份滿分財報失去了說服力。Janus Henderson投資組合經理Richard Clode也指出,過去三年輝達的持續超預期,讓“超預期”從驚喜變成了市場基準,一旦業績只是符合預期而非大幅超越,高位資金就會選擇落袋為安。四重隱憂浮現,輝達增長天花板顯現資本市場的遲疑,並非毫無依據,透過亮眼的財報資料,輝達的多重發展隱憂已逐漸浮現,這些問題不僅關乎公司自身,也折射出整個AI算力產業的潛在風險。最突出的問題是業務結構極度單一。91%的營收依賴資料中心業務,意味著該業務的需求波動將直接決定輝達的整體營收表現,缺乏第二增長曲線的支撐,讓公司的發展開始瀰漫不確定性的影子。其次是客戶高度集中,且需求可持續性存疑。Colette Kress在財報電話會上承認,2026年全球頭部五大雲端運算服務商貢獻了輝達資料中心業務超50%的營收,公司業績與少數巨頭的資本開支計畫深度繫結。而TrendForce的報告顯示,2026年四大雲廠商的資本支出增速將從2025年的73%放緩至62%,2027年還存在見頂風險。更關鍵的是,這些核心客戶正加速自研晶片,試圖擺脫對輝達的依賴。Google第七代Ironwood TPU算力已超越輝達B200晶片,且成本更低。Meta計畫2027年在資料中心部署數十億美元TPU,2026年已通過Google雲租用算力。AMD的GPU產品也拿下了Oracle、Meta的訂單,還與OpenAI簽署了6GW算力協議。雲廠商的自研替代,正逐步侵蝕輝達的市場份額。第三是地緣政治風險加劇,海外營收穩定性受影響。2025年12月美國雖允許輝達H200晶片對華出口,但附加了嚴格限制條件,截至2026年2月,該晶片對華獲批銷售數量為零,輝達未收到任何中國客戶的有效訂單。中國作為全球重要的AI晶片市場,市場需求旺盛,這對輝達長期業務佈局造成持續衝擊。而近期美國政府官員關於“DeepSeek使用輝達晶片訓練模型違反美國出口管制規定”的言論,更是讓輝達的海外市場拓展蒙上了政策不確定性的陰影。知名“大空頭”、《大空頭》原型麥可·貝瑞指出,輝達財報中的“採購義務”從一年前的161億美元飆升至952億美元,原因是台積電要求其支付更多現金用於定製晶片生產。這意味著輝達被迫在需求尚未完全明朗的情況下,簽下了不可取消的採購訂單,若未來下游需求出現動搖,這一高額數字將直接威脅公司的業績健康。AI產業回歸理性,自主可控成國核心心方向輝達的股價波動,也是整個AI算力賽道的一個重要訊號。生成式AI爆發後,資本市場對AI算力的狂熱正在降溫,行業認知開始回歸理性。過去兩年,資本市場對AI的投資多停留在“故事和預期”層面,只要與AI沾邊,企業就能獲得高估值。而如今,隨著AI創業企業估值走高和逐步完成上市,投資者的關注焦點已轉向“商業化落地和增長可持續性”,不再盲目追捧相關概念。Richard Clode表示,市場的辯論核心已從短期業績轉移到人工智慧資本支出的可持續性,輝達的規模、貨幣化能力以及潛在的現金流惡化,都成為投資者擔憂的點。從產業層面來看,AI算力領域的競爭格局和發展邏輯正發生深刻變化。過去輝達憑藉CUDA生態壁壘,在AI晶片領域形成壟斷,而如今隨著GoogleTPU的崛起,以及雲廠商自研晶片的推進,這一壟斷格局正被打破。同時,全球AI應用正從訓練向推理加速遷移,雲廠商的採購策略也從“單一GPU”轉向“GPU與ASIC雙軌平行”,兼顧成本效益與場景適配性。這意味著未來的AI算力需求將更趨多元化,單純依靠高端晶片的增長模式已難以為繼,輝達需要在生態、產品、成本等方面持續發力,才能維持領先地位。而輝達的地緣政治風險和市場壟斷,也讓國內AI產業進一步明確了自主可控的重要性。經過多輪技術限制後,國內相關行業逐漸形成共識,關鍵算力產品不能過度依賴外部供應。這一共識也讓國內企業更傾向於支援國產方案,推動了國內AI算力產業鏈的自主化發展。目前,國內頭部雲廠商均在加大自研晶片佈局。騰訊在外購GPU的同時,與本土廠商合作推進ASIC自主方案。阿里巴巴旗下平頭哥、阿里雲正積極自研ASIC AI晶片。百度旗下崑崙芯也在今年1月份提請IPO。這些舉措不僅有助於降低國內產業對輝達的依賴,也讓國產AI算力晶片的研發和商業化處理程序不斷加快。除了大廠之外,國內GPU創業企業也在加快追趕。2月27日,國內算力晶片廠商寒武紀、摩爾線程和沐曦股份相繼發佈了2025年度業績快報。總體來看,上述三家企業營收都呈現出明顯的增長趨勢。最新完成IPO的摩爾線程和沐曦股份雖目前仍處於虧損狀態,但其虧損缺口在縮小。報告顯示,沐曦股份虧損縮小21.28%,摩爾線程虧損縮小36.70%。從全球來看,AI產業依然是未來科技發展的核心方向,算力需求的長期增長趨勢並未改變,但行業的競爭邏輯已發生根本變化。靠講故事、炒預期的階段或許已過去,未來的競爭將聚焦於技術創新、成本控制、生態建構和商業化落地。對輝達而言,如何打破業務單一的困局、應對競品的替代挑戰、化解地緣政治風險,將決定其未來的發展命運。而對整個AI產業來說,輝達的這次股價異動是一次重要提醒:AI的故事已經講完,真正的現實考驗才剛剛開始,只有能實現技術突破、落地商業化的企業,才能在未來的競爭中站得更加穩固。 (億歐網)
AI行業拐點已至?推理算力成新風口
當OpenAI官宣下調千億級算力投資預算,市場一度嘩然:AI產業要踩剎車了?答案恰恰相反——這場看似的“收縮”,實則是行業從瘋狂燒錢的算力軍備競賽,邁入回歸商業本質、聚焦盈利的新階段。而隨著AI應用加速落地,算力需求的結構重構正在上演,推理算力成為新的增長風口,國產AI晶片更是借此迎來了前所未有的發展機遇。OpenAI的“預算下調”,實則是理性的戰略聚焦。此前其提出的2030年前1.4兆美元基建投入,是涵蓋晶片、電力、資料中心等的全產業鏈廣義規劃;而此次調整為6000億美元純算力專項支出,精準聚焦晶片採購與租賃,更與2030年2800億美元的營收目標相契合。這並非算力投入的降溫,而是從“盲目擴張”轉向“投入產出匹配”,就連高盛等機構也直言,這一調整讓訂單確定性更強,更利於行業長期發展。與此同時,全球算力產業鏈的高景氣度並未消退。Meta與輝達達成數十億美元晶片採購協議,大手筆拿下數百萬片最新AI加速晶片,還首次引入輝達CPU部署大模型;OpenAI仍在推進超千億美元融資,90%資金來自輝達、軟銀等頭部戰略投資者。北美雲廠與AI企業的資本開支援續增長,印證了算力需求的底層邏輯依舊堅挺,只是行業發展的重心,正悄然發生轉移。行業的核心變化,在於從“重訓練”到“訓練+推理並重”,推理算力成為新的增長引擎。如果說訓練算力是為大模型“打地基”,需要極致高端的算力支撐,那麼推理算力就是大模型落地應用的“毛細血管”,支撐著每一次使用者互動、每一個場景呼叫。隨著AI應用商業化拐點臨近,推理算力的需求爆發式增長,其市場規模更是被業內看好:2030年全球AI訓練算力市場規模約1兆美元,而推理算力市場將達到4-5兆美元,增速和規模均遠超訓練算力。更關鍵的是,推理算力的需求特性,為國產晶片打開了全新的發展空間。與訓練算力對高端GPU的高度依賴不同,推理算力更講究性價比,注重成本、效率與系統能力的平衡,定製化AI晶片成為破局關鍵。這恰恰是國產晶片的優勢所在——借助ASIC、全端最佳化等技術,國產晶片能在推理賽道建立獨特的競爭壁壘。市場的反饋已經給出答案:國內AI ASIC龍頭芯原股份2025年末在手訂單達50.75億元,較三季度大增54.45%,連續九個季度高位運行;寒武紀、摩爾線程等國產晶片企業紛紛登陸資本市場,壁仞科技、燧原科技加速IPO處理程序,百度崑崙芯也計畫分拆上市;海光資訊憑藉“DCU+CPU”晶片組合,與中科曙光形成產業鏈協同優勢,成為推理算力賽道的重要玩家。就連海外初創公司Taalas的ASIC晶片也印證了這一趨勢,其專為輕量級大模型最佳化的產品,能效較傳統GPU提升50倍,成本僅為1/20,讓定製化晶片的價值愈發凸顯。AI應用的商業化落地,更是為推理算力需求添上了一把火。這個春節,千問“一句話下單”近2億次,日活使用者達7352萬,僅用3個月就追上豆包3年的使用者規模;“AI+醫療”“AI+行銷”“AI+企服”等細分賽道加速落地,利歐集團等企業已打造專屬AI智能體矩陣,推動AI與主業深度融合。當大模型從“實驗室”走向“生活場”,從單一超大模型向“多模型+專用模型+MoE”演進,對推理算力的需求將滲透到千行百業,成為行業增長的核心驅動力。這場行業變革中,真正的機遇早已不再是單純的算力堆砌,而是能匹配商業需求、兼具性價比與實用性的算力解決方案。而推理算力的風口,不僅重構了算力產業鏈的競爭格局,更讓國產晶片擺脫了在高端訓練算力領域的被動局面,憑藉定製化、高性價比的優勢,在全球AI產業中搶佔了屬於自己的賽道。AI行業從未停下腳步,只是換了更務實的前行方式。當回歸商業本質成為主旋律,推理算力的爆發式增長已然開啟,而國產AI晶片,正站在這場變革的黃金風口上,迎來屬於自己的發展春天。 (元宇宙與人工智慧三十人論壇)
儲存巨頭發聲漲價貫穿全年、Deepseek聯合清北發佈論文、OpenAI拿到7500億融資、AI去年對美國GDP貢獻幾乎為零| 算力產業半月報(第44期)
儲存巨頭最新發聲:今年無法滿足所有客戶的需求漲價將貫穿全年!近日,SK海力士在高盛的電話會上發佈對儲存行業及公司經營的最新觀點。該公司認為:“全球儲存器產業已徹底轉向賣方市場,2026年價格漲勢將貫穿全年。”SK海力士這項判斷是基於AI需求爆發與供應端剛性約束的雙重擠壓。公司透露目前DRAM及NAND庫存僅剩約4周,且沒有任何客戶能完全滿足需求。更為嚴峻的是,2026年高頻寬儲存器 (HBM) 產能已提前售罄,標準型DRAM的極度短缺正大幅提升供應商議價權,產業鏈已啟動長期合約談判以鎖定未來供應。SK海力士將發生上述情況的核心原因歸結為兩點:一是AI大模型、高效能運算對儲存器的真實需求持續井噴,遠超產業預期;二是儲存器晶片製造依賴的無塵室空間擴張緩慢,產能爬坡受限,形成“需求-供給”差距。“今年無法滿足所有客戶的需求,價格持續上漲已成定局。”該公司稱。(來源於:新浪財經)高盛:AI去年對美國GDP貢獻幾乎為零高盛首席經濟學家Jan Hatzius認為,儘管美國公司在人工智慧上投入巨大,但進口晶片和硬體抵消了這些投資在GDP計算中的實際意義,因此對2025年美國GDP增長的貢獻基本為零。部分商業領袖可能也持相同的看法。最近一項針對美國、歐洲和澳大利亞近6000名高管的調查發現,儘管70%的公司都在積極使用人工智慧,但其中約80%的公司表示,人工智慧對就業或生產力沒有產生任何影響。(來源於:格隆匯APP)DeepSeek聯合清北重磅硬核論文:發力智能體底層基建 擊穿Agent推理I/O瓶頸!大模型正在從單輪對話機器人,快速進化為能夠自主規劃、呼叫工具並解決實際問題的Agent。然而,這種轉變在底層算力架構上引發了一場大地震。當大模型在長期的上下文中與環境進行幾十甚至上百輪的互動時,計算的瓶頸從GPU的算力轉為儲存I/O頻寬。由於每次只追加極少的Token,導致KV-Cache命中率極高(通常大於95%),GPU大量的時間被用來等待從外部儲存中讀取海量的歷史KV-Cache資料。為了打破這一僵局,DeepSeek聯合北大、清華研究團隊提出了一種全新的大模型推理系統——DualPath。該系統通過引入“雙路徑KV-Cache載入”機制,巧妙利用了叢集中閒置的網路頻寬,將Agentic大模型負載的離線推理吞吐量提升了最高1.87倍,線上服務吞吐量平均提升了1.96倍。目前,這項研究已在包含多達1152張GPU的叢集上完成了大規模驗證,支援DeepSeek-V3.2 660B等頂級大模型。(來源於:華爾街見聞)五角大樓極限施壓Anthropic 要求周六前解除所有AI安全限制美國五角大樓正向 Anthropic極限施壓,要求在美國時間周五晚前(台北時間周六晚前,2月28日晚前)徹底解除Claude的軍事應用限制。如果 Anthropic 拒絕,五角大樓將考慮動用《國防生產法》(Defense Production Act)強制其修改程式碼,或者直接將其打上「供應鏈風險」的標籤,徹底切斷其與軍方乃至其他聯邦承包商的商業聯絡。會後,Anthropic發佈新版政策。公司正式放棄了「單方面暫停大模型訓練」的安全承諾。在政治與商業的雙重壓力下,AI 安全理想主義最終向現實妥協。(來源於:新智元)剛剛,OpenAI狂攬7500億元 輝達、亞馬遜、軟銀搶投2月28日,OpenAI宣佈拿到1100億美元(約合人民幣7544億元)新融資,其中亞馬遜投500億美元、輝達投300億美元、軟銀投300億美元。這也是全球AI領域迄今規模最大的單筆融資。(來源於:智東西)阿里Qwen3.5-Plus/Qwen3.5-397B-A17B 新模型上線2月16日,阿里在chat.qwen.ai頁面低調上線了Qwen3.5-Plus和Qwen3.5-397B-A17B兩款新模型。Qwen3.5-Plus定位為Qwen3.5系列最新大語言模型,Qwen3.5-397B-A17B定位則是Qwen3.5開源系列旗艦大語言模型。兩款模型均支援文字和多模態任務。(來源於:第一財經)千問將發佈AI眼鏡據悉,阿里千問將在2026年世界移動通訊大會(MWC)上發佈AI眼鏡,並於3月2日開啟線上線下全管道預約。據阿里內部人士透露,除AI眼鏡之外,千問還會在年內陸續發佈AI指環、AI耳機等產品,並面向全球市場發售。(來源於:科創板日報)宇樹科技,發佈新款機器人!2月24日,宇樹科技發佈新款四足機器人Unitree As2,稱其動力性能約為當前主力四足機器人Go2的兩倍。宇樹科技發佈的視訊Demo中,Unitree As2挑戰了多種複雜路況和惡劣天氣,能在河溝、雪地、叢林、亂石路中自由穿行。軟體方面,Unitree As2配備仿生具身大模型,並升級了智能伴隨系統,可以隨著人類方位行進,並根據人類手勢移動、跳起,呈現類似人與寵物狗一樣的互動。(來源於:中國經濟網)Google推出Nano Banana 2圖像AI模型:支援4K解析度輸出 改進中文字元亂碼問題2月27日,Google現已正式推出 Nano Banana 2圖像模型,新版模型基於Gemini 3.1 Flash Image 建構,相比上一代擁有更快的響應速度和更強的理解能力,對使用者提示詞的解析也更加精準。據Google透露,Nano Banana 2 在生成一致性方面有明顯提升,同時修復了此前版本中常見的中文字元亂碼、語義混亂或畫面中出現奇怪偽影等情況。在性能層面,Nano Banana 2 的圖像輸出解析度從 2K 提升至最高 4K,可處理更複雜的提示內容,支援在多張圖片中保持最多 5 個角色形像一致,並能在單張畫面中融合多達 14 個元素。(來源於:IT之家)雷軍:十五五小米將重點攻堅 晶片、AI、作業系統等底層核心技術近日,小米集團董事長兼CEO雷軍表示,小米計畫未來五年重點攻堅晶片、AI、作業系統等底層核心技術,向著成為全球硬核科技公司的目標不斷努力。(來源於:北京日報) (超算百科)
【輝達財報】創紀錄,老黃定調智能體拐點:算力就是印鈔機
算力即收入,黃仁勳認為智能體拐點已來,只要算力還在驅動收入成長,就不必擔憂AI泡沫。營收681.3億美元!剛剛,輝達公佈了創紀錄的2026財年第四季業績,並給出了2027財年第一季780億美元的業績預期。在商業世界裡,數據永遠是最有說服力的語言。截至周三收盤,輝達的股價累計上漲了5%,而同一時期,科技股的晴雨表納斯達克指數下跌了0.4%。當華爾街和矽谷還在為AI泡沫爭論不休時,黃仁勳再次用數據擊碎了「AI泡沫論」。不僅如此,他還提出了自己的「AI經濟學」:算力=收入成長,直言如今流向AI的千億美元資本開支,最終都會直接轉化為收入。支撐老黃「AI經濟學」的,是他看到了智能體拐點已經到來,由此帶來了驚人的算力需求。Vera Rubin平台:六款新晶片,一台AI超級計算機為了把這些驚人的算力需求變現,輝達也推出了下一代整櫃級算力系統-Vera Rubin,將在2026年下半年出貨。輝達財務長Colette Kress透露,公司已經清楚預見到,2025至2026年間Blackwell和Rubin產品組合帶來5,000億美元營收。超預期的第四季業績在2026財年第四季度,輝達一舉衝破了市場的預期線,當季總營收高達681.3億美元,年增幅達到了驚人的73%。公司的淨利更是走出了幾乎翻倍的狂飆曲線,躍升至430億美元。如果把視野拉長到全年,輝達的總營收直接突破了2,159億美元的大關。這台高速運轉的賺錢機器背後,資料中心業務展現了無可匹敵的一家獨大態勢。輝達的資料中心業務,在2026年Q4的收入達到了623億美元,年增75%,撐起了公司超過91%的收入。在過去四年,輝達資料中心業務成長了約19倍(1789%)。Colette Kress表示,超大規模雲端服務商仍是輝達最大的客戶類別,佔資料中心營收的比例略高於50%。輝達給出的2027財年Q1的毛利率指引約為75%。更令人震撼的是供應鏈的提前鎖定,供應相關承諾總額從第三季的503億美元,迅速飆升至952億美元。這意味著輝達已經在用真金白銀鎖死了未來的龐大需求。Colette Kress稱,對於2025至2026年間Blackwell和Rubin產品組合帶來5,000億美元營收,公司具備清晰的可預見性。她預計到2029年,AI基建的投資規模將達到每年3兆至4兆美元。AI業務狂飆成長,其他業務不得不做出讓步。曾經作為核心支柱的遊戲業務,雖然年增47%達到37億美元,但卻比上季卻下降了13%。Colette Kress也坦誠指出,受全球記憶體短缺的波及,遊戲業務在2027財年第一季開始及之後,將不得不面臨供應壓力的陣痛。由於記憶體限制,輝達必須優先保障AI處理器的產能,分析師甚至猜測公司今年可能會直接跳過新一代遊戲GPU的發表。沒有Token就沒成長「智能體拐點」來了在周三的業績電話會上,分析師的提問直擊要害:雲端廠商高達千億的資本開支,到底還能不能持續下去?黃仁勳認為這幾乎不用猶豫,並拋出了他的「AI經濟學」:在這個AI新世界裡,算力就是收入。沒有算力,就沒辦法生成Token;沒有Token,就沒辦法讓營收成長。黃仁勳對自己這些大客戶的現金流成長很有信心,如今流向AI的千億美元資本開支,最終都會直接轉化為收入。原因非常簡單:智能體拐點已經到來。我們現在已經看到了智能體AI(agentic AI)的轉折點,以及智能體在全球各地、各類企業中的實際價值,你也因此看到了驚人的算力需求。老黃已經清晰預見我們正在經歷第三次平台遷移。前兩次是從傳統CPU轉向GPU運算,以及從傳統機器學習跨入生成式AI。而現在,產業正全速衝向智能體AI時代。全球各類企業對智能體的採用率正直線飆升,這就註定了這不是靠削減成本就能完成的進化,它需要海量的、實打實的新增投資。為了牢牢護住這片生態的護城河,輝達在投資與結盟上也豪擲重金。年內公司豪擲175億美元,大舉投資各類新創企業,甚至入股了晶片製造商英特爾。儘管在財報裡輝達直言,這些投資短期內可能無法獲利,甚至永遠收不回本,但這是建構帝國必不可少的佈局。此外,那個讓整個科技圈翹首以盼的數字:與OpenAI高達1,000億美元的合作協議,目前也正在接近達成。能效狂飆10倍 下一代系統Vera Rubin終極拆解如果你覺得現在的算力規模已經觸及天花板,輝達今年下半年即將量產出貨的下一代AI工廠算力基石——Vera Rubin,則有望打破這一侷限。它是Grace Blackwell的絕對繼任者。2026年1月6日,輝達創辦人兼CEO黃仁勳在拉斯維加斯舉行的年度消費性電子展上介紹Vera Rubin AI平台Vera Rubin不是普通的伺服器,輝達官方將其定義為由「六大全新晶片建構的單一AI超級電腦」。輝達下一代AI系統Vera RubinRubin平台由六款全新晶片組成,每款晶片都針對AI工廠中的特定角色進行專門設計,並從一開始就作為統一的機架級系統的一部分進行構建。NVIDIA Rubin 平台晶片以旗艦機架系統Vera Rubin NVL72為例,不僅針對峰值性能進行了優化,更注重持續的智能產出:可預測的延遲、在異構執行階段的高利用率,以及將電力高效轉化為可用智能的能力。Vera Rubin NVL72 概覽硬核技術指標 六大核心晶片的算力狂飆Vera Rubin在底層架構上實現了飛躍,其核心關鍵技術包括:Rubin GPU(算力核心):配備了8顆最前沿的HBM4高頻寬內存,單卡顯存容量高達288 GB,內存頻寬飆升至驚人的22 TB/s。在全新NVIDIA Transformer引擎加持下,其NVFP4格式的AI推理性能高達50 PFLOPS(約前代5倍),訓練性能達35 PFLOPS(約前代3.5倍)。Vera CPU(資料調度中樞):專為大模型推理與資料調度打造,採用88個輝達自研的Olympus Arm核心,支援176線程空間多線程技術,可尋址高達1.5 TB的LPDDR5X記憶體。它透過高達1.8 TB/s的NVLink-C2C互連技術與GPU緊密耦合。第六代NVLink與網路體系:實現了單GPU高達3.6 TB/s的驚人互連頻寬(是前代兩倍)。搭配ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-X以太網,徹底打通了百萬Token長文字和多模態大模型的資料傳輸瓶頸。能效與散熱 100%純液冷的「熱水」奇蹟隨著算力狂飆,資料中心最害怕的就是龐大的電力消耗。Vera Rubin雖然功耗大約是前代產品的兩倍,但它做到了一個讓全行業振奮的突破:每瓦性能提升了足足10倍。官方數據顯示,相較於Blackwell,它能以四分之一的GPU數量完成相同的AI訓練任務,而在AI推理時,每百萬Token成本直接降至前代的十分之一。據估計,這樣一個單系統機架的售價將高達350萬至400萬美元。為了壓住這頭性能巨獸的溫度,輝達首次採用了100%純液冷設計,最硬派的是,它甚至能用高達45度的熱水來進行冷卻。這將有助於未來的資料中心大幅減少對水資源的消耗,徹底擺脫傳統冷卻設施的束縛。極簡美學與全球供應鏈協同在狂暴的性能之外,Vera Rubin也展現了極簡的工程美學。相較於前輩Blackwell必須將組件直接銲接在電路板上,Vera Rubin採用了模組化設計,每個超級晶片都可以在幾秒鐘內像抽屜一樣從計算托盤中輕鬆抽出,簡化了維護。在Vera Rubin的供應鏈上,輝達整合了全球至少20個國家的80多家供應商,面對讓全行業頭疼的HBM4內存短缺和成本飆升,輝達AI基建負責人Dion Harris顯得很從容。他表示輝達正在向供應商提供非常詳細的預測,以此來對抗供應鏈的不確定性,確保這套「世界上最複雜的AI系統」能夠如期統治未來的資料中心。王座下的暗流輝達王座之下並非風平浪靜。客戶一邊離不開輝達的機器,一邊又對這種深度的生態綁架感到恐懼。出於戰略安全上的本能防禦,亞馬遜已經在自己的​​資料中心裡,部署了由自研Trainium 2晶片驅動的超伺服器。同樣,Google也在重倉囤積著自家TPU組成的機架,並開啟了商業化的步伐,這些昔日的客戶,很可能搖身一變,成為未來的競爭對手。此外,挑戰者們正在加速步步緊迫。老對手AMD帶著首個整櫃級系統Helios殺入戰場,一舉拿下了Meta高達6吉瓦電力容量的巨大承諾。就像分析師一針見血指出的那樣,客戶們需要更多的算力容量,同時也極度渴望擁有一個可靠的第二供應來源,以此來對輝達形成製衡。面對來自多面的競爭,黃仁勳加固輝達護城河的辦法是在單點晶片技術之外,透過推出Vera Rubin,直接把供應鏈、算力、網路、冷卻系統全部打包,變成一個難以踰越的整櫃級系統壁壘。想模仿我的晶片?可以。但你能複製我這套龐大系統嗎?正如先前AI基建負責人所言:「向所有敢於嘗試的人致敬,但這絕不是一件簡單的事。」在不斷加速的AI算力競賽敘事下,如果說2024年投產的Grace Blackwell重新定義了單一系統所能達到的算力規模,而即將在2026年下半年出貨的Vera Rubin,則更像是為AI工業革命親手建造的算力超級工廠。在老黃「AI經濟學」的邏輯中,算力即所得。只要算力還在驅動營收成長,就不必擔憂AI泡沫。 (新智元)
【十五五】兩會前瞻|把脈「十五五」之基建篇
編者按:全國兩會召開在即,審議「十五五」規劃綱要是備受關注的核心議程。作為中期發展藍圖,「十五五」規劃將追求高品質發展,切實回應社會關切,擘畫未來五年中國式現代化經濟社會路線圖,為實現2035年遠景目標奠定基礎。香港文匯報從今日起,啟動兩會前瞻之把脈「十五五」系列報導,通過採訪代表、委員及學者,重點解畫「十五五」在新型基礎設施、民生福祉提升、灣區科創融合、產業提質升級等方面的前瞻佈局與潛在機遇,幫助讀者更準確把握國家發展方向,並為香港全面、精準對接國家發展規劃提供有益思路。「這個隧道掘進速度太快了,一天一個樣啊。」2026年春節期間,甘肅省靈台縣中台鎮楊村村民王宏每天總會忙裡偷閒,站在田間看一眼今年1月剛開工的靈台至華亭高速公路二期項目進展。村民期待已久的村村通高速夢想馬上就要實現了,不久之後,村裡的蔬菜就能在家門口坐上「高速直通車」,村民收入肯定會越來越多。楊村其實只是中國基建惠民的一個縮影。進入「十五五」之後,更多的基建工程也隨之按下「加速鍵」。得益於自主創新與舉國體制,這些承載著發展動能的基建工程,不僅為經濟發展注入新的活力,更讓民眾的幸福生活更加「可感可及」。今年是「十五五」開局之年,新年剛過,全國各地一大批基建項目便上馬開工,各省區市未來五年的基建工程也隨之公佈。「開局之年拚出開局之勢,起步之時幹出關鍵之為。」陝西基建領域資深從業者楊建華接受香港文匯報記者採訪時表示,基礎設施建設在國民經濟發展中具有基礎性、先導性、戰略性重要作用。「十五五」規劃建議明確提出建構現代化基礎設施體系,他認為傳統「鐵公基」(鐵路、公路、機場、水利等)會擔負起夯實根基的重擔,依然會發揮出極其重要的作用。這一點從目前各省區市公佈的「十五五」基建項目不難看出。楊建華舉例,比如廣東省的廣州新機場項目,江西省的浙贛粵運河工程,湖南省要實現「縣縣通高速」,江蘇省則將完善沿江沿海高鐵主骨架。在他看來,「鐵公基」基建項目在經濟發展中扮演著「壓艙石」和關鍵支撐角色。它們不僅直接拉動了投資、消費和經濟增長,還通過改善交通和基礎設施條件最佳化了資源配置及區域經濟佈局,亦為廣大民眾創造了就業機會、增加收入。「十五五」4兆投新電力系統2026年1月,位於內蒙古赤峰的30萬千瓦風電項目全容量投產,年發電量8.6億千瓦時,能滿足40余萬戶家庭用電需求。「十五五」規劃建議指出將加力建設新型能源基礎設施。國家電網今年1月亦宣佈,「十五五」期間將投入4兆元錨定新型電力系統建設。總部位於陝西西安的隆基綠能,是最早進入內蒙古庫布齊沙漠的太陽能公司之一。全國人大代表、隆基綠能董事長鐘寶申表示,太陽能產業為中國沙戈荒地區新能源基地建設營運樹立了技術標竿。「十五五」期間,中國能源產業鏈將沿著智能化、綠色化、融合化方向縱深發展,為中國經濟高品質發展注入持久動力。全國人大代表、福建社會科學院副院長黃茂興接受媒體採訪時亦表示,「十五五」時期重點之一就是要加快建設新型能源基礎設施,著力建構新型電力系統、推進清潔能源基地建設,支撐引領產業發展全面綠色轉型。「十五五」時期是中國實現碳達峰的收官期和實現綠色低碳轉型的關鍵階段。截至2025年底,中國太陽能發電裝機容量12.0億千瓦,同比增長35.4%;風電裝機容量6.4億千瓦,同比增長22.9%。按照這個勢頭,「十五五」期間,以風光為主的新能源將迎來新的飛速增長,為中國基建不斷開闢綠色發展新賽道。多地建算力中心新型基站去年10月底,首次寫入「十五五」規劃建議的「適度超前新型基礎設施建設」,一度成為熱門討論話題。在全國各省地方版「十五五」規劃中,都不約而同地提到了適度超前佈局新型基礎設施。這也預示著「十五五」基建在傳統「鐵公基」模式基礎上,將通過新基建「適度超前」拓展增長空間。新基建主要是指提供數字轉型、智能升級、融合創新等服務的基礎設施體系。香港文匯報記者梳理髮現,「十五五」基建項目中,遼寧省提出打造遼西地區綠色算力中心,內蒙古亦提出將適度超前佈局衛星網際網路、移動物聯網、區塊鏈等新型基礎設施。此外,北京、河北、山西、廣東、江西、福建、海南、寧夏、青海、黑龍江等省區市亦公佈了相應的新基建佈局。中國社會科學院經濟研究所研究員黃群慧在接受媒體採訪時表示,在新一輪科技革命和產業變革中,交通、能源、水利等許多領域都有數智化、綠色化更新改造需求。特別是以新一代通訊基站、高性能算力裝置、超大型儲存設施為代表的數智化基礎設施,成為新基建重中之重。國家發展改革委綜合運輸研究所交通運輸融合創新研究中心主任向愛兵認為,中國新基建目前的結構性矛盾和短板還比較突出,「適度超前」恰恰就是解決問題的關鍵。「『適度』反映了基礎設施與經濟社會發展水平的適配程度,『超前』體現了基礎設施的先導性和支撐引領作用。」「新基建將為企業快速發展帶來更多機遇。」新疆絲路新雲數字科技有限公司董事長李倩指出,目前企業正以適度超前的節奏持續進行算力基礎設施建設投入,力爭在算力應用高速增長過程中搶佔先機。逢山開路遇水架橋中國基建震撼世界2025年與2026年交替之際,中國基建圈接連上演了幾場震撼世界的「超級工程秀」。天山勝利隧道貫通、常泰長江大橋刷新世界紀錄、雄忻高鐵北太行山隧道順利貫通,這些超級工程以「第一」「首次」「最大」著稱,在彰顯中國基建重大突破的同時,也為「十四五」畫上圓滿句號,更為「十五五」中國基建再創輝煌開了一個好頭。施工人員在雄忻高鐵首對鋼軌鋪設現場作業。 資料圖片基建項目一直以投資周期長、資金需求大、產業鏈條長而著稱,需要強大的經濟和技術支撐。剛剛過去的2025年,中國經濟交出了一份滿意的答卷,全年國內生產總值達140.19兆元,同比增長5%。核心專利實現自立自強作為全球經濟最重要、最穩定、最可靠的動力源,中國經濟表現出的「穩」和「韌性」,成為中國基建「十五五」高品質發展的堅實保障。此外,近年來全行業積極引入民營資本,調動社會力量,民營資本成為中國基建邁向新發展階段的重要力量。多年來,中國基建不斷刷新「不可能」,其背後「逢山開路、遇水架橋」的強大技術攻堅能力和新裝置,一直被全球業界所津津樂道。港珠澳大橋攻克深埋沉管隧道、人工島築造等世界級難題,天山勝利隧道全程使用「中國製造」。中國目前的基建核心專利,特別是作為隧道工程領域「大國重器」的中國盾構機,目前全球佔有率已經達到70%,真正意義上實現了國產裝置的自立自強。中國盾構機全球佔有率達70%。圖為中國自主研製超大直徑盾構機「滄淵號」全貌。資料圖片除了技術上的多項第一,基建「中國速度」背後的資源整合效率,也讓全世界矚目。北京大興國際機場從開工到投運僅用4年,創造全球最大單體航站樓建設紀錄;深圳城脈金融中心4天建一層的建設速度;中國高鐵營運里程超5萬公里,超過世界上其他國家總和。這種效率源於完整的工業產業鏈,從鋼鐵、水泥到工程機械,中國能自主供應90%以上的基建物資,疊加集中力量辦大事的體制優勢,形成獨一無二的建造合力。此外,近年來,隨著人工智慧技術的突飛猛進,AI也全面進入到中國基建領域。5G遠端操控、AI質量檢測等技術推動施工效率提升20%至50%,全流程數位化管理實現了對工程的精準管控,維運成本降低35%。數字孿生技術將施工進度預測誤差從傳統方法的15%降至4.2%,實現了工程從設計到維運的全生命周期管理。AI深度賦能,也與「十五五」規劃建議中推進傳統基礎設施更新和數智化改造完全契合,助力中國基建創造更多的「新刻度」。 (香港文匯報)
2026,中國國產AI晶片,跨越天塹:從“推理”走向“訓練”
過去幾年,中國國產AI晶片始終活躍在一個相對安全、也相對邊緣的位置——推理側。在政務、金融、安防、工業質檢等場景中,中國國產晶片憑藉成本可控、供應穩定等優勢,逐步完成了從“可用”到“好用”的過程。但在AI訓練這一算力金字塔頂端,中國國產晶片長期缺席,或者只能參與邊緣性任務。這一格局,正在發生改變。2026年,將成為“中國國產AI晶片訓練落地元年”。但這一步,絕非簡單升級,而是一場系統工程等級的跨越。01 訓練與推理有何區別?在大眾語境中,“AI算力”往往被視作一個整體,但在工程實踐中,訓練與推理幾乎是兩種完全不同的工作負載。訓練的核心是讓AI模型“學會知識”,具體而言,是通過海量帶標籤樣本,經過特定演算法迭代,求解出機器學習模型最優參數的過程。這一階段需要海量資料的持續投喂、數十億至兆級參數的動態更新,以及數周乃至數月的不間斷運行,追求的是吞吐量與規模化運算效率。這意味著訓練晶片不僅要具備強悍的算力,還需配備極高的視訊記憶體頻寬、高效的分佈式通訊能力,以及萬卡級叢集規模下的穩定性。訓練過程可進一步細分為預訓練與後訓練兩個階段:預訓練依託海量無標註或弱標註資料,通過大規模反覆迭代計算最佳化模型參數,最小化預測誤差,最終形成具備通用生成能力的基礎大模型,對晶片的計算性能、互連通訊能力及通用性提出極高要求;後訓練又稱微調、最佳化階段,基於通用大模型,借助標註專業資料集對輸出層參數進行量化、剪枝等最佳化,通過強化學習強化特定領域適配能力,雖計算量不及預訓練,但隨著行業化需求提升,其在全流程中的權重正持續增加。與訓練形成鮮明對比,推理是模型“運用知識”的階段,需要依託已訓練完成的模型參數,對新輸入資料進行預測、生成響應,是AI技術落地解決實際問題的核心環節。相較於訓練,推理更側重速度、能效比、響應延遲與成本控制,其部署場景覆蓋雲服務、邊緣節點乃至終端裝置,對穩定性與能效比的訴求遠高於峰值算力。這種特性使得推理過程無需經歷漫長的迭代訓練,可直接呼叫成熟模型完成分析預測,在海量資料處理與即時響應場景中具備顯著高效性。大模型的發展遵循Scaling Law的經驗公式,即模型參數量、資料量以及計算資源的增長能得到更好的模型智能。在通用基礎大模型發展階段,大模型向更大參數方向不斷演化,預訓練階段的資料量呈指數級增長,GPU作為算力硬體的核心在預訓練市場經歷了爆發增長。根據中國信通院《中國算力發展白皮書(2023)》,GPT-3的模型參數約為1,746億個,而GPT-4的模型參數約達到了約1.8兆個,訓練算力需求上升了68倍。此外,xAI發佈的Grok-3使用20萬卡訓練晶片叢集帶來模型性能提升亦證明了預訓練Scaling Law將長期成為人工智慧發展的基石。更值得關注的是,訓練算力存在“邊際效益遞減”的天花板。對於稠密架構大模型,當參數從千億級向兆級跨越時,算力需求呈超線性增長,指數級攀升的成本壓力,讓從頭訓練大模型成為少數科技巨頭的“專屬遊戲”。憑藉高算力門檻,國際領先廠商輝達的產品一直以來都是人工智慧訓練端的首選,佔據了AI訓練市場90%以上份額,其Blackwell架構支援1.8兆參數模型訓練,且NVLink 6技術實現72卡叢集無縫互聯。而推理端(尤其是邊緣端、終端推理)對晶片性能要求較訓練端低,因此推理晶片市場百花齊放,各類晶片均佔有一席之地。由於中國AI晶片市場起步較晚,中國國產廠商通常從門檻相對較低的推理端切入市場,目前已取得階段性成果;而訓練端的中國國產化率仍相對較低。在海外高性能晶片出口管制不斷升級的背景下,擁有高性能計算能力、產品可有效應用於訓練端的中國國產廠商將充分受益。02 中國國產算力走向訓練,難在那裡?從“能推理”到“能訓練”,表面看是性能維度的小幅提升,實則是跨越全技術堆疊的深度重構,核心面臨技術突破與商業閉環兩大挑戰,考驗的是企業的綜合攻堅能力。技術層面,核心矛盾已從單一晶片的紙面參數競爭,轉向萬卡級叢集的互聯瓶頸突破,最終目標是提升模型算力利用率(MFU)。硬體端,單卡性能的提升已無法滿足大規模訓練需求,分佈式平行成為必由之路——Scale Up通過增加單伺服器GPU數量建構超節點,Scale Out通過擴容伺服器規模搭建分佈式叢集,Google、Meta、微軟等海外大廠已率先佈局,如GoogleA3虛擬機器搭載2.6萬塊輝達H100 GPU,同時基於自研晶片搭建8960卡TPUv5p叢集,通過規模化叢集優勢最佳化服務架構。而中國國產廠商雖在單卡性能上實現突破,但在叢集協同能力上仍與海外存在差距。軟體端,單純相容CUDA生態的路徑在高強度訓練場景中已暴露瓶頸,建構原生、高效的自主軟體生態成為必然選擇。隨著大模型參數量與演算法複雜度提升,訓練任務對計算系統的通訊能力要求持續升級,千卡、萬卡級智算叢集成為標配,而中國具備完整訓練晶片部署能力的廠商寥寥無幾。其中,華為海思憑藉長期技術積澱、全端協同優勢及豐富的人才與客戶儲備,在中國國產訓練晶片領域建立了顯著領先地位。技術之外,市場用最樸素的邏輯投票:穩定性與總擁有成本(TCO),這兩大維度構成了對中國國產訓練晶片的核心拷問:其一為應用穩定性,長達數月的訓練任務對晶片平均無故障時間(MTBF)提出極致要求,一次意外中斷就可能造成數百萬沉沒成本。這也是當前智算中心普遍採用“異構部署”策略的核心原因——通過輝達晶片保障核心基座模型的穩定運行,同時用中國國產晶片在垂類模型微調、推理等場景中迭代最佳化、積累信任,推動中國國產算力從“敢用”向“願用”跨越,而實戰落地是唯一的破局路徑。其二為產業體系升維。客戶最終採購的並非PetaFLOPS這類冰冷的性能參數,而是穩定高效的AI生產力。這要求中國國產廠商完成從“單一晶片供應商”到“全端算力解決方案服務商”的轉型,具備從供電、液冷等基礎設施到軟體調優、維運支援的全鏈條服務能力,交付一套高性能、高可靠的“算力動力總成”。03 中國國產AI晶片從推理走向訓練中國國產晶片在訓練場景的落地,並非一蹴而就的爆發,而是政策驅動與技術迭代共同作用的結果,早在去年就已顯現端倪。2025年8月21日,DeepSeek曾表示,新版本採用了一項針對中國國產晶片而設計的技術,能夠實現性能最佳化,並加快處理速度。政策層面的支撐更為明確:2025年5月,美國BIS發佈《關於可能適用於先進計算晶片及其他用於訓練AI模型商品的管制的政策聲明》《關於通用禁令10(GP10)對中華人民共和國(PRC)先進計算晶片適用的指南》《關於防止先進計算晶片轉移的行業指南》,從AI晶片的使用範圍、供應鏈制裁等角度進一步加強了對先進AI晶片和相關技術的出口管制,將出口管制風險進一步延伸至產業鏈的各個參與方。地緣政治倒逼相關中國客戶使用中國國產GPU產品,在一定程度上幫助中國國產GPU廠商與中國客戶和供應商建立密切聯絡,進而快速實現技術和產品迭代升級。而且近期,工信部聯合7部門出台《“人工智慧+製造”專項行動實施意見》明確提出,支援突破高端訓練晶片、端側推理晶片、人工智慧伺服器、高速互聯、智算雲作業系統等關鍵技術。多重因素疊加下,2026年成為中國國產AI晶片訓練落地的關鍵元年。今年以來,一批基於中國國產晶片訓練的AI大模型密集落地,標誌著中國國產算力在訓練場景的實戰能力得到驗證。2026年1月14日,智譜聯合華為開源新一代圖像生成模型GLM-Image,開源後24小時內登頂全球AI開源社區Hugging Face Trending榜單榜首。該模型基於華為昇騰Atlas 800T A2裝置與昇思MindSpore AI框架,完成從資料處理到模型訓練的全流程閉環,是首個依託中國國產晶片實現全程訓練的SOTA(當前最高水平)多模態模型,首次讓中國國產晶片訓練的模型站上國際頂端舞台,印證了中國AI模型端到端自主研發能力的突破,引發全球AI圈、產業界與資本市場的廣泛關注。1月13日,摩爾線程與北京智源人工智慧研究院達成突破,依託MTT S5000千卡智算叢集與FlagOS-Robo框架,成功完成智源自研具身大腦模型RoboBrain 2.5的全流程訓練。這一成果首次驗證了中國國產算力叢集在具身智能大模型訓練中的可用性與高效性,標誌著中國國產AI基礎設施已具備應對複雜多模態任務的能力。此外,摩爾線程還與小馬智行正式宣佈達成戰略合作。雙方將聚焦L4級自動駕駛技術落地與規模化應用,圍繞小馬智行技術核心——世界模型及虛擬司機系統的訓練與最佳化展開深度協同,共同探索“AI演算法+AI算力”深度融合的合作新範式,以安全可靠的AI算力,賦能自動駕駛技術迭代和商業落地。雙方將基於摩爾線程MTT S5000訓推一體智算卡及誇娥智算叢集,共同推進小馬智行世界模型及車端模型訓練的適配與驗證。中國電信近期開放原始碼的千億級星辰大模型,實現了中國國產AI全端生態的關鍵突破。此次發佈的TeleChat3系列包含兩大核心模型——混合專家架構的TeleChat3-105B-A4.7B-Thinking與稠密架構的TeleChat3-36B-Thinking,其訓練全程依託上海臨港中國國產萬卡算力池完成,累計消耗15兆tokens訓練資料,成為中國國產AI發展史上的里程碑事件。技術層面,該系列模型實現從硬體到軟體的全鏈路中國國產化適配,深度整合華為昇騰生態,包括Atlas800T A2訓練伺服器的硬體支援、昇思MindSpore框架的開發環境,以及完整的中國國產AI算力基礎設施支撐。客觀來看,輝達A100/H100/H800系列GPU仍是全球超大規模前沿模型(如DeepSeek-V3)訓練的首選,但中國國產算力平台已逐步實現突破,可穩定支撐數十億至千億參數級模型的全流程訓練任務。此前主流大模型高度依賴海外GPU的格局正在改變,供應鏈安全風險得到有效緩解,中國國產AI晶片正從推理側的“單點突破”,邁向訓練側的“體系化崛起”。 (半導體產業縱橫)
深圳CPU成功點亮
藍芯算力RISC-V+AI通智融合伺服器CPU成功點亮藍芯算力+聯想藍芯算力(深圳)科技有限公司宣佈:2026年2月18日,公司自研、全球首創的RISC-V+AI融合架構智算伺服器CPU順利完成晶片點亮,成功啟動Linux作業系統。本次晶片點亮是藍芯算力和聯想CFC團隊聯合技術攻關的成果。該晶片採用32性能核(Pcore)+16能效核(Ecore)共48核異構設計,片上整合75TOPS INT8 AI算力引擎,同時支援通用計算和智能計算,統一儲存管理。這標誌著國產高性能RISC-V伺服器CPU在通用計算與AI智算融合方向取得關鍵突破,為資料中心、雲端運算、具身智慧型手機器人、各類智能體、大模型推理、金融與電信等關鍵場景提供自主可控、高能效的算力底座。本次點亮的智算伺服器CPU,以RISC-V開源指令集為根基,支援RVV1.0向量擴展,支援RVA23標準規範,採用高性能多核架構與片上AI加速深度融合的異構計算方案,支援CXL 2.0記憶體擴展。32顆高性能核負責高吞吐通用計算、資料庫、虛擬化與業務負載;16顆高能效核協同處理多執行緒並行、邊緣解除安裝與輕量負載,實現性能與功耗的最優平衡。晶片內建專用AI算力模組,峰值算力達75TOPS,支援 INT4/INT8/FP16/FP32等主流精度,可在片內完成AI推理加速,大幅降低資料搬運延遲、提升能效比,適配大模型本地推理、特徵提取、視訊分析與高並行智算場景。藍芯算力作為專注RISC-V+AI高性能智通融合伺服器CPU的創新型企業,助力國產自主算力發展,以開放架構與異構融合為技術路線,面向智算中心、雲服務商、營運商與企業級市場,提供高安全、高可靠、易擴展的算力解決方案。本次晶片成功點亮,是公司產品化處理程序的標誌性里程碑,將進一步完善國產RISC-V智算晶片矩陣,助力新質生產力發展與數字基礎設施自主可控。來源:藍芯算力 (芯榜+)
超級利空?AI圈炸鍋了
【導讀】利空還是誤解?OpenAI大幅下調總算力支出目標2月21日,OpenAI正告知其投資者,目前的目標是到2030年總算力支出達到約6000億美元。就在幾個月前,其首席執行長山姆·奧特曼還曾宣揚1.4兆美元的基礎設施承諾。據知情人士透露,這家人工智慧公司現在提供了一個較低的數字和更明確的計畫支出時間表。此前,外界日益擔心其擴張野心過大,可能與隨之而來的潛在收入不匹配。知情人士表示,OpenAI預計到2030年其總收入將超過2800億美元,其中消費者業務和企業業務的貢獻幾乎各佔一半。他們表示,公司提出的這項支出計畫旨在更直接地與其預期的收入增長掛鉤。去年下半年,OpenAI宣佈了一系列價值數十億美元的基礎設施交易,並與領先的晶片製造商和雲服務公司建立了合作夥伴關係。一位知情人士稱,OpenAI正在敲定一輪總額可能超過1000億美元的巨額融資,其中約90%來自戰略投資者。輝達正在商討向OpenAI投資高達300億美元,作為本輪融資的一部分,這可能使該公司的投前估值達到7300億美元。除輝達外,本輪融資的戰略投資者還包括軟銀和亞馬遜。據悉,OpenAI在2025年實現了131億美元的收入,超過了100億美元的目標。同時,該公司的資金消耗為80億美元,低於90億美元的預期目標。知情人士表示,ChatGPT目前的周活躍使用者數已超過9億,高於10月份的8億。面對來自Google和Anthropic等對手的競爭,OpenAI在去年12月發佈了“紅色警報”(code red),旨在集中精力改進聊天機器人。知情人士稱,ChatGPT的增長在秋季曾出現小幅下滑,但目前其周活躍和日活躍使用者數均已回升至歷史新高。此外,知情人士提到,該公司的程式設計產品Codex的周活躍使用者數已突破150萬。Codex直接競爭對手是Anthropic的Claude Code,後者在過去一年中受到了廣泛採用。如何解讀?OpenAI大幅下調總算力支出目標,周末被市場普遍認為對於算力硬體而言是一個利空事情,畢竟OpenAI作為全球頭部的人工智慧公司,算力資本支出的大幅減少,釋放的訊號很明顯。不過市場也有另外一種解讀聲音,認為這是把兩個不同口徑、不同時間周期的數字強行對比。分析稱,山姆·奧特曼此前提出的1.4兆美元指的是未來8年的基礎設施相關的承諾投入規模,時間跨度約8年,涵蓋更廣義的基礎設施相關投入,不是“到2030年的累計資本開支”。而此次提出的6000億美元指的是到2030年的算力支出,相比未來8年的1.4兆美元支出,時間更短,口徑更窄(只覆蓋算力部分,不等於全部基礎設施承諾)。市場將“未來8年承諾1.4兆美元”對比“到2030年算力支出6000億美元”,然後得出“砍了8000億美元”,這在邏輯上是不成立的,本質是口徑錯配。 (中國基金報)