#Vera | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#Vera

傳輝達擬削減Vera Rubin機架記憶體配置，以應對成本飆升

7月27日消息，據外媒Wccftech援引廣發證券（GF Securities）的分析報導稱，輝達公司正在大幅減少其Vera Rubin NV72機架級AI系統的記憶體使用量，以應對持續的記憶體短缺和價格上漲問題。輝達的Vera Rubin NVL72機架系統是全球性能最頂尖的AI計算平台之一。該系統於今年1月發佈，其首批性能資料在本月初由CoreWeave共享不同AI系統的吞吐量資料後首次浮出水面。結果顯示，在處理混合專家（MoE）模型工作負載時，搭載輝達Blackwell AI GPU的系統在150兆瓦功耗下可實現每秒8萬token的吞吐量；而全新的VR200 NVL72 Vera Rubin平台則將這一數值提升了10倍，達到每秒80萬token。這一結果出爐之前，伯恩斯坦（Bernstein）早前的一份報告曾指出，單台NVL72 Rubin機架的成本可能高達910萬美元，主要原因在於記憶體價格走高。伯恩斯坦表示，此前有關該機架成本為780萬美元的估算，是基於過時的記憶體價格預測得出的。該金融機構進一步指出，HBM4記憶體的價格在2027年可能上漲至53美元/GB。近日，廣發證券的一份報告顯示，輝達正在進行調整，以應對記憶體市場的供應和價格壓力。該報告認為，從Vera Rubin NVL72機架開始，輝達將把該機架的SOCAMM（小型壓縮附加記憶體模組）容量減半，從原先的192GB模組降至96GB。這些調整是為了應對LPDDR5X市場的供應緊張局面。

輝達按下加速鍵：Vera Rubin正式進入全面量產，誰能搶佔下一波紅利？

在AMD舉行AI相關活動前夕，輝達搶先釋放了一枚重磅信號。美東時間7月21日， $輝達 (NVDA.US)$ 更新下一代Vera Rubin平台進展：Vera Rubin NVL72已正式進入量產爬坡階段，相關機架已經在 $CoreWeave (CRWV.US)$ 、 $Google-C (GOOG.US)$ Google Cloud、 $微軟 (MSFT.US)$ Microsoft Azure和 $甲骨文 (ORCL.US)$ Oracle Cloud Infrastructure等合作夥伴處運行。這並不是一次簡單的新品預告。早在5月底，輝達便宣佈Vera Rubin進入全面生產階段；此次更新的真正意義，在於平台開始從「量產承諾」轉向「客戶部署與實測驗證」。輝達披露，Vera Rubin背後已經形成一張覆蓋全球30個國家、350多個工廠節點、約300家合作夥伴的供應鏈網絡。如此龐大的產業協作規模意味著，輝達銷售的不再只是一顆GPU，而是一整套可以復制和擴張的「AI工廠」。

輝達首次公開維拉·魯賓“活系統”：全液冷、800VDC配電和NVLink 6，中國AI基礎設施追趕的下一代物理邊界？

2026年7月下旬，輝達向《Tom's Hardware》等十幾名記者，開放了總部附近一處此前未公開的“工程超級實驗室”（Engineering SuperLab）。即將於2026年下半年交付的維拉·魯賓（Vera Rubin）NVL72機櫃，沒有擺在展台上當拆解樣品，而是在真實資料中心環境裡跑著生產級負載。輝達現場透露，實驗室內運行的機櫃，正在處理OpenAI的部分任務。前端面板顯示，一些計算托盤正在跑OpenAI的GPT‑Rosalind模型。這是維拉·魯賓頭一回以“活系統”形態出現在媒體鏡頭前——不是PPT，也不是事先錄好的短片。《Tom's Hardware》在7月21日發佈了這次獨家探訪的報導。記者描述，實驗室噪聲約80到90分貝，進場須戴護耳裝備。輝達工程師的走動方式透露出另一層資訊：這地方的首要目的是方便快速部署和更換機櫃，看起來不像那種窗明幾淨的正式資料中心。這處超級實驗室，是輝達過去兩年在總部附近悄悄建起的四個不對外公開站點之一。

AMD AI大會前輝達秀亮CPU「戰果」，Vera Rubin全面量產，超300合作夥伴部署

輝達5月底就宣佈，Vera已進入全面生產，並稱該晶片的特定任務完成速度可達到傳統x86 CPU的1.8倍。本周二輝達強調，相比單純堆疊更多核心，Vera更重視單線程性能、核心之間的通訊帶寬以及內存訪問延遲，並表示Vera Rubin NVL72正在全球範圍內進入量產爬坡，CoreWeave、Google、微軟等合作夥伴已開始部署相關機架；CoreWeave運行基準測試結果顯示，Vera Rubin NVL72的每兆瓦Token產出量較Blackwell架構提升10倍。輝達正在把戰火從GPU市場燒向CPU。在AMD舉行AI相關活動前夕，輝達於美東時間21日周二集中披露下一代Vera Rubin平台的最新進展：Vera Rubin NVL72已經進入量產爬坡階段，輝達稱該平台的供應鏈覆蓋全球350多個工廠和30個國家，已有超過300家合作夥伴參與其中。同時，輝達進一步公佈了Vera CPU及Vera Rubin平台在AI智能體（agent）工作負載中的性能數據，試圖證明，隨著AI從「回答問題」轉向自主規劃、調用工具和執行任務，CPU正在成為AI基礎設施的新戰場。

狙擊AMD AI大會？輝達搶先披露Vera CPU新細節

在AMD “Advancing AI 2026大會”前夕，輝達搶先公佈了資料中心CPU產品Vera的更多技術細節。這不僅是輝達繼Grace之後在CPU領域的又一重磅落子，更是其從“賣顯示卡”向“賣AI工廠”垂直整合戰略的徹底攤牌—— Vera是全球首款從核心層面專為代理式AI（Agentic AI）量身定製的處理器。輝達還透露，Vera Rubin NVL72已進入量產爬坡階段，該平台的供應鏈覆蓋了全球350多個工廠、30個國家，超過300家合作夥伴參與其中。

輝達延期基本確認了？

The Information 上周去了聖克拉拉的輝達總部，在一個半秘密的測試場地裡見到了正在跑的 Vera Rubin 機架，資訊量不小。結合近期對頭部ODM廠商的調研，簡單分享幾點觀察： 1. 測試機架已經在客戶手上了包括 CoreWeave、微軟、OpenAI、Anthropic、SpaceXAI 在內的數十家客戶，已經收到少量測試機架，每個機架 72 顆 GPU。一位買家向 The Information 透露，這批機架的單價在 700 萬至 800 萬美元之間，而當前旗艦機型 GB300 機架的價格約為 500 萬美元。

Vera Rubin實測性能首度披露，性能大幅提升！輝達在AMD大會之前「砸場子」

輝達在AMD年度發佈會前夕密集亮牌：Vera CPU性能較x86晶片近乎翻倍、延遲壓縮六倍，Vera Rubin NVL72實測能效較上代躍升10倍。OpenAI、Anthropic、SpaceX已率先拿到首批晶片。這場精心擇時的數據轟炸，既是對AMD的正面狙擊，更是輝達強勢闖入CPU市場、志在2000億美元蛋糕的宣戰書。 $輝達 (NVDA.US)$在勁敵AMD年度產品發佈會召開前夕，打出一記重拳，密集披露新一代Vera Rubin平台的實測性能數據，並正式公開自研CPU晶片Vera的完整規格。周二，輝達披露，Vera CPU在代理式AI任務上的性能較x86晶片高出近一倍，延遲改善幅度達六倍。與此同時，雲計算合作夥伴CoreWeave的早期生產測試顯示，Vera Rubin NVL72平台在運行DeepSeek R1模型時，每兆瓦算力產生的token吞吐量較上一代基於Blackwell架構的GB200 NVL72系統提升10倍。上述數據的發佈時機頗具深意。AMD將於本周四在舊金山舉行年度產品發佈會"Advancing AI"，輝達此時集中釋放性能數據，被外界普遍解讀為一次有意為之的市場造勢。對於正在評估下一代AI基礎設施投資的雲廠商和企業客戶而言，這批數據將直接影響其採購決策。

Wedbush：看好輝達自研VeraCPU，高核心數性能超越x86

金吾財訊 | 投行 Wedbush 周四發佈行業研報稱，看好輝達(NVDA)自研 Vera 數據中心 CPU 的市場競爭力，認為這款高核心數處理器性能優於英特爾、AMD 主導的傳統 x86 架構服務器晶片，將顯著拓寬輝達整體可觸達市場(TAM)，成為公司未來數年核心增長曲線之一。輝達在今年 GTC 全球技術大會上正式推出 Vera CPU，產品定位面向 AI 智能體推理場景，搭載 88 顆自研 Olympus 核心、支援 176 線程，內存帶寬表現大幅領先傳統 x86 服務器 CPU，官方實測綜合性能、能效全面佔優，可與輝達 Blackwell 系列 GPU 深度協同，適配大規模 AI 算力叢集調度需求。 Wedbush 分析師 Matt Bryson 在研報中指出，過去市場普遍默認通用服務器計算市場由 x86 架構壟斷，而輝達藉助 GPU 生態切入通用 CPU 賽道，打破固有行業格局。Vera 並非單純配套加速晶片，而是完整補齊算力底座，讓輝達能夠滲透此前由英特爾(INTC)、AMD(AMD)把持的通用服務器市場，疊加公司原有網絡硬體業務，多產品線協同打開增量空間。分析師表示，Vera 落地是輝達向硬體鄰域擴張的關鍵一步，算力、網絡、通用 CPU 形成完整產品矩陣，長期成長邏輯進一步強化。 (金吾資訊)