報導:輝達AI晶片故障引發微軟等客戶砍單!股價一度重挫近5%


輝達最新一代AI晶片Blackwell在部署至資料中心時遭遇技術問題,包括伺服器機架過熱和晶片連接異常,導致多家客戶(如微軟、AWS、Google、Meta)推遲資料中心計畫並削減訂單。消息公佈後,周一早盤,輝達一度跌超4.7%。

美東時間1月13日周一,據《The Information》報導,輝達最新一代人工智慧晶片Blackwell在部署至資料中心時遇到了技術問題,主要包括伺服器機架過熱和晶片連接異常。

這些問題對資料中心的部署處理程序造成阻礙,輝達多家客戶(包括微軟、亞馬遜旗下AWS、Google、Meta)最近砍掉了部分Blackwell GB200機架的訂單。

因延遲交付,微軟原本計畫安裝大量GB200的鳳凰城資料中心現在已經裝滿了H200晶片。有消息人士透露,如果輝達無法解決這些問題,其性能可能會低於公司承諾的水平。

消息公佈後,輝達美股早盤一度跌超4.7%。

01 主要客戶削減訂單尋求替代方案

Blackwell晶片以其卓越性能和高能效廣受期待。與上一代產品Hopper相比,Blackwell的能源效率提高了四倍,吸引了微軟、亞馬遜、Google和Meta等科技巨頭。每家公司為此下達了價值逾100億美元的訂單。

然而,將多個高功耗晶片整合到一個伺服器機架中比預期更具挑戰。每個Blackwell機架比家用冰箱還高,重量接近一輛本田思域汽車。由於計算密度極高,機架必須採用水冷系統,而非傳統的風冷系統。對於多數AI開發商和資料中心營運商而言,部署這種特殊機架是全新且複雜的任務。此外,並非所有資料中心都能滿足這些機架的環境需求,客戶必須重新規劃部署方案。

因過熱和連接問題,部分客戶削減了Blackwell GB200機架的訂單。例如,有客戶選擇等待可能在今年下半年推出的改進版本,另一些則計畫採購輝達的舊款AI晶片作為替代方案。雖然輝達推薦整機架方案,但部分客戶可能改為單獨購買Blackwell晶片以便自行組裝。

儘管面臨挑戰,輝達仍有機會挽回局面。如果能夠及時解決這些技術問題,客戶或許會重新增加訂單。此外,儘管機架存在問題,Blackwell晶片的性能仍然優於上一代產品,輝達可能會為問題機架找到其他買家。

輝達去年11月曾預測,新一代AI晶片Blackwell將在今年第一季度為公司帶來數十億美元的收入,並助推其全年資料中心晶片收入從475億美元增長至1500億美元。Blackwell晶片的高能效本是吸引雲服務提供商的關鍵因素,這些供應商希望在固定能源條件下實現更高的計算效率。

02 晶片延遲影響資料中心部署計畫

據知情人士透露,作為OpenAI的伺服器提供商,微軟原計畫在其鳳凰城的一個設施中安裝至少包含5萬枚Blackwell晶片的GB200機架。然而,由於Blackwell晶片從去年開始延遲交付,OpenAI要求微軟儘早為其提供上一代輝達H200晶片。這一變化導致原本計畫安裝大量GB200的鳳凰城資料中心現在已經裝滿了H200晶片。

據知情人士透露,微軟現在計畫在今年3月在鳳凰城的一個設施中安裝包含12000枚Blackwell晶片的GB200機架,這一數量約為最初計畫的四分之一。另一位與微軟合作的人士表示,該公司還計畫在今年晚些時候GB300 Blackwell機架上市時進行採購。

輝達原本計畫在去年年底開始向客戶交付Blackwell機架,但由於晶片設計缺陷導致初期延遲了三個月。儘管輝達已經修復了這一問題,但到11月份時,客戶開始擔心機架的過熱問題。為此,輝達多次要求供應商更改設計。

然而,問題並未得到完全解決。據參與機架測試的三位人士透露,客戶還發現晶片之間資料傳輸(即網路)存在不一致的情況。這些問題可能導致Blackwell機架的設定時間比預期更長,如果輝達無法解決這些問題,其性能可能會低於公司承諾的水平。 (硬AI)


最近長文
關於鉅亨號
「鉅亨號」是《Anue鉅亨網》以AI 大數據和推薦引擎所推出具影響力的自媒體社群平台,從投資理財為主題擴展到金融財經、房地產、汽車、數位虛擬貨幣、影音視頻及Podcast的數位生活圈。讀者可透過一面牆及個人化功能關注一天的大小事;對創作者而言更是一個直接能與1,000萬用戶互動的舞台。
最好用的投資平台,幫你找到最適合自己的標的
看真實的投資分享文章,跟隨達人腳步取得最佳利益
多元投資社群平台,掌握最新市場動態熱門議題