近日,據知情人士消息,英偉達(輝達,Nvidia)專為中國市場設計的"閹割版"AI 晶片H20系列,已開始接受通路商的預購。
據了解,H20的定價與華為昇騰910B接近。H20中國通路定價設定在12,000~15,000美元之間,但部分渠道商的報價為11萬人民幣(相當於15,320 美元)。而華為昇騰910B 售價約在12萬人民幣左右。
H20 是英偉達為中國市場開發的三款AI 晶片(H20、L20 PCle 和L2 PCle)中最強的一款,這三款晶片都是基於英偉達H100修改而來,其算力要低於H100 和H800。據了解,H20內存容量96GB,運行速度高達4.0Tb/s,運算能力為296 TFLOPs,使用GH100晶片,性能密度(TFLOPs/Die size)僅為2.9。相較之下,H100擁有80GB HBM3內存,內存頻寬3.4Tb/s,運算能力是1,979 TFLOP,性能密度高達19.4。也就是說,"閹割版" 的H20 晶片的AI 算力只有H100 的不到15%。
相較於華為昇騰910B,H20在某些關鍵領域的性能不如華為昇騰(Ascend)910B,例如衡量晶片處理常見任務速度的FP32性能方面,但在互連速度方面H20 似乎比910B更具優勢。
從性能和價格來看,英偉達H20顯然主要對標的對象就是:華為昇騰910B。為什麼呢?
首先,英偉達超過20%的營收來自於中國大陸。根據TrendForce數據,中國雲端運算公司目前80%的高階晶片來自英偉達,未來5年可能會降到50%-60%。 2023年12月6日,黃仁勳就曾公開透露,中國市場佔了英偉達總營收的20%。可見,中國市場是英偉達至關重要的市場。
其次,來自英偉達多年來的老對手AMD的競爭壓力。在GPU領域,英偉達與AMD兩者幾乎瓜分了全球市場份額,前者佔八成左右,後者佔二成左右。
再次,網路大廠紛紛推出自研AI晶片。如OpenAI、微軟、Meta、亞馬遜、高通等科技廠商,都在做AI推理晶片。預計未來一到兩年,大模型推理過程,將不再需要藉助昂貴的GPU,就可以實現技術迭代,把算力成本降下來。
但最近越來越多的廠商們意識到過度依賴CUDA的危險性,於是開始有意減少CUDA的應用。就如近期英特爾CEO基辛格所言,MLIR、谷歌和OpenAI等都在轉向一個“以Python語言為基礎的編程層”,以使AI訓練更加開放。
因此,我們也不難理解,為何黃仁勳要在今年英偉達中國年會上,頂著一頭幹練利落的花白短髮,黑色體卹外,套著一件東北大花馬甲,兩手各頂一隻紅手帕,投入地跳起了東北二人轉。(飆叔科技洞察)