根據晶片產業顧問公司SemiAnalysis最新預測,輝達公司為中國市場「特供」的H20晶片,預計在當前財年大幅提振該公司中國區業績。
該機構預測,輝達今年預計將交付超過100萬個新的H20晶片。以單一晶片1.2萬美元—1.3萬美元計算,光是這款晶片就將貢獻超過120億美元的營收(約870億人民幣)。
值得一提的是,在上一年度財報中,輝達中國區營收為103億美元。這就意味著,如果SemiAnalysis預測成真,光是H20顯示卡銷售額就將超過上一財年輝達中國區整體營收。
今年初,中國企業對性能大幅縮水的H20持觀望態度。如今,憑藉輝達的生態優勢,加之華為昇騰910B始終供貨緊張,即使性能“閹割”,H20也逐漸熱了起來。
H20接受度逐漸提升
今年2月,H20在中國市場接受預訂之初,通路商給企業客戶的報價在1.5萬美元(約合人民幣11萬元),一台搭載八張H20計算卡的伺服器售價約150萬元。
如今,一位經銷商告訴《IT時報》記者,目前一台配置八張H20的伺服器價格約120萬元。
業內人士告訴記者,包括百度、阿里、騰訊和字節在內的網路大廠是H20主要需求方。 「因為能合規進口,他們除了H20沒有別的選擇了。」這位人士說。
儘管H20在性能上不如輝達H100,其AI算力不到後者的15%,但由於國產晶片中最接近輝達頂級晶片的華為昇騰910B始終供應緊張,H20成為企業們的無奈之選。
今年1月《IT時報》曾報導,已有中國廠商將在今年第一季拿到H20,但由於這些「特供版」AI晶片性能大幅縮水,大部分中國企業仍處於觀望狀態。半年時間過去,H20晶片在中國的接受度逐漸提升。
《IT時報》記者註意到,7月9日,萬馬科技在投資者關係活動上表示,目前公司用輝達H20搭建算力集群,建造無人駕駛雲端服務項目。這家企業進一步表示,未來若能解決合規問題,將考慮使用輝達A/H100,同時也在和中國供應商合作進行測試,若滿足客戶需求,未來不排除考慮使用國產AI晶片。
而在6月24日發布的公告中,萬馬科技稱全資子公司優咔科技將在江蘇常州建設自動駕駛雲端服務建設項目,將規劃建造伺服器1個SU,共31台NVIDIA H20 伺服器。
7月10日,有投資者在互動平台向弘信電子提問:“輝達H20下半年中國區爆單,作為一級代理商,公司最近有下單H20晶片嗎?”
對此,弘信電子回應稱,公司全資子公司安聯通作為輝達中國區精英級合作夥伴,具有輝達晶片取得的通路優勢,為客戶提供H20算力業務是安聯通的業務重點發展方向之一。
記者註意到,2023年4月以來,弘信電子策略性佈局AI算力伺服器硬體研發生產製造與AI算力租賃兩大業務,當月弘信電子斥2.93億元買下輝達合作公司北京安聯通科技有限公司股權。
生態成為國產晶片桎梏
業內人士告訴《IT時報》記者,H20晶片之所以能夠在中國市場站穩腳跟,很大程度上得益於其生態系統優勢,這是包括AMD、英特爾以及中國競爭對手難以匹敵的。
雖然H20的性能不如頂級型號,但對於中國大企業而言,採用H20晶片相較於全盤國產化,對現有生態系統的衝擊較小,因此成為更具吸引力的選擇。
該業內人士進一步透露,去年騰訊採購了不少AMD晶片,但實際利用率並不高,甚至在今年初一度尋求「出手」。
生態目前仍是國產晶片廠商亟需突破的一大桎梏。在近日的中國資訊化百人會上,中國工程院士、清華大學電腦系教授鄭緯民表示,國產AI晶片的核心問題在於生態系統不夠完善。他認為,儘管國產AI晶片在硬體效能上取得了顯著進展,但由於軟體生態系統的不成熟,使用者使用體驗不佳。
什麼是好生態?鄭緯民認為,如果一個原本在輝達平台上開發的人工智慧軟體能夠輕鬆移植到國產系統上,這就意味著生態系統是好的。
鄭緯民指出,如果國產AI晶片生態系統得到改善,即使只能達到國外晶片60%的效能,用戶也會願意使用。
從基礎大模型轉向推理
「就大模型訓練而言,H20基本上屬於不可用。」今年初,山海引擎COO彭璐在接受《IT時報》採訪時表示,H20的配置更適用於推理,而不適用於模型訓練。彭璐當時認為,從市場應用的角度來看,除了一些大廠可能會投入成本用於推理訓練外,大型模型新創公司很少大量購買推理算力,因為它們更注重模型訓練的競爭力。
幾個月來,彭璐觀察到,中國算力市場經歷了不少變化。他表示,目前中國專注於基礎大模型的廠商數量正在減少,導致大規模算力需求減弱,反而小集群需求增多,「中型集群的需求基本上沒了。」這也導致今年春節後H100等高端設備價格不斷下調。
記者了解到,今年初,兩家小型通路商與輝達展開合作,最初的目標是用H20建立「萬卡集群」。然而,隨著時間的推移,實際部署情況並沒有達到最初預想的規模。知情人士表示,目前這兩家渠道商所建立的最大集群規模為128台伺服器的千卡集群,“但千卡集群在現在的環境下租不出去。”
彭璐進一步表示,中國算力需求正從大規模模型訓練轉向推理需求,尤其是企業對於私有化部署的推理需求日益增長。隨著開源模型能力的提升,企業發現透過微調這些模型即可滿足特定任務需求,無須投入大量資金訓練超大規模模型。這種趨勢促使推理市場開始升溫,企業傾向於建立小模型來完成特定任務。
「但目前我們還沒有看到像我們這種IDC公司有大量進H20的,主要還是幾個大廠在買。」彭璐說。(IT時報 )