英偉達中國就如同兩個大洲板塊碰撞下的邊界,除了承受擠壓,別無他法。
穿著大花襖,轉著紅手絹,入鄉隨俗的英偉達CEO黃仁勳脫下他標誌性的黑色皮衣,在全體上海員工的哄鬧中,跳起了東北大秧歌。這是時隔4年,黃仁勳再度光臨英偉達中國年會。
在英偉達(輝達)內部,黃仁勳這次“訪華”是高度機密,“當主持人說有請我們最親密的家人後,很多人都在猜測是誰”, 英偉達內部員工告訴36氪,“直到老黃出現,全場沸騰,完全沒想到他會來。”
英偉達的員工大多視黃仁勳為偶像。他的到來將年會氣氛推向頂點,也給英偉達中國員工和合作夥伴吃了一顆定心丸。 5天時間,他連趕了3場年會。
美國的晶片禁令,讓這家晶片巨頭過去一年,在中國市場舉步維艱,黃仁勳2023年6月原定的訪問中國大陸的行程取消後,甚至有員工在視頻會上問道: “你還能來中國嗎?”
但黃仁勳的意外光臨,打消了員工的疑慮,也在這個充滿寒意的冬天,向整個英偉達中國員工傳遞出了正面的訊號。
英偉達無疑是2023年全球最受矚目的公司。大模型火爆帶來的晶片需求激增,讓它在這年賺得盆滿缽滿,前三個季度總營收達到388億美元,年增85.5%。
英偉達股價更是水漲船高,一年時間翻了3倍,截止2024年2月2日收盤,英偉達股價已突破660美元/股,可望成為又一家突破2兆美元市值的科技巨頭。
英偉達員工「靠股票致富」一度成為業界熱聞,令人羨慕。但在中國,英偉達所面臨的局面卻頗為尷尬。
顯示卡兩度禁售,一度讓英偉達在中國幾乎無貨可賣,業績遭遇了巨大下滑。公司新改良的PCIe L20(面向中國市場的AI推理特供版GPU,以下簡稱「L20」),在大模型訓練市場銷售艱難。
黃仁勳訪華後僅10天,市場上便立刻傳出HGX H20(面向中國市場的用於AI訓練特供版GPU,以下簡稱「H20」)的消息。但H20僅面向大客戶開啟預定,至少等到2024年下半年才能到貨。接近英偉達的人告訴36氪,銷售都表示中國市場四季「廢」了。
英偉達主要透過代理商出貨,其官方合作夥伴的員工管業曾私下透露,「第一次被禁後,我們衝了一波業績,但第二波被禁後,英偉達幾乎全系列數據中心的卡全部砍了,我們每天問老闆,可以賣什麼? ”
無事可做,也讓英偉達部分員工,尤其銷售和客戶服務相關部門產生了巨大的隱憂。部分企業端的銷售開始賣了軟體和InfiniBand網路產品(用於伺服器間互聯的通訊產品,以下簡稱IB網路),但這聊勝於無。
在核心產品兩次被禁後,一次視訊會議上,英偉達中國員工向黃仁勳發問,“你會裁員嗎?”
這是夾縫中的英偉達中國員工最真實的情緒反應,他們擔心自己的前途,儘管黃仁勳一再強調“不會裁員”,但當時代的重錘落下,英偉達中國就如同兩個大洲板塊碰撞下的邊界,除了承受擠壓,別無他法。
「無卡可賣」的2個月
在英偉達生態圈多年,管業(化名)從未經歷過如此艱難的時刻。
2023年10月底,美國對中國發起了第二次AI晶片出口管制,除了先前已被禁的A100和H800,專為中國市場推出的改良版晶片A100、H100晶片被列入名單,就連消費領域的4090卡也成為犧牲品。
這讓身為英偉達合作夥伴的管業感受到了一絲絕望。因為只賣英偉達產品,管業所在公司的一切業績都繫英偉達之上。
但如今英偉達企業端根本沒卡可賣,“當時嫌棄A800難賣, 現在我們每天都得問老闆,還能賣什麼”, 管業感慨道。
一時之間,整個產業哀鴻遍野。在當下最火熱的大模型訓練市場,英偉達的伺服器是最重要和幾乎唯一的算力武器。買不到英偉達,就代表沒法訓練大模型,在這場百模大戰中失去先機。
為了縮小損失,第二次禁令到來後,英偉達內部立刻行動起來,更改符合規定的產品。
「大家幾乎一夜之間從床上爬起,把產品重新翻新一遍,軟體、硬體部門忙著重新配置GPU,後端忙著對硬體進行穩定性測試,完全是新品發布會前最忙的節奏。”一位英偉達員工回憶道。
不到2個月時間,英偉達便迅速推出了面向中國遊戲市場的特供版本4090D,補上了市場的空缺。
英偉達4090D顯示卡(取自淘寶截圖)
比起遊戲業務,資料中心業務的道路無疑難了許多。被禁一個月後,產業便出傳英偉達會為中國市場再推出三款改良版的企業端GPU晶片—— HGX H20、L20 PCle和L2 PCle的消息。
具有推理功能的L20 PCle卡迅速在市場上推出,但能用於大模型訓練的H20,直到黃仁勳訪華10天后的1月29日,才在市場上開始預定,但僅有大客戶具有預定資格。
在A800、H800被禁後的2個多月裡,多位從業人員告訴36氪,英偉達中國市場幾乎所有資料中心顯示卡都被禁,目前能賣的GPU只有L20。
這是一款推理晶片,它的顯存容量和訪存頻寬與被禁的L40S幾乎沒有差異,價格還便宜了一半,很適合用在AI的搜尋、推薦等模型。接近英偉達的人林瓊稱,第一批L20到貨後很快就被位元組、百度、騰訊等大廠分完了。
只要不用在大模型推理市場,L20就有極高的性價比。但當英偉達中國不得不用它打大模型市場時,一切就變得艱難。
“我們做了很多測試來證明L20可以用於訓練,但客戶根本不買單”,英偉達內部員工馮元夏滿懷無奈。
英偉達的員工很少會遇到如此艱難的時刻。這家晶片巨頭一手發明了GPU產品,品質又向來過硬,員工銷售時一向底氣十足,很少有心裡發虛和鬱悶的經歷,“明明是豪華車,卻不得不跑在經濟車賽道”,一位英偉達員工頗為無奈。
「A800、H800至少還能用,L20的性價比實在太低了。」一位對晶片需求較為了解的算力供應商周毅明告訴36氪。就連頭痛賣什麼的管業也表示:“見客戶根本不說這個,沒意義,他們只關心算力。”
除了算力性能不達標,L20卡推薦的是4卡機的方案,一台伺服器只能放4張卡,這意味著要達到同等算力,它需要更多的機櫃、更多的電和更多的場地,營運成本會更高。
管業苦笑,英偉達銷售說這些成本用買卡省下來的錢就都抵銷回來,不過是沒東西可賣、不得已而為之的說法。
黃仁勳訪華後才姍姍來遲的H20顯示卡,雖具有大模型訓練功能,但現在完全沒貨,最快可能要6月才能交付客戶。 “產能有限,肯定是生產最賺錢的產品”, 接近英偉達的人士林瓊感慨。
無奈之下,中國的客戶們開始了另一個選擇──購買非官方通路的英偉達GPU。
周毅明告訴36氪,在第二次禁售之前,國內客戶都還老實購買為中國市場準備的A800、H800,但二次禁令後,大家索性放開了,直接購買H100產品。
“很多公司跑到海外,向國內賣英偉達GPU,每個月通過不同渠道都有H100進入中國。”
微信群組裡販售英偉達伺服器的訊息(作者截圖)
買不到貨的客戶也開始考慮在海外建立資料中心,解決買卡難問題。 AI領域從業人員金傑表示,「很多人找我詢問,有沒有在海外建資料中心的合作夥伴資源。有大規模訓練需求的公司可能不敢出海訓練,但零散訓練需求的企業,還是願意試水。”
辦法總比困難多,但無論是在海外購買的英偉達GPU,或是可能從中國走出去的資料中心客戶,其業績都將不再屬於英偉達中國。
英偉達中國能做什麼?
面對這種被動場景,英偉達中國能做的卻十分有限。
最直接的,在何時推出、推出何種合規GPU這件事上,英偉達中國沒有任何話語權,只能被動等待與美國總部的溝通。原本英偉達計畫H20與L20一同在11月發布,但由於美國政府的限制,英偉達不得不調整計劃,將H20的發佈時間推遲。
就算不是這一特殊事件,英偉達中國的自主權和決策權也相對較弱,這從它的組織架構便可窺見。 AMD有大中華區總裁,英特爾和高通有中國區董事長,但英偉達中國沒有一個能代表中國區與美國總部溝通的總負責人。
嚴格意義上,英偉達中國並非獨立閉環的組織,它的各個業務是總部各職能部門的延伸,每個業務都向總部職能線負責人匯報,一個僅十幾個人的小團隊也不例外。如果將各職能部門都視為八爪魚的一腳,英偉達中國則更像是每個腳上的觸手。
在這種架構下,英偉達中國更多承擔的是執行功能,不具決策權。一位英偉達中國早期員工告訴36氪,“很多事情都是有結果了才會通知中國,決策正確與否,全靠總部想明白。”
以商務為例,即使中國大陸已占到英偉達營收的20%左右,是其全球第二大市場,英偉達中國也沒有一個商務總負責人,其消費業務和企業卡業務等條線銷售負責人,都要報告給亞太區的副總裁。換句話說,在中國,商務條線的高階主管只在業務負責人層級。
因為業務需求的暴增,英偉達北京辦公室的員工相比2021年的約230人擴張了一倍,這其中很大一部分是銷售和解決方案團隊等前端員工。
「但在申請擴招時,英偉達總部很難理解,為什麼需要這麼多人?」英偉達內部員工很苦惱。銷售們也常在溝通上自嘲,自己在公司沒有價值。
此外,商務在日常工作中的自主權也有限。英偉達的產品是統一定價,商務不能對產品打折,甚至他們在簽單時也不能保證到貨期,也只能向總部申請貨源。
這種自主權缺失的問題,在行銷等部門同樣常見。
有英偉達前員工抱怨,「有時候想做一點本土化行銷的東西,如微博行銷、節慶等,總部並不認同。他們所做的亞馬遜電商活動又不符合國內受眾胃口。」儘管許多國外巨頭在中國區都存在類似的問題,但英偉達無疑是其中對權限收縮較緊的。
「其實這就是一家五金公司,市場、銷售這些都是錦上添花,重要的還是產品夠好或夠便宜。」一位英偉達前員工告訴36氪。
與市場、商務等業務相比,研發是這家公司的人才核心。英偉達中國曾被寄予厚望,總部一度將重要的晶片放在中國研發。
當上海團隊成立不到5年時,英偉達正研究全球第一款40nm GPU晶片,當時便將數位後端工作交給了中國團隊。這也是英偉達在40nm製程的第一顆晶片,有著特殊性。
「但總部給了機會,這件事在英特爾、AMD是不可能發生的。」莫風鳴表示。
英偉達願意給中國團隊機會,但在海外法律等限制因素影響下,總部不得不思考哪些業務可以放在中國,英偉達中國也很難參與GPU最核心的架構設計和研發,這也讓部分員工因“只能做邊緣工作」、「只能當螺絲釘」等原因離職。
根據莫風鳴介紹,英偉達中國部分員工曾有機會參與高端CPU的研發,但被美國政府關注到後該業務作廢,重新收回美國總部。
發展到最後,「前端越靠前的越在美國,我們參與後端。」莫風鳴表示。
如今,英偉達上海的後端團隊也是英偉達最大的後端設計團隊,幾乎英偉達每一款晶片等流片都需要中國後端測試、驗證團隊的參與。英偉達中國也有一些獨特性的業務職能,在總部退出視訊編解碼業務後,英偉達中國成為公司內部唯一擁有完整編解碼人員配置的團隊。
何去何從?
兩次產品被禁,英偉達中國的員工都問了黃仁勳同一個問題,“你會裁員嗎?”
英偉達的產品不在中國生產,卡全靠進口。一位內部員工擔憂道,「如果哪天老黃捨得放棄中國市場,當場關閉,就什麼也沒有了。」在代理商看來,英偉達減少部分員工也不影響其運轉,「他們即使只做大客戶的生意,也有很大訂單。”
在2023年,裁員一直是科技大廠避不掉的話題,AMD 、英特爾、高通、德州儀器等公司接連裁員。如AMD對RTG部門,即負責GPU的設計開發的團隊進行最佳化;德州儀器則裁撤了中國區MCU研發團隊,將MCU產品線遷往印度。有「英國英偉達」之稱的人工智慧(AI)晶片獨角獸Graphcore,也裁減了大部分中國員工,退出中國。
面對如此複雜的局面,黃仁勳給出的答案是“不會”,並表示公司仍將擴張。
他的態度罕見地鮮明、直接。對比2018年美國總部問是否會裁員時,當時黃仁勳並未給出直接答复,只是舉例不會輕易裁員,2008年金融危機時也是透過全員降薪度過的危機。
這的確安撫了人心,尤其是研發人員。一位英偉達的研發告訴36氪,禁令後大家很擔憂裁員,「但現在安全感挺高,老黃在公司說話非常有分量。」研發所從事的產品軟硬體開發,通常以專案製為週期,其工作目標不以業績為導向,產品面向全球,所受影響其實相對較小。
最焦慮的是與客戶接觸最多的銷售員工。 「他們只有做底層開發的軟體工程師不會擔憂,像商務和SA都非常焦慮。」管業告訴36氪。
SA是英偉達與商務配合的部門,幫忙推廣產品、測試產品表現等。 「他們的工作和當地客戶聯繫非常緊密,如果沒有晶片可賣,工作會受到影響。」一位英偉達內部員工告訴36氪。有的銷售員工則擔心「明年我還在不在都是問題」。但沒人知道答案。
禁售後,原本「事無鉅細,半小時沒回覆客戶訊息就會投訴你」的英偉達商務們,陷入了迷茫。當代理商詢問產品訊息、狀況,得到的都是「不要問我」、「等官方回覆」、「問我們市場同事」的回答。
在此之前,他們完全是另一個狀態——每天行程安排很滿,“哪怕乾到夜裡3點,第二天早上照樣8點起來、回復工作消息。”
這種焦慮的情緒,在可用於訓練市場的H20卡開啟預定後,得到了一定的緩解。
1月29日,黃仁勳訪華10天后,新華三宣布將為東方國信首批提供H20 GPU 系列算力伺服器。這是第一個關於H20預定的消息,也意味著,在不遠的將來會有更多中國客戶可以訂購到H20。
不過,H20在算力上還是進行了壓縮。 H20的峰值算力僅英偉達H100的15%,但顯存頻寬維持不變。
「老黃非常想保住中國市場,每生產一塊H20,就意味著少生產一塊H100。H20的價格相比H100非常有誠意,現在可以說是賠錢保市場。」一位英偉達的員工表示。
市場對H20的態度還算積極。一位業者告訴36氪,此前大家對於H20的預期就很低,但這張卡價格上划算,相較國產晶片重新適配CUDA生態和做無數次的大規模測試,H20的成本是可控的。
不過即使能買到,禁令和合規也會像達特茅斯之劍一樣垂在英偉達中國和國產廠商的頭上。 “合規卡的生命可能在18個月左右,之後會被新的合規卡取代”,上述行業人士表示。
兩年兩禁,也徹底打破了國內客戶的幻想。接近需求端的從業人士宮浩滿懷不滿無奈,「今日割5城,明日割10城,總不能別人限制什麼我們用什麼」。如今,客戶紛紛開始嘗試國產GPU產品,「就算不好用也要用起來」。
更換國產GPU是一件成本很高的事情,CUDA生態是英偉達強大的壁壘,企業和GPU公司駐場團隊要磨合至少半年,開發算子和打磨產品都需要時間。如今,有國產GPU公司已經開始與網路大廠合作,為其寫算子庫,讓GPU顯示卡能變得好用。
隨著市場轉向,國產GPU卡的租賃和購買價格也水漲船高。 AI領域從業人員金傑告訴36氪,華為GPU卡的算力租賃價格已經跟A100、A800相差不大。
為了搶奪可能失去的市場,一位接近英偉達銷售的合作夥伴透露,H20的降價可能會很快到來,這在之前的英偉達,是很少出現的情況。
除了在風雨中飄搖的GPU卡,如今,商務們也正努力尋找新故事和潛在使用者。為了尋求自救,英偉達商務也開始宣傳了IB網路和SDK等軟體。
網路傳輸能力是英偉達的一大技術優勢,英偉達如今將IB網路拿出來單獨販售。網路傳輸有乙太和IB組網兩種產品,在做大模型訓練時,採用IB組網能有更快的資料傳輸效果。但大部分客戶,都傾向採用以太網路。英偉達這項業務的營收非常少,“九牛一毛”,很難養起一家公司。
除了IB網絡,軟體產品也是英偉達的商務們今年發力的重點方向。
販賣軟體是英偉達的新業務。 2022年英偉達第一次被禁前後,英偉達開始將軟體產品作為一項獨立產品售賣,到2023年8月左右,英偉達也對軟體產品進行了調價。
接近英偉達的人告訴36氪,2023年英偉達的合作夥伴做了很多小型高峰會來推廣軟體產品。如具有線上協同工作功能的NVIDIA Omniverse等。不過由於售價太高,推起來難度也較大。
現有市場之外,英偉達中國也開始尋找新的發展方向-自動駕駛。
這是英偉達投入已久的潛力業務,英偉達的自動駕駛晶片Orin一直聲名響亮,在高端智慧駕駛市場幾乎獨佔鰲頭,但其整體解決方案一直在業界被人詬病。這次在中國部署的自動駕駛團隊,主要是從事量產及解決方案業務。
2023年12月,加入英偉達不到4個月的吳新宙,火速帶著數個部門VP回國,加速自動駕駛業務招聘事宜。如今其招聘已取得初步成果, 2個月時間,英偉達便招募了超100名員工。
一位獵人頭告訴36氪,他們的招募策略也從以往的看綜合素質,到要求快速進人,補齊團隊空缺,更具體的是具有量產服務經驗、能打仗的團隊,很多團隊為了進人甚至放寬了對英語的要求。
“卷”,是對自動駕駛團隊的核心要求,這跟英偉達先前的文化截然相反。現實也的確如此。在一向以WLB(生活、工作平衡)的英偉達中國,他們開始了週六、週日加班的節奏。
賣軟體、解決方案、IB網絡,加強自動駕駛領域重要性,都是英偉達中國對抗GPU市場下沉的努力,因為它懂這種經驗將帶來何種打擊。
在GPU概念還不為人知、CPU當道的2015年,美國就曾為了限制中國超算的發展,禁止英特爾向中國四家超算公司出口高效能運算晶片。
這給英特爾帶來巨創。當時,採用中國E級超算天和2號所採購的英特爾Xeon處理器和至強Phi加速器晶片,占到英特爾該晶片約一半的銷售量。隔年,英特爾Phi 7290、7250加速器價格腰斬,Phi 7290更是於2017年直接停產。而中國也逐漸發展出了自研的CPU晶片。
儘管去年12月,8天內連續訪問了日本、新加坡、馬來西亞和越南四國,但黃仁勳清楚的知道中國市場的重要性,他曾在接受《金融時報》採訪時說,「如果失去了中國市場,我們並沒有應變計劃。中國祇有一個。”
從成立以來,英偉達中國就一直向上,並且在如今了達到頂點。但當一切變化迅速襲來,面對本屬於自己的時代,以及隨時可能流走的機會,英偉達中國目前只能承受、適應。
在時代的枷鎖下,如英特爾的Phi晶片一樣,在板塊擠壓下墜入海溝,大概是英偉達中國最不願意看到的事。(智能湧現)