財經雜誌:輝達晶片倒爺,快玩不動了

3月30日,美國升級對華晶片出口禁令,表示將對中國出口的AI半導體產品採取「逐案審查」政策規則,全面限制輝達、AMD以及更多更先進AI晶片和半導體設備向中國銷售。


在不為人可知的特殊管道裡,輝達晶片生意一度風生水起。在這一波囤積的算力釋放之後,倒爺會逐漸沉寂,最終大多數都會消失


這項舉動實質影響有限──在2022年和2023年,美國已經兩度收緊對華AI晶片出口。產業界普遍對出口的口子被重新擴大不抱幻想。從2022年下半年開始,中國公司就開始瘋狂搶購輝達等AI晶片,一張GPU售價一度飆升至接近40萬元。

一個被普遍接受的觀點是,在國產晶片能夠逐漸替換輝達之前,仍舊有至少三五年的過渡期。擁有足夠多的輝達晶片,目前暫時是大多數中國公司參與新一輪AI競爭的生命線。

這也催生了一個特殊職業:倒賣輝達晶片。傳聞裡,這生意一本萬利,倒爺們神通廣大,賺得盆滿缽滿。果真如此嗎?

我們試著講述一位掮客在此間經歷的瘋狂、慾望和欺騙。人類歷史上下一場科技革命最重要的燃料,世界上最稀缺的算力資源,如何在無數隱蔽的小黑屋和推銷電話裡,被決定了流向——這正是阿誠的故事的特別之處。

01 “5個億”

阿誠號稱自己搞成了5個億的生意。

他曾經是個普通的英文老師。 2023年9月,阿誠入職深圳一家賣輝達晶片的經銷公司。做的第一件事,是給自己整了一套全新的名片。即使那時他身上已經裝了六、七種不同身分的名片,隨時可以對不同的人展開不同的說辭,但沒有哪個身分比這張名片上的頭銜更讓他覺得有面子了──新紀元科技有限公司中國區銷售總負責人。

只要他不說,沒有外人會猜到,包括總負責人在內這公司只有兩個銷售——阿誠是其中一個,再加上老闆、財務、售後,他們就開始搞事了。

在絕對的產品力面前,任何銷售技巧都是多餘的。在一個500人的晶片大群裡,我只加了誠哥一個人,因為他的群組暱稱太有誘惑力了:誠哥H800。

H800,輝達特供中國的一款資料中心GPU,也是2023年大模型算力競賽裡中國公司能合法買到的最先進的GPU。當下,輝達就是訓練大模型所需算力的最適解。全世界都在搶購。有人說,大模型的風吹了一年多,只有兩撥人賺到了錢:一撥人賣AI課、一撥人炒輝達晶片。

2023年10月,美國宣布擴大對華晶片管制,H800等四款產品也被要求禁運。當天,輝達特供中國的A800和H800晶片停止接單。接下來,價格是按小時漲的,短短一周內,單張H800卡的報價幾乎從20萬元人民幣翻了一番。一台H800伺服器在10月初的伺服器售價220萬元,到了10月底已經飆升到300萬元。

半年後,在深圳南山附近的一家咖啡店裡,誠哥問我,“你猜我們五個人,一個月賣了多少錢?”

「5——個——億哦。」許是很滿意我已經驚訝到接不上話,他主動吐露了答案。我看著這個西裝下穿著運動鞋、風塵僕僕的80後男人,他看起來真誠、老實,微微含著肚腩,給人一種靦腆的感覺,只有瞳孔因為興奮而明顯放大——我突然相信了,他剛才告訴我他老闆說他炒芯片時的狀態——“阿誠啊,你一炒芯片就眼睛發光,肯定是要發大財哇。”

02 H100,財富密碼

發財,首先要有機會。兩年前,對阿誠來說,機會還顯得那麼有距離。

那時他在英語教培機構工作,別說大財了,想在深圳買房子要存錢到下輩子。他不甘心。 2021年7月。雙減政策一出,阿誠是本機構第一個跑路的人。

一個沒了工作的35歲男人,在不少地方要被歸類為中年loser(失敗者)。但深圳有自己獨特的造富生態,單車變摩托車的故事俯拾皆是。在阿誠看來,早年賣山寨機,「網路+」興起時玩地推,等到比特幣行情起來了再用顯卡挖礦,發幣割韭菜的,很可能就是同一撥人。

風口在變,身份都是自己給的。

當時,這個風口是「炒晶片」。既然是炒,就表​​示有套利的空間。疫情後缺芯危機愈演愈烈,珠三角活躍著上萬個晶片黃牛,有些公司一個月就可以招募100個晶片銷售。阿誠折騰起了晶片。在外人看來。從英文老師轉行賣晶片實在是匪夷所思,但是在誠哥的口中,這個難度並不存在,「公司招人時,對我發了個面試邀請,我就過來了」。

不需要專業知識嗎?我很懷疑。

“其實……”他頓了一下說,“很多時候都是現學的。”

他認為,高槓桿的事情才有賺。倒賣資訊差就是槓桿最高的賺錢方式。越是風口上的行業,資訊差越高,槓桿越高。如果在風口上,個人能力的參差似乎並不重要。

問題是,一窮二白的人要如何跟上風口?

誠然其實也不知道,他能做的,就是跑動得勤快一些。短短一年不到,他加了幾百個行業群,跑了幾百場會,換了幾百張名片,他的身上有一種深圳式的搞錢執著。即使千里迢迢跑到外去參會他也很少覺得辛苦。

他深信一點:只要圈子對了,賺錢就像呼吸一樣簡單。

珠三角成為中國電子資訊產業集聚地已經快40年,近年越來越明顯的變化是,國際局勢任何風吹草動,都可能改變這裡一群人的生計。

2022年底,大模型開始席捲科技圈。誠然發現,有一個字高頻地出現在圈子中。這些人無論原來是在挖礦、玩NFT、搞元宇宙,現在,他們有了一個新的財富密碼:H100。

H100,輝達這一輪市場行情的起點。如果說輝達當下是訓練大模型所需算力的最適解,H100就是最優解中的明珠。

大模型的競爭會被稱為算力軍備競賽,是因為大模型本質上還是一種大力出奇蹟的暴力美學,換句話說,想要獲得更強大的模型效果,就得靠堆卡,堆更多、更強大的卡片。

供需極度失衡。產業媒體GPU Utils曾經做過一個測算,H100一年的出貨量大約只有55萬張。但是,光是美國大型科技公司和少數幾家明星新創公司,對H100的需求量一年內就達到了43萬張。對Meta之類的巨頭公司來說,囤上10萬張H100在商業競爭中才有先機。而對新創企業來說,沒有1萬張H100,連坐上牌桌的資格都沒有。

中國也差不多的情況,但中國公司的需求被美國政府的出口限制強行摁住。 2022年10月,美國對華啟動晶片管制。幾乎是在H100和比其性能稍弱的A100被禁運的同一時間,OpenAI發布了chatGPT,從那時起,有多少張輝達卡,成了中國科技公司AI實力的一把標尺。幾乎所有選擇宣布加碼大模型的網路大廠,在財報會上一定會被問到的一個問題是,公司儲備了多少輝達卡?

第一撥行動者出現了。在2022年夏天之前,原價18萬多元人民幣的H100在中國需求量並不驚人,性價比低點的A100甚至有些滯銷。然而,晶片禁令後市場上不多的存貨就像被蝗蟲過境,一掃而空。

四個月後,中國的大模型業進入了“百模大戰”時間,輝達面向中國客戶推出H800,這個版本被俗稱為H100的“閹割版”,輝達在這個版本裡去掉了受美國政府那一輪禁令管制的參數。加上先前已經推出的A100低配版A800,輝達的中國客戶還算有卡可用。搶卡的競爭又來到了一個新賽點。

至少有五類角色在瘋狂搶購:電信運營商、伺服器大廠、互聯網和AI公司,以及業務和算力無關但是現金流充沛的大企業。

輝達晶片在中國市場有四種通路流通。其中兩種可以訂購中國特供版的官方管道:一條透過輝達自己的經銷商體系,一條透過輝達認證過的伺服器大廠經銷商體系,這兩條通路上擠滿了排隊下單的大廠,交貨的時間則取決於輝達,最快也要到2023年底。為了插隊,大廠高層八仙過海式的拉關係,甚至不乏上市公司老闆直接飛去美國見輝達CEO(執行長)黃仁勳。

另外兩種渠道則是透過黃牛,這個渠道多少有點暗箱操作:一類有海外背景,可以有特殊的海外渠道讓H100/A100流入內地;另一類則是體量更小的散戶,他們的貨源來自內地,「至於具體是哪裡,那就要看各自的本事了」。

「一卡難求」的情況甚至還推高了國產晶片的市場空間。誠然一開始沒有通路,賣不了英威達晶片。他花了四個多月,幫一家號稱「中國輝達」的國產AI晶片公司成交了一筆200多萬元的合約。

可是,他卻沒能拿到一分佣金。

誠然認為,之所以說好的佣金也不給他,是因為這公司自己處境艱難。他的依據很簡單,市場上願意買輝達之外晶片的廠商寥寥,「客戶買輝達的卡是拼手速,秒慢沒;買這公司的卡要磨磨蹭蹭,討價還價」。即便賣出去了,客戶的目的只是為了符合國產晶片需佔一定比例的採購要求,買了卡片也通常是堆在庫房。

此時,對於在2023年向輝達下訂單的大多數中國公司來說,H800遙遙無期,A800是唯一到貨的產品。這款產品剛推出時售價為7.4萬元,到了6月底,黃牛開出的高配版的售價逼近10萬元,而到了7月下旬,價格已超過12萬元。無論是出於抬高價格還是恐慌心理,市場在瘋傳,美國將要再次收緊晶片管制。

入局者也越來越多了。如果說一年前的夏天,大量囤輝達卡的公司必定業務和其有相關,現在也可能是賣味精的公司或是女裝公司。囤卡的散戶也從過去長期依賴輝達顯卡挖礦的大佬,變成了現在可能是任何一個毫無背景的人。

例如一個曾經的英語老師。

誠然就是那個時候入局的——新紀元這家公司當時成立才一個月,但有「通路」。

03 “先簽了再說”

從外表來看,新紀元實在不夠新。在大廠林立的深圳南山,這裡著實太簡陋了:兩間屋子,五張椅子,還有一些電腦和手機,就是全部家當。

誠然一進去就發現了這是個草台班子。雖然他之前只短暫賣過四個月國產AI晶片,但他已經是公司裡經驗最豐富的人。老闆是個快60歲的老江湖,年紀不小,看起來很瘋狂。他對阿誠直言不諱,招他來,是因為他有些經驗但是又不多,「太會的人拿捏不住」。

被寄予厚望的誠哥獲得了使用單獨辦公室的權利。不是因為他資深,而是他不喜歡和同事在一起打電話。

這種古老的行銷手段,在這個新圈子裡卻有用。誠哥和同事們獲客的方式就是先在網路上找到哪裡出現了招標的消息,再找到消息中參與公司的聯絡方式,直接打過去。

誠然有一個觀察,人們對陌生電話常常充滿警惕,但是對推銷輝達的陌生電話格外寬容。在聽完他說「你好,我是賣輝達卡的」之後,幾乎所有人都會願意聊下去。無論對方是上市公司AI業務總監,或是某個大型實驗室採購負責人,通常對話不需要進行十句,雙方加上微信,誠哥便會把報價和合約推過去。

在絕對的賣方市場裡,有了貨源就代表有了權力。在中國,輝達的兩個官方通路一類是原廠—總代理—經銷商—市場;另一類是原廠—伺服器大廠—經銷商—市場。

看起來,每個管道只有四類角色,是一個組織嚴密的金字塔狀;但事實是由於市場過熱,這兩個結構已經被衝擊成網格式的蜂巢狀了——換句話說,每一類角色的背後,都可能分化出無數二道販子,交易不再是逐級流通。

誠然的公司就是這樣遊離在第二種邊緣。 「我們老闆和伺服器大廠那邊有些關係,能搞到卡。但我們沒有大廠正規經銷商的資質,充其量只能說是遊擊隊。」不過,即使是遊擊隊在當時也擁有了不一般的地位。誠然說,他見客戶從來都是“讓客戶過來”,和客戶吃飯時“他們對能搞到貨的人佩服得五體投地”。

如今,阿誠回想起來那段日子,能想到的形容詞只有一個,「瘋狂,太瘋狂了」。 10月17日,美國擴大對華晶片管制範圍,輝達在中國市場流通的所有AI晶片都被列入其中。

這份管制原定有30天公告期。這段時間也因此被業界人士視為「最後30天窗口期」。理論上說,最後30天,輝達等企業會把所有先進AI晶片產能、庫存都優先供給中國市場。這會是中國企業搶購輝達晶片最後的「操作窗口」。

此時,H800單卡市價已飆升至21萬元一張左右。很快,新紀元公司就成交了一筆4億元的合約。還沒來得及慶祝,就又簽下了一個1億多元的單。

我在禁令出台當天和他通了一個電話,那時他剛接完一個十億元的訂單垂詢,聲音嘶啞,但是是破音的那種興奮。接下來,他的電話就再也沒有打通過──他太忙了。過去對他發訊息從來不回的大廠高層,為了買卡一天發十幾則訊息。一家公司問他們能搞到多少張,「280萬元以下的H800伺服器有多少台我們都收」。誠然那幾天幾乎瘋狂,不需要吃飯,也不會疲勞,只要在呼吸,就可以賣卡。他根本沒有考慮過有沒有貨源能交貨。

“先簽了再說。”

他閉上眼睛,想睡一會,腦海裡又響起來狂躁的詢問聲,“有卡嗎!有卡嗎!有卡嗎!買卡嗎!買卡嗎!買卡嗎!”

人類歷史上下一場科技革命最重要的燃料,世界上最稀缺的算力資源,就這樣在這些隱密的小黑屋和電話裡,被決定了流向。

04 數位遊戲

只是在一週之後,阿誠就開始懷疑,這一切不過是在玩數字遊戲。

10月25日,美國宣布禁令立刻生效,30天窗口期以一種戲劇性的方式被掐斷。不久後,和上次在英語訓練機構一樣,他先跑路了。

原因很簡單。那些天價訂單生意,隨著交貨日期的臨近,他太擔心老闆要捲款跑路了。這擔心始終存在於公司所有人的心裡。空手套白狼的例子太多了——假設A公司什麼也沒有,也可以和B先談妥一筆供應合同,A再去找C拿貨,C的貨可能也是從D或者E處加價買來,中間A發現F的開價比B高,於是先前的一切白紙黑字都可以作廢。

有多少合約能夠落地?就像那筆4億元的訂單,貨物從簽單到完成交付中間隔了12週的時間,市價漲了100多萬元,而毀約只需要成單價1%的罰金,他很懷疑,老闆不會選擇交付。

那麼那批貨到哪裡去了呢?

誠然也不知道。他告訴我,自始至終,他沒有見到那批貨,就像他也沒見過那筆錢一樣。

更重要的是,誠哥突然發現,90%的倒爺賺不到大錢,這讓我感到意外。他給我算了一筆賬,假設一台H100八卡伺服器出廠價250萬元,終端市場價280萬元,中間看起來有30萬元的差價,但是很可能倒了十次不止,一家隻能賺3萬元。這些利潤大部分被掌握貨源的老闆吞掉,他作為打工人,抽成是利潤的3%。

因此,這生意只有掌握貨源的人才能賺錢。他有一個切身感受,這兩年來各家瘋搶GPU的力度遠遠超過了真實需求,更類似於市場對美國隨時有可能加碼的芯片製裁的本能反應——只要科技競爭的陰影存在,高端AI晶片必然是期貨。不少公司是在以此為投資。甚至可以說,找散戶下單的公司,將來相當一部分還會選擇再把晶片賣出去。

歸根究底,二道販子這麼多,是因為貨源太稀缺了。 「無論晶片透過什麼方式進入國內,就像水流一樣,封鎖當然不可能完全封鎖,但已經足夠鎖住大部分的水流了。」阿誠說。

事實是,所有的瘋狂都是徒勞無功。在2023年10月17日晶片禁令之後,合法通路到貨的H800寥寥無幾。


在2023年10月晶片禁令之後,合法通路到貨的H800寥寥無幾


財報顯示,2023年第三財季,輝達中國大陸收入高達40.3億美元,較上季大漲47%。出口管制規則出爐後,2023年第四財季輝達中國大陸收入僅19.5億美元,季減52%。當季,中國大陸僅佔輝達總營收的8.8%,是史上最低點。

輝達和AI相關的資料中心業務在中國大陸的收入佔比過去長期達到20%-25%。但自2023年10月起,該收入顯著減少。輝達高層表示,2023年第四財季,中國大陸在資料中心收入的比例已降至個位數,預計下個財季也將維持這一水準。

對大多數渴望暴富的人來說,那些像做夢的日子,最後真的落了一場空。

05 拋物線後半段

不過,輝達的行情仍在持續。

2024年,輝達將會推出H200等四款革命性AI運算產品。同時,根據瑞銀近期的研究,其交付時間正在縮短,已經從2023年末的8個至11個月縮短了一半時間。一些機構預測稱,輝達在今年將銷售約150萬到200萬個AI GPU,數量是2023年3倍。


2024年3月18日,美國聖荷西,輝達CEO黃仁勳。在輝達年度技術高峰會GTC 2024大會上發表主題演講  圖/IC


看起來,這些與中國無關了。但是,這裡有一個連鎖反應在後,輝達在全球範圍內供應能力的成長將會給中國企業帶來更大的競爭壓力。隨著全球AI應用水準因GPU供應的大量增加而快速提升,中國必須尋找替代方案來應對。

目前,透過官方管道購買H/A800和H/A100已經不可能。黃牛之間流通的晶片價格略有回落,但依舊令人咋舌。離開新紀元以後,阿誠自己開了一家公司,剛剛給客戶報了價,一台搭載八個H800的AI伺服器價格還是約300萬元。還好在一些先前被囤積的晶片正在被釋放,市場上現貨充足,一般兩週以內就能交付。

因為生意不穩定,他還同時在另一家輝達代理商那裡上著班。即使AI晶片受限,他還是堅定看好輝達包括遊戲顯示卡和自動駕駛在內其他業務在中國的前景。

這塊市場輝達無法放棄。在晶片禁令不久之後,輝達再次針對中國市場推出了三款在數據傳輸速度等關鍵性能上進一步降低的晶片:H20、L20和L2。市場上傳言,這些晶片性價比太低,不受中國公司青睞。中國公司更願意採購國產新品。

阿誠對這種傳聞嗤之以鼻。 「那些只是外界的一廂情願」。具備推理能力的L20最先面世,但是迅速被幾家網路大廠搶購一空,沒有多少能流入到市場上。而適用於大模型訓練的H20不是中國公司不想買,而是買不到。 H20在今年1月開始接受預訂,但僅限大客戶。

中國公司想要透過正規管道取得輝達晶片,可能性越來越小了。

這反而激發了部分公司對特殊途徑的需求。無論是將晶片透過非禁運國家以轉運的方式進入中國市場,還是考慮把資料中心業務建在海外,在業界人看來,即使審查的手段越來越嚴嚴。願意冒險的公司數量仍在明顯變多。

3月30日凌晨,美國商務部宣布了一項新的出口管制規定,對涉及美國和中國澳門等地區的對華半導體產品銷售限制進行了調整,同時,美國對華出口的AI半導體產品將實施「逐案審查」政策,對技術等級、客戶身分、合規計畫等進行全面審查。也就是說,新規進一步限制輝達、AMD以及其他先進AI晶片和半導體設備對中國的銷售。

想要透過特殊管道讓晶片流入中國,也越來越難了。

這在意料之中。阿誠告訴我,這些變化在短期內影響不大。新規主要限制AI晶片未來流入中國的可能,但是中國市場在先前囤積的晶片已經足夠很長一段時間供需。他注意到,交付週期明顯縮短。之前一些在瘋狂搶卡的公司,現在已經開始賣卡和做算力租賃了。過去倒爺們只需要強調“有卡,速來”,現在還要強調“量大,可持續供應”。

不過,可以預見,在這一波囤積的算力釋放之後,倒爺們會逐漸沉寂,也許最終大多數都會消失。 「中國區需求量的高峰期是在去年三季度。炒貨的高峰期是在去年四季度,但是需求量已經在減少了。」他認為,中國公司對輝達的需求已經過了拋物線的高點。接下來,輝達在中國的發展重點不是是否衰退,而是衰退的曲線如何改變。

技術的領先是有時間期限的。對中國公司來說,如果無法購買更先進的輝達產品,現有存貨的優勢終將隨著時間變化而減少。他聽說了一些關於國產AI晶片如今供不應求的故事——情況和去年這時已經大不同了。他對華為晶片很有興趣,有機會的話也想賣。

不過眼下,阿誠還得先做好輝達,年前他才剛成交一單700萬元的生意。 「一切都會越來越好的。」他充滿信心,因為現在的圈子多得是企業中高層和行業大人物。

他向我談起一個關係密切的中間人,告訴我對方「是某某亞太AI協會的領導,協會裡有100多位院士」。他說,之前對方幫他介紹過1筆500台以上的大訂單,如果成了,他要付給對方一台3萬元的中介費,也就是對方至少可以賺1500萬元。

「可惜沒有成。」我看著他一臉真誠的遺憾,有些常識不確定他知不知道,中國大陸並不允許公司註冊名以亞太開頭——所以我一看到以亞太為名的機構,很難不聯想到註冊在中國香港的皮包公司。

(文中新紀元與阿誠皆為化名) (財經雜誌)