科技巨頭排隊送錢!按噸賣晶片,淨利暴漲8倍,皮衣刀客何成「華人之光」?

2022年末,ChatGPT的火熱出圈,帶動了大模型和生成式AI的研發熱潮,高性能、高算力、低能耗的AI晶片銷量飆升,以英偉達(輝達,NVIDIA)A100、H100為代表的GPU晶片供不應求,推動其業績和市值雙雙創歷史新高,成為2023年躋身萬億美元市值俱樂部的新一代科技寡頭。

追溯英偉達的發展史,軟硬整合是其商業模式的關鍵字。其以GPU硬體縱向迭代為發展主軸,從定義顯示卡的GeForce 256,到紙面算力達到1Exaflops(每秒進行百億億次浮點運算)的GH200晶片,其GPU產品效能緊貼顧客需求不斷升級,並擴展出GPU、CPU、DPU協同的硬體佈局。軟體層面,其則透過開源的運算平台CUDA,橫向開拓廣大的應用市場,打造了與下游顧客不斷更新的需求相符的算力平台,進而連結千行萬業,成為AI時代智慧駕駛、智慧雲、大模型、生成式AI等科技巨頭背後的「賣鏟人」。

內部研發與外部收購並重,則是其保持技術領先的要訣。與所有科技巨頭一樣,其一手專注研發,成立以來累計研發投入超過370億美元,打造了內部技術迭代與進化的澎湃動能;一手頻頻外部收購,完善技術鏈條、延伸產業鏈,構建了強客戶黏性的算力生態系。

有效的策略,推動英偉達在五次科技大風口中迎風起舞,20年間營收成長近14倍,淨利潤成長58倍。

隨著晶片產業整體競爭加劇,提出「做AI界的台積電」新目標的英偉達,仍在加速奔跑。其一邊圍繞AI提升GPU硬體效能,擴大軟體生態,以快速迭代的新架構、新產品,加固其技術護城河,實現「贏家通吃」;一手加碼投資AI賽道獨角獸企業,擴張其AI生態圈,以合作雙贏深度綁定B端客戶,放大平台優勢。

算力為王的時代,晶片是科技巨頭打造算力底座最核心的零件,微軟、Google、Meta、華為、百度等已自研AI晶片,並爭相建構AI生態。算力軍備賽中,英偉達的領先優勢將會持續多久?


作為2023年市值成長最快的科技公司,英偉達(NVDA.O)備受各方關注。

2023年10月17日,拜登政府更新了針對AI晶片的出口管制規定,計畫阻止英偉達等公司向中國出口先進的AI晶片。其A800及H800等晶片皆受影響,用於遊戲市場的RTX4090系列顯示卡在國內電商通路已逐漸下架,存貨單價被炒高至5萬元。

AI時代,佔據算力要衝的英偉達,2023年1至9月股價已翻了兩倍,市值達到10843億美元,替代特斯拉成為美股“萬億美元市值俱樂部”的“老五”,同時也是全球市值最高的晶片股。

為其提供晶片製造和封裝服務的台積電(TSM.N,2330.TW),以4,631億美元市值緊隨其後,市值位居晶片產業第二。

8月28日,英偉達發布2024財年第二季(2023年4月30日至7月30日)財報,當季實現營收135.07億美元,年增101%,季增88%;淨利錄得61.88億美元,年增843%,季增203%,創歷史紀錄。

風口起舞的英偉達,何以成為新時代的科技寡頭?有志國產替代的企業,如何借鏡成長經驗?


01 業績、市值均創歷史新高,還有8年10倍成長空間

英偉達的營收主要來自遊戲、資料中心、專業視覺化、代工及其他、自動駕駛五大市場。其中,遊戲和資料中心是其營收支柱,二者佔總營收的比重已由2014年的50.73%上升至2022年的89.24%,2023年第二季再度升至93.4%。

得益於這兩項業務的強勁成長,2013-2022年,英偉達營收及淨利分別成長5.5倍、8.9倍(圖1)。其淨資產收益率(ROE)由9.87%上升至19.8%,2023年第二季更升至29.93%,與A股ROE排第15名的山西汾酒(600809)接近。相較於高通、AMD等晶片同行上下起伏的ROE,英偉達ROE長期穩定在20%左右,使之堪稱性能穩定的印鈔機(圖2)。




不得不說的是,2023年二季度,英偉達業績如此爆發式增長,全靠去年同期業績的「襯托」和大模型業務的爆發。

一方面,其2022年同期的績效比較基數低。2021年12月至2022年9月,代表美股半導體行情的費城半導體指數(SOX.GI)下跌40%,遊戲市場萎縮及幣圈挖礦業務降溫,導致英偉達遊戲業務營收驟降44%,專業視覺化業務營收下降20%,代工及其他業務營收下降11%,其錄得近10年來第二差的季度業績,僅次於2019年第二季。

另一方面,晶片產業整體陷入蕭條的背景下,2022年11月末,美國科技公司OpenAI推出的ChatGPT爆火出圈,科技公司紛紛跟風推出大模型,帶動作為算力「剛需」的英偉達高性能GPU晶片A100和H100等供不應求、價格飆升,英偉達業績由此實現連續3個季度成長。

AI暖風勁吹,英偉達股價昂揚向上,2022年10月末至2023年6月13日,由112美元/股飆漲至400美元/股。其也因此首次躋身「萬億美元市值俱樂部」。2023年8月31日,其股價漲至494美元/股高點,市值創歷史新高,達1.2兆美元,是美股「萬億俱樂部」中2023年股價漲幅最大的「當紅炸雞」。

近5個財年(2018.1.28-2023.1.29),英偉達累計總股東回報達2.38倍,遠高於標準普爾500指數、納斯達克100指數的報酬(圖3)。


英偉達市值飆漲背後,是投資機構真金白銀的下注。


Wind數據顯示,截至2023年6月30日,英偉達機構股東數達3178家,持股市值5956億美元,較2022年12月31日的2338家增長36%,持股市值翻了1.7倍——而這僅是投資機構半年的報酬率。其大股東貝萊德(BlackRock)及先鋒集團(Vanguard)均持股超過10年,合計持股從2017年末的11.31%增至2022年末的15.55%。大資金持股的時長,與其投資報酬呈正相關。

值得一提的是,英偉達業績和股價雙升,是全球運算轉型的時代註腳。

算力世界正在從程式慢、成本高的通用計算,向加速計算過渡。正如英偉達創辦人兼CEO黃仁勳所說,正在發生的運算轉型是一個轉捩點,世界各地的資料中心正在對此做出反應和轉變。在這項變革中,企業提高資料吞吐量、能源效率和成本效率的最佳方式是投資加速運算和生成式AI(Artificial Intelligence Generated Content,簡稱「AIGC」)。根據麥肯錫的研究,AIGC每年對全球經濟的貢獻將達7.9兆美元。由此可預見,遍及全球的算力轉型需求,將為高性能AI晶片帶來廣大成長空間。

公開數據顯示,2020-2022年,全球GPU的市場規模分別為254.1億美元、334.7億美元、448.3億美元,年複合成長率為32.8%。以這項成長率保守估算,2030年全球GPU市場規模將達4,337億美元,8年有近10倍的成長空間。如果疊加2023年爆發的大模型和AIGC的強勁推動,市場空間將更大。

在第二季財報發布後的電話會議上,黃仁勳也提到:「目前全世界資料中心的價值高達1兆美元,其中絕大部分使用的是CPU處理器。如果未來4到5年順應AIGC大趨勢,大部分數據中心改用GPU,這會是多麼大的市場?”

英偉達顯然對獵獲這個增長紅利野心勃勃。

為了成為算力王者,向智能駕駛、智能雲服務、大模型、加速計算等領域的掘金者“賣鏟”,英偉達正致力於成為軟硬一體化的AI算力解決方案供應商:在硬件端,其建構了「GPU+CPU+DPU」的全端佈局;而其開發的運算平台CUDA(Compute Unified Device Architecture,一種平行運算架構),則被認為是最適合深度學習和AI訓練的架構,開源、可程式性能夠連結廣闊的軟體市場,並與通訊服務提供者和資料中心建構者合力規劃下一代AI世界的基礎設施。



02 軟硬體一體化,獨佔GPU市場超80%份額

當企業巨頭用科技魔法重塑我們的生活時,那些個性色彩鮮明的商業大佬們,也在虛擬世界緊握著流量密碼。

英偉達的創辦人兼CEO是被粉絲們稱為「華人之光」的黃仁勳。這位美籍華人在社交平台擁有不輸明星的熱度和擁躉,其焊在身上的皮衣與英偉達的GPU產品一樣出圈。

1993年,30歲的皮衣刀客與另兩位合夥人克里斯(Chris Malachowsky)和普雷艾姆(Curtis Priem)創立英偉達。公司名稱「NVIDIA」取自拉丁文,意為嫉妒,公司標誌也用了嫉妒的綠眼睛。2023年,步入而立之年的英偉達確實成為了令人嫉妒的公司,連採購其GPU的大客戶特斯拉(TSLA.O)的CEO馬斯克也不無嫉妒地說了一句,「似乎每個人、每隻狗都在購買GPU……取得GPU比取得毒品還難」。

英偉達早期以生產為遊戲PC(個人電腦)提供渲染特效的圖形處理器(GPU或顯示卡)為主。其以超越同行的性價比獲得了全球遊戲廠商的大批訂單,1998年營收首次突破1億美元,達1.58億美元。1999年,其推出全球第一款可程式顯示卡GeForce 256,當年營收年增137%,達3.75億美元。

1999年1月22日,成立約6年的英偉達在納斯達克掛牌上市,開啟了20多年的高速成長。

2003-2022年,英偉達營業收入由18.23億美元增至269.74億美元,淨利由0.74億美元增至43.68億美元,分別成長了14倍、58倍。

這20年中,英偉達精準踩中了科技發展的五個大風口:2005年的PC普及、2010年行動互聯網、2016年的深度學習、2021年的幣圈「挖礦」以及2022年的AI大模型,其淨利潤均出現了非線性暴增(圖4)。



我們簡單將20年的發展劃分為兩個階段,2013年之前為搭建業務架構的蓄力階段,2013年至今為伴隨AI迎風發展階段。

  • 搭建一體化業務架構,英偉達和AMD雙寡頭格局成型

第一階段中,2005年PC銷售爆發和2006年CUDA研發面世,是英偉達搭建業務底座的兩個關鍵節點,前者奠定其產品搭載規模,後者為其打開通往軟體市場之門。

2005年,從工業設計、工業造型,到電影、高畫質廣播、醫學影像,數位革命幾乎席捲所有產業,全球PC銷售達到2.185億台,作業系統供應商微軟2005財年淨利年增50%, 2006財年營收突破400億美元,並以超過2,600億美元的市值成為全球市值TOP10企業中唯一的科技企業。而搭乘微軟東風的DirectX 9.0 GPU,在繪圖處理器市場獨領風騷。

DirectX 9.0 GPU是英偉達可程式設計GPU與微軟DirectX 9.0高階著色語言的組合產品,能夠高效處理和編輯高清數位影片、數位照片的影像,使電腦圖形達到電影級視效。

英偉達與微軟的合作最快在2000年3月,英偉達成為微軟第一款家用電視遊戲機Xbox的獨家圖形引擎供應商。當年6月,英偉達即被《商業周刊》評為全球第一的半導體公司;11月,其以7000萬美元現金加100萬股股票收購競爭對手「3Dfx」的圖形處理器核心資產,成為圖形處理器業規模第一的公司。

2001-2003財年,英偉達營收由7.35億美元增加至19.1億美元,年複合成長率達61%。突飛猛進的業績讓英偉達初嘗遊戲產品的甜頭,自此,其錨定了以GPU硬體為核心主線的業務發展路徑。

2004年,英偉達GeForce 6800和6600 GPU量產,推動其DirectX 9.0 GPU在相容圖形處理器領域的市佔率從21%上升至67%。2005年,趁熱打鐵的英偉達進一步擴展其架構和技術優勢,當年6月發布的GeForce 7800將其市場份額從67%進一步拉升到79%,成為GPU市場的第一大供應商。此時,英偉達已將客戶需求融入產品DNA,其GPU也隨著微軟作業系統迭代升級而快速升級。

配合顧客需求而發展的GeForce系列,成為英偉達最長青的產品系列之一。其2023年推出的最新產品GeForce RTX 4090,單價12999元起。

值得一提的,90年代,矽谷誕生了一批專研圖形處理器的公司,它們大多淹沒在技術迭代的洪流中,而英偉達能夠穿越週期,成長為全球GPU龍頭,另一個重要的基石是從硬體朝向更廣闊的軟體市場延伸,最重要的工具是CUDA。CUDA之於英偉達,類似安卓系統之於Google。

2003年,史丹佛大學博士生伊恩·巴克(Ian Buck,現任英偉達加速運算總經理)進入英偉達實習,其所在團隊為解決微軟創建的應用程式介面DirectX的程式門檻過高問題,推出了程式設計模型Brook 。2006年,伊恩·巴克正式加入英偉達,並基於Brook模型研發出CUDA,利用GPU中的平行運算引擎來解決複雜的運算問題,可以加快密集型應用程式的運算速度,比單獨使用一個CPU的速度更快。

2007年開始,英偉達將CUDA內建入所有GPU產品中。CUDA以彼時最廣泛使用的C語言為基礎,不同客戶的程式設計師可以根據具體需求和處理任務,對GPU進行相應編程,這一應用很快在程式設計師群中流行,具備了成為通用計算工具的能力。這項能力,磨刀霍霍切分CPU廠商的蛋糕,引來了CPU巨頭的聯合圍剿。

2006年,向英偉達購買90% GPU的AMD,以54億美元對價收購GPU供應商ATI,形成CPU整合GPU的新型解決方案。2007年,英特爾收購實體加速引擎公司Havok,並發表CPU融合GPU的Larrabee架構,欲在其CPU中整合GPU。

CPU大廠絞殺疊加經濟危機影響,2008年9月,業績承壓的英偉達宣布裁員6.5%。同年11月,英偉達發布的2009財年第三季財報顯示,其營收下降20%,淨利下降74%至0.6億美元,回到了2000年的水準。2008年和2009年,成為英偉達上市以來唯二的虧損年度。利空催化下,其股價一年內蒸發了85%。

業績與市值雙殺,成為黃仁勳創業生涯中一次刻骨銘心的失敗記憶。

試圖提振績效的英偉達,抓住了行動網路發端的「救命稻草」。2010年,英偉達開闢行動市場業務,推出費米架構(Fermi)與基於此架構的新一代Quadro GPU,其3D應用效能比上一代Quadro產品快5倍,運算類比效能比上一代快8倍。這助推其專業解決方案(PSB)業務和消費者產品(CPB)業務營收分別達到60%、27%的成長。但是,隨著競爭對手大量湧入,英偉達決定放棄行動市場,回歸並聚焦PC端產品。

這次取捨對於英偉達發展的重要性不言而喻,正如黃仁勳在2023年台灣大學畢業典禮演講中所言,「戰略性撤退、犧牲、決定放棄什麼才是成功的核心,並且非常關鍵」。

值得一提的是,在業績低迷期間,英偉達並未停下技術升級的腳步,3年投入26億美元進行研發,以優化晶體管層的設計來解決散熱壓力帶來的產品良率困擾,從而大幅提升產品效能和功耗比。

或許正是英偉達GPU和架構的快速迭代形成的壓力,2009年末,英特爾宣布無限期推遲Larrabee架構發行,並於2011年1月再次與英偉達簽訂6年的專利交叉許可協議。伴隨英特爾的退出,GPU領域英偉達和AMD的雙寡頭競爭格局成型,且持續至今。

超前設計的CUDA架構,與市場的生化反應延遲到了2010年才發生。這一年,AI先驅吳恩達使用AI程式辨識出一隻貓,使用了16,000個CPU處理器,但是將CPU換成GPU,只需要12個GPU。2012年的ImageNet大賽(大規模視覺辨識挑戰賽)上,卷積神經網路模型AlexNet以超出第二名10%以上的正確率獲得冠軍,其利用英偉達GPU的運算能力解決了複雜的模型問題。自此,英偉達GPU被認為適用深度學習,被AI企業大量採購。

至此,GPU和CUDA已成為英偉達故事中關鍵的“1”,此後,其發展主線聚焦於縱向技術迭代和橫向應用拓展,不斷在後面疊加“0”。

縱向技術升級,得益於關鍵技術的引進。例如,2016年,英偉達引進Tensor Core & NVLink高速互聯技術,以多個GPU組成為GPU陣列,進而形成超級GPU,為超強算力奠定了硬體基礎;2022年,其引進NVSwitch交換互聯技術,大幅降低了GPU通訊的延遲,提升了AI大模型高速平行運算中資料同步的效率,為其GPU在深度學習領域建立了強大的競爭障礙。

這些關鍵性的技術突破,讓英偉達的晶片可以不斷拓展出大規模的晶片集群,進而搭建出任意形式的晶片拓樸結構。2022年末,英偉達GPU顯示卡中的CUDA Core(核心)數量已較2007年提升超30倍,其GPU搭載於全球最快的超級電腦。

在橫向應用擴展方面,英偉達逐漸衍生出「GPU+CPU+DPU」的全端佈局,先後開發出Kelvin、Rankine、Curie、Tesla、Fermi、Kepler、Maxwell、Volta、Turing、Ampere、Hopper等不斷升級的架構,並在這些架構基礎上推出十多個產品系列(表1),支援從影像處理到平行運算再到AI資料處理等不同應用場景,英偉達的產品已成為GPU晶片專業效能和相容性的基準。



  • 資料中心替代遊戲成最大營收支柱,淨資產報酬率穩定在20%左右

英偉達的營收中,遊戲和資料中心是核心支柱,二者佔營收的比重由2014年的50.73%升至2023年第二季的93.4%(表2)。


這項變化來自遊戲市場和AI產業對GPU日益膨脹的需求,而市場風口的切換,直觀體現在英偉達營收支柱的切換(圖5)。



2021年前,遊戲業務是英偉達絕對的營收支柱。2014-2021年,其遊戲產品營收由20.58億美元增加至124.62億美元,年複合成長率達30%。

近20年來,全球3A/3D遊戲不斷推新,催生了對GPU處理器的巨大需求。全球億萬玩家倒逼高性能3D圖形渲染成為PC製造商重要的差異化賣點,而GPU是PC實現這一差異化的關鍵部件,因此,PC代工廠商進一步倒逼英偉達的GPU在滿足終端用戶、程序開發商和設備製造廠商三方需求中不斷尋求平衡。

從早期的《生化危機》《全面戰爭》《榮譽勳章》到後來的《魔獸世界》《英雄聯盟》《王者榮耀》等網路遊戲,均擁有超長的生命週期,它們背後億萬付費玩家在全球培育出動視暴雪(ATVI.O,2022年1月被微軟以687億美元對價收購,2023年10月下旬完成交易)、騰訊、網易等多家市值超5000億元的公司。

2022年,全球遊戲市場營收約1,844億美元,網路遊戲市場營收為1,326億美元,佔72%。其中,中國是網路遊戲最大市場,貢獻了全球收入的20.1%。2003-2021年,遊戲市場規模急劇擴張,中國遊戲市場規模由13.2億元成長至2,965.13億元,18年擴大224倍。

面對如此擴容的市場,主要面對PC端用戶的英偉達開發出四類產品,包括用於桌上型電腦和筆記型電腦遊戲的GeForce RTX和GeForce GTX GPU、用於低功耗裝置上玩PC遊戲的GeForce NOW、用於電視播放高品質串流媒體的SHIELD,以及適用於遊戲主機的系統單晶片(SOC)和開發服務。

不玩網路遊戲的人很難體會顯示卡片配置的重要性,但透過間隔一年的兩代產品,可以看出英偉達顯示卡的迭代效率。

2022年9月,英偉達發布了Ada Lovelace GPU架構,並推出了基於該架構的首批產品,包括GeForce RTX 4090、RTX 4080和RTX 4070。其中,RTX 4090內建760億個電晶體、16384個CUDA核心和24GB高速鎂光GDDR6X顯現,在4K解析度的遊戲中持續運行速度超過100FPS,光線追蹤技術帶來的纖毫畢現得以完美實現。而其於2020年9月發表的GeForce RTX 3090產品,內建283億個電晶體、10496個CUDA核心和24GB GDDR6X顯存。

4090較3090性能提升2-4倍,但功耗同樣維持在450W。維持同等能耗的基礎上大幅提升產品效能,對於晶片公司是翻山越嶺的難度。

即便產品效能提升不止,2021年後,英偉達遊戲業務營收仍掉頭直下。英偉達在其年報中的解釋是,「全球宏觀經濟狀況及中國遊戲需求下降的影響」。

被英偉達特別強調的中國市場(不包含台灣地區),多年來一直是其銷售額最高的市場之一,但近年來銷售額明顯下降,由2021年的71.11億美元下降至2022年的57.85億美元,佔英偉達總營收的比重由2021年的26.42%下降至2023年上半年的20.92%(圖6、7),中國市場的重要性可見一斑。




接替遊戲成為英偉達創收支柱的,是資料中心。2023年上半年,這項業務的營收達到146.07億美元,接近2022年全年150.05億美元的水平,直線拉升了英偉達的業績。

資料中心的營收不是突然暴增。2014-2022年,英偉達資料中心的營收年複合成長率達62%。同期,英特爾的資料中心營收由143.87億美元增至191.96億美元,年複合成長率為3.7%。兩家公司資料中心的業務雖然不同,但英偉達成長速度之快,可見一斑。

資料中心業務是什麼?

根據英偉達財報中的闡述,我們可以簡單理解為算力平台或算力服務。

英偉達算力平台,由英偉達的高能源效率GPU、資料處理單元(DPU)、互連和系統、CUDA程式設計模型,以及越來越多的軟體庫、軟體開發工具包(SDK)、應用框架和服務組成,服務於大多數加速運算密集的工作負載,如AI、資料分析、圖形和科學運算、超大規模雲端和企業、公共部門和邊緣資料中心等。該平台既可以作為整體系統打包出售,也可以單獨出售,以應對客戶的客製化需求。

英偉達的GPU和相關軟體的大規模平行運算架構非常適合深度學習、機器學習和高效能運算,為AI時代的規模化運算提供動力。加速運算的能力,令英偉達得以藉力三個應用風口,成就AI時代的高速發展。

第一個風口,2016年深度學習接管網路。2015年的英偉達GPU技術大會上(GTC大會),黃仁勳宣布英偉達全面轉型AI。2016年3月,Google的機器人阿爾法狗(AlphaGo)擊敗了圍棋世界冠軍、職業九段棋手李世石,引發全球關注深度學習。隨後,Google、微軟等網路巨頭快速將各自的深度學習平台開源,供全球開發者無障礙使用,向企業提供傳統編碼無法提供的雲端和AI服務,大量資料反哺深度學習,加速了AI的進化。英偉達推出NVIDIA TensorRT深度學習推理架構和Inception計劃,以支援深度學習和資料科學領域的新創公司發展,帶動其2016年GPU業務營收年增39%。

第二個風口,2021年加密貨幣「挖礦」產業回春。英偉達推出了Lite Hash Rate(LHR)和GeForce GPU,並增加了CMP(cryptocurrency mining processors,加密貨幣處理器)的供應,以滿足「挖礦」大規模運算的需求。2021年一季度,CMP為英偉達創收1.55億美元,上半年創收4.21億美元,部分對沖了遊戲市場下滑對其業績的負面影響。

第三個風口,2022年11月,語言大模型催化AI時代提早來臨。這一年11月30日,OpenAI推出ChatGPT,5天內註冊用戶數超過100萬,兩個月後月活用戶超過1億,成為史上成長最快應用,全球掀起語言大模型和AIGC研發潮。中國市場以華為盤古、百度文心、騰訊混元、阿里通義為代表的大模型如雨後春筍般湧現,對高性能晶片的需求井噴。

AI大模型是「大數據、大算力、強演算法」結合的產物,其中,大算力堪稱基礎建設。英偉達基於Hopper和Ampere架構推出的A100、H100以及特供中國市場的A800和H800(A100和H100部分性能減配的替代產品)等高性能晶片,是AI大模型的核心部件。

大模型潮起,英偉達「A+H」系列晶片銷量激增。2023年8月10日,多家媒體報道,百度、騰訊、阿里等中國企業向英偉達採購約10萬顆A800、H800處理器,訂單總額或超50億美元。

AMD的CEO蘇姿丰(Lisa Su)曾提出,2023年,全球資料中心AI加速器的潛在市場總額將達到300億美元左右,預計到2027年,這一數字將超過1500億美元(折合1.095萬億元),年複合成長率超過50%。這意味著,英偉達資料中心未來營收的成長空間龐大。

除了硬體支持,英偉達也提供大型模式服務,推出語言模式NVIDIA NeMo、影像視訊模式NVIDIA Picasso、藥物研發模式NVIDIA BioNeMo等全端式服務,使用者可自訂用例並調整模式。

值得一提的是,除了中國科技圈興起“百模大戰”,業務與AI毫不沾邊的上市公司也在採購高算力芯片處理器,以圖跨界“算力”提振股價。

2023年9月29日,蓮花健康(600186)公告,其全資子公司杭州蓮花科技創新有限公司將以6.93億元的總價,向新華三集團控股子公司新華三資訊科技有限公司採購330台英偉達H800 GPU系列算力伺服器(每台伺服器含8張GPU)。在此之前的一個月內,蓮花健康股價由3.22元/股上漲至5.98元/股,大漲86%,創5年來新高。「算力」概念對A股公司市值的提振效力,可見一斑。

馬太效應下,越來越多不同產業的企業和新創公司使用英偉達的GPU和軟體,將其建構的產品和服務自動化。例如,專業設計師使用其GPU和軟體創建電影中的視覺效果,並設計從手機到商用飛機的建築物和產品;交通運輸行業用其構建自動駕駛平台;醫療保健行業用以增強醫學成像和加速藥物發現;金融服務業藉此進行詐欺檢測。

英偉達成為第二季全球業績成長最強勁的科技公司背後,是其在顯示卡領域遙遙領先的市場份額。公開數據顯示,英偉達佔據全球資料中心AI加速市場82%的份額,而且,以95%的市場佔有率壟斷了全球Al訓練市場。

近乎「壟斷」的市場地位,簡單總結源自於英偉達三方面的優勢。

一是產品和架構。基於架構的彈性、多功能性和穩定高速效能,英偉達能夠勝任從資料處理到訓練、推理,推理前對資料所進行的預處理,再到後期的資料處理,語言進行識別化以便用於訓練等任務。尤其是大模型和AIGC的工作流程強度大,大量的應用程式需要強大的平行處理能力,英偉達的架構組合和產品能夠加速中心運算程序,以確保最低的運算和保有成本。

二是規模和速度。在遊戲、智慧駕駛、大模型、加速運算、智慧雲端等終端機上,英偉達已擁有龐大的安裝量。龐大的規模和超快速度,決定了英偉達能夠在不同的使用模型和運算環境中,持續發展極其複雜的軟硬體、網路和運算堆疊,在保質保量的前提下加快客戶的工程進度。而軟體開發者能夠透過英偉達的平台,接觸最大數量的終端用戶,提升業務或獲得投資回報。規模效應下,在產業未出現大的技術創新和拐點前提下,強者癒強的馬太效應將持續鞏固英偉達的領先優勢。

三是系統和生態。在AI大模型訓練等平行工作負載中,效能強大的晶片處理器重要,軟體生態更重要。效能強大的GPU讓英偉達成為晶片巨頭,但讓英偉達成為全端運算平台的,是其龐大的軟體體系。

英偉達除了提供CUDA平行程式設計模型、CUDA-X應用加速函式庫、應用程式介面(API)、SDK和工具以及特定領域的應用程式框架,還提供NVIDIA GPU Cloud登錄(NGC),這是一個涵蓋科學計算、深度學習和機器學習等領域、易於使用且經過優化的軟體堆疊的全面目錄。借助NGC,AI開發人員、研究人員和資料科學家可以開發AI和HPC(高效能運算)應用。

基於英偉達構建的軟體系統,其硬體可以在每個大型電腦製造商和大型雲端伺服器(CSP)的行業標準伺服器中使用,也可以在英偉達DGX AI超級電腦中使用(DGX是一個專門為深度學習和GPU加速應用而建構的系統)。為了擴大可用客戶群、降低使用門檻,英偉達圍繞GPU構建了多種現成系統,包括面向超大規模和超級計算數據中心的HGX、面向企業和邊緣計算的EGX、面向高精度邊緣人工智能的IGX以及面向自主機器的Argan。

算力王者背後,是英偉達從產品到平台再到生態系統不斷進化,並擴大其領先優勢。那麼,英偉達這樣的優勢能否輕易複製呢?


03 370億美元投入研發,專業化收購完善技術鏈

風口即市場需求,連續踩中科技產業發展風口,背後是英偉達滿足爆發性算力需求的能力。

這一能力,源自於其對變化中的早期市場和新創公司的關注和長期佈局。例如,在ChatGPT爆紅出圈之前的2016年,黃仁勳已拜訪創立於2015年12月的OpenAI,並捐贈搭載8顆P100價值百萬的超級電腦DGX-1,成為「為ChatGPT算力助攻的英偉達」。

插播一句,OpenAI採用了與AI先行者谷歌不同的技術路線,Google2017年6月推出具有6500萬個可調用參數的Transformer模型,而OpenAI採用GPT(生成式預訓練)模型,並於2018年推出具有1.17億個參數的GPT-1。二者之間的技術競賽自此開啟。

我們從其產品迭代的時間密集度上,感受一下OpenAI進化的速度:2019年2月15億參數的GPT-2、2020年5月1750億參數的GPT-3、2021年1月120億參數的DALL-E、2021年6月120億參數的Codex、2022年3月13億參數的InstructGPT、2022年11月末20億參數的ChatGPT相繼推出。

OpenAI每一次進化,都伴隨著Google的迭代回應。2021年5月,Google發布1,370億參數的AI系統LaMDA對話應用語言模型。正是巨頭之間你追我趕的競爭,才推動了全面AI時代的提早到來。

堪稱新創公司算力最強助攻的英偉達,全球超過30,000家合作夥伴中,15,000家是新創公司,其中包括數千家AIGC公司。截至2023年1月末,英偉達GPU支援的應用程式已超過2800個。英偉達為全球TOP500排行榜上超過70%的超級電腦提供支持,其中包括Green500排行榜上排名前30的系統中的23個。正如三、六零(601360)創辦人、董事長週鴻禕評價英偉達,「對用戶真正產生價值,才能慢慢生出偉大」。

如前所述,從賣GPU顯示卡,到賣平台服務,再到建構軟硬一體的AI算力生態系統,推動英偉達演進的核心動能來自研發與收購。

「Innovation is at our core」(創新是我們的核心)是英偉達每一年的年報中均會出現的固定表達。研發是科技公司的第一個生產力,截至2023年1月末,英偉達研發的投入累計超過370億美元,擁有1,9532名研發人員,佔員工總數的75%。

其中,2013-2022年,其研發支出的絕對值維持著高速成長,研發佔營收的比重穩定維持在20%(圖8)。與同類可比較上市公司相比,英偉達研發投入佔營收的比重達23.47%,高於高通和AMD(表3)。




除了真金白銀做研發,從內部構築技術發展動能,英偉達也以收購從外部完善技術鏈。

科技業是併購重組的主陣地,英偉達30年的發展歷程中,併購時有發生。從2000年收購圖形晶片廠商3dfx,2023年計畫收購行動晶片供應商ARM,英偉達借助收購來實現技術躍升、業務拓展,從而實現業務轉型和產業鏈完整。

我們從代表性的案例,來看資產收購對英偉達的意義。

第一,2019年3月至2020年4月,英偉達以70億美元的對價收購以色列晶片製造商邁絡思科技有限公司(Mellanox Technologies,簡稱「Mellanox」)。該公司是全球領先的伺服器和儲存端對端連接解決方案的供應商,產品包括乙太網路交換器、InfiniBand智慧互連解決方案、伺服器、儲存設備和超融合基礎設施,應用於高效能運算、雲端運算、資料中心、企業運算及儲存市場,全球500強超級電腦中超過一半使用其設備。

藉此收購,英偉達硬體產品佈局得以從GPU擴展至DPU。英偉達推出了BlueField DPU,由資料中心基礎架構軟體DOCA提供支持,透過DOCA,開發人員可以為BlueField DPU建立軟體定義、硬體加速的網路、安全性、儲存和管理等應用程式。因此,英偉達可以在整個運算、網路和儲存堆疊中進行最佳化,以提供資料中心規模的運算解決方案。目前,BlueField DPU應用於頂級的安全、儲存和網路公司,但滲透率也比較低。

黃仁勳在2022財年第一季財報發佈時表示:“Mellanox收購完成一年來,超出了我們的預期,英偉達也轉型為一家數據中心級計算公司。”

第二,2022年1月10日,英偉達收購其十多年的合作夥伴Bright Computing。該公司成立於2009年,是全球領先的高效能運算軟體開發商,其所生產的軟體管理著全球700多個組織使用的高效能運算系統。

藉此收購,英偉達強化了其軟體在邊緣運算、資料中心和公有雲、混合雲等領域的運作能力,從而進一步擴大其高效能運算市場。截至2023年1月末,全球25個高效能運算應用程式中的23個使用英偉達的產品。

第三,2022年3月,英偉達收購其合作夥伴Excelero。該公司成立於2014年,是一家高效能軟體定義儲存供應商,其開發的NVMesh軟體,可管理和保護NVMe快閃磁碟機的虛擬陣列,作為跨公有雲和私有雲的區塊存儲,其區塊儲存在運行DPU的DOCA軟體框架中發揮重要作用。被收購後,Excelero的技術被整合到英偉達的軟體堆疊中,並應用到AI和高效能運算平台。

第四,2023年7月,英偉達收購了AI新創公司OmniML。該公司成立於2021年的美國加州,主要產品是一個旨在快速、輕鬆地大規模進行AI優化的平台Omnimizer,其軟體可以壓縮機器學習模型的大小,以便在更小的設備上驅動人工智慧,但其引用的範例主要涉及電腦視覺。例如,幫助智慧攝影機或自動駕駛汽車識別周圍的物體,是汽車實現自動駕駛的關鍵技術之一。

值得一提的是,OmniML的三位共同創辦人大學部皆畢業於清華大學,分別是麻省理工學院電機工程與電腦科學教授韓松、Meta前軟體工程師吳迪,以及參與發明深度壓縮技術的毛慧子。

除了上述「強鏈補鏈」式收購,英偉達也曾啟動收購行動晶片巨頭,藉以重回行動領域。

籌劃收購ARM(ARM.O),是英偉達史上最受矚目的收購計畫。

ARM是一家行動裝置CPU晶片和架構供應商,全球99%的智慧型手機和89%的平板電腦使用其晶片架構,其成立至2022年末,晶片出貨量超過2500億顆。一直面向PC客戶端的英偉達,如果收購ARM,將實現其在行動端的業務突破,覆蓋PC和行動端客戶,成為晶片領域真正的「壟斷者」。

收購的機會由ARM控股股東軟銀釋放。2020年9月14日,因多筆投資價值大縮水而在2019財年出現成立15年來首次虧損(虧損130億美元)的軟銀,為緩解財務壓力,宣布將ARM以400億美元對價出售給英偉達。但這項交易計畫自帶的「壟斷」屬性,很快就遭到ARM公司創辦人赫曼·豪瑟(Hermann Hauser)和英國、歐洲、美國和中國的監管機構以及高通、微軟、Google等公司的反對。2023年2月9日,英偉達正式宣布放棄此收購,軟銀轉而推動ARM獨立上市。2023年9月14日,ARM在納斯達克上市,創下2023年全球最大規模IPO紀錄。ARM最新市值為515億美元。

長期堅守內部研發外部收購,造就如今擁有算力生態系的英偉達。那麼,需要提問的是,英偉達有哪些「軟肋」限制其未來發展呢?


04 輕資產代工生產模式,兩大環節“卡脖子”

AI風口上, GPU是賣方市場。

大模型訓練的「入門級」算力支撐,至少需要1000顆A100晶片。GPT-3模型訓練採用的超級計算機,則需搭載數萬顆英偉達A100晶片,而升級後的大模型所需的晶片更多。因此,創建大模型的第一門檻,就是晶片的數量和晶片價格。

供不應求下,2022年12月至2023年6月的半年內,英偉達A100價格累計漲幅近70%。英偉達H100的單價在2023年8月底超過了4.5萬美元,專業機構推算,其成本約3000美元,利潤率達1400%。

這樣的暴利產品,當然大賣特賣最好,讓利潤漲到天上去。但是,高階晶片的生產流程複雜度和產品良率幾乎成反比,英偉達「生產」不出來市場所需的晶片。站在產業鏈頂端的科技巨頭,正遭遇「卡脖子」。

晶片產業如同所有高階製造業,有重資產整合模式,也有輕資產的代工模式,前者的代表如英特爾(僅20%的產品由外部代工),後者代表如英偉達,雖然二者的產品結構不同,但隨著高階產品佔比提高以及出品規模成長,2020年開始,英偉達的淨利率超過了英特爾,2023年上半年,差距進一步拉大(圖9)。



作為一家專注晶片設計和銷售的公司,英偉達生產上依靠台積電等供應商,其晶片產品升級迭代中,生產環節的複雜度和生產工藝的難度往往呈非線性增長,需要整個供應鏈的合力支持,甚至面臨供應鏈的重構(表4)。



這就導致,在外包生產的輕資產模式中,如果代工廠遭遇生產效率低下或排產限制等問題,產品就會無法按期量產或交付延期。早在2012年,英偉達即出現過產品因代工廠原因而供不應求的問題。2012年一季度,由於台積電28奈米開普勒(Kepler)GPU容量限制,英偉達無法滿足客戶對高階桌上型電腦GPU產品的需求,導致當季營收下降4%,淨利下降55.3%,一直持續到2013年第一季才重回正成長軌道。

截至2023年1月,對台積電營收貢獻排名前10的客戶分別為蘋果、聯發科、AMD、高通、博通、英偉達、Marvel、意法半導體、亞德諾、英特爾。2020-2022年,其來自最大單一客戶蘋果的銷售金額由3,367.76億元新台幣增加至5,296.5億元新台幣,成長57%,但蘋果佔台積電總營收的比重由25%降至23%。由此可見,台積電的客戶集中度正在下降,單一大客戶很難對其績效造成特別重大影響。

針對客戶對台積電的產能佔有問題,台積電在2023年財報中明確表示,由於設計技術和功能的快速變化,代工客戶一般不會提前很多時間下採購訂單來製造產品,但是一部分客戶與其達成協議,透過支付臨時費用以獲得台積電晶圓廠的指定產能。

這意味著,在台積電的排產計畫中,預留了臨時付費增產的空間。據悉,台積電正以超急件(superhotrun)生產英偉達GPU,但H100和A100的訂單已經排到2024年二季度,即現在下訂單,明年年中才能收貨。

一般而言,晶片的性能與電晶體的數量正相關,但單位面積的矽片上電晶體排布越多,能耗越大散熱問題越突出,產品良率也越低,因此晶片設計的關鍵在於性能與能耗必須達成平衡。

以服務超級加速器的晶片H100為例,其是由超過3.5萬個零件和近1兆個電晶體組成的系統組件,內部設計的複雜程度,外行人難以想像。

分割晶片結構,H100主要由邏輯晶片、HBM記憶體晶片、CoWoS封裝、PCB板等輔助元件組成。目前,封裝和記憶體晶片是兩大「卡脖子」環節。

我們以H100最通用的版本H100 SXM為例,其採用的是台積電CoWoS的7晶粒封裝,記憶體晶片則是6顆16G的HBM3晶片分列兩排、圍繞中間的邏輯晶片。

首先,台積電CoWoS封裝是一種2.5D封裝工藝,能將計算、內存等晶片堆疊到矽中介層或矽轉接板,透過矽中介層上的高密度佈線,實現晶片互連,再安裝到基板上進行封裝。這提升了晶片的連接速度、降低了功耗,相較直接在晶片上打孔、佈線的3D封裝工藝,其成本更低、散熱更優,數據吞吐帶寬更寬,幾乎是市場上高算力、高記憶體晶片的唯一封裝製程。

目前,英偉達、AMD的4款高性能GPU均採用此一套裝製程。但台積電此封裝製程產能不足,目前幾無可替代廠商,限制了英偉達相關產品的產量,預計2024年,三星或可提供此封裝服務。

根據集邦諮詢預測,台積電正在擴產能,其CoWoS月產能將在2023年底達到1.2萬片,即便是台積電把CoWoS產能都排給英偉達,英偉達高端晶片產能的天花板也僅是1.2萬片/月。因此,解決了封裝環節的限制,高階晶片的出貨量才會增加。

其次,記憶體晶片供應不足。H100中的6顆HBM3記憶體晶片,由韓國SK海力士獨家供應。一張H100 SXM使用6顆HBM3記憶體晶片的成本約1500美元。2023年上半年,三星的HBM3量產出加快,記憶體晶片在2023年下半年後或不再限制H100出貨量。

一塊H100重達70磅,這幾乎是今年市場上唯一用「體重」計量的晶片產品,其2023年第二季出貨量超過了900噸。長期來看,H100的供需缺口會隨著AIGC的應用爆發而水漲船高。根據金融時報的報道,2024年H100的出貨量預計將高達150萬-200萬張,相比於2023年的50萬張提升3-4倍。有華爾街投行預測,2024年英偉達「A+H」系列顯示卡的出貨量合計將達到300萬-500萬張。

得益於H100等高性能產品的拉動,2023年二季度,英偉達的毛利率達到68.2%,較2022年末的56.9%提高了11.3個百分點,創歷史新高,且高於直接競爭對手英特爾和AMD(圖10)。英偉達的毛利率,在Wind美股半導體設備與產品分類的104家公司中,排名第10。在排名前9的公司中,6家2022年淨利錄得虧損,僅博通(AVGO.O)的淨利潤高於英偉達。


令競爭對手不寒而慄的是,H100和A100產能尚在爬坡階段,英偉達性能更強的新產品又來了,一場看不見硝煙的算力戰爭正在發生。


05 黃氏定律挑戰摩爾定律,算力會鎖死嗎?

順週期航程中,站在頭部的巨頭,只會加速。

2023年8月初,在美國電腦協會電腦繪圖影像特別興趣小組(Special Interest Group for Computer GRAPHICS,簡稱「SIGGRAPH」)組織的2023年年會上,英偉達發布了基於Grace Hopper架構、搭載的記憶體為全球首款HBM3e(較HBM3快50%)處理器的新顯示卡GH200,可用於處理大語言模型、推薦系統、向量資料庫等全球最複雜的AIGC工作負載所需。該晶片配備141GB記憶體、72核心ARM中央處理器和每秒5TB的頻寬,較H100晶片記憶體增加1.7倍,傳輸頻寬增加1.5倍。

GH200已於2023年5月全面投產,基於GH200 Grace Hopper平台的新系統將於2024年第二季開始交付。

對使用者來說,投資800萬美元使用Grace Hopper,相當於使用8,800個價值1億美元的X86 GPU,整體成本降低12倍、能耗降低20倍。這也是黃仁勳說的「買的越多越省」的原因。

需要強調的是,英偉達的新平台依舊延續相容模式,客戶可以透過英偉達NVLink與其他超級晶片連接、協同工作,進而部署大型AIGC模型。因此,英偉達的一致性技術使GPU可以存取CPU內存,在雙配置中可提供總計1.2TB的快速記憶體。

這無疑進一步增加了使用者改換GPU和平台的難度和成本。用戶忠誠度「被動」加固。

那麼,英偉達GPU晶片的效能升級會永無止境嗎?

在晶片效能提升過程中,電晶體數量增加的規律誕生了一個摩爾定律,即積體電路上可容納的元件數目,約每隔18-24個月便會增加一倍,效能也將提升一倍。在客觀存在的物理限制下,整個產業間隔十多年便會出現困擾聰明大腦的問題,摩爾定律會不會失效、算力會不會鎖死?

2023年9月29日,英偉達發布的一篇部落格稱,在過去10年中,英偉達GPU的AI處理能力增加了1,000倍。由此,「單晶片推理性能」中看到的加速不會逐漸消失,理論上會繼續出現,這項發現被業界稱為「黃氏定律」。

短期內算力不會鎖死,但AI大模型最強助攻的英偉達,如果其顯卡所有環節都實現產能自由,那麼,根據工業品規模化生產的萊特定律,產品累積產量翻倍,單位成本將下降固定百分比。

例如,汽車業,整車廠產量翻倍,其成本價格就會下降15%。根據相關機構測算,在晶片產業中,晶圓產量翻倍,成本下降約22%。如果技術迭代,例如晶片從10奈米迭代到7奈米技術,交付處理器的最終成本每年可以下降30%-33%。

如台積電2023財年年報所示,當其產能利用率增加時,固定製造成本會分攤到更大的產量上,產量越大,單位成本越低。為了提升晶片製造效率,針對目前的SoC開發方法,台積電開發了多項晶圓加工程序,多個客戶可以共用遮罩(mask晶片製造中的模具),從而降低客戶的原型成本、縮短產品上市週期。

英偉達與台積電在長期合作中,學習曲線效應與技術難度升級共振,彼此均獲得了不可取代的優勢。這也是AI晶片賽道上,英偉達被英特爾、 AMD、微軟、谷歌等巨頭追趕多年,卻尚未被超越的根本原因,而台積電也越來越難被取代。

但是,產能受限的英偉達,必然無法獨吞未來10年AI算力晶片的萬億市場蛋糕,哪些公司將會是英偉達強勁的對手呢?


06 算力產業競爭加劇,英偉達要做“AI界的台積電”

全球GDP成長乏力的背景下,數位經濟維持強勁成長。發展數位經濟,算力是核心生產力,未來很長一段時間,投資算力將對經濟成長產生倍增效應。《2022-2023年全球計算力指數評估報告》顯示,算力指數平均增加1個百分點,該國的數位經濟和GDP將分別成長3.6‰和1.7‰。

算力已成為經濟成長的主要驅動力之一,且全球主要國家數位經濟佔GDP的比重持續成長。2022-2026年,該比重預計將從50.2%成長到54%。其中,2022年中國AI算力規模達268百億億次/秒,超過一般算力規模。預計未來5年中國智慧算力規模的年複合成長率將達52.3%。

熱門賽道上,從來沒有獨一份的生意,即使是在算力世界「廣積糧高築牆」的英偉達,也面臨競爭對手的追擊。


  • 競品頻出,AI算力市場風起雲湧

目前,英偉達主要的競爭對手有兩類:一是以AMD和英特爾為代表的解決方案供應商和授權人;二是以Google、亞馬遜、微軟為代表的大型雲端服務商。

首先,專業處理器陣營第一梯隊的英特爾和AMD,2023年都已推出標英偉達H100的產品和對標CUDA的軟體系統。

為因應AI時代的算力需求,2023年7月,英特爾推出面向中國市場的第二代Gaudi深度學習加速器Habana Gaudi 2,用於AI訓練,意在爭奪「百模大戰」的中國市場。

目前,英特爾資料中心有兩大系列產品,Gaudi系列為人工智慧加速領域中的專屬產品,適用於大模型的工作負載,Max系列GPU適用於科學運算領域。預計到2025年,英特爾將把兩條產品線融合,推出結合第二代Gaudi的GPU產品。

2023年9月19日,Intel On技術創新大會上,英特爾CEO基辛格(Pat Gelsinger)揭露了5nm AI晶片Gaudi 3,該晶片將於2024年推出。同時,基辛格也預覽了第五代英特爾至強可擴充CPU處理器,其較第四代的AI效能提升2-3倍。阿里巴巴的“阿里雲通義千問大模型”,使用的即是英特爾第四代至強處理器。

英特爾也宣布與ARM合作推出AI推理和部署運行工具套件OpenVINO,不僅支援預訓練模型,也支援跨平台應用,以建立其軟體生態。

值得一提的是,早在2021年12月,英特爾就推出了one API,作為其「軟體先行」策略的重要一步。one API是一個統一簡化的程式設計模型,旨在簡化跨多架構的開發流程(如CPU、GPU、FPGA、加速器),建立類似英偉達CUDA的軟體橋樑。

2023年9月19日,英特爾的軟體計畫迎來新的跨越,Linux基金會宣布,成立統一加速UXL基金會。這是一個跨產業組織,致力於提供一個開放的標準加速器程式設計模型,簡化開發高效能、跨平台應用程式的流程,其核心是加速演進英特爾one API計畫。

基金會的參與組織包括ARM、富士通、Google雲端、英特爾、高通、三星、Imagination Technologies(2017年被凱橋資本以5.5億英鎊收購)等公司,不包括英偉達。簡單概括,這些晶片公司試圖建立一個更大更開放的生態系統,角力英偉達的生態系統。

GPU二號玩家AMD,2023年6月推出Instinct MI 300A和Instinct MI300X兩款加速顯示卡,用於AI和高效能運算等領域。

前者是全球首個為AI和高效能運算打造的APU加速卡,也是AMD首款採用「CPU+GPU+記憶體」的一體化組合產品,其中包含1,460億個電晶體、24個Zen 4 CPU核心、1個CDNA 3圖形引擎和128GB HBM3記憶體。後者則是對標英偉達H100、面向AIGC推出的加速器,內含1530億個晶體管,單卡可支援400億參數的大模型,其顯存容量和頻寬均超越H100,是AMD產品史上最大的晶片產品,預計2023年四季度量產。

除此之外,AMD也推出集合了8個MI 300X的Instinct Platform,對標英偉達CUDA,同樣以軟硬整合模式提供AI算力解決方案。

其次,向英偉達貢獻萬顆晶片訂單的雲商大客戶,也紛紛自研AI晶片。

雲端服務是能夠將AI三要素(資料、運算和模型)融合的最佳模式。微軟AWS、亞馬遜Azure、Google雲端等大型雲端服務商,正在自研晶片與AI模型,以降低使用算力與模型服務的成本。

以最早研發AI晶片的Google為例,早在2016年,其資料中心已推出TPU,2023年4月推出AI晶片TPU V4,比英偉達A100處理速度快1.2-1.7倍,功耗卻低1.3-1.9倍。更重要的是,Google已將AI晶片團隊調整至Google雲端團隊中,以提高Google雲端AI晶片的租用服務能力。

同樣,華為也提出全面智慧化策略,打造中國堅實的算力底座,為世界打造第二選擇。有消息稱,華為的GPU技術能力已可對標英偉達,其昇騰910晶片性能可對標A100。

而微軟則因為投資了OpenAI而躍升為大贏家,從Bing到Office再到Windows,微軟不斷將OpenAI的技術置入旗下產品,風頭壓過了Google。2023年第二季度,微軟雲端全球市佔率達26%。2023財年,微軟雲端營收年增22%至1,116億美元。持續成長的微軟雲,未來可望超越市佔率30%的亞馬遜雲。

作為OpenAI的獨家雲端供應商,微軟Azure支援OpenAI的所有工作負載。同時,微軟也增加了對專業超級電腦系統的開發和部署的投資,以加速OpenAI的相關研究。

微軟已宣布,對其生產力軟體中的AIGC功能收取30美元/月的費用,雲端運算與大模型的疊加效應已為其帶來實質的效益。

面對日益高昂的算力費用,微軟也將於2023年11月推出AI晶片“雅典娜(Athena)”,用於其資料中心伺服器,並可用於ChatGPT訓練,從而降低微軟內部和OpenAI大模型訓練和推理的成本,減少對英偉達晶片的依賴。

面對科技巨頭的競爭與追趕,英偉達也在延伸服務鏈條,降低其產品的使用門檻和可觸及性。


  • 向雲端服務延伸,對標台積電

AI時代,高性能的算力配置價格高昂,大模型訓練成本動輒數千美元,並不是所有公司都擁有入場資格。

自2020年以來,OpenAI在其最大的支持者微軟建造的大型超級電腦上,開發了AIGC技術,該電腦使用了1萬顆英偉達的GPU。現在建造這樣一台超級計算機,光是GPU成本已近20億元。

Bernstein分析師斯泰西·拉斯貢(Stacy Rasgon)分析,運行ChatGPT是非常昂貴的,每次查詢大約花費4美分,如果ChatGPT的搜尋量增長到谷歌搜尋量的1/10,它將需要大約價值481億美元的GPU,每年需要價值約160億美元的晶片來維持運作。隨著英偉達GPU供不應求、價格飆升,OpenAI不少短期計畫被迫延後。有報告顯示,OpenAI正在探索自研AI晶片,並有意收購一家晶片公司,解決被晶片短缺限制進程的障礙。

成本高昂,但每個企業都需要大模型和AI服務,這是成長潛力巨大的長尾市場。

為此,黃仁勳提出英偉達要做“AI界的台積電”,透過與大模型廠商、雲廠商合作提供高性價比的雲端服務解決方案,幫助下游企業降低大模型訓練成本。

向雲端業務延伸的英偉達,推出雲端服務相關模式的動作迅速,一手合作、一手投資。

2022年8月,英偉達發布原生AI模型Omniverse Avatar Cloud Engine(ACE),任何規模的企業都能夠透過其雲端的模型和服務即時獲得創建並部署虛擬助理和數位人所需的大規模算力。

2023年3月,英偉達推出用於自訂AI基礎模型的AIGC雲服務BioNeMo,能夠加速新蛋白質和治療方法的創建以及基因組學、化學、生物學和分子動力學等領域的研究。

2023年3月,英偉達宣布推出包括NVIDIA NeMo、NVIDIA Picasso和NVIDIA BioNemo在內的一整套雲端服務,使企業能夠建置、完善和運行自訂大型語言模型和AIGC模型。

同時,英偉達與微軟、Google、甲骨文等雲端運算巨頭合作託管其DGX Cloud,合力提升超大規模雲端的效能。使用者無需採購和擁有伺服器,可以透過瀏覽器存取DGX Cloud,包括AI超級計算、AI框架、預訓練模型服務,DGX Cloud的收費標準是每個實例36999美元/月起,每個實例包括8個H100或A100 80GB GPU,每個GPU節點記憶體達640 GB,且運算資源專用,不與雲端中另外的租戶共享。

除了與大型雲端服務商合作外,英偉達還密集投資了雲端服務新創公司。

投資標的之一是「算力黃牛」CoreWeave。成立於2016年的CoreWeave,起初業務單一,就是用算力“挖礦”,其向英偉達採購了大量GPU組建礦機中心,並在幣圈低潮期逆週期囤積了大量GPU,一路將自己買成了英偉達的“VIP”,享有英偉達顯示卡優先配貨權。

2019年,CoreWeave將礦機中心改造為企業級資料中心,為企業級GPU加速工作負載提供AI雲端服務或為運算密集型用例建構雲端解決方案算力,比大型公有雲快35倍,但價格便宜80%。

2023年,隨著ChatGPT爆火,英偉達顯卡市場緊俏,連馬斯克都在2023年4月成立X.AI公司,加入AI混戰。賣方市場下,誕生了GPU租賃服務,英偉達GPU成為可抵押融資的「硬通貨」。

2023年8月,CoreWeave抵押其擁有的英偉達H100顯示卡,從黑石等機構獲得23億美元債務融資,公司估值達80億美元。此前2023年4月,CoreWeave完成4.21億美元的B輪融資,投資者包括英偉達,彼時其估值僅20億美元。4個月時間,其估值放大了3倍,可見這個市場的熱度。

2023年6月末,黃仁勳宣布與雲端運算巨頭Snowflake合作,販售英偉達的軟體和模型服務。2023年9月有媒體透露,英偉達正計劃向雲端服務商Lambda Labs投資3億美元,Lambda Labs最早業務是銷售GPU驅動的計算機,後轉型為GPU雲端伺服器租賃,目前主要面向企業出租帶有英偉達晶片的伺服器,從而與亞馬遜、微軟、谷歌等雲端服務商競爭。

從Google、微軟等科技公司的AI佈局可以看到,雲端服務是AI業務落地的重要抓手和橋樑,英偉達在雲端服務上的研發、合作、投資將不會停止。


07 頻密投資完善產業鏈,英偉達AI生態圈擴容

業績大好的英偉達,正在以投資的方式建構以AI為核心的生態圈。

截至2023年7月31日,英偉達帳面趴著58億美元現金和現金等價物,較2022年末的34億美元成長了71%。足夠的錢,是英偉達對外投資的基礎。

不差錢的英偉達,2023年前9個月參與了至少20家AI新創公司的融資,堪比創投機構。要知道,全球最大的獨角獸投資者之一的老虎環球基金(Tiger Global Management)同期也僅投資了30家標的。

其中,AIGC是英偉達投資的主要賽道,2023年英偉達投資了8家相關公司(表5)。這8家公司已在AI領域做出領先產品,其中不乏Inflection AI和Imbue等英偉達的下游客戶。



例如,在2023年6月30日完成13億美元融資的Inflection AI,投資者包括微軟、英偉達和三名個人投資者。融資完成後,其歷史總融資額達15.25億美元,成為融資金額僅次於OpenAI的AIGC新創公司。

該公司由GoogleAI實驗室DeepMind創辦人之一的穆斯塔法・蘇萊曼(Mustafa Suleyman)於2022年1月離開Google後創立,2023年5月即推出首款產品-名為Pi的AI個人助理,6月發布支持Pi的AI模型Inflection-1,被視為OpenAI勁敵之一。

穆斯塔法・蘇萊曼稱,英偉達和CoreWeave正在為公司部署數千個H100 GPU,投入使用後Inflection的新集群將運行2.2萬個H100 GPU,超過Meta公司的1.6萬個GPU集群。

另外,融資到I輪、估值超過430億美元的Databrick,2023年3月發布ToB端的語言大模型Dolly,4月發布Dolly2.0,可用於構建商業應用程序,預計在B2B生成式AI應用爆發式增長時期占得先機。2023年6月,以13億美元的對價收購了開源大模型公司MosaicML,該標的也是OpenAI的勁敵之一。強強聯合後,Databrick在AI領域的實力更強,IPO或將提上日程。

AIGC之外,醫藥AI是英偉達聚焦投資的另一個核心賽道。根據bioSeedin不完全統計,2023年8月、9月及10月第一周,共有29家AI製藥企業完成新一輪融資,披露融資總金額超過16億美元,達到2021年醫藥公司融資巔峰期的1/3,其中6家公司獲得了英偉達的投資(表6)。



例如,上市公司Recursion(RXRX.O)獲得英偉達5000萬美元投資後,宣布將利用英偉達的AIGC雲端服務來加速AI在生物和化學領域的基礎模型開發,而Recursion也能透過自身龐大的數據來不斷訓練英偉達的AI模型。Iambic Therapeutics宣布將利用英偉達的DGX Cloud AI超級運算平台和BioNeMo雲端服務,加速其藥物研發。

作為熟知AI技術路線的產業投資者,英偉達透過投資AI領域的新創企業,並推動這些企業的發展,一方面有助於其緊跟前沿賽道的產品需求,不斷迭代技術,保持競爭優勢,另一方面,成為AI前沿賽道公司的股東後,這些獨角獸無論繼續融資或上市,英偉達都將獲得不斐的投資收益。

Wind數據顯示,美股揭露相關數據的88家半導體及半導體設備上市公司中,2023年10月20日的收盤價高於發行價的佔比64%。由此可見,英偉達的投資從開端就大機率會達到雙贏。

除了投資AI下游應用型企業外,英偉達同時向上參與光刻機製造。2023年,英偉達與台積電、ASML、新思合作發布了計算光刻庫cuLitho。cuLitho可以透過部署大量GPU的DGX AI計算系統對計算光刻(在晶片設計和製造領域的關鍵步驟,也是最大的計算負載之一)進行加速,使其達到基於CPU計算速度的幾十倍,同時降低計算過程的總能耗,有助於晶圓廠縮短原型週期時間、提高產量、減少碳排放,將長期影響產業發展並累積形成世代差。

以GPU為核心,英偉達向上下游延伸業務,打造更龐大的AI生態圈,它也因此成為AI產業鏈上更重要的存在。


08 股價高點回檔12%,英偉達高成長可持續嗎?

在算力領域全面出擊的英偉達,也不可避免地被投資人投了看空票。多位投資人認為,受產能限制,英偉達的股價已提前兌現了未來的業績成長。

我們先看美股半導體產業的整體走勢。受惠於OpenAI推出的ChatGPT大模型推動,2022年11月底至2023年7月末,費城半導體指數、標普500指數、納斯達克100指數均走出了氣勢如虹的上揚線,費城半導體指數更終結了先前9個月下跌40%的萎靡(2021年12月至2022年9月),但仍未回升到2021年12月的歷史高點(圖11)。



晶片產業整體仍處在蕭條期。Wind資料顯示,截至2023年10月20日,已揭露2023年第二季業績的美股93家半導體企業中,35家企業錄得虧損。其中,英特爾虧損12​​.77億美元,AMD虧損1.12億美元,美光、安霸虧損均呈現逐季擴大趨勢(表7)。獲利的高通,淨利也較去年同期下滑42.9%。



除了虧損問題,存貨飆漲成為困擾美股半導體企業的另一個問題。2022年末,英特爾的存貨達到132億美元。2023年6月末,高通存貨達69億美元。二者的存貨均創歷史新高。

韓國也不例外,其最大的晶片企業三星電子存貨連續3年攀升,至2023年6月末,存貨達3,050億元,創歷史新高。2023年第二季度,韓國第二大晶片企業SK海力士因需求疲軟,虧損2.9兆韓元,較去年同期下跌169%。

同行可比公司普遍承受業績下行和庫存飆漲的雙重壓力下,英偉達股價也由高點回調。2023年8月31日至9月29日,其股價下跌12%,總市值蒸發約1,​​500億美元。同期,費城半導體指數下跌6.5%,標普500指數下跌5%。

值得注意的是,這一波迴調,發生在英偉達發布最好第二季業績和250億美元的股票回購計畫之後。

據報導,2023年10月9日,韓國總統辦公室通報,美國同意三星電子和SK海力士向其位於中國的工廠提供設備,無需其他許可。這項變更或將扭轉兩家韓國企業的庫存和虧損問題。這無疑是對蕭條的晶片產業釋放的空前利好,英偉達股價此後連漲兩天。

但是,受拜登政府更新針對AI晶片的出口管制規定影響,費城半導體指數、標普500指數、納斯達克100指數一致下跌,英偉達市值4天內蒸發1163億美元,股價下跌10%。

中國仍是晶片巨頭最大的單一市場。尤其是緊隨OpenAI,2023年中國科技公司興起“百模大戰”,更是釋放了對AI晶片的巨大需求。

中國AI頭號玩家百度,2023年初整合崑崙芯、太行DPU、飛槳深度學習框架、文心大模型、百度智能雲等產品,建構AI大底座。AI大底座將千卡並行加速比提升90%以上,訓練場景資源利用率提升70%以上,模型開發迭代效率提升100%以上。目前,其萬卡訓練集群的加速比達到95%,有效訓練時間佔比達到了96%,千帆平台大模型調用量正以每週環比20%的增速攀升。

操作員方面,中國電信將採購I系列/G系列訓練型伺服器總計4175台,InfiniBand交換器總計1182台。中國移動在上半年業績會上表示,正在興建亞洲最大的智算中心。

在這些「基礎設施」的建設中,算力儲備至關重要,而大模型訓練需要大量的英偉達GPU。百川智能創辦人、CEO王小川曾對媒體分析指出,在大模型中,GPU的算力成本大概佔40%-70%,而其中網路連線成本和GPU顯示卡成本的比例大概為3:1。而從大模型訓練、推理兩部分來看,國產AI晶片在資料推理上可以爭取國產替代。目前,在模型訓練方面,英偉達做得最好。英偉達GPU在AI訓練領域的市佔率達到95%,且暫時沒有可取代產品或方案。

更重要的是,國內GPU企業面臨生態遷移的難題,許多基於CUDA的程式碼和程序,轉型新生態需要大量的時間和重建成本,以及處理相容性難題。

有私有雲公司的CEO在接受媒體採訪時說,他們的公司也想過轉去買AMD的顯示卡,但要把這些顯示卡調試到正常運作至少需要兩個月的時間。而為了縮短這兩個月,英偉達投入370億美元跑了30年。

因此,英偉達在AI算力的領先優勢看起來仍將持續。不斷成長的中國AI市場,或將再度成為其業績成長的動能。

可怕的是,英偉達還在奮力奔跑。2023年5月,其宣布推出一款新型大內存AI超級計算機,由NVIDIA GH200 Grace Hopper超級芯片和NVIDIA NVLink Switch System驅動的NVIDIA DGX超級計算機,旨在助力開發面向生成式AI語言應用、推薦系統和數據分析工作負載的巨型、下一代模型。

TO B端的英偉達,與下游AI科技公司深度捆綁。未來,市場能否出現低成本的AI算力替換方案,或AI技術路線的顛覆性變革,挑戰其競爭優勢,我們拭目以待。(新財雜誌)