《黑神話:悟空》輝達H100那麼牛,為何不能玩《黑神話悟空》?

說起玩“黑神話”的電腦組態,大家都在吹自己的4090顯示卡。

可是比4090貴了幾十倍的H100,同樣是“GPU”,為何卻不能用來玩遊戲?



這個問題,猛一看,很弱雞啊。

但問到具體原因,很多人卻說不出個456來。



今天我就簡單捋捋,除了介面之外,其他更重要的原因↓


01 架構設計的差異

最核心的一點在於兩者的架構差異,架構決定了彼此的核心能力不一樣。

RTX4090採用了N記的Ada Lovelace架構,專注於遊戲和高級圖形處理,這種架構在遊戲性能上有賊拉牛B的最佳化,包括高級的圖形渲染技術如光線追蹤和DLSS。



RTX4090總共包含 16384 個 CUDA 核心和 512個第四代 Tensor 核心,以及 128 個第三代 RT(光線追蹤)核心。

下面這個是其單個SM的架構圖,4090由128個這樣的SM組成。



提升遊戲體驗的幾大黑科技,都是靠這些核“肝”出來的。

比如光追效果主要依靠RT核,而DLSS包括抗鋸齒、超解析度、光線重建等等,主要依賴Tensor核心和CUDA核心提供的AI增強圖形效果。

玩燒機遊戲的都懂,開不開光追效果,體驗完全不一樣。



而H100的則是基於Hopper架構,主要針對大規模平行處理和AI任務進行最佳化,而非圖形渲染。

H100包括了16896個CUDA核心和528個第四代Tensor核心,注意,沒有對圖像渲染至關重要的光追核心(RT Core)。

下圖是H100單個SM的架構示意,H100由132個這樣的SM組成。


看對比圖就發現差別了,雖然H100擁有更多的CUDA核心和Tensor核心,但這些核心是面向複雜計算和深度學習模型訓練的。

比如,H100的CUDA核心支援FP64、FP32、TF32、BF16、INT8等多種資料類型的高效計算。

而4090的CUDA核心就不一樣了,人家主攻圖形密集應用,只針對單精度和雙精度做了最佳化。



02 驅動和API的支撐大不一樣

H100除了核心最佳化和設計的硬傷,還有一個大問題。

N記為遊戲級GPU(也4090為代表的Geforce系列)提供了專門的遊戲驅動,最佳化遊戲性能和相容性。H100則沒有。

這就是導致H100無法支援DirectX、OpenGL、Vulkan等主流遊戲API(嚴格說是理論上支援),也不支援Unity、虛幻、Godot這些主流的遊戲引擎。

比如,黑神話悟空採用的就是虛幻引擎5。



基本上,這兩條就斷絕了拿H100玩遊戲的任何念想。當然我們可以堆砌一些理由↓

成本的問題:我一個4090都買不起的小卡拉米,我會考慮拿貴幾十倍的H100來玩遊戲嗎?

電源和散熱的問題:H100的功耗和熱輸出設計用於機架式伺服器環境,對用遊戲PC來說,有極大的挑戰。



所以呢,4090這種GPU,可以叫顯示卡,或者圖形加速卡。

而H100這種GPU,更準確的叫法其實是GPGPU(General-Purpose GPU),我更願稱之為AI加速卡。

好了,不扯了。

是時候把我的珍藏20多年的TNT2翻出來插上,暢玩《黑神話悟空》了 (特大號)