編者按:周三 NVDA 就要發財報了。這之前,黃仁勳和戴爾在拉斯維加斯 Dell World 上做了一場對談。我把裡面有價值的部分按 10 個主題挑出來,原汁原味放在這裡。
有幾個點值得提前劃重點:黃仁勳第一次明確給出"十年等級"的 AI 建設期判斷;供應鏈每年翻倍甚至翻四倍仍然追不上;CPU 不是被 GPU 替代,而是被智能體工作流拉起來——這對戴爾的伺服器業務是直接利多。
一手原話比什麼二手解讀都值錢,下面是實錄。
#1 供應瓶頸:記憶體與先進製程半導體是最大卡點
採訪者:現在你們最大的供應瓶頸是什麼?
戴爾:記憶體肯定是個挑戰。我覺得就是記憶體。先進製程的半導體也仍然緊張。整個半導體供應鏈都在爬坡,但需求增長比供給更快。
黃仁勳:我們這邊是把技術做成整合方案的——記憶體是和我們的技術一起打包出去的。我們的供應鏈規劃已經做了兩到三年,是全球規模最大的供應鏈。合作夥伴在幫我們鎖產能上做得非常好。每一環都對得上——HBM 跟 Grace Blackwell 和 CPU 對得上,矽光那一塊也對得上。問題只是需求遠遠大於全球整體產能。
戴爾:這種東西非常難預測。你要是在 2023 年去預測 2027 年的需求長什麼樣,根本預測不出來。建這些工廠確實周期很長。但我們和這些合作夥伴關係都幾十年了,他們也看到我們在贏,所以更願意跟我們一起幹。
#2 這不是周期性的記憶體繁榮,是結構性需求
採訪者:我是不是該把教科書收起來了?教科書告訴我記憶體歷來是周期性的——大漲大跌。你們兩個都得說服記憶體廠商,這次需求是持久的,他們才肯擴產。這樣理解對不對——這不是一個景氣周期,而是市場結構本身變了?
黃仁勳:我們花了很多時間和供應鏈溝通。你可以去問 Micron 的 Sanjay Mehrotra,三年前的一次會議上,我向他描述過未來會怎麼走,結果現在一模一樣地發生了。我非常感激 Micron 把整條路線圖都跟我們對齊了。SK 的 Tony 也會告訴你,我們幾年前也做了同樣的事。
我們的任務,是把對行業未來的判斷向上游傳遞給供應鏈,讓他們照著這個方向去建產能;同時也要向下游傳遞給那些握著發電、土地、融資的人。上下游都得一起為未來做好準備。
#3 智能體 AI:下一波建設浪潮,幾十億數字員工
黃仁勳:邏輯很簡單——我們現在已經進入到了智能體 AI 階段,AI 真正變得有用、有生產力了。可以把這些智能體理解成數字員工。今天全球有幾億數字員工,未來我們會有幾十億 AI 智能體,它們 7×24 小時不停工作。
就像我們給每個員工配一台筆記本和一小塊資料中心資源一樣,未來每個智能體也得配一台電腦、一點儲存、一小塊資料中心給它用。
換個角度想——你作為一個人一天能幹多少活,然後交給下一個人。但現在,你可能有幾百個、幾千個數字智能體在幫你幹活,你只負責監督。這會大大提高你的生產力,讓你能做更多事,也釋放你的創造力。但這背後需要的算力、記憶體、儲存、網路都會成倍增加——這就是我們一起在做的事。
戴爾:以前是人用工具,現在是智能體用工具。我們會有幾十億個智能體。人偶爾才用一下工具,智能體是一直在用工具,而且用得非常快。所以我們會需要更多的 CPU。這些 CPU 連到 GPU"大腦"上,CPU 才知道怎麼思考、怎麼推理、怎麼規劃、怎麼呼叫工具。
#4 企業客戶從測試走向生產:本地 AI 工廠落地
採訪者:AI 工廠新增 1000 個客戶是個巨大的跳躍。這些新客戶——加起來 5000 個——和一年前相比,現在到底在建什麼?
戴爾:最大的變化是從"測試和評估"走向"生產"。我們今天台上展示了幾個很好的例子——Eli Lilly、三星部署在物理世界中的 1000 塊 GPU,這些都不是螢幕上演示的東西,是真正落到了全球最大企業的真實場景裡。這種勢頭正在所有客戶、所有行業、所有國家廣泛蔓延。
雖然現在已經增長得很猛了,但我仍然覺得這只是這一波浪潮的開頭——尤其是企業市場,那裡的機會大得多。
黃仁勳:智能必須在"上下文產生的地方"被生產出來。上下文在那、動作發生在那,你就得在那裡生產智能。
早期的 AI 應用大多在雲端,很多消費者服務也在雲端。但對於 Lilly、三星、未來的製造業——你會希望智能體跑在本地,因為你的資料在那裡,你的安全資料、專有資料、跟公司繫結的所有 know-how,全都在那裡。
#5 供應鏈未來十年都很難追上需求
黃仁勳:我們才剛剛進入 AI 建設期。這真的就是智能體 AI 建設的最初階段。這個周期我們要建十年,甚至更久。因為再往後,數字智能體會變成物理智能體,我們會進入物理 AI——這塊我們甚至還沒開始。
那是一個大得多的市場,需要全新的基礎設施能力——第一次有機會把 AI 帶進全球剩下那 90 兆美元的傳統行業。我們前面有一個巨大的市場要去建。
與此同時,供應鏈每年都在翻倍以上,可能每年翻四倍。但即便如此,未來至少十年我們都會非常吃力地追趕建設速度。
#6 10 倍到 100 倍的生產力提升,推動企業緊迫感
戴爾:現在企業意識到一件事:當他們用這項技術重新設計工作流,得到的不是 10%、20%、30% 的提升——而是 10 倍、20 倍、甚至 100 倍。
這才是真正能讓一個企業贏的速度。我們自己在這麼做,輝達也在這麼做,這些事能成不再是秘密了。每家公司都想抓住這個速度,把它轉化成自己的競爭優勢和實際成果。
#7 完整的智能體堆疊:大腦、外殼、記憶體、網路
黃仁勳:我們得一起做好幾件事。
第一,造大腦——Grace Blackwell NVL72、Vera Rubin。
第二,造 Vera CPU——這是全球性能最強、專為智能體 AI 設計的 CPU。這是用來跑智能體本身、呼叫工具的"外殼"(harness)。
什麼叫"外殼"?就是給大模型套上一層殼,讓它能訪問記憶體、連線到網路、呼叫工具,有本地暫存記憶體、工作記憶體和長期記憶。這個外殼本質上是把"大腦"變成"智能體"——變成一個能幹活的數字機器人。
智能體跑在 CPU 上。我們還跟 Dell 一起搭了智能體專用的長期記憶——基於輝達的 Dell AI Data Platform。橫向擴展的網路也是基於輝達的。
所以整套東西——智能體、大腦、長期記憶、所有擴展用的網路、加上智能體執行階段本身(我們叫 Nemo)——全部跑在一個安全可控的容器(Open Shell)裡。這些東西我們都拼好了。
Dell 要做的是把這套東西打包成企業能用的解決方案。Dell 要為全球企業做的事,就是雲廠商為雲做的那件事。
#8 智能體工作負載推動 CPU 需求拐點
採訪者:在 AI 時代,Dell 在 CPU 和通用計算上的故事是什麼?
戴爾:當企業內部開始轉向這些智能體框架,CPU 的使用量會大幅增加。這就是正在發生的現實,而且我覺得只會越來越多。
黃仁勳:我們會有幾十億個智能體。人偶爾才用一下工具,智能體是不停在用工具,而且用得飛快。所以我們需要的 CPU 會多得多。這些 CPU 連到 GPU 大腦上——CPU 負責思考、推理、規劃、呼叫工具。基本就是這樣跑的。
#9 個人 AI:雲之後的下一個平台轉變
黃仁勳:回頭看計算行業的演進路徑——當我和邁克爾剛進入這個行業的時候,正好是大型機增長的尾聲、個人電腦的開端。
現在我們看到的是雲端 AI 的開端,這條線還會繼續漲。但我們也會看到個人 AI——不是個人電腦,而是個人 AI。
AI 必須在"有上下文的地方"運行。
- 如果我的資訊全都在自己的筆記本上,AI 要幫我幹活,就得在本地跑。
- 如果我有一家工廠,智能體就得在工廠裡跑。
- 如果我有一家醫院,智能體就得在醫院裡跑,因為手術室在那裡——你不可能讓它跑在別的地方。
- 如果你開的是自動駕駛汽車,AI 必須在車裡跑。
這就是分佈式智能、無計量智能的理念——你可以想生成多少 token 就生成多少 token。
#10 供應鏈多元化與美國再工業化
黃仁勳:當然,台灣仍然是全球技術製造和研發的核心,供應鏈非常完整。
與此同時,我們也在推動美國再工業化,把製造業帶回來。我們這麼做,恰逢 AI 需求處於這場新計算革命的起點上,需求異常旺盛。所以我們在美國建更多工廠:晶片廠、封裝廠、電腦廠、AI 工廠。這些工廠也在加緊擴產,因為整體需求實在太大了。
供應鏈可以同時做到多元化和韌性,每個人都應該努力往這個方向走。但同樣事實是,台灣會繼續是全球科技中心之一。
劃重點:
- 黃仁勳三年前就跟 Micron 描述了現在的需求曲線,並且供應鏈路線圖是幾年前就對齊的。
- 供應鏈每年翻倍甚至翻四倍,但十年內仍追不上需求——這是黃仁勳第一次明確給出"十年等級"的建設期判斷。
- CPU 需求拐點出現在智能體階段,不是 GPU 替代 CPU,而是"GPU 是大腦、CPU 是外殼"的協同放大。
- 企業 AI 從測試走向生產:Lilly、三星已經是真實場景,5000 個 AI 工廠客戶裡有 1000 個是新增。
- 物理 AI 還沒開始
——黃仁勳把它定義為"更大得多"的市場,對應全球 90 兆美元的傳統行業 TAM。 (北向牧風)
