黃仁勳回應一切:中國工程師天生熱愛開源、希望死在工作崗位、AGI 已到來

如果要找一個人來解釋這場 AI 大爆發究竟是怎麼發生的,黃仁勳無疑是最合適的人選。

三十年前創立輝達、押注圖形處理器,把 CUDA 強行裝進遊戲顯示卡,市值從 80 億跌至 15 億,然後用十年爬回來。在所有人還在爭論推理晶片會不會只是低端市場時,他已經在為智能體時代設計機架架構。

這種提前預判,顯然不只是靠運氣,更離不開他幾十年如一日做的一件事:在所有人相信之前,先把那個未來講給所有人聽。

今天,知名播客主持人 Lex Fridman 公開了他與黃仁勳長達兩小時的深度專訪。對話涵蓋 CUDA 護城河、中國科技生態、程式設計的未來,DLSS5、乃至意識與死亡。

這是黃仁勳近期最完整的一次公開表達,也是迄今為止最接近他思維方式的一次真實記錄。

附上黃仁勳採訪文字版實錄 🔗:

https://lexfridman.com/jensen-huang-transcript

一個問題,60 個專家同時在場,這就是輝達開會的方式

採訪開篇,Fridman 指出輝達已將設計重心從單晶片擴展至機架等級,涵蓋 GPU、CPU、記憶體、網路、NVLink、光纖與銅纜互聯、供電、冷卻、軟體以及機架本身。他問黃仁勳:在如此多變數的協同設計中,最難的部分是什麼?

黃仁勳首先解釋了極致協同設計為何從工程邏輯上不可迴避。

他說,問題的根源在於規模:當你把一個任務分佈到一萬台電腦上,你期望的結果是獲得遠超線性疊加的加速效果,比如一百萬倍的提升,而單純增加電腦數量只能帶來線性收益。

阿姆達爾定律(Amdahl's Law)由電腦科學家 Gene Amdahl 於 1967 年提出,指的是「短板效應」在平行計算中同樣存在——系統的整體性能提升受限於無法平行的那部分程式碼。

這就是阿姆達爾定律的約束,也就是說,如果計算只佔總工作量的 50%,即便把計算速度提升到無限快,整體也只能加速兩倍。

「一旦你把問題分佈出去,所有東西都會成為瓶頸。CPU 是問題,GPU 是問題,網路是問題,交換機是問題。分散式運算在我們這個規模下,每一個環節都必須同時攻克。」

在組織層面,黃仁勳透露自己的直接匯報超過 60 人,幾乎涵蓋所有技術學科的頂尖專家:記憶體、CPU、光學、GPU 架構、演算法、設計,無一缺席。他刻意放棄一對一匯報制度,改為讓所有人同時在場討論任何一個具體問題。

「因為我們在做極致協同設計,所以任何一次討論都不可能只有一個人在場。我們呈現一個問題,所有人一起攻。當我們討論冷卻,網路專家在聽;當我們討論供電,記憶體專家在聽。誰要是對本該關注的事情沒有關注,我會直接點名。」

他將公司架構比作作業系統,認為公司的組織結構應當直接反映它所處的環境和它要生產的產品,而非套用統一的「漢堡式」或「軟性」組織圖或者「汽車公司」組織圖。

把 CUDA 塞進遊戲顯示卡,是最痛苦也是最關鍵的決定

在講述輝達的戰略演進時,黃仁勳也詳細梳理了從圖形加速器到計算平台的轉型路徑。

他說,輝達最初是一家加速器公司,專注於圖形處理。專業化的好處是極致最佳化,問題在於市場邊界天然受限,而市場規模直接決定研發投入能力,研發能力又決定了一家公司在計算領域能發揮多大的影響力。

於是輝達必須拓寬邊界,向通用計算邁進,但通用性和專業性之間往往存在天然的矛盾:越向通用計算靠攏,專業加速能力就越被稀釋。

「我把這兩個本質上矛盾的詞硬連在一起,公司必須一步一步走那條極其狹窄的路,在擴展計算邊界的同時,守住最重要的專業化能力。」

第一步是可程式設計像素著色器,第一次向可程式設計性邁進。第二步是在著色器中加入 IEEE 標準相容的 FP32 浮點運算,這一步吸引了那些此前在 CPU 上做流處理和資料流計算的研究者。他們發現,GPU 的計算密度極高,又能相容他們原有的軟體邏輯。這直接促成了 Cg 語言(為 GPU 程式設計設計的高級著色器語言),再到 CUDA。

將 CUDA 搭載到 GeForce 消費級顯示卡是整個歷史中最關鍵也最痛苦的決策。

黃仁勳說,計算平台的價值完全取決於裝機量,而不是架構的優雅程度。他舉 x86 為例:這是歷史上被批評最多的架構,遠沒有同期那些被頂尖電腦科學家精心設計的 RISC 架構優雅,但 x86 活下來了,RISC 大多失敗了。原因只有一個:裝機量。

「當時 GeForce 每年出貨數百萬塊顯示卡。我們說,不管使用者用不用 CUDA,都把它裝進每一台 PC 裡,用這個作為培育裝機基數的起點。同時我們去大學裡寫教材、開課程、到處推廣 CUDA。在那個年代,PC 是主要的計算載體,沒有雲,我們等於把超算塞進了每一個在校學生和研究人員的手裡,總有一天會有驚喜發生。」

代價是慘烈的。CUDA 讓 GeForce 的成本大幅上升,將輝達的毛利率徹底壓垮,公司毛利率本已只有 35%,成本增加 50% 之後,全部利潤蒸發。市值從約 80 億美元一路跌至 15 億美元,在底部徘徊了相當長的時間。

「但我們一直扛著 CUDA,一直搭載在 GeForce 上。輝達是 GeForce 建起來的家,是 GeForce 把 CUDA 送到了所有人手裡。研究人員和科學家在大學裡發現了 CUDA,因為他們本來就是遊戲玩家,他們自己攢電腦,他們拿 PC 元件搭叢集。」

後來,這成為深度學習革命的基礎設施。對於如何作出這類賭注式決策,黃仁勳說,他的決策過程始於好奇心,然後是推理。當推理系統在內心足夠清晰地呈現出「這件事一定會發生」時,他便開始相信它,而一旦相信,就會去實現。

但更重要的是他管理集體信念的方式:他從不等到決策那一天才宣佈,而是通過每一次外部資訊、工程里程碑、行業新發現,持續向董事會、管理團隊、員工、合作夥伴一點一點地鋪設認知基礎。

「到了宣佈的那一天,我希望所有人的反應是:『Jensen,你怎麼現在才說?』收購 Mellanox 是這樣,全力押注深度學習是這樣,現在 Groq 也是這樣,我已經鋪墊了兩年半。」

他把 GTC 大會描述為向全行業塑造未來認知的工具,不只面向員工,也面向合作夥伴和整個生態。「我們不生產電腦,也不搭建雲。我們是計算平台公司,任何人都無法直接購買我們的產品,但我們向所有層級開放平台。在我的產品準備好之前,必須先讓所有人相信它將要到來。」

Ilya 說資料耗盡了,黃仁勳說他搞錯方向了

對於 Scaling Laws(縮放定律/擴展定律),黃仁勳提出了一個系統性框架,包含四個相互咬合的層次。

第一條是預訓練擴展定律。模型越大,訓練資料越多,AI 越聰明。

當 Ilya Sutskever 表示「預訓練資料耗盡」時,業界一度恐慌,認為 AI 到了天花板。黃仁勳認為這個擔憂搞混了方向:

人類生產的資料確實有限,但合成資料的比重會越來越高,而且這並不奇怪,人類知識本來就是「合成」的,知識在人與人之間流轉、被重新詮釋、再創作、再消費。AI 現在已經能夠以真實資料為基礎大量生成合成訓練資料,預訓練的瓶頸從資料量轉移到了算力。

第二條是後訓練擴展定律。通過指令微調、強化學習等方式持續精煉模型能力,這個空間仍然廣闊。

第三條是測試時擴展定律(test-time compute),也就是推理階段的計算投入。黃仁勳說,當初很多人預判推理是「簡單的」,認為推理晶片只需要小而廉價,完全不需要輝達那樣昂貴複雜的產品,將來推理市場會是一個被商品化的低端市場。

「這在邏輯上就說不通。預訓練是記憶和歸納,是閱讀;推理是思考、推理、規劃、搜尋、嘗試、分解陌生問題。思考怎麼可能是計算輕量級的?」事實證明他是對的,測試時擴展的計算消耗遠超市場預期。

第四條是智能體擴展定律。一個大語言模型變成一個智能體,在測試時去查資料庫、使用工具、分配子任務,同時派生出大量子智能體。

「擴充輝達規模最簡單的方法是多僱員工,而智能體的分裂速度比僱人快多了。」這些智能體在運行過程中積累大量有價值的經驗和資料,其中的精華會反哺預訓練,再經後訓練精煉,再經測試時增強,形成完整的閉環飛輪。

「歸根結底,智能的擴展取決於一件事:算力。」

對於如何在硬體設計層面預判 AI 模型的走向,黃仁勳坦言這是最難的部分之一,因為 AI 模型架構每六個月就會迭代一次,而系統和硬體架構的迭代周期是三年。

輝達的應對策略包括三條:內部做基礎研究和應用研究,自己訓練模型,獲得一手體感;作為全球唯一與所有 AI 公司同時合作的平台公司,廣泛傾聽行業前沿的挑戰;以及保持架構的靈活性,讓 CUDA 能隨演算法演進而演進。

他舉了混合專家模型(MoE)的例子:正是預判到 MoE 的崛起,輝達才將 NVLink 從 8 路擴展到 72 路,使一個完整的 4 兆乃至 10 兆參數模型能夠在單一計算域內運行,行為上如同一塊巨大的 GPU。

而 Vera Rubin 一代機架相較於 Grace Blackwell 機架,最顯著的變化在於增加了儲存加速器,引入了全新的 Vera CPU,還有專為智能體任務設計的 Rock 機架,因為智能體工作時需要頻繁訪問檔案系統、呼叫工具、執行程式碼,這與單純運行 LLM 推理是完全不同的工作負載。

為什麼在 Claude Code、Codex、OpenClaw 出現之前,我們就設計好了這一代架構?因為推理根本不需要等到具體產品出現,你只需要坐下來認真思考:一個大語言模型要成為真正的數字工人,它必須做什麼?它必須訪問檔案系統獲取真實資料,必須能上網查資料,必須會用工具,必須能派生子任務。這些都不是玄學,就是基本邏輯。

他還用了一個生動的思想實驗:想像十年後最強的 AI 智能體是一個人形機器人,進入你家幹活,更可能的情形是它使用你家裡現有的工具,比如微波爐,還是它的手指會隨時變成錘子、手術刀或者微波發生器?答案顯然是前者。「我描述的,其實就是 OpenClaw 幾乎所有的核心特性。」

黃仁勳眼中的馬斯克:一個把自己變成所有人最高優先順序的人

Fridman 提到黃仁勳曾高度稱讚馬斯克以四個月時間建成 Colossus 超算,目前已達 20 萬塊 GPU 的規模。黃仁勳闡述了他從中看到的工程與管理哲學。

他說,馬斯克是一個能在多個高深領域同時保持深度的人,同時又是出色的系統思考者。他習慣性地對每一件事追問三個問題:這是必要的嗎?必須這樣做嗎?必須花這麼長時間嗎?層層追問之後,系統會被剝離到最小必要形態,但能力卻完整保留。

「他也會親自出現在問題發生的現場。有問題,他就去現場,『把問題給我看』。這種做法能打破大量『這就是我們一貫的做法』的慣性。每個供應商都有很多客戶和項目,他的做法是讓自己成為所有人項目裡的最優先順序,而且他是靠親身示範做到的,不是靠嘴說。」

他描述了 Fridman 也同樣經歷過的一個細節:馬斯克曾蹲在機架旁邊和工程師一起研究如何插拔線纜,目的是減少出錯機率。

「從每一個細節積累起來的直覺,讓你能同時看清微觀的低效和宏觀的系統性問題,然後你才有資格說『讓我們換一種完全不同的方式來做這件事』。」

為什麼中國科技圈天然傾向於開源

談及最近訪問中國之行,黃仁勳表示,全球約 50% 的 AI 研究人員是中國人,其中大多數仍在中國國內工作。中國科技行業崛起的時間節點,恰好與移動網際網路時代高度重合,使他們能夠以軟體為突破口進入全球競爭。

他認為,中國科技生態之所以能持續輸出大量頂尖公司,有幾個結構性原因。

第一是競爭烈度。中國並非一個統一的大市場,而是由無數個省和城市組成的競爭體系,這導致每個垂直領域都出現了數量驚人的競爭者,電動車如此,AI 公司亦然,最終在激烈競爭中存活下來的必然是極其優秀的企業。

第二是開放共享的文化。中國工程師圈子高度依賴於學校、公司之間的人際網路,同學就是終身兄弟,朋友就是同行。黃仁勳說,中國工程師的優先順序排序是:家人第一,朋友第二,公司第三。這個排序直接決定了他們對待知識的態度。

他們的工程師,兄弟在那家公司,朋友在那家公司,大家都是同學。同學這個概念,在中國意味著一輩子的兄弟。所以他們分享知識的速度極快,根本沒有理由把技術藏著掖著,放到開源上就好了。

正因如此,中國科技公司對開放原始碼的貢獻力度遠超外界預期,而開源社區反過來進一步放大、加速了整體創新節奏。

第三是崇尚工程的社會文化。這是一個崇尚建造的國家。他也由此延伸到輝達的開源戰略,特別提到 Nemotron 3,這是一個 1200 億參數的開放權重混合專家模型,架構上融合了 Transformer 與狀態空間模型(SSM)。

輝達推進開源有三重動機:其一,自己訓練模型是極致協同設計的一部分,能讓硬體團隊直接感知模型架構的走向;

其二,專有模型和開源模型各有必要,開源是讓 AI 真正擴散到每個行業、每個國家、每個研究者和學生手中的必要條件;

其三,AI 遠不只是語言,生物學、物理、氣象、流體等領域都需要專門訓練的模型,每個行業都能獲得世界級的 AI 基礎模型。

43000 個人和數百萬開發者,共同撐起輝達護城河

被問及輝達最重要的競爭護城河,黃仁勳給出了一個清晰的排序。

第一是 CUDA 的安裝基數。

他說,即便二十年前有人做出了一個技術上更出色的替代架構,比如 GUDA 或 TUDA,也很可能失敗。因為決定架構成敗的從來不只是技術,而是有多少開發者將自己的軟體建立在這個平台上。

CUDA 今天的地位,來自 43000 名輝達員工數十年的持續投入,也來自數百萬開發者將他們的軟體棧壓注在這個平台上的信任。

他還強調了輝達執行速度的重要性:任何一個開發者只要選擇了 CUDA,幾乎可以確定六個月後它會變得更好十倍;他開發的軟體能觸達幾億台裝置、覆蓋所有主要雲服務商、所有主要行業、所有主要國家;而且他能確信輝達會在可預見的未來持續維護和改進 CUDA。

「把這幾點加在一起,如果我是一個開發者,我會首先選 CUDA,並且把最多的資源投入到 CUDA 上。」

第二護城河是生態系統的橫向覆蓋。

輝達將極其複雜的系統縱向整合,但同時向每一家公司的計算平台橫向開放接入,從Google雲、亞馬遜 AWS、微軟 Azure,到 CoreWeave、Nscale 這樣的新興算力公司,到製藥企業的超算,再到電信基站邊緣裝置、汽車、機器人、衛星。

一個架構覆蓋了全球幾乎所有行業。

對於輝達未來能否達到 10 兆美元市值,黃仁勳的推演從兩個根本性變化出發:計算從檢索式轉向生成式,意味著算力需求量級躍升;電腦從倉儲單元轉變為生產工廠,意味著它從成本中心變成了直接與企業營收掛鉤的利潤中心。他預計世界 GDP 增速將會加快,而計算佔 GDP 的比例將達到過去的 100 倍以上。

他提到輝達的 3 兆美元收入路徑在他看來是「當然可能」的,並沒有任何物理定律約束這一數字的實現,更重要的是,輝達的增長不依賴於從現有競爭對手手中奪取份額,而是依賴於一個幾乎從零開始生長出來的全新市場。

「當輝達是 100 億美元的公司時,你沒法說『如果他們從誰那裡拿到 10% 份額就能增長多少』。他們的想像力需要從零建構。但我有的是時間,每一次 GTC 都會讓這件事變得更加真實。」

談及智能體時,他將 OpenClaw 比作「Token 的 iPhone」:「消費者直接能用到了。iPhone 等級的產品到了,它是有史以來增長最快的應用,一飛衝天,就這樣。」

玩家對 AI 糊感的憤怒,其實是一面鏡子

黃仁勳說,GeForce 至今仍是輝達最重要的品牌行銷策略:人們十幾歲時因為遊戲認識輝達,進入大學和職業生涯後自然轉向 CUDA 和專業工具。

被問及史上最重要的遊戲,他給出兩個答案:從文化與行業影響力看是 Doom,它把 PC 從辦公工具變成了家庭娛樂裝置;從遊戲技術看是 Virtua Fighter。近年的代表作則是完整實現光線追蹤渲染的《賽博朋克 2077》。

談及 DLSS 5 引發的玩家爭議,他理解那種對「AI 糊感」的反感,承認這是真實存在的審美問題。

但他解釋,DLSS 5 的工作前提是三維幾何資料的嚴格約束,每一幀都完全忠實於藝術家定義的空間結構和紋理風格,做的是增強而非覆蓋。

「玩家以為 DLSS 會在成品遊戲上做後處理,這個理解是錯的。它嵌入在創作流程裡,藝術家決定用還是不用。」系統也完全開放,工作室可以自行訓練模型、指定卡通或水彩等任意風格。

他隨後作出一個更宏觀的觀察:玩家對 AI 糊感的敏感,恰恰說明人類真正在乎的是創作者留下的那些不完美的印記。「只要 AI 是輔助藝術家的工具,它就是好的。」

此外他還提到輝達為遊戲開發者提供的次表面散射皮膚著色器,這項技術模擬光線穿透皮膚淺層後散射的物理現象,讓遊戲人物皮膚呈現出更接近真實的半透明質感。「這些都是工具,由藝術家決定怎麼用。我們只是提供工具箱。」

AGI、程式設計的未來與人類的位置

在 AGI 定義問題上,Fridman 以「能夠從零創立並營運一家市值超十億美元的科技公司」作為測試標準,黃仁勳的回答是:這個門檻,我認為 AI 現在已經達到了。

他設想一個 AI 建立了某款應用,短時間內吸引數十億使用者,完成商業化後退出,這和網際網路時代那些曇花一現的爆款網站並無本質差異,而那些網站的技術複雜度遠低於 OpenClaw 今天能生成的東西。

「我不知道具體會是什麼,但我在網際網路時代也沒有預測到任何那些公司。」他同時強調,100000 個智能體建立一個持續營運的輝達的機率是零,但建立一個短暫的爆款應用並從中獲利,完全可能已經在發生了。

關於程式設計的未來,黃仁勳認為程式設計的定義本身需要改寫。程式設計的本質是規格說明,即告訴電腦要建構什麼。

在這個定義下,能做到這件事的人數量將從 3000 萬擴展到 10 億。每一個木匠、水管工、會計師都將成為自己行業裡的創新者,因為 AI 讓他們能夠以自然語言表達意圖,並將其轉化為實際產品。「如果我是一個木匠,我看到 AI,我會非常興奮。如果我是一個水管工,我會完全瘋狂。」

他用輻射科醫生的案例回應了「AI 會消滅職業」的擔憂:電腦視覺在 2019 年前後達到超人水平,曾被普遍預測輻射科醫生將消亡。

結果是所有輻射科平台都整合了 AI、輻射科醫生數量不降反升,現在全球還出現了輻射科醫生短缺。原因很簡單:能更快讀片,就能讀更多片,就能服務更多病人,醫院營收增加,需要更多輻射科醫生。

「那個預警走得太遠,嚇跑了很多本該進入這個行業的人,這是真實的傷害。輝達的軟體工程師數量只會增加,不會減少。他們的職業目的是解決問題,而解決問題這件事的每一個組成部分,評估結果、團隊協作、診斷問題、創新、連接不同領域,這些都不會消失。」

在工作中倒下,是最好的結局

被問及是否思考自己的死亡,黃仁勳的回答十分誠實。

「我真的不想死。我有很好的家庭,有非常重要的工作。這不是『一生難得一次的體驗』,而是整個人類文明難得一次的體驗,我正在其中。輝達是歷史上最重要的科技公司之一,這件事我非常認真。」

對於繼承人規劃,他的回應讓人出乎意料:他說他「不相信繼任規劃」,但原因恰恰是認真思考了這個問題。如果你真的關心自己離開後公司的命運,那麼你今天應該做的,是把你所學、你所理解、你所積累的全部知識、洞察和判斷,以最高頻率傳遞給周圍所有人。

「每一次會議都是推理會議。我學到的任何東西,沒有在我桌上停留超過一秒鐘的,立刻就指向某個人:去研究這個,這個東西很了不起,你會想瞭解它的。我在持續地賦能周圍所有人,讓他們的能力不斷提升。」

他說自己希望的結局是在工作中倒下,而且是瞬間的,沒有漫長的痛苦過程。

對於人類未來 100 年的希望,他說他一生都對人性的善意保有高度信心,儘管偶爾會被辜負,但結果一次又一次證明他是對的,而且往往超出預期。 (APPSO)