【GTC大會】1萬塊GPU砸向歐洲!老黃怒懟AI末日論:全球首個工業AI雲來了

推理模型開始「自言自語」、量子計算進入臨界點……AI大航海時代已然啟航,這不是一次產品發佈會,而是未來的預言書。巴黎GTC大會,黃仁勳開講了!這次他脫下了皮衣。

「AI是世界上創造的最偉大的平等工具。」

在巴黎,黃仁勳這樣說道。

他表示,人工智慧既不會引發反烏托邦式災難,也不會導致壟斷,它是解放人類的工具

再巴黎GTC會議後的新聞發佈會上,黃仁勳認為AI的確改變了職場,但駁斥了Dario Amodei最近關於AI導致大裁員的預測:

每個人的工作都會發生變化。雖然部分崗位會被替代,但也會湧現出大量新職業……

當公司更具生產力時,他們會僱傭更多人。

這次輝達還簽了個大單:直接賣了1萬塊GPU!

這些GPU將用於在德國建設全球首個工業AI雲平台,加速歐洲工業巨頭的製造應用。

輝達2026財年第一季度財報出來時,黃仁勳表示歐洲AI意識覺醒,算力需求爆發。他將拜訪多個歐洲國家首腦。

這次歐洲之行,輝達收穫滿滿,包括與法國、德國、義大利等國家達成合作。


此外,與多家公司和研究機建構立了合作關係,包括與Mistral合作開發AI雲服務等。

黃仁勳還宣佈了DGX Lepton項目,助力歐洲擴大AI影響力:

DGX Cloud Lepton正在連接歐洲開發者與全球AI基礎設施。我們正在與來自歐洲的夥伴共同打造AI工廠網路,供開發者、研究人員和企業將本地的突破性成果擴展為全球性創新。

這意味著客戶能夠自動將推理工作負載從不同的雲平台之間轉移,同時理論上保持相同的軟體使用者介面和體驗。

如果DGX Lepton成功,它將為所有新雲(neocloud)建立標準的使用者體驗、價值和性能水平,這將導致這些新雲陷入激烈的價格戰,最終使利潤降至極低的商品水平。

這是輝達首次在巴黎舉行GTC大會,拉開2025年VivaTech的序幕,揭示了從智能體系統到AI工廠的下一階段AI計算。

從感知AI到自主AI

正是輝達的GPU,使AI革命成為可能。

而AI,早已是輝達關注的重點。

在巴黎GTC上,黃仁勳回顧了AI的發展,強調了AI在理解、感知、推理、規劃和執行任務方面的進步。

AI的第一波浪潮:感知智能

回到2012年,那時輝達與開發者合作,「深度學習」的新演算法橫空出世,誕生了AlexNet,這被認為是AI的宇宙大霹靂時刻。

AlexNet由Alex Krizhevsky, Ilya Sutskever,和「深度學習教父」Hinton使用Cuda和C++開發

在過去15年,AI的進展非常迅速。

第一階段是讓電腦看懂圖像、聽懂語音、識別模式。這就是「感知智能」。

第二波浪潮:生成式人工智慧(Generative AI)

最近這五年,AI進入了第二階段——生成式人工智慧GenAI。

AI不只是識別,還能生成圖像、生成語言內容。

它擁有「多模態」能力——能夠同時理解圖像和文字,所以我們可以用文字“提示”AI去創作圖像。

這項能力極大地提升了我們生產內容的效率。

AI能寫、能畫、能說、能演,這開啟了「內容生成革命」。

為了支援開源生態,讓開發者與企業也能擁有世界一流的大模型,於是輝達打造了NeMo框架和Nemotron項目。

NeMo是NVIDIA開發的全端大模型平台,而Nemotron是提升開源模型質量的專項計畫。

LLaMA Nemotron針對性強化了開放原始碼的Llama模型,效率和精準率大幅度提升。

在多個領域,Nemotron模型排名領先,性能優異。

第三波浪潮:Agentic AI

現在進入了第三波浪潮 —— 智能體AI(Agentic AI)。

智能不僅僅是識別或生成內容,更是能“理解、推理、規劃並執行任務”。

我們正在開啟新一波AI浪潮。

從根本上說,智能是關於理解、感知、推理、規劃任務(如何解決問題),然後執行任務。

真正的智能包括三個核心循環:

  • 感知(Perception)
  • 推理(Reasoning)
  • 規劃(Planning)

它允許應用一些以前學過的規則,來解決從未見過的問題。

這就是聰明人之所以聰明的原因,他們能夠解決複雜問題,將問題一步步分解,思考如何解決問題;也許會進行研究,也許會學習一些新資訊,獲得一些幫助;使用工具,並一步步解決問題。

智能體AI(Agentic AI)具備這些能力,它能將所學知識應用到新問題中,逐步拆解複雜問題,找到解決方案。比如:

面對沒見過的問題,AI可以自己想步驟、找工具、搜尋資料、呼叫其他智能體、整合上下文,並一步步完成任務。

輝達提供了完整的Agent平台。

企業客戶正在用它建構專屬Agent系統:

  • Cisco(思科):用於企業安全情報的AI平台;
  • SAP:將AI整合到業務自動化;
  • DeepL:用於翻譯系統的AI平台;
  • PhotoRoom:用於AI圖像與視訊編輯;
  • Kodo(前Kodium):AI程式碼助手;
  • Iola:語音互動系統;
  • 全球最大臨床試驗自動化平台:也使用NeMo建構智能體。

第四波浪潮:進入機器人時代

在實際實現中,智能體AI的具身化以及現在的生成能力正在生成運動。

這種AI不是生成視訊、圖像或文字,而是生成局部運動。它能夠行走,或者伸手抓取東西,使用工具。AI以物理形式具身化的能力基本上就是機器人技術。

這些能力,即實現智能體(基本上是資訊機器人)和具身化AI(物理機器人)的基本技術,現在已經擺在我們面前。

從虛擬世界走向現實,這就是「具身智能」(Embodied AI)的世界。機器人就是這種智能的物理體現。

目前,我們正處於兩個核心AI領域交匯的時刻:

(1)資訊型機器人(像ChatGPT這樣的聊天助手);

(2)實體型機器人(可以在物理世界中行動的AI)。

這兩類智能體現在都已經成為現實,我們正在迎來AI發展的全新時代!

對於AI來說,這真是令人興奮的時刻。

但這一切都始於都始於輝達的第一張顯示卡:GeForce 256。

GeForce 256

加速千行百業

GeForce帶來了電腦圖形。

這是有史以來開發的第一個加速計算應用程式,電腦圖形的發展令人難以置信。

GeForce將CUDA帶給世界,這使得機器學習研究人員和AI研究人員能夠推進深度學習。

隨後,深度學習徹底改變了電腦圖形,並使我們將電腦圖形提升到全新的水平成為可能。

黃仁勳展示了電腦模擬:光子模擬、物理模擬、粒子模擬。

所有一切從根本上來說都是模擬,而不是動畫,也不是藝術。

它之所以看起來如此美麗,是因為世界本身就是美麗的,數學也是美麗的。

那麼,讓我們一起來看看吧。

這本質上就是模擬,而且看起來非常美麗。

現在能夠模擬幾乎所有事物的規模和速度,可以將所有事物都變成數字孿生。

因為所有事物都可以被數字孿生,我們可以在將其投入物理世界之前,完全以數字方式進行設計、規劃、最佳化和操作。

一切都在軟體中建構,輝達將這一想法現在已經成為現實:

所有物理事物都將以數字方式建構。

所有宏偉的事物都將以數字方式建構。

所有以巨大規模運行的事物都將首先以數字方式建構,並且會有數字孿生來操作它們。

現在的「GB300 NVL 72」看起來是這樣的。

該計算裝置重兩噸半,1.2萬個零件,大約300萬美元。120千瓦,由150家工廠製造,200家技術合作夥伴與輝達合作完成

它已經完全投入生產。它被設計成一台思考機器。

這意味著它能夠推理、規劃,並且像人一樣,花費大量時間自言自語。

加速AI推理

推理模型正在自言自語,我們需要30到40倍的性能提升。

它不再是那種一問一答的ChatGPT,現在是推理模型,當思考時,它會生成更多的token。

它會一步步地分解問題、推理;嘗試各種不同的路徑:也許是思維鏈(chain of thoughts),也許是思維樹(tree of thoughts)的最佳結果。

它會反思自己的答案。

可能你已經看到這些研究模型在反思答案,說「這是一個好答案嗎?你能做得更好嗎?」然後推理模型會說:「哦,是的,我能做得更好。」然後回去思考更多。

因此,這些思考模型、推理模型實現了令人難以置信的性能,但這需要更多的算力

而最終的結果,MVLink 72 Blackwells的架構,帶來了性能的巨大飛躍,在僅僅一代之內實現30到40倍的性能提升。

根據摩爾定律,半導體物理學,每三到五年只有大約兩倍的性能提升。

而解讀下圖的方式是:X軸代表它思考的速度。Y軸代表工廠在同一時間支援大量使用者時的產出量。


加速計算

輝達曾經夢想,建立全新的計算平台,去完成傳統電腦無法完成的任務。

他們加速了CPU,創造了一種全新的計算方式,稱為「加速計算」。

他們最初的應用之一是分子動力學模擬。從那以後,他們走過了漫長的道路,開發了無數的庫。

事實上,使加速計算與眾不同的原因在於,它不僅僅是一個新的處理器,也不僅僅是你編譯程式碼就能運行的軟體。

你必須徹底重新設計你的計算方式,重新構思你的演算法。而這對大多數人來說極其困難——

要將軟體和演算法重新建構為高度平行化的形式並不容易。

所以,他們建立了各種庫,幫助每一個行業、每一個應用領域實現加速。

每一個這樣的庫都為開發者打開了新的可能。

比如:

  • 計算光刻,也許是今天半導體設計中最重要的應用之一;它在台積電、三星等大型晶圓廠中運行,在晶片製造之前會運行一個基於反物理演算法的流程,稱為Computational Lithography(計算光刻)。
  • 稀疏求解器、代數多重網格求解器等。
  • cuOpt:剛剛開放原始碼的應用庫,它能加速決策制定,最佳化數百萬變數和約束的問題,比如旅行商問題。

這些只是他們提供的部分庫。

他們有400多個類似的庫,每一個都加速特定的應用領域,每一個都為行業打開新的可能。

另一個極其重要的是CUDA Q。它將CUDA擴展到量子經典領域。

量子計算拐點

輝達開發CUDAQ已經好幾年了。

黃仁勳認為:「量子計算正在發生拐點。」

眾所周知,在近30年前,第一個物理量子位元就被演示了。

第一一個糾錯演算法於1995年被發明,而在2023年,將近30年後,世界上第一個邏輯量子位元由Google演示。從那時起,幾年後,邏輯量子位元的數量(由大量帶糾錯的物理量子位元表示)開始增長。

就像摩爾定律一樣,完全可以預期每5年邏輯量子位元增加10倍,每10年增加100倍。這些邏輯量子位元將得到更好的糾錯,更健壯,性能更高,更有彈性,當然也將繼續可擴展。

輝達與世界各地的量子計算公司以多種不同的方式合作,而歐洲相關從業者最多。

現在,輝達很清楚:「我們已經觸手可及,能夠在未來幾年將量子計算,量子經典計算應用於可以解決一些有趣問題的領域。」

這是真正激動人心的時刻。

在接下來的幾年裡,或者至少是下一代超級電腦,都將配備QPU,並且QPU將連接到GPU。QPU當然會進行量子計算,而GPU將用於預處理、控制、糾錯(這將是計算密集型的)、後處理等。

就像加速CPU一樣,現在有QPU與GPU協同工作,以實現下一代計算。

參考資料:

https://www.youtube.com/watch?v=X9cHONwKkn4%20

https://www.nvidia.cn/gtc/paris/keynote/

https://nvidianews.nvidia.com/news/nvidia-builds-worlds-first-industrial-ai-cloud-to-advance-european-manufacturing

https://media.iprsoftware.com/219/files/20255/gtc-paris-2025-keynote-deck.pdf

https://fortune.com/2025/06/11/nvidia-jensen-huang-disagress-anthropic-ceo-dario-amodei-ai-jobs/

https://abcnews.go.com/Technology/wireStory/nvidia-chief-calls-ai-greatest-equalizer-warns-europe-122745910

https://x.com/SemiAnalysis_/status/1932802502069755956

https://blogs.nvidia.cn/blog/nvidia-dgx-cloud-lepton-connects-europes-developers-to-global-nvidia-compute-ecosystem/ (新智元)