#主題演講
徐直軍在華為全聯接大會2025上的主題演講
以開創的超節點互聯技術,引領AI基礎設施新範式徐直軍在華為全聯接大會2025上的主題演講女士們、先生們,各位老朋友、新朋友,大家上午好!歡迎來參加2025年華為全聯接大會,時隔一年,很高興再次與大家相聚在上海。我想大家都能感受到,過去的一年對所有AI從業者、關注者來講是記憶深刻的一年,DeepSeek橫空出世,讓全國人民過了一個快樂的AI年,也讓所有大模型訓練者開啟了不知多少個不眠之夜,調整訓練方式,復現DeepSeek結果,當然也給我們帶來了巨大衝擊。從春節開始,到今年4月30日,經過多團隊的協同作戰,終於使Ascend910B/910C的推理能力達成了客戶的基本需求。在進入今天的具體分享之前,請允許我回顧一下去年的HC,我講到了如下幾點:第一、智能化的可持續,首先是算力的可持續;第二、中國半導體製造工藝將在相當長時間處於落後狀態;第三、可持續的算力只能基於實際可獲得的晶片製造工藝;第四、人工智慧成為主導性算力需求,促使計算系統正在發生結構性變化;第五、開創計算架構,打造“超節點+叢集”算力解決方案持續滿足算力需求。但第五點沒有展開講,本來想講,但我的團隊不同意。今天,我想利用此機會,來把我去年HC沒有完成的任務完成,也算是答卷。我今天分享的主題是:“以開創的超節點互聯技術,引領AI基礎設施新範式”,也是回答去年HC提到的第五點:如何開創計算架構,打造“超節點+叢集”算力解決方案來持續滿足算力需求。在展開今天主題前,回到DeepSeek對產業界、對華為的衝擊,DeepSeek開源後,我們的客戶對華為的昇騰發展指出了很多問題,也充滿了期待,並一直在給我們不斷地提建議。為此,經過內部的充分討論並達成共識,我們於2025年8月5日在北京專門舉辦了昇騰產業峰會,我代表華為給出了回應,在座的有的參加了,有的可能沒有參加。今天,我也利用此機會就主要的決定給大家匯報一下。主要有四點:一、華為堅持昇騰硬體變現;二、CANN 編譯器和虛擬指令集介面開放,其它軟體全開源,CANN基於Ascend 910B/C的開源開放將於2025年12月31日前完成,未來開源開放與產品上市同步;三、Mind系列應用使能套件及工具鏈全面開源,並於2025年12月31日前完成;四、openPangu基礎大模型全面開源。接下來回到今天的主題。儘管DeepSeek開創的模式可以大幅減少算力需求,但要走向AGI、要走向物理AI,我們認為,算力,過去是,未來也將繼續是人工智慧的關鍵,更是中國人工智慧的關鍵。算力的基礎是晶片,昇騰晶片是華為AI算力戰略的基礎。自2018年發佈Ascend310晶片,2019年發佈Ascend910晶片,到2025年,Ascend910C晶片隨著Atlas900超節點規模部署,為大家所熟悉。在過去幾年,客戶和夥伴們對昇騰晶片有很多訴求,對昇騰晶片也有很多期待。面向未來,華為的晶片路標是如何規劃的?想必是大家普遍關心的話題,可能也是最關心的內容。因此,今天,我就直入主題來介紹昇騰晶片及其路標。我很確定地告訴大家,昇騰晶片將持續演進,為中國乃至世界的AI算力構築堅固根基。未來3年,至2028年,我們在開發和規劃了三個系列,分別是Ascend 950系列,包括兩顆晶片:Ascend950PR和Ascend950DT,以及Ascend960、Ascend970系列,更多具體晶片還在規劃中。下面我分別介紹快要推出的和已規劃的4顆昇騰晶片。我們正在開發、且即將推出的晶片叫Ascend950系列。我首先介紹一下Ascend 950系列的晶片架構,Ascend 950PR和Ascend 950DT共用了Ascend950 Die。與前一代昇騰晶片相比,Ascend950 在以下幾個方面實現了根本性提升。第一,新增支援業界標準FP8/MXFP8/MXFP4等低數值精度資料格式,算力分別達到1P和2P,提升訓練效率和推理吞吐。並特別支援華為自研的HiF8,在保持FP8的高效的同時,精度非常接近FP16。第二,大幅度提升了向量算力。這主要通過三個方面實現:其一,提升向量算力佔比;其二,採用創新的新同構設計,即支援 SIMD/SIMT 雙程式設計模型,SIMD能夠像流水線一樣處理“大塊”向量,而SIMT便於靈活處理“碎片化”資料;其三,把記憶體訪問顆粒度從512字節減少到128字節,記憶體訪問更精細,從而更好地支援了離散且不連續的記憶體訪問。第三,互聯頻寬相比Ascend910C提升了2.5倍,達到2TB/s。第四,結合推理不同階段對於算力、記憶體、訪存頻寬及推薦、訓練的需求不同,我們自研了兩種HBM,分別是:HiBL 1.0和HiZQ 2.0。不同的自研HBM與Ascend950Die合封,分別構成晶片Ascend950PR:面向Prefill和推薦場景,以及Ascend950DT:面向Decode和訓練場景。下面分別介紹。首先是我們的第一顆晶片,Ascend 950PR,主要面向推理Prefill階段和推薦業務場景。首先,我們發現,隨著Agent的快速發展,輸入上下文越來越長,首Token輸出階段佔用計算資源越來越多。其次是在電子商務、內容平台、社交媒體等業務應用中,要求推薦演算法具有更高的精準度和更低的時延,對計算能力的需求也越來越大。推理Prefill階段和推薦演算法都是計算密集型,對計算平行的能力要求高,但對記憶體訪問頻寬的需求相對低。通過分級記憶體解決方案,推理Prefill階段和推薦演算法對本地記憶體容量的需求相對也不高。Ascend 950PR 採用了華為自研的低成本HBM,HiBL 1.0,相比高性能、高價格的HBM3e/4e,能夠大大降低推理Prefill階段和推薦業務的投資。這顆晶片將在2026年一季度推出,首先支援的產品形態是標卡和超節點伺服器。接下來這一顆是Ascend 950DT,相比Ascend950PR,它更注重推理Decode階段和訓練場景。由於推理Decode階段和訓練對互聯頻寬和訪存頻寬要求高,我們開發了HiZQ 2.0,使記憶體容量達到144GB,記憶體訪問頻寬達到4TB/s。同時把互聯頻寬提升到了2TB/s。其次,支援了FP8/MXFP8/MXFP4/HiF8資料格式。Ascend 950DT 將在2026年Q4推出。第三顆是在規劃中的晶片Ascend 960。它在算力、記憶體訪問頻寬、記憶體容量、互聯連接埠數等各種規格上相比Ascend 950翻倍,大幅度提升訓練、推理等場景的性能;同時還支援華為自研的HiF4資料格式。它是目前業界最優的4bit精度實現,能進一步提升推理吞吐,並且比業界FP4方案的推理精度更優。Ascend 960將在2027年四季度推出。最後一顆是在規劃中的Ascend 970,這顆晶片的一些規格還在討論中。總體方向是,在各項指標上大幅度升級,全面升級訓練和推理性能。目前的初步考慮是,相比Ascend 960,Ascend 970的FP4算力、FP8算力、互聯頻寬要全面翻倍,記憶體訪問頻寬至少增加1.5倍。Ascend 970計畫在2028年四季度推出。大家屆時可以期待它的驚人表現。這是剛才介紹的昇騰晶片的主要具體規格和路標,總體上,我們將以幾乎一年一代算力翻倍的速度,同時圍繞更易用,更多資料格式、更高頻寬等方向持續演進,持續滿足AI算力不斷增長的需求。可以看到,相比Ascend 910B/910C,從Ascend 950開始的主要變化包括:引入SIMD/SIMT新同構,提升程式設計易用性;支援更加豐富的資料格式,包括FP32 /HF32 /FP16/BF16/FP8/MXFP8/HiF8/MXFP4/HiF4等;支援更大的互聯頻寬,其中950系列為2TB/s,970系列提升到4TB/s;支援更大的算力,FP8算力從950系列的1PFLOPS提升到960的2PFLOPS、970的4PFLOPS;FP4算力從950的2PFLOPS提升到960的4PFLOPS、970的8PFLOPS;記憶體容量逐漸加倍,而記憶體訪問頻寬將翻兩番。有了昇騰晶片為基礎,我們就能夠打造滿足客戶需求的算力解決方案。從大型AI算力基礎設施建設的技術方向看,超節點已經成為主導性產品形態,並正在成為AI基礎設施建設的新常態。超節點事實上就是一台能學習、思考、推理的電腦,物理上由多台機器組成,但邏輯上以一台機器學習、思考、推理。隨著算力需求的持續增長,超節點的規模也在持續、快速增大。今年3月份,華為正式推出了Atlas 900超節點,滿配支援384卡。因為是超節點,這384顆Ascend910C晶片,能夠像一台電腦一樣工作,最大算力可達300PFLOPS。到目前為止,Atlas 900依然是全球算力最大的超節點。大家經常聽到的CloudMatrix384超節點,是華為雲基於Atlas 900超節點建構的雲服務實例。Atlas 900超節點自上市以來,已經累計部署超過300套,服務20多個客戶,涵蓋網際網路、電信、製造等多個行業。可以說,Atlas900於2025年,開啟了華為AI超節點的征程。今天,結合我們已經推出或正在研發中的昇騰晶片,我將為大家帶來更多超節點和叢集產品。現在進入今天最激動人心的時刻,就是新產品發佈環節。今天我要發佈的第一款產品,Atlas 950超節點,基於Ascend950DT打造。Atlas 950超節點支援8192張基於Ascend950DT的昇騰卡,是Atlas 900超節點的20多倍,我們習慣稱呼的昇騰卡,每張卡對應一顆Ascend950DT晶片,8192張昇騰卡等同於8192顆Ascend950DT晶片。Atlas950超節點滿配包括由128個計算櫃、32個互聯櫃,共計160個機櫃組成,佔地面積1000平方米左右,櫃間採用全光互聯。總算力大幅度提升,其中,FP8算力達到8E FLOPS,FP4算力達到16E FLOPS。互聯頻寬達到16PB/s,這個數字意味著,Atlas 950一個產品的總互聯頻寬,已經超過今天全球網際網路峰值頻寬的10倍有餘。Atlas 950超節點的上市時間是:2026年四季度。我們很自豪的看到,Atlas 950超節點,至少在未來多年都將保持是全球最強算力的超節點,並且在各項主要能力上都遠超業界主要產品。其中,相比輝達同樣將在明年下半年上市的NVL144,Atlas 950超節點卡的規模是其56.8倍,總算力是其6.7倍,記憶體容量是其15倍,達到1152TB;互聯頻寬是其62倍,達到16.3PB/s。即使是與輝達計畫2027年上市的 NVL576相比,Atlas 950超節點在各方面依然是領先的。算力、記憶體容量、記憶體訪問速度、互聯頻寬等能力的大幅度增強,為大模型訓練性能和推理吞吐帶來顯著提升。相比華為已經推出的Atlas900超節點,Atlas 950超節點的訓練性能提升17倍,達到4.91M TPS。通過支援FP4資料格式,Atlas 950超節點的推理性能提升達26.5倍,達到19.6M TPS。8192卡超節點並不是我們的終點,我們還在繼續努力。我今天發佈的第二款超節點產品,Atlas960超節點。基於Ascend960,Atlas 960超節點最大可支援15488卡。Atlas960超節點由176個計算櫃,44個互聯櫃,共220個機櫃,佔地面積約2200平方米。Atlas960超節點的上市時間是:2027年四季度。伴隨卡的規模的再次升級,Atlas 960超節點讓我們在AI超節點的優勢再度增強。基於Ascend960,其總算力、記憶體容量、互聯頻寬在Atlas950基礎上再翻倍。其中,FP8總算力將達到30E FLOPS,而FP4總算力將達到60 EFLOPS;記憶體容量達到4460TB,互聯頻寬達到34PB/s。大模型訓練和推理的性能相比Atlas950超節點,將分別提升3倍和4倍以上,達到15.9M TPS 和80.5M TPS。通過Atlas 950和Atlas 960,我們對於為人工智慧的長期快速發展提供可持續且充裕算力,充滿信心。超節點已經重新定義AI基礎設施的範式,但不僅僅侷限於AI。在通用計算領域,我們同樣認為,超節點技術能夠帶來很大的價值。從需求角度考慮,金融核心業務等目前仍然有部分承載在大型機和小型機之上,相比普通伺服器叢集,它們對伺服器的性能和可靠性有更高的訴求,通用計算超節點在這兩點上正好切合需求。從技術角度考慮,超節點同樣可以為通算領域注入全新活力。因此,鯤鵬處理器主要圍繞支援超節點,更多核、更高性能等方向持續演進。同時,通過自研的雙執行緒靈犀核,使鯤鵬處理器能方便支援更多執行緒。2026年Q1,我們將推出Kunpeng950處理器,包括兩個版本,分別是:96核/192執行緒和192核/384執行緒;支援通用計算超節點;安全方面新增四層隔離,成為鯤鵬首顆實現機密計算的資料中心處理器。2028年Q1,鯤鵬處理器將在晶片微架構、先進封裝技術等領域持續突破關鍵技術,將再次推出兩個版本,分別是高性能版本,96核/192執行緒,單核性能提升50%+,主要面向AI host、資料庫等場景。以及高密版本,不少於256核/512執行緒,主要面向虛擬化、容器、巨量資料、數倉等場景。接下來是今天我發佈的第三款產品:TaiShan 950超節點,基於Kunpeng950打造,全球首個通用計算超節點,其最大支援16節點,32個處理器,最大記憶體48TB,同時支援記憶體、SSD、DPU池化。這款產品不只是通用計算領域的一次技術升級,除了大幅提升通用計算場景下的業務性能,還能幫助金融系統破解核心難題。當前大型機、小型機替換的核心挑戰是資料庫分佈式改造,而基於TaiShan 950超節點打造的GaussDB多寫架構,無需改造,但性能提升2.9 倍,最終可平滑替代大型機、小型機上的傳統資料庫。TaiShan950加上分佈式GaussDB將成為各類大型機、小型機的終結者,徹底取代各種應用場景的大型機和小型機以及Oracle的Exadata資料庫伺服器。除了核心資料庫場景,TaiShan 950超節點在更廣泛的場景裡,表現也很亮眼:比如虛擬化環境的記憶體利用率提升20%,在Spark巨量資料場景,即時資料處理時間縮短30%。TaiShan 950超節點上市時間是:2026年一季度,敬請期待。超節點的價值,不僅僅體現在智算和通算傳統業務領域。網際網路產業廣泛應用的推薦系統,正在從傳統推薦演算法向生成式推薦系統演進。我們可以基於TaiShan950和Atlas950打造成混合超節點,為下一代生成式推薦系統打開全新架構方向。一方面,通過超大頻寬、超低時延互聯以及超大記憶體,混合超節點構成超大共用記憶體池,支援PB級推薦系統嵌入表,從而支撐超高維度使用者特徵;另一方面,混合超節點的超大AI算力,能夠支援超低時延推理和特徵檢索。因此,混合超節點是面向下一代生成式推薦系統的解決方案的全新選擇。大規模超節點把智算和通算的能力都推向新的高度,同時也對互聯技術提出了重大挑戰。華為作為聯接領域的領導者,當然不懼挑戰。在定義和設計Atlas950、Atlas960兩個超節點的技術規格時,我們遭遇到了互聯技術的巨大挑戰,主要在兩個方面:第一是如何做到長距離而且高可靠。大規模超節點機櫃多,櫃間聯接距離長,當前電互聯和光互聯技術都不能滿足需求。其中,當前的電互聯技術在高速時聯接距離短,最多隻能支援兩櫃互聯,而當前的光互聯技術雖然可以把長距離的多機櫃聯接在一起,但無法滿足可靠性需求。第二是如何做到大頻寬而且低時延。當前跨櫃卡間互聯頻寬低,和超節點的需求差距達5倍;跨櫃的卡間時延大,當前互聯技術最好只能做到3微秒左右,和Atlas950/960設計需求仍然有24%的差距,當時延已經低至2~3個微秒時,已經逼近物理極限,那怕0.1微秒的提升,挑戰都很大。華為基於三十多年構築的技術能力,通過系統性創新,徹底解決了當前技術存在的問題,超標達成Atlas950/960超節點的設計需求,使萬卡超節點成為可能。首先,為瞭解決長距離且高可靠問題,我們在互聯協議的物理層、資料鏈路層、網路層、傳輸層等每一層都引入了高可靠機制;同時在光路引入了百納秒級故障檢測和保護切換,當出現光模組閃斷或故障時,讓應用無感;並且,我們重新定義和設計了光器件、光模組和互聯晶片。這些創新和設計讓光互聯的可靠性提升100倍,且互聯距離超過200米,實現了電的可靠和光的距離。其次,為瞭解決大頻寬且低時延問題,我們突破了多連接埠聚合與高密封裝技術,以及平等架構和統一協議,實現了TB級的超大頻寬,2.1微秒的超低時延。正是因為一系列系統性、原創性的技術創新,我們才攻克了超節點互聯技術,滿足了高可靠、全光互聯、高頻寬、低時延的互聯要求,讓大規模超節點成為了可能。為了達成Atlas950/960超節點對互聯的技術要求,為了實現萬卡超節點還能是一台電腦,華為開創了超節點架構並開創了新型的互聯協議,能夠支撐萬卡級超節點架構。基於這個互聯協議的超節點架構的核心價值主張是:萬卡超節點,一台電腦,也就是說,通過該互聯協議,把數萬規模的計算卡,聯接成一個超節點,能夠像一台電腦一樣工作、學習、思考、推理。在技術上,我們總結認為,萬卡級超節點架構應該具備6大特徵,分別是匯流排級互聯、平等協同、全量池化、協議歸一、大規模組網、高可用性。我們為這個面向超節點的新型互聯協議取名“靈衢”,英文名稱:UB,UnifiedBus今天,我們正式發佈靈衢、UnifiedBus,一個面向超節點的互聯協議。同時,我宣佈,華為將開放靈衢2.0技術規範。為什麼從靈衢2.0開始開放?事實上,靈衢的研究是從2019年開始的,因為眾所周知的原因,先進工藝不可獲得,我們需要從多晶片上突破,希望把更多的計算資源聯接在一起。我們取了一個名字叫UnifiedBus,簡稱UB,中文名字“靈衢”,意味著類似九省通衢,實現大規模算力的聯通。基於靈衢 1.0 的Atlas 900超節點自2025年3月開始交付,至今已商用部署300多套,靈衢1.0技術得到充分驗證。在靈衢1.0的基礎上,我們繼續豐富功能,最佳化性能,提升規模,進一步完善了協議,形成了靈衢2.0,前面發佈的Atlas 950超節點就是基於靈衢2.0。我們認為靈衢2.0具備了開放的條件,為了更廣泛地促進互聯技術發展和產業進步,今天華為決定開放靈衢2.0技術規範,歡迎產業界夥伴基於靈衢研發相關產品和部件,共建靈衢開放生態。我在去年HC會上強調過,基於中國可獲得的晶片製造工藝,我們努力打造“超節點+叢集”算力解決方案,來持續滿足算力需求。今天已經介紹了三個超節點產品。靈衢既為超節點而生,是面向超節點的互聯協議,也是建構算力集群產品最優的互聯技術。接下來為大家帶來兩個叢集產品:首先是,Atlas 950 SuperCluster 50萬卡叢集!Atlas 950 SuperCluster叢集由64個Atlas 950超節點互聯組成,把1萬多機櫃中的52萬多片昇騰950DT組成為一個整體,FP8總算力可達524 EFLOPS。上市時間與Atlas 950超節點同步,即2026年Q4。在叢集組網上,我們同時支援UBoE與RoCE兩種協議,UBoE是把UB協議承載在乙太網路上,讓客戶能夠利用現有以太交換機。相比傳統RoCE,UBoE組網的靜態時延更低、可靠性更高,交換機和光模組數量都更節省,所以,我們推薦UBoE。這就是我們的Atlas 950 SuperCluster叢集。相比當前世界上最大的叢集xAI Colossus,規模是其2.5倍,算力是其1.3倍,是當之無愧的全世界最強算力集群!無論是當下主流的千億稠密、稀疏大模型訓練任務,還是未來的兆、十兆大模型訓練,超節點叢集都可以成為性能強悍的算力底座,高效穩定地支援人工智慧持續創新。相應的,在2027年Q4,我們還將基於Atlas 960超節點,同步推出Atlas 960 SuperCluster,叢集規模進一步提升到百萬卡級,FP8總算力達到2 ZFLOPS!FP4總算力達到4 ZFLOPS。並且,它同樣也支援UBoE與RoCE兩種協議,在UBoE協議加持下,性能與可靠性同樣更優,並且,靜態時延和網路無故障時間優勢進一步擴大,因此繼續推薦UBoE組網。通過Atlas 960 SuperCluster,我們將持續加速客戶應用創新,探索智能水平新高。很高興今天給大家帶來一系列新產品,我們希望和產業界一起,以開創的靈衢超節點互聯技術,引領AI基礎設施新範式;以基於靈衢的超節點和叢集持續滿足算力快速增長的需求,推動人工智慧持續發展,創造更大的價值! (中國青年網)
剛剛!吳清,最新發聲!中國證監會再推新政!
6月18日上午,為期兩天的2025陸家嘴論壇正式開幕,本屆論壇的主題為“全球經濟變局中的金融開放合作與高品質發展”。中國人民銀行行長潘功勝、金融監管總局局長李雲澤、中國證監會主席吳清、中國國家外匯局局長朱鶴新出席會議並行表主題演講。吳清:推出進一步深化科創板改革的“1+6”政策措施吳清在2025陸家嘴論壇上表示,將聚焦提升制度的包容性和適應性,以深化科創板、創業板改革為抓手,更好發揮科創板“試驗田”作用,加力推出進一步深化改革的“1+6”政策措施,統籌推進投融資綜合改革和投資者權益保護,加快建構更有利於支援全面創新的資本市場生態。具體來看,“1”在科創板設定科創成長層,並且重啟未盈利企業適用於科創板第五套標準上市,更加精準服務技術有較大突破、持續研發投入大、商業前景廣闊的優質科創企業,在強化資訊披露、加強投資者適當性管理方面作出安排。“6”即在科創板創新推出6項改革措施,包括對於適用科創板第五套標準的企業,試點引入資深專業機構投資者制度;面向優質科技企業試點IPO預先審閱機制;擴大第五套標準適用範圍,支援人工智慧、商業航天、低空經濟等更多前沿科技領域企業適用;支援在審未盈利科技企業面向老股東開展增資擴股等活動;完善科創板公司再融資制度和戰略投資者認定標準;增加科創板投資產品和風險管理工具等。同時,證監會也將在創業板正式啟用第三套標準,支援優質未盈利創新企業上市。吳清:引導更多中長期資金參與科技企業投資吳清表示,支援編制更多科技創新指數、開發更多科創主題公募基金產品,引導更多中長期資金參與科技企業投資。吳清:上市是起點不是終點,融資是工具不是目的吳清表示,上市是起點不是終點,融資是工具不是目的,證監會將堅持目標導向、問題導向,不斷完善上市公司全鏈條的監管制度安排。吳清:將批覆全國首批2隻資料中心REITs註冊吳清表示,進一步強化股債聯動服務科技創新的優勢。大力發展科創債,最佳化發行、交易制度安排,推動完善貼息、擔保等配套機制,加快推出科創債ETF,積極發展可交換債、可轉債等股債結合產品。今天,證監會將批覆全國首批2隻資料中心REITs註冊,下一步將繼續支援科技企業利用智慧財產權、資料資產等新型資產開展資產證券化、REITs等融資,進一步盤活科技創新領域存量資產。吳清:推動基金份額轉讓業務試點轉常規吳清表示,推動基金份額轉讓業務試點轉常規,最佳化實物分配股票試點和“反向掛鉤”等機制,暢通多元化退出管道。吳清:全球科技創新進入密集活躍期,諸多領域都迎來了Deepseek吳清表示,當前新一輪科技革命和產業變革加速引進,全球科技創新進入密集活躍期,科技創新正在從點狀突破到系統整合推進,技術突破到市場應用轉化,諸多領域都迎來了Deepseek。吳清:推動股份對價分期支付機制、重組簡易稽核程序等新舉措落實吳清表示,證監會將抓好“併購六條”和重大資產重組管理辦法落地,推動股份對價分期支付機制、重組簡易稽核程序等新舉措落實,研究完善上市公司股權激勵實施程序,提升便利性和靈活度,推動上市公司持續提升核心競爭力和經營業績,在高品質發展中更好回報投資者。吳清:更大力度培育壯大耐心資本、長期資本吳清表示, 更大力度培育壯大耐心資本、長期資本,聚焦私募基金“募投管退”各環節卡點堵點,精準發力、暢通循環。積極推動社保基金、保險資金、產業資本參與私募股權投資,拓寬資金來源。吳清:中國資本市場有力促進了科技、資本、產業良性循環吳清表示,創新發展需要科學家、企業家和投資家,更需要投資家、科學家和企業家的牽手。中國資本市場發生深刻結構性變化,有力促進了科技、資本、產業良性循環。近年來,中國證監會認真落實創新驅動發展戰略,深化發行、併購重組等適配性改革,最佳化制度和產品供應,為支援科技創新和產業轉型升級提供重要支撐。吳清:無論是大而強的科技巨頭還是小而美的科創新秀,都離不開資本市場的支援吳清表示,當前,適應創新規律的資金形成機制還不完善,長期資本和耐心資本遠遠不夠,對創新的激勵約束機制不夠完善,資本市場大有可為。資本市場具有獨特的風險共擔、利益共享的激勵約束機制,同時,資本市場可以對關鍵要素進行資產定價,可以激發企業家精神和人才創新的活力,無論是大而強的科技巨頭,還是小而美的科創新秀 ,都離不開資本市場的支援。 (券商中國)
輝達CEO黃仁勳在巴黎VivaTech 2025 上的主題演講: 從智能體到AI工廠 | 全文2萬字
【城主說】輝達CEO黃仁勳今天在巴黎的VivaTech2025發表了主題演講。如老黃所說,這是GTC演講的巴黎VivaTech版,基本可以看做是GTC演講Plus更新版:)。這次演講核心發佈了專為推理和思考設計的 Blackwell 架構,並闡述了“AI 工廠”作為新型國家基礎設施的理念。老黃詳細介紹了輝達在智能體 AI、工業數字孿生、自動駕駛和人形機器人領域的全端式解決方案,並強調了與歐洲在建構主權 AI 生態系統方面的深度合作。核心觀點Blackwell 架構: 發佈專為大規模推理和思考設計的“思考機器”Blackwell,相較於前代實現性能巨大飛躍。AI 工廠理念: 將 AI 資料中心重新定義為生產智能的“AI 工廠”,是推動經濟增長的新型國家基礎設施。智能體 AI (Agent AI): AI 進入新浪潮,能夠進行推理、規劃和使用工具的智能體將成為主流,輝達提供從模型到部署的全套開發平台。工業數字孿生: Omniverse 平台通過建構物理精確的數字孿生,賦能從工廠設計到機器人訓練的整個工業流程。具身智能與機器人: AI 的終極形態是物理機器人,輝達正通過 Thor 晶片和 Omniverse 模擬平台,加速自動駕駛和人形機器人的發展。歐洲主權 AI: 宣佈與歐洲各國及 Mistral AI 等公司深度合作,建設區域性 AI 雲和技術中心,支援歐洲 AI 生態發展。序幕視訊解說: 這就是智能的誕生方式。一種新型工廠。資訊基元的生成器。人工智慧的基石。資訊基元開啟了新的疆域。邁入一個超凡世界的第一步。在那裡,無限可能孕育而生。資訊基元將圖像轉化為科學資料。測繪外星大氣層。並指引未來的探索者。他們深入探測地球深處,探尋隱藏的危險。他們將潛力轉化為豐饒。並幫助我們收穫豐碩成果。Tokens 在疾病發作之前就能發現它們。精準治癒。並瞭解我們的運作機制。Tokens 關聯各項資訊。以便我們能保護我們最珍貴的生物。Tokens 解讀物理定律。以此驅動我們更快發展。讓我們的生活更高效。令牌不僅教會機器人如何移動。更能帶來喜悅。以及舒適。令牌幫助我們向前邁進。這是個人的一小步,卻是人類的一大步。這樣我們就能大膽前行,抵達前人未至之境。而這一切都始於此。歡迎輝達創始人兼首席執行官黃仁勳上台。黃仁勳: 巴黎,你好!大家好!這是輝達首次在巴黎舉辦GTC大會。這真是太棒了。感謝所有蒞臨現場的合作夥伴。多年來,我們與許多人攜手合作。事實上,我們已經在歐洲深耕多年,儘管這是我首次在巴黎參加GTC大會。我有很多事情要告訴大家。加速計算:從科學到人工智慧的基石黃仁勳: 曾幾何時,輝達旨在打造一個全新的計算平台。做普通電腦無法做到的事情。我們加速了CPU,創造了一種新型計算,稱為加速計算。我們最早的應用之一就是分子動力學。自那時起,我們已經取得了長足的進步。湧現出如此多不同的庫。事實上,加速計算的特別之處在於,它不僅僅是一個你可以編譯軟體的新型處理器。你必須重新構想你的計算方式。你必須重新設計你的演算法。而事實證明,人們要重新設計軟體和演算法以實現高度平行化,是極其困難的。因此,我們建立了各種庫,以幫助每個市場、每個應用領域實現加速。這些庫中的每一個都為開發者開啟了新的機遇。並且它也為我們以及我們的生態系統合作夥伴開啟了新的增長機遇。計算光刻,可能是當今半導體設計中最重要的應用,在台積電的工廠中運行。三星,大型半導體晶圓廠。在晶片製造之前,它會運行通過一種名為cuLitho的逆向物理演算法,即計算光刻。直接稀疏求解器,代數多重網格求解器。CuOpt,我們剛剛開源了它,這是一個極其令人振奮的應用庫。這個庫能夠加速決策制定,以最佳化包含數百萬變數和數百萬約束條件的問題,例如旅行商問題。Warp,一個用於表達幾何和物理求解器的Pythonic框架,非常重要。cuDF,cuML,結構化資料庫,資料幀,經典的機器學習演算法。cuDF 加速 Spark,零行程式碼更改。cuML 加速 scikit-learn,零行程式碼更改。Dynamo 和 cuDNN。cuDNN 可能是 NVIDIA 迄今為止建立過的最重要的庫。它加速了深度神經網路的原語。而 Dynamo 是我們全新的庫,它使得在整個 AI 工廠中調度、編排和分發極其複雜的推理工作負載成為可能。cuEquivariance 和 cuTensor,張量收縮演算法。等變性適用於遵守幾何定律的神經網路,例如蛋白質、分子。Arial 和 Shiona,一個非常重要的框架,旨在賦能 AI 運行 6G。IRF2,我們用於氣象和氣候模型的基礎模型的模擬環境。平方公里,極高的解析度。MONI,我們用於醫學影像的框架,廣受歡迎。Parabrix,我們用於基因組學分析的求解器,取得了巨大成功。cuQuantum,cu2q,我稍後就會談到,用於量子計算。還有cuPiNumeric,對NumPy和SciPy的加速。正如您所見,這些只是眾多庫中的幾個例子。還有400個其他的。它們每一個都加速了一個應用領域。它們每一個都開啟了新的機遇。量子飛躍:CUDA-Q 與未來計算黃仁勳: 那麼,其中最令人興奮的,莫過於cu2q。cu2x 是這套庫。一個基於 cu2 的庫套件,用於加速應用程式和演算法。我們現在有了 cu2q。cu2q 用於量子計算,以及基於 GPU 的經典-量子混合計算。我們在 cu2q 上已經投入開發好幾年了。而今天,我可以告訴大家,量子計算領域正在迎來一個轉折點。眾所周知,第一個物理量子位元大約在近30年前得到了演示。一個糾錯演算法在1995年被發明。而在2023年,差不多30年後,世界上第一個邏輯量子位元由Google成功演示。從那時起,幾年之後,邏輯量子位元的數量,即那些由大量帶有糾錯功能的物理量子位元所代表的邏輯量子位元的數量,正在開始增長。就像摩爾定律一樣,我完全可以預期每五年邏輯量子位元數量增加10倍,每十年增加100倍。這些邏輯量子位元將變得糾錯能力更強、更魯棒、性能更高、更具韌性,而且,當然,將繼續保持可擴展性。量子計算正處於一個轉折點。我們一直在以多種不同方式與全球各地的量子計算公司合作。但在歐洲,存在一個大型社群。我昨晚見到了帕斯卡。我昨晚見到了巴塞隆納超級計算中心。現在很清楚,我們已近在咫尺,能夠在未來幾年內將量子計算、量子經典混合計算應用於能夠解決一些有趣問題的領域。這是一個真正令人興奮的時刻。因此我們一直在與所有的超級計算中心合作。如今非常清楚,在未來幾年內,或者至少在下一代超級電腦中,每一台都將配備一個QPU,並且QPU將連接到GPU。QPU當然將用於量子計算,而GPU將用於預處理、控制、糾錯(這將是高度計算密集型的)、後處理等。在這兩種架構之間,正如我們加速了CPU一樣,現在QPU與GPU協同工作,以實現下一代計算。那麼,今天我們宣佈,我們的整個量子演算法堆疊現已在Grace Blackwell 200上得到加速。並且加速效果簡直令人難以置信。我們通過多種不同方式與量子計算行業合作。一種方式是使用QuQuantum來模擬量子位元或模擬運行在這些量子電腦上的演算法。本質上,就是使用經典電腦來模擬或模擬量子電腦。另一方面,極其重要的是CUDA-Q。基本上,就是發明了一種新的CUDA,將CUDA擴展到量子經典領域,這樣,在CUDA-Q上開發的應用可以在量子電腦問世之前以模擬方式運行,或者在量子電腦問世之後以協作方式運行。量子經典加速計算方法。因此,今天我們宣佈 CUDA-Q 可用於 Grace Blackwell。這裡的生態系統極其豐富。當然,歐洲在科學、超級計算專業知識以及該領域的傳承方面底蘊深厚。在這裡看到量子計算取得進展不足為奇。在未來幾年,我們將看到一個真正非凡的拐點。那麼,對於所有為此努力了三十年的量子電腦行業,我祝賀你們今天取得的這些令人難以置信的成就和里程碑。謝謝。人工智慧的新浪潮:從生成式到智能體黃仁勳: 讓我們來談談人工智慧。你們可能會驚訝於我會和你們談論人工智慧。同一塊運行並支援我所提及的所有應用的GPU,正是同一塊GPU使得人工智慧得以問世。我們於2012年首次接觸人工智慧,就在那之前,我們已與開發者合作,共同開發一種名為深度學習的新型演算法。它促成了2012年AlexNet引發的人工智慧大爆發。在過去的約15年裡,人工智慧取得了驚人的迅猛發展。人工智慧的第一波浪潮是感知能力,旨在使電腦能夠識別並理解資訊。第二波浪潮,即我們在過去大約五年間普遍談論的,是生成式人工智慧。它具備多模態特性,這意味著人工智慧能夠同時學習圖像和語言。因此,你可以通過語言對其進行提示,而它則能夠生成圖像。人工智慧所具備的多模態能力,以及翻譯和生成內容的能力,共同促成了生成式人工智慧的革命。生成式人工智慧,即生成內容的能力,對於我們提高生產力具有根本性的重要意義。嗯,我們正在開啟新一波的人工智慧浪潮。在過去的幾年裡,我們看到人工智慧的能力取得了巨大的進步。從根本上說,智能關乎理解、感知、推理、規劃任務、解決問題,然後執行任務。感知、推理、規劃。智能的核心循環。它使我們能夠應用一些預先學到的規則來解決我們從未見過的問題。這就是為什麼聰明的人之所以聰明。能夠處理一個複雜的問題,並將其一步步分解,推理如何解決,或許進行研究,或許學習新知識,尋求幫助,使用工具,然後一步步地解決問題。嗯,我剛才描述的這些能力,通過所謂的智能體人工智慧,在今天已經從根本上成為可能。我馬上就會向您展示更多。在其實際的物理實現中,即那種具身化的人工智慧的體現,以及在動作方面,現在其生成能力正在生成運動。這種人工智慧不再是生成視訊、圖像或文字,而是生成移動能力,例如走路,或者伸手抓取物體、使用工具的能力。人工智慧能夠以物理形式具身化的能力,基本上就是機器人技術。這些能力,即實現智能體(它們本質上是資訊機器人)和具身化人工智慧(即物理機器人)的基礎技術,這兩項核心能力如今已然擺在我們面前。對人工智慧而言,這真是激動人心的時代。Blackwell:為思考而生的工程奇蹟黃仁勳: 但這一切都始於GeForce。GeForce帶來了電腦圖形技術。這是我們所開發過的第一個加速計算應用。電腦圖形技術發展到如今的程度,真是令人難以置信。GeForce將CUDA帶給了世界,這使得機器學習研究人員和人工智慧研究人員能夠推進深度學習的發展。然後,深度學習徹底改變了電腦圖形學,使我們能夠將其提升到一個全新的高度。今天我將向大家展示的一切,今天我將向大家展示的一切,我將先給大家一個預告,但今天我將向大家展示的所有內容都是電腦模擬,而非動畫。它是光子模擬、物理模擬、粒子模擬,一切從根本上說都是模擬,而非動畫,並非藝術。它看起來美得令人難以置信,因為結果發現世界是美麗的,結果發現數學是美麗的。那麼,我們來看看吧。你們覺得怎麼樣?運作中的數字。運作中的數字。這本質上就是模擬的意義,而且看起來簡直美不勝收。但是,鑑於我們現在模擬幾乎所有事物的規模和速度,我們可以將一切都轉化為數字孿生。既然一切皆可成為數字孿生,我們就能將一切都轉化為數字孿生。在我們將其投入物理世界之前,它可以被完全以數字方式進行設計、規劃、最佳化和營運。將一切都建構在軟體中的理念,如今已然來臨。所有的物理實體都將以數字方式建構。所有精妙建構的事物都將以數字方式建構。所有在龐大規模下營運的事物都將首先以數字方式建構,並將有數字孿生來營運它們。因此,今天我們將大量討論數字孿生。那麼,最初作為一塊GeForce顯示卡出現的事物……這裡有人知道GeForce是什麼嗎?好的。好的。好的,最初的GeForce如今已是這般模樣。這就是新的GeForce。它重達兩噸,甚至兩噸半,由120萬個零件組成。價值約300萬美元。120千瓦。由150家工廠生產。200家技術合作夥伴與我們攜手完成這項工作。為打造GB200(並已向GB300演進),研發預算可能高達400億美元。它已全面投入生產。而這台機器,其設計初衷就是一台思考機器。思考機器,就其能夠推理、規劃,並花費大量時間進行自我對話而言。就像你一樣。在我們實際輸出之前,我們大部分時間都在為自己的思維生成詞語,為自己的思維生成圖像。因此,從架構上講,這種思考機器正是 Grace Blackwell 的設計初衷。它被設計成一個巨型 GPU。我將它與 GeForce 相比是有充分理由的。GeForce 是一個 GPU。GB200 也是如此。它是一個巨大的虛擬 GPU。現在,我們必須將其拆分為眾多元件,建立大量新的網路技術和 SerDes 技術,以及極低功耗、高能效的互連技術,以便將所有這些晶片和系統連接成一個虛擬 GPU。這是Hopper版本。這是世界聞名的Hopper系統。八個GPU通過NVLink互聯。這裡未展示的是一個CPU托盤。一個配備雙CPU和系統記憶體的CPU托盤,位於頂部。這共同構成了一台AI超級電腦的一個節點。約50萬美元。這就是Hopper系統。正是這個系統,真正使我們在AI版圖上佔據了一席之地。而且由於市場需求激增,它長期處於配給狀態。但是,這就是著名的Hopper系統。整個系統,包括中央處理器,都被這個卓越的Blackwell節點所取代。這是一個計算托盤。僅此一塊就能取代那個完整的系統。它採用全液體冷卻,並且中央處理器(CPU)與圖形處理器(GPU)直接整合連接。所以你可以在這裡看到,兩顆中央處理器,四顆圖形處理器。它的性能優於那個完整的系統。但令人驚奇的是這一點。我們想將一大批這樣的系統連接起來。如何將所有這些連接起來,對我們來說確實很難想像。於是我們將其拆解。我們所做的,就是將整個主機板拆解成這和這。這是革命性的NVLink系統。計算的橫向擴展並非那麼困難。只需用乙太網路連接更多CPU,橫向擴展並不困難。縱向擴展則極其困難。你所能建構的電腦規模,受限於你實際能夠實現的程度。要將如此大量的技術和電子元件整合進一個記憶體模型中,是極其難以實現的。所以我們決定建立一個名為NVLink的新型互連技術。NVLink是一種記憶體語義互連技術。這是一個計算互聯結構,而非網路。它直接連接到所有這些不同NVLink系統(即計算節點)的中央處理器。這是交換機。九個這樣的,這九個矗立在頂部。其中九個位於底部。中間是NVLink交換機。將它們連接在一起的是這個奇蹟。這是NVLink主幹。這是百分之百的銅。銅同軸電纜。它將所有NVLink晶片直接連接到所有GPU,通過整個骨幹網路直接互聯。這樣,每一顆144個Blackwell裸晶片(或72個不同封裝中的晶片)都能同時互相通訊,且不會產生阻塞。遍佈於整個NVLink骨幹網路。它的頻寬大約是每秒130太字節。130... 我知道。不,等等,等著瞧。等著瞧。每秒130太字節。如果以位元為單位... 每秒130太字節。這個背板上的資料速率,超過了全球整個網際網路峰值流量的總和。這就是我們如何將網際網路濃縮到 60 磅的秘訣。NVLink。於是我們完成了所有這些。我們之所以做這些,是因為未來人們對電腦的理解和思考方式將發生根本性改變,對此我將花更多時間探討,但它旨在讓 Blackwell 在 Hopper 基礎上實現一次巨大的飛躍。請記住,摩爾定律和半導體物理學,每三到五年才能帶來大約兩倍的性能提升。我們又如何才能在僅僅一代之內實現 30 到 40 倍的性能提升呢?我們需要 30 到 40 倍的性能提升,因為推理模型正在進行內部對話。它不再是像 ChatGPT 那樣的單次(輸出),現在它是一個推理模型,當你進行內部思考時,它會生成大量更多的 token。你正在一步步地分解問題,進行推理,嘗試各種不同的路徑,也許是思維鏈(chain of thoughts),也許是思維樹(tree of thoughts),或者是 n 選一最佳(best of n)。它正在反思自己的答案。你可能見過這些研究模型在反思答案時會說:“這是一個好答案嗎?”“你能做得更好嗎?”而它們會說:“哦,是的,我能做得更好”,然後回去再思考一下。因此,這些思考模型、推理模型取得了令人難以置信的性能,但這需要更多的計算能力。最終結果是,MV Link 72、Blackwell 架構帶來了性能的巨大飛躍。這種解讀方式是:x軸代表它的思考速度。y軸代表工廠能輸出多少,同時支援大量使用者。因此,你希望工廠的吞吐量儘可能高,這樣你就能支援儘可能多的人,從而使你的工廠收入儘可能高。你希望這個軸儘可能大,因為人工智慧很智能,它在這裡比在那裡更智能。思考得越多,速度越快,就能在提供答覆前進行更充分的思考。因此,這與Token的平均銷售價格(ASP)有關,也與工廠的吞吐量有關。這兩者的結合就是工廠的收入。這家基於 Blackwell 的工廠,得益於其架構,能夠產生巨額收入。我們所建造的成果真是令人難以置信。我們為您製作了一段視訊,只是為了讓您感受一下建構 Grace Blackwell 所投入的工程量的浩瀚。請看。Blackwell 是一項工程奇蹟。它始於一塊空白的矽晶圓。數百道晶片處理和紫外線光刻工序,在一塊 12 英吋的晶圓上,逐層建構起 2000 億個電晶體。晶圓被劃分為單個的 Blackwell 裸晶,經過測試和分揀,分離出合格的裸晶以進入下一階段。通過基板上晶片的晶圓級工藝,32 個 Blackwell 裸晶和 128 個 HBM 堆疊被連接固定到定製的矽中介層晶圓上。金屬互連線直接刻蝕其上,將 Blackwell GPU 和 HBM 堆疊連接起來,形成每個系統和封裝單元,並將所有元件固定就位。隨後,整個元件經過烘烤、塑封和固化,從而製成 Blackwell B200 超級晶片。每個 Blackwell 晶片都在 125 攝氏度的烤箱中進行壓力測試,並被推向其性能極限,持續數小時。機器人晝夜不停地工作,將超過 10,000 個元件拾取並放置到 Grace Blackwell PCB 上。與此同時,定製的液冷銅塊也已準備就緒,以保持晶片處於最佳溫度。在另一個工廠,ConnectX 7 SuperNICs 正在製造,以實現橫向擴展通訊,同時 BlueField 3 DPU 也在製造,以解除安裝並加速網路、儲存和安全任務。所有這些部件匯聚在一起,被精心整合到 GB200 計算托盤中。NVLink 是 NVIDIA 發明的一種突破性高速互連技術,用於連接多個 GPU 並擴展成為一個巨大的虛擬 GPU。NVLink 交換托盤由 NVLink 交換晶片構成,提供每秒 14.4 太字節的全互聯頻寬。NVLink 主幹形成定製的盲插式背板,通過 5,000 根銅纜將全部 72 個 Blackwell,即 144 個 GPU 裸片,連接成一個巨大的 GPU,提供每秒 130 太字節的全互聯頻寬,這超過了全球網際網路的峰值流量。零部件從世界各地運抵,由熟練的技術人員組裝成機架規模的 AI 超級電腦。總計 120 萬個元件、兩英里長的銅纜、130 兆個電晶體,總重量近兩噸。Blackwell 不僅僅是技術奇蹟。它是全球協作與創新力量的明證,正在推動將塑造我們未來方方面面的發現和解決方案。我們致力於賦能我們這個時代的天才們,讓他們完成畢生事業。我們迫不及待地期待著您們帶來的突破。Grace Blackwell 系統,全部投入生產。這真是一個奇蹟。從技術角度來看,這是一個奇蹟,但集結起來建構這些 GB200 系統(每套重兩噸)的供應鏈更是奇蹟,我們現在每周能生產一千套系統。之前從未有人以如此規模批次生產過超級電腦。這些機架中的每一個,本質上都是一台完整的超級電腦。僅在2018年,最大的Volta系統——Sierra超級電腦,其性能甚至不如這些機架中的一個。而那個系統功耗為10兆瓦。而這僅為100千瓦。2018年至今,代際更迭帶來的巨大差異在於,我們已真正將超級計算,特別是AI超級計算,提升到了一個全新的水平。而我們現在正以巨大規模生產這些機器裝置。而這僅僅是個開始。事實上,你所看到的僅僅是一個系統,即Grace Blackwell。全世界都在談論這一個系統,爭相要求將其部署到全球資料中心,用於訓練、推理和生成式AI。然而,並非所有人以及並非所有資料中心都能處理這些液冷系統。某些資料中心需要企業級堆疊,需要運行 Linux Red Hat、Nutanix 或 VMware 的能力,以及來自 Dell EMC、Hitachi、NetApp、Vast、Weka 等諸多不同的儲存系統,如此之多不同的 IT 系統。而這些系統的管理必須以與傳統 IT 系統一致的方式進行。我們有如此多的新電腦正準備投入量產。我非常高興地告訴大家,其中的每一個都已投入量產。你們還沒有看到它們。它們正從生產線上加速出貨,供不應求,而這一切都始於此地。DGX Spark 讓您能夠基本上在您的桌面電腦上擁有 Grace Blackwell 系統。就 Spark 而言,是桌面電腦。就 DGX Station 而言,是辦公桌旁。這樣,在開發軟體和AI時,您就不必一直佔用超級電腦了。但您希望架構完全相同。從架構角度來看,這些系統是完全一致的。從軟體開發人員的角度來看,它看上去是完全一樣的。唯一的區別是規模和速度。而在這一側,是所有的x86系統。全球IT組織仍然青睞x86並認可x86。只要能充分利用最先進的AI原生系統,他們就會去利用;當他們無法這樣做,又希望將其整合到企業IT系統時,我們現在為他們提供了這樣做的能力。最重要的系統之一,也是我們耗時最久才建構完成的系統,因為它軟體和架構都極其複雜,那就是如何將AI原生架構引入並融入到傳統的企業IT系統中。這就是我們全新的RTX Pro伺服器。這是一個非凡的系統。主機板經過了完全重新設計。女士們,先生們,珍妮·保羅。這塊主機板看起來如此簡潔。然而,在這塊主機板上,有八個 SuperNIC 交換機,通過一個每秒200吉位元的尖端網路晶片連接八個 GPU,該晶片隨後連接這八個 GPU 以及這些 Blackwell RTX Pro 6000 GPU。全新產品,剛剛投入生產。其中八個安裝到一台伺服器中。那麼,它有何特別之處?這台伺服器是世界上唯一一台能夠運行世界上所有已編寫內容以及輝達開發過的所有內容的伺服器。它運行人工智慧、Omniverse、用於視訊遊戲的 RTX,它運行 Windows、它運行 Linux,運行 Kubernetes,它運行 Kubernetes 和 VMware。它基本上運行一切。如果您想將Windows桌面從一台電腦流式傳輸到您的遠端裝置,毫無問題。如果您想流式傳輸Omniverse,毫無問題。如果您想運行您的機器人技術堆疊,毫無問題。僅是這台特定機器的質量保證就令人難以置信。它所運行的應用程式,基本上是普遍適用的。迄今為止世界上開發的所有一切都應該能在這裡運行。其中,如果您是一名視訊遊戲玩家,也包括《孤島危機》。因此,如果您能運行《孤島危機》,您就能運行任何程序。好的,這就是RTX Pro伺服器,一個全新的企業級系統。AI 工廠:新工業革命的核心黃仁勳: 那麼,某種變化正在發生。我們知道人工智慧是一項極其重要的技術。我們現在確切地知道,人工智慧是一種能夠徹底改變並顛覆每一個行業的軟體。它能夠實現這些令人驚嘆的成就。這一點我們是清楚的。我們也知道,處理人工智慧的方式與我們過去處理人工編寫軟體的方式有著根本性的不同。機器學習軟體的開發方式不同,其運行方式也不同。系統的架構、軟體的架構,完全不同。網路運行的方式,完全不同。其作為儲存的方式,完全不同。那麼,我們知道這項技術能夠做各種各樣的事情,令人難以置信的事情。它具有智能。我們也知道它的發展方式與以往截然不同。它需要新型電腦。真正有趣的問題是,這一切對國家、對公司、對社會而言意味著什麼?而這是一個我們早在近十年前就做出的觀察,如今每個人都已醒悟過來。事實上,這些人工智慧資料中心根本不是資料中心。它們並非傳統意義上的資料中心。儲存您所檢索的檔案的。這些資料中心並未儲存我們的檔案。它只有一個職責,而且僅此一個。生產智能標記。人工智慧的生成。這些人工智慧工廠從其內部有大量電腦這一點來看,看起來像資料中心,但這就是所有不同之處。它的設計方式,它被製造、擴展、設計和建造的規模,它的使用方式,它的編排、配置和營運方式,以及人們如何看待它——例如,沒有人真正把他們的資料中心看作一個創收設施。我說了一件事,每個人都會說:“嗯,我想你是對的。”從來沒有人把資料中心看作一個創收設施。但他們會把他們的工廠,他們的汽車工廠,看作創收設施。他們迫不及待地想再建一個工廠。因為每當你建造一個工廠,收入很快就會隨之增長。你可以為更多人建造更多事物。那些想法與這些人工智慧工廠中的想法完全相同。它們是創收設施。它們旨在生產令牌。這些令牌可以被重構為眾多行業的生產性智能,以至於人工智慧工廠現已成為一個國家基礎設施的一部分,這就是為什麼你看到我在世界各地奔波與各國元首對話的原因,因為他們都想擁有人工智慧工廠。他們都希望人工智慧成為他們基礎設施的一部分。他們希望人工智慧對他們而言是一個增長型的製造業。這確實意義深遠。我認為,由於所有這一切,我們正在談論一場新的工業革命,因為每一個行業都受到影響,以及一個新興產業的誕生,正如電力成為一個新興產業一樣。起初,當它被描述為一項技術並作為一項技術被展示時,它被理解為一項技術,但後來我們明白它也是一個龐大的產業。接著是資訊產業,我們現在稱之為網際網路,二者都因其影響了如此多的行業,而成為了基礎設施的一部分。我們現在擁有一個新興產業,即人工智慧產業,它現在是被稱為“智能基礎設施”的新型基礎設施的一部分。每個國家、每個社會、每個公司都將依賴它。你可以看到它已經實現了規模化。這是一個備受關注的案例。這是 Stargate。這看起來不像一個資料中心。它看起來像一個工廠。這是一吉瓦(的設施)。它將容納大約五十萬個 GPU 核心。並產生可供所有人使用的海量智能。歐洲的 AI 雄心:建構主權基礎設施黃仁勳: 歐洲現在已經意識到這些人工智慧工廠的重要性,以及人工智慧基礎設施的重要性,我很高興看到這裡有如此多的活動。這是歐洲電信公司正在與輝達合作建設人工智慧基礎設施。這是歐洲雲服務提供商正在與輝達合作建設人工智慧基礎設施。這是歐洲超級計算中心正在與輝達合作建設下一代人工智慧超級電腦和基礎設施。而這僅僅是個開始。這還不包括公有雲中即將出現的內容。這還不包括公有雲。因此,這是由歐洲公司為歐洲市場在歐洲本地建構的人工智慧基礎設施。還有20個正在規劃中。20個新增的人工智慧工廠,其中有幾個是超級工廠。總計,僅在兩年內,我們將把歐洲的人工智慧算力增加10倍。因此,研究人員、初創公司,以及你們的AI短缺、GPU短缺問題都將很快得到解決。它即將到來。現在我們正在與各個國家合作,以發展各自的生態系統。因此,我們正在七個不同的國家建設人工智慧技術中心。這些人工智慧技術中心的目標是,一是進行合作研究,二是與初創公司合作,並建設生態系統。讓我向你們展示一個生態系統是什麼樣子。在英國,我昨天剛去過那裡,這些生態系統是建立在輝達技術堆疊之上的。舉例來說,每一個輝達,眾所周知,輝達是唯一可在所有雲平台使用的AI架構。它是除了x86之外,唯一一種普遍可用的計算架構。我們與每一家雲服務提供商都有合作。我們加速來自世界上最重要的軟體開發商的應用程式,例如歐洲的西門子、Cadence、Red Hat、ServiceNow。我們已經徹底改造了計算堆疊。眾所周知,計算不僅僅是一台電腦,它還包括計算、網路和儲存。每一層,每一個堆疊都已被徹底改造。我們與思科有著良好的合作關係,他們昨天在會議上發佈了一款基於輝達的全新模型。戴爾,也有著良好的合作關係。NetApp、Nutanix,以及一大批良好的合作關係。正如我之前提到的,軟體的開發方式已經發生了根本性變化。不再僅僅是編寫 C 程序、編譯 C 程序、交付 C 程序。現在是 DevOps、ML Ops、AI Ops。所以,整個生態系統正在被重塑,我們的生態系統合作夥伴遍佈各地。當然,還有解決方案整合商和提供商,他們可以幫助每家公司整合這些能力。嗯,在英國,我們有合作的特殊公司。確實有非常棒的公司,從研究人員到開發人員再到合作夥伴,幫助我們提升當地經濟和當地人才的技能水平。那些使用技術的企業,當然還有雲服務提供商。我們在英國有很棒的合作夥伴。我們在德國有很棒的合作夥伴。在德國,我們有著難以置信的、非常棒的夥伴關係。我們在義大利擁有良好的合作關係。當然,我們在法國也擁有卓越的合作關係。沒錯,法國加油!馬克宏總統稍後會來到這裡。我們將談及一些新的公告。所以,我們必須對人工智慧表現出一些熱情,好嗎?這樣就對了。向他展示一些熱情。所以,我們在法國擁有卓越的合作關係。我想特別強調一個:我們與施耐德的合作關係。甚至建造這些AI工廠,我們現在也以數字方式建造它們。我們以數字方式設計它們,以數字方式建造它們,以數字方式營運或最佳化它們,並且最終我們甚至會在數字孿生中以完全數位化的方式最佳化和營運它們。這些AI工廠非常昂貴,有時高達500億美元,未來甚至會達到1000億美元。如果這些工廠的利用率未能達到最高,那麼工廠所有者將承擔難以置信的成本。因此,我們需要在所有可能的地方進行數位化並使用AI,將一切都放入Omniverse中,以便我們擁有直接和持續的遙測資料。我們在這裡有一個重要的合作夥伴關係,今天將對外公佈。這是一家年輕的公司,有一位我非常欣賞的CEO,他正在努力建立一家歐洲AI公司。這家公司的名字是Mistral。今天我們正在宣佈我們將在歐洲共同建設一個AI雲平台,以交付他們的模型,以及為其他AI初創公司的生態系統提供AI應用,這樣他們就可以使用Mistral模型或他們喜歡的任何模型。因此,Mistral 和我們,將合作在這裡建設一個非常大規模的人工智慧雲,今天晚些時候我們將與馬克宏總統討論更多細節。Nemotron 與智能體:讓人工智慧無處不在黃仁勳: 人工智慧技術正以光速發展。我在這裡向大家展示的是,左側的專有模型正以光速發展。然而,開源模型也正以光速發展。僅僅落後幾個月。無論是 Mistral、Llama、DeepSeek R1、即將推出的 R2,還是 Qwen,這些模型都非常出色。它們每一個都非常出色。因此,在過去幾年中,我們一直致力於動用一些世界上最頂尖的人工智慧研究人員,來使這些人工智慧模型變得更好。我們稱之為 Nemotron。基本上,我們所做的是,我們獲取那些開放原始碼的模型——當然,它們無論如何都是基於 NVIDIA 建構的——因此我們獲取這些開源模型,然後進行後訓練。我們可能會進行神經網路架構搜尋。我們可能會進行神經網路架構搜尋,為其提供更優質的資料,使用強化學習技術,增強這些模型,賦予它推理能力,並擴展上下文,以便它在與您互動之前能學習和閱讀更多內容。這些模型大多數的上下文都相對較短,而我們希望它們擁有巨大的上下文處理能力,因為我們想將其用於企業應用中,而我們希望與之進行的對話在網際網路上是不可獲取的。它存在於我們公司內部。因此我們必須為其載入海量的上下文資訊。所有這些能力隨後都被打包成一個可下載的NIM。您可以訪問輝達的網站,直接下載一個API,一個最先進的AI模型,將其部署到任何您喜歡的地方,我們會對其進行大幅改進。這是Nemotron 相對於 LLAMA 的改進示例。所以LLAMA 8B、70B、405B,通過我們的後期訓練能力、推理能力的擴展以及我們提供的所有資料,得到了大幅增強。我們將不斷地進行迭代。因此,所有將使用此 Nemotron 的使用者都將知道,未來還有大量其他模型,而且它們無論如何都是開放的。因此,如果您想從開放模型開始,那太棒了。如果您喜歡從 Nemotron 模型開始,那太棒了。而 Nemotron 模型的性能非常出色。在一次又一次的基準測試中,Nemotron 的性能在各項榜單上都名列前茅。因此現在您知道,您可以使用一個增強的、仍然開放且在排行榜上名列前茅的模型。您也知道輝達致力於此,因此只要我還活著,我就會一直這樣做,好嗎?這項策略太棒了。這項策略如此出色,以至於歐洲各地的區域模型製造商和開發者現在已經認識到這項策略有多麼出色,我們正在合作,為區域語言調整併增強這些模型。您的資料歸您所有。你的資料屬於你。它是你民族的歷史、你民族的知識、你民族的文化。它屬於你。對於許多公司,以輝達為例,我們的資料大部分是內部資料。33年的資料。我今天早上查了一下,西門子,180年的資料。其中一些寫在紙莎草紙上。羅蘭·布什就在這裡。我想拿我的好朋友羅蘭·布什開開玩笑。所以,在人工智慧能夠學習之前,你們必須將這些資料數位化。因此,資料歸您所有。您應該使用這些資料,使用像Lemotron這樣的開放模型以及我們提供的所有工具套件,以便您能夠根據自己的用途對其進行增強。我們還宣佈,我們與Perplexity建立了良好的合作關係。Perplexity是一個推理搜尋引擎。沒錯。我使用的三個模型是ChatGPT、Gemini Pro和Perplexity。這三個模型我交替使用。Perplexity非常出色。我們今天宣佈,Perplexity將整合這些區域模型並將其直接連接到Perplexity中,這樣您現在就可以以您國家的語言、文化和符合當地文化習慣的方式提問並獲取答案。好的,所以是Perplexity和區域模型。智能體AI。智能體意義重大。正如您所知,最初,對於預訓練模型,人們會說,但它會產生幻覺。它會胡編亂造。您說的完全正確。它無法獲取最新的新聞和資料資訊。完全正確。它在沒有對問題進行充分推理的情況下就放棄了。彷彿每一個答案都必須從過往資料中記憶而來。完全正確。所有這些事情,你知道的,它為什麼試圖弄清楚如何計數並加數?它為什麼不用計算器呢?你說得一點沒錯。因此,所有這些與智能相關的能力,儘管每個人都能提出批評,但他們說得完全正確,因為大家大體上都明白智能是如何運作的。但這些技術正在世界各地被建構,並正在融合匯聚,從資訊檢索、增強生成,到網路搜尋,再到多模態理解,以便你能夠閱讀PDF、存取網站、查看圖像和文字、收聽視訊、觀看視訊,然後將所有這些理解融入到你的語境中。當然,你現在也能理解來自幾乎任何事物的提示。你甚至可以說:“我要問你一個問題,但請從這張圖片開始。”我可以說,請在你回答問題或執行我要求你做的事情之前,先從這段文字開始。它隨後就會進行推理、規劃並自我評估。所有這些能力現已整合,你也可以看到它們正在各地湧入市場。智能體AI是真實存在的。智能體AI相較於一次性AI,是巨大的階躍式發展。一次性AI是奠定基礎所必需的,以便我們能夠教導這些智能體如何成為智能體。你需要對知識和推理有基本的理解,才能具備可教性。因此,預訓練關乎AI的可教性。後訓練、強化學習、監督學習、人類演示、上下文提供、生成式AI,所有這些正匯聚一堂,共同構成了現在的智能體AI。讓我們來看一個例子。讓我向你展示一些東西。它基於Perplexity建構,而且非常酷。AI智能體是數字助手。基於提示,它們進行推理並將問題分解為多步驟計畫。它們使用適當的工具,與其他代理協作,並利用記憶中的上下文在NVIDIA加速系統上正確執行任務。它始於一個簡單的提示。讓我們請Perplexity協助在巴黎啟動一家餐車業務。首先,Perplexity代理對提示進行推理並制定計畫,然後呼叫其他代理,使用多種工具協助處理每個步驟。市場研究員閱讀評論和報告,以發現趨勢並分析競爭市場。基於這項研究,一位概念設計師探索當地食材並提出菜單,包括準備時間估算,並研究口味偏好並生成品牌標識。接著,財務規劃師使用蒙特卡洛模擬來預測盈利能力和增長軌跡。營運規劃師建立啟動時間表,包含所有細節,從購買裝置到獲取所需許可證。行銷專員制定啟動計畫,包含社交媒體行銷活動,甚至編寫一個互動網站,包括地圖、菜單和線上訂購功能。每個代理的工作匯聚成一份最終的打包提案,而這一切都始於一個單一的提示。一個提示,像原始聊天機器人中的那種一個提示,會生成幾百個令牌。但是現在,僅僅一個提示輸入到一個代理來解決問題,它一定生成了10,000倍多的令牌。這就是為什麼Grace Blackwell是必要的。這就是為什麼我們需要性能,並且系統在代際上要表現出如此高得多的性能。嗯,這就是Perplexity建構他們代理的方式。每家公司都將不得不建構自己的代理。這太棒了。你將要僱傭來自OpenAI、Gemini、Microsoft Copilot、Perplexity和Mistral的代理,並且會有為你建構的代理。它們可能會幫助你規劃一次假期,或者,你知道,去做一些研究,等等。然而,如果你想建立一家公司,你將需要使用專業工具並具備專業技能的專業代理。那麼問題是,你如何建構這些代理?因此,我們為你建立了一個平台。我們建立了一個框架、一套你可以使用的工具,以及一大批合作夥伴來幫助你實現它。它始於最底層,即具備我之前談到的推理模型的能力。輝達的Nemo、Nemotron推理大語言模型都是世界一流的。我們擁有Nemo Retriever,它是一個多模態、語義搜尋引擎。表現卓越。我們建構了一個可操作的演示藍圖,它本質上是一個通用代理。我們稱之為IQ、AI、AIQ。此外,我們擁有一套工具,可讓您引入一個通用代理,精心整理資料來訓練它、評估它、設定安全保障、監督、訓練它、使用強化學習,直至部署,並確保其安全無虞。這套工具包,以及這些庫,都已整合到AIOps生態系統中。您也可以自行從我們的網站下載,但它主要還是整合在AIOps生態系統中。基於此,您可以建立自己的特殊代理。許多公司正在這樣做。這是思科。他們昨天宣佈了此事。我們正在共同建構用於安全的人工智慧平台。現在,請看這個。AI代理並非一個模型就能包攬所有這些了不起的事情。這是一個模型集合,一個模型系統。這是一個人工智慧大型語言模型系統。其中一些針對特定類型的任務進行了最佳化。正如我提到的,例如檢索、執行技能,以及使用電腦。你不會想把所有這些東西都打包成一個龐大無比的單一人工智慧,而是會把它分解成小的部分,然後你可以隨著時間的推移對其進行持續整合/持續部署。這是思科的一個例子。那麼現在的問題是,你該如何部署它呢?因為正如我之前提到的,輝達的計算資源位於公有雲中。還有區域雲。我們稱它們為NCP。例如,這裡有 Mistral。您可能擁有私有雲解決方案,因為這符合您的安全和資料隱私要求。您甚至可能決定在本地(您的桌面上)運行某些系統。那麼,問題是,您如何運行所有這些呢?而有時它們在不同的地方運行,因為這些都是微服務。這些是能夠相互通訊的人工智慧。它們顯然可以通過網路相互通訊。那麼,您如何部署所有這些微服務呢?那麼,我們現在有一個出色的系統。我非常高興能向大家宣佈這一點。這就是我們稱之為DGX Lepton的產品。您在此處看到的DGX Lepton,實際上是眾多不同的雲。這裡有Lambda雲、AWS雲,等等。這裡還有您自己的開發人員機器,您自己的系統。它可以是DGX工作站、Nibias、Yoda、Nscale。它可以是AWS。它可以是GCP。NVIDIA的架構無處不在。因此,您可以決定在何處運行您的模型。您可以使用一個超級雲來部署它。所以,它是一個雲之雲。一旦你讓它運行起來,一旦你將這個NIMS部署到Lepton中,它就會在你所選擇的各種雲端進行託管和運行。一種模型架構,一次部署,你就可以在任何地方運行它。你甚至可以在這台小巧的機器上運行它。你們看,這台DGX Spark,它...這是一個咖啡時間嗎?看看這個。它擁有2000馬力。這是我最喜歡的小機器,DGX Spark。首款人工智慧超級電腦,我們在2016年建造了一台人工智慧超級電腦。它被稱為DGX-1。它是我一直以來所談論的一切的第一個版本。八塊 Volta GPU 通過 NVLink 連接。我們投入了數十億美元來建造它。而在我們宣佈 DGX-1 的那一天,沒有客戶,沒有興趣,沒有掌聲,只有百分之百的困惑。為什麼會有人建造一台那樣的電腦?它能運行 Windows 嗎?不能。所以我們還是建造了它。幸好,舊金山的一家年輕的公司,一家初創公司,一家非營利性初創公司,看到這台電腦時非常高興,他們說:“我們能得到一台嗎?”我心想,天那,我們賣出了一台。但後來我發現它是一家非營利組織。但我把一台電腦,把一台DGX-1放進我的車裡,然後我把它開到了舊金山。而那家公司的名字是OpenAI。我不知道那裡面有什麼人生教訓。有很多非營利組織。你知道,所以下次,但也許教訓是這樣的。如果有開發者聯絡你,需要GPU,答案是肯定的。沒錯,就是這樣。所以想像一下你擁有Lepton。它在你的瀏覽器裡。而你擁有這個Helm Chart,一個你開發的人工智慧代理。您想讓它在這裡運行。其中一部分您想在AWS中運行。另外一部分您想在某個區域雲中運行。您使用Lepton,部署您的Helm Chart,它便會神奇地顯示在這裡。明白嗎?因此,如果您想先在這裡運行它,直到完成並準備好部署,然後再將其部署到雲端,那真是太棒了。但美妙之處在於,這種架構是基於Grace Blackwell的。GB10、GB200、GB300,以及所有這些不同的版本,但這種架構正是Grace Blackwell。這真是太棒了。所以我們正在為Lepton做這件事,但接下來,輝達(NVIDIA)已將 Lepton 與 Hugging Face 連接起來了。因此,無論何時你在 Hugging Face 上訓練模型,如果你想將其部署到 Lepton 並直接接入 Spark,都沒問題。只需點選一下即可。因此,無論你是進行訓練還是推理,我們現在已連接到 Hugging Face,Lepton 將幫助你決定部署位置。讓我們來看看。開發者需要便捷可靠的計算資源,以滿足他們的工作需求,無論他們身在何處,無論他們在建構什麼。DGX Cloud Lepton 提供對全球 GPU 網路的按需訪問,這些網路分佈在不同的雲、區域以及 Yoda 和 Nebius 等合作夥伴之間。多雲 GPU 叢集通過單一統一的介面進行管理。資源調配速度快。開發者可以快速擴展節點數量,無需複雜的設定,即可立即開始訓練,這得益於預整合的工具和訓練就緒的基礎設施。進度可即時監控。GPU性能、收斂性及吞吐量盡在您的掌握之中。您可以直接在控制台內測試您的微調模型。DGX Cloud Lepton 可以在多個雲或區域中部署 NIM 端點或您的模型,以實現快速分佈式推理。正如共享出行應用將乘客與司機連接起來一樣,DGX Cloud Lepton 將開發者與 GPU 計算連接起來,驅動著一個虛擬的全球 AI 工廠。DGX Cloud Lepton。好的,那麼那是思科。這就是 SAP 在輝達建構 AI 平台的方式。Sana 正在基於輝達建構 AI 商業應用自動化。DeepL 正在基於輝達 AI 建構他們的語言框架和平台。Photoroom,一個視訊編輯和 AI 編輯平台,正在基於輝達建構他們的平台。這是 Codo,以前我認為是 Codium,一個基於輝達建構的卓越編碼智能體。這是 Iola,一個基於輝達建構的語音平台。而這個是臨床試驗平台,是全球最大的、基於輝達建構的臨床試驗自動化平台。因此,所有這些基本上都建立在相同的理念之上。NIMS,它將 Nemotron 大語言模型或其他大語言模型(如 Mistral 等)封裝並打包在一個虛擬容器中,可以部署到任何地方。然後,我們整合了一些庫,這些庫基本上涵蓋了一個人工智慧、一個人工智慧智能體的整個生命周期。你對待人工智慧智能體的方式,有點像對待數字員工。所以你的 IT 部門需要讓它們入職、精細調整、訓練、評估、確保它們遵守規定、保持安全,並持續改進它們。而整個框架平台就叫做 Nemo。所有這些目前正在全球各地被整合到一個個應用程式框架中。這只是其中少數幾個例子。接下來,我們讓您可以在任何地方部署它們。如果您想在雲端部署,雲端有 DGX,也有 GB200。如果您想在本地部署,因為您擁有 VMware、Red Hat Linux 或 Nutanix,並且想在本地虛擬機器中部署,您也可以實現。如果您想將其部署為私有雲,您也可以做到。您甚至可以直接部署在您的 DGX Spark 或 DGX Station 上,毫無問題。因此,Lepton 將幫助您實現這一切。工業 AI:數字孿生重塑製造業黃仁勳: 讓我們來談談工業人工智慧。這是我最喜歡的時刻之一。這是羅蘭·布什。這是一個令人開心的時刻。他想提醒我,神經電腦,也就是神經網路電腦,是在歐洲發明的。這就是這整個幻燈片(要表達的)。那真是個美妙的時刻。這就是 Synapse 1。各位,這簡直不可思議。Synapse 1。這是 Synapse 1,1992年。它運行神經網路的速度比當時的中央處理器快8000倍。這難道不令人難以置信嗎?那麼這就是世界的AI電腦。羅蘭只是想……永遠不要忘記那一點,黃仁勳。永遠,永遠不要忘記那一點。我說,好的,好吧。我會告訴……甚至我會告訴大家。西門子,1992年。西門子,1992年。我們與西門子有著出色的合作關係。西門子和首席執行官羅蘭·佈施正在為公司注入強大動力,使其能夠跨越、徹底跨越上一次IT工業革命,並將歐洲的工業能力、西門子的工業能力和雄厚實力與人工智慧融合,從而開創所謂的工業AI革命。我們正在與西門子在諸多不同領域展開合作。從設計到模擬,到工廠的數字孿生,再到工廠中人工智慧的營運,所有環節都端到端地涵蓋其中。這也讓我們/我再次意識到歐洲工業實力的非凡之處。這對你們而言是多麼非凡的機遇。這是一個非凡的機遇,因為人工智慧不同於普通軟體,它是一種真正、真正智能的軟體。而這種智能軟體最終能夠做一些事情,徹底變革你們所服務的產業。所以,我們製作了一段“情書”視訊,不妨這麼說。讓我們播放這段視訊。它始於此。第一次工業革命。瓦特蒸汽機和機械織布機帶來了自動化,並促成了工廠的興起。工業由此誕生。電氣時代。安培闡明了電磁學。法拉第發明了第一台發電機。而麥克斯韋則為現代電氣工程奠定了基礎。西門子和惠特斯通的發電機。電力之源。讓機器、火車、工廠和城市煥發生機。使地球電氣化。點燃現代製造業。而今,誕生於計算與資訊時代,第四次工業革命。人工智慧時代。重塑工業的每一個環節。遍佈大陸,工業人工智慧正日益普及。從設計到工程,你們正在開創新的路徑,邁向更深刻的理解與革新。你們將物理世界帶入虛擬世界。用於規劃和最佳化全球的現代化工廠。你們正在建構新的前沿。在這裡,所有移動的事物都已實現機器人化。每一輛汽車。一個智能自主體。以及一支新型協作型勞動力隊伍,以幫助我們向前發展。幫助彌合全球勞動力缺口。遍佈整個大陸的開發者們正在建構各種類型的機器人。教會它們新技能。在數字孿生世界和機器人訓練場中。準備讓它們與我們並肩工作。在我們的工廠裡。倉庫裡。手術室。甚至在家中。第四次工業革命已經到來。就在第一次工業革命開始的地方。你覺得呢?我很喜歡那個視訊。你做的。真棒。你做的。嗯,我們正在與一家又一家公司就工業人工智慧開展合作。這是寶馬。正在Omniverse中建造他們的下一代工廠。這是……我不知道該怎麼說。有人能教教我嗎?聽起來不錯。沒錯。完全正確。幹得好。幹得好。這完全正確。他們當然正在建造他們的工廠。Omniverse 中的數字孿生。這是 Keyon。他們用於倉儲物流的數字孿生。這是梅賽德斯-奔馳及其在 Omniverse 中建構的工廠數字孿生。這是舍弗勒及其在 Omniverse 中建構的倉庫數字孿生。這是您在法國的火車站。在 Omniverse 中建構其火車站的數字孿生。這是豐田在 Omniverse 中建構其倉庫的數字孿生。當你在Omniverse中建造這些倉庫和工廠時,你就可以設計它、規劃它、改變它。在新建項目中,這是非常棒的。在改造項目中,它也是非常棒的。你可以在實際進行物理搬運和移動物品之前,模擬其有效性,從而避免在事後才發現其並非最優。因此,在數字孿生中以數字方式完成一切的能力是令人驚嘆的。但問題是,為什麼數字孿生必須達到照片級逼真?為什麼它必須遵守物理定律?其原因是,我們最終希望它是一個數字孿生,讓機器人可以在其中學習如何像機器人一樣進行操作。機器人依賴光子來建構它們的感知系統。而這些光子是通過Omniverse生成的。機器人需要與物理世界進行互動。這樣它就能知道自己是否做得對,並學會如何正確地去做。因此,這些數字孿生必須看起來真實,並且行為舉止也符合現實。好的,這就是Omniverse被建立的原因。這真是太棒了。這是一個核聚變反應堆的數字孿生。如您所知,這是一個極其複雜的儀器。而沒有人工智慧,下一代核聚變反應堆將不可能實現。好的,我們今天宣佈,我們將在歐洲建立世界上第一個工業人工智慧雲。這些工業人工智慧雲,是的,就是雲中大量的電腦。然而,它的要求、它的性能、它的安全要求根本上是不同的。所以,我會在周五告訴你更多關於它的資訊。我今天只是向你透露故事的一部分。但是,這個工業雲將被用於設計和模擬。您只需步入其中的虛擬風洞。您只需將車輛移入其中,便可觀察其運行表現的虛擬風洞。打開車門,打開車窗,改變設計。所有這些都完全即時進行。即時設計。在一個數字工廠的生產車間中建造它。即時數字孿生。所有這一切都是為了讓機器人學習如何成為卓越的機器人。並建造我們未來的機器人。自動駕駛汽車等等。我們在這裡已經擁有龐大的生態系統。如您所知,我們在這裡已經很久了。輝達已經成立33年了。我們首次來到歐洲是在工作站、產品數位化以及CAD(電腦輔助設計)革命剛剛興起之時。我們曾身處CAE革命之中,而現在又經歷了數字孿生革命。歐洲這裡有一個價值約2兆美元的生態系統,我們與之合作,並有幸為其提供支援。具身智能:自動駕駛與人形機器人的未來黃仁勳: 由此誕生的是一場正在發生的新革命。眾所周知,所有會移動的事物都將由機器人技術驅動。所有會移動的事物都將由人工智慧驅動。汽車就是下一個最顯而易見的例子。輝達建構人工智慧超級電腦來訓練模型。用於Omniverse數字孿生的人工智慧超級電腦。我們也建構用於機器人本身的人工智慧超級電腦。無論是在雲端、用於Omniverse,還是在汽車領域,我們都提供完整的堆疊解決方案。電腦本身,以及運行在這台電腦之上的作業系統——每個實例都不同,這台電腦必須是高速的、感測器豐富的、功能完善的、安全的,在任何情況下都絕不能完全失效。因此,其安全要求極高。而現在,我們擁有一個運行在其之上的、令人驚嘆的模型。這個運行在其之上的模型是一個Transformer模型。它是一個推理模型。它接收感測器輸入,你告訴它你想要它做什麼,它就會把你送到那裡。它接收像素輸入,並生成路徑規劃輸出。所以它是一個基於Transformer的生成式AI模型。令人驚嘆的技術。輝達的AI團隊,自動駕駛(AV)團隊,令人驚嘆。這是我所知的唯一一支連續兩年贏得CVPR端到端自動駕駛挑戰賽的團隊。因此,他們今年再次獲勝。讓我們看看這段視訊。好的,謝謝。就像任何司機一樣,自動駕駛汽車在一個充滿不可預測且可能存在安全關鍵風險的場景中運行。輝達Drive,基於Halo安全系統建構,使開發者能夠利用多樣化的軟體棧、感測器和冗餘電腦來建構安全的自動駕駛汽車。這始於訓練。安全的自動駕駛汽車需要海量的多樣化資料,才能應對各種極端情況。但真實世界的資料是有限的。開發者使用輝達 Omniverse 和 Cosmos 來重建真實世界,並生成逼真的合成訓練資料,從而為自動駕駛模型帶來多樣性。該模型能夠感知並推理其環境,預測未來結果,並生成運動規劃。為了決策多樣性,一個獨立的經典堆疊平行運行。安全防護機制監測安全性能,並在出現異常情況時,呼叫仲裁器執行緊急停車。感測器和計算架構中也內建了進一步的多樣性和冗餘。每個感測器都連接到冗餘電腦。因此,即使某個感測器或電腦發生故障,車輛仍能保持安全運行。在發生嚴重故障時,系統可以執行最小風險操作,例如靠邊停車。安全是自動駕駛的基石。NVIDIA Drive 讓全球開發者能夠將 Halos 整合到他們的產品中,以打造下一代安全的自動駕駛汽車。道路上行駛著十億輛汽車,平均每年行駛 10,000 英里,總計 10 兆英里。自動駕駛的未來顯然是極其廣闊的。而它將由人工智慧驅動,並獲得人工智慧的賦能。這是下一個巨大的機遇。我們正與全球各地的大型企業和卓越公司合作,以實現這一目標。在我們自動駕駛(AV)領域所做一切的核心,是安全。我們對我們的Halo系統感到非常、非常自豪。它始於晶片的架構,繼而是晶片設計、系統設計、作業系統、人工智慧模型、軟體開發方法以及我們的測試方式。從我們訓練模型的方式,為模型提供的資料,一直到我們評估模型的方式,涵蓋一切。輝達的Halo系統以及我們的自動駕駛(AV)安全團隊和能力,都絕對享譽全球。這台電腦是首個實現軟體定義的。世界上第一個軟體定義的、完全100%軟體定義的、AI驅動的軟體,以及用於自動駕駛汽車的AI驅動堆疊。我們從事這項工作已經接近10年了。因此,這項能力舉世聞名,我為此感到非常自豪。汽車行業正在發生的事情,也正在一個新的行業中發生。正如我之前提到的,如果能夠根據提示生成視訊,如果AI能夠感知、推理,並且能夠生成視訊、文字和圖像。就像現在對於汽車而言,它可以生成路徑,方向盤的路徑,為什麼它就不能生成運動能力和關節活動能力呢?因此,AI徹底改變最困難的機器人學問題之一的這種基本能力,即將到來。類人機器人將成為現實。我們現在知道如何建構、訓練和操作這些東西了。類人機器人技術有可能成為有史以來最大的產業之一。這需要懂得製造、並能製造出具備非凡能力物品的公司。這指的是歐洲國家。世界上如此多的產業都設在這裡。我認為這將是一個巨大的機遇。嗯,假設全世界有十億個機器人。全球有十億個機器人的設想是非常合理的。那麼,為什麼它還沒有實現呢?嗯,原因很簡單。現今的機器人程式設計過於困難。只有最大的公司才能負擔得起安裝機器人,對其進行示教,程式設計讓它做完全正確的事情,並確保其周邊環境安全。這就是為什麼全球最大的汽車公司都擁有機器人的原因。它們的規模足夠大,工作也足夠重複。行業規模足夠大,足以讓你能夠將機器人部署到那些工廠中。對於幾乎所有的中型企業、中小型公司,或者夫妻店、餐廳、商店或倉庫而言,都不可能擁有那樣的程式設計能力。直到現在。我們將提供給你一種本質上可以由你進行教導的機器人。它們會向你學習。正如我們之前談到的具身智能,我們現在擁有了人形AI,它們可以使用與我之前談到的Nemo工具包高度一致的工具包,從你的教導中進行學習。輝達在這裡也建構了三層堆疊。我們建構了這台電腦,即雷神電腦。開髮套件看起來有點像這樣。這是一台機器人電腦,完全獨立。開髮套件就放在你的桌上。這些都是感測器。裡面是一個小型的超級電腦Thor晶片。確實非常非常不可思議。還有這些,嗯,我能想像其中一個像那樣被植入。好的,謝謝你,Janine。所以那就是Thor處理器。上面是一個專為機器人設計的作業系統。除此之外,Transformer模型接收感測器資料和指令,將其轉換並生成飛行或路徑,以及用於臂部、手指和腿部關節的運動控制。然而,人形機器人技術面臨的一大挑戰是,訓練它所需的資料量非常非常難以獲取。那麼問題是,你如何做到這一點?解決這個問題的辦法是,利用Omniverse——一個遵循物理定律的數字孿生世界。這是我們正在進行的一項了不起的工作。別這麼做。哦,我的錯。好的,這些是機器人。我們開發用於模擬和訓練它們的電腦,以及安裝在它們內部的電腦。世界上正在建立許多人形機器人公司。它們都看到了徹底改變這種新裝置的巨大機會。進展速度快得驚人。它們學習的方式都是在一個虛擬世界中進行。而這個虛擬世界必須遵守物理定律。最近,我們宣佈與迪士尼研究院和DeepMind建立一項重大的合作關係。我們將合作創造世界上最精密的物理模擬。此時此刻,我只是想弄明白如何切換到那張幻燈片。教教我。誰能幫幫我?這就是只排練一次會發生的情況。好的,所以這個,這個不可思議的系統,就是人工智慧學習如何成為人工智慧的地方。讓我展示給你看。我們有一位特邀嘉賓。你的名字叫格雷克。你是小男孩還是小女孩?好的,他,格雷克是個小女孩。現在,請看。格雷克在Omniverse中學會了走路,同時遵守了物理定律。然而,在Omniverse內部,我們建立了數十萬個場景。最終,當Grek學會了如何在那些環境中進行操作、行走和操控時,比如在沙地、礫石地、濕滑的地面、水泥地和地毯上。那麼當Grek進入物理世界時,物理世界僅僅是這個世界的第100,001個版本。因此,你學會在虛擬世界中行走,看看你現在。你能,你能跳嗎?哇。你能跳舞嗎?嗯,我想,我想,我只是想讓你知道,我是主旨演講者。所以我需要你,我需要你表現得規矩些。我需要你規矩幾秒鐘。我需要你乖幾秒鐘。你能坐下嗎?坐下。嘿,你知道我們該做什麼嗎?讓我們給所有人拍張照吧。對。咔嚓,咔嚓。你願意跟我回家嗎?你願意跟我回家嗎?我明白了,是的,我知道。嗯,我有寵物。它們會想把你當成寵物。不是嗎?不。你真聰明。你真聰明。嗯,真是不可思議,對吧?你是世界上最好的機器人。總有一天,我們都會擁有一個像你一樣的,它們會跟隨我們左右。但是,如果我需要,如果我需要一杯威士忌,你就得去讓別人給我拿一杯威士忌,因為你沒有手臂。是啊,你真可愛。好的,小女孩,你在這裡等一下。終章:一個新時代的開啟黃仁勳: 讓我們做個總結吧。好的。非常清楚,非常清楚一場工業革命已經開始了。下一波,下一波人工智慧浪潮已經開始了。格雷格是如今機器人技術所能實現的完美範例。教會機器人進行操作、模擬所需的技術。當然,一個不可思議的機器人現在就呈現在我們眼前。我們有實體機器人,也有資訊機器人。我們稱之為智能體。因此,新一輪人工智慧浪潮已經開啟。這將導致推理工作負載呈爆炸式增長。這基本上將呈指數級增長。使用推理技術的人數已從800萬人增至8億人,短短幾年內增長了一百倍。正如我之前提到的,提示所包含的令牌數量已從數百個令牌增至數千個令牌。當然,如今我們比以往任何時候都更廣泛地使用人工智慧。因此,我們需要一種專為思考和推理而設計的專用電腦。這就是Blackwell,一台思考機器。這些Blackwell系統將部署到新型資料中心中,它們本質上是人工智慧工廠,專為單一目的而設計。而這些人工智慧工廠將生成Token。而這些Toekn將成為你的食物,小格雷格。是的,我知道。我知道。真正、真正令人難以置信的是,我非常高興看到歐洲正在全力投入人工智慧。在接下來的幾年裡,這裡正在建設的人工智慧基礎設施數量將增加一個數量級。我想感謝各位的合作。祝Viva Tech大會圓滿成功。謝謝。 (Web3天空之城)
深度|槍口同時對準上三常,馬克宏還威脅東大,我們有了新對手?
今年的香格里拉對話會,中方只派出國防大學的一個代表團;美方高度重視,派出了防長海格賽斯,另一個重量級嘉賓是法國總統馬克宏,而他明顯來者不善。戎評註意到,馬克宏在香會上的主題演講,有這麼三點值得警惕:首先一點,他將俄烏局勢與亞太安全環境聯絡起來,警告亞太國家“在烏克蘭發生的事情,未來也將發生在亞洲,東大台灣、菲律賓都有可能發生”;其次,他威脅東大,如果東大不能阻止朝鮮干預歐洲安全,那就準備應對“北約在亞太擴大存在”;最後他同時批評了中美,將世界帶入“大國博弈”的環境,並且呼籲歐亞國家不要選邊站,而是“結成新的聯盟”。這三點都很惡劣,在戎評看來,這標誌著馬克宏的對外政策發生了重大轉變,他要效仿英國的“全球英國”戰略,以及東大當年“三個世界”論斷,確保法國乃至歐盟成為“多極世界的一極”。戎評就給大家挨個解讀一下:第一點和第二點,其實不是什麼新鮮的說法,關於“今日烏克蘭、明日台灣島或者菲律賓”的提法,這是西方一貫的臭毛病,就是瞎聯想;烏克蘭的問題,和台海、南海沒有任何相同之處,三者根本不是一個層面上的問題。台海問題是東大的內政問題,是合法的中央政府,與非法的地方叛亂政權之間的矛盾,是東大的統一問題;南海問題是主權爭端而非地緣衝突,東大和東盟不存在地緣矛盾,各方的利益是一致的,都是為了自身的發展,東盟早就從一個冷戰性質的地緣組織,轉變為一個促成區域一體化的多邊合作組織。事實上,東盟國家很反感西方炒作他們與東大的矛盾,多次強調域外勢力介入南海的危害性,這次香會發佈的備忘錄裡,就明確點出了菲律賓引入美國的行為,破壞了地區的和平穩定,損害了東盟的獨立性。東道主都把話說到這份上了,馬克宏還揪著這個問題嘮叨,眼力見也就這樣了。至於馬克宏要挾東大“管管朝鮮”的說法,也是不值得一駁,歐洲特別喜歡給別人找“爹”,大概是因為自己就有一個“美爹”,所以別人也應該如此。但東大和朝鮮的關係雖然特殊,但是我們確實不能左右朝鮮的政策,朝鮮軍人參加庫爾斯克戰鬥,那是俄朝之間的事,跟東大沒關係。這種論調是西方一貫的話術,目的是將東大拖下俄烏衝突,迫使東大按照西方的立場來做事,但是在香會這種場合提這件事,意義不大,其他國家不傻,知道其中的孰是孰非。戎評就跟大家重點說說第三點,因為這是馬克宏這次亞太之行,提出的一個比較新的說法。他呼籲歐洲和亞洲國家“不要選邊站”,要結成新的“歐亞聯盟”,是跟前幾天他在越南提出“第三種力量”的說法遙相呼應;他這個提法具有一定的迷惑性,因為我們也是主張“歐亞合作”,提出的“歐亞大陸橋”計畫、“一帶一路”倡議、“陸上/海上絲綢之路”戰略,都包含了歐亞合作的內容。但是,馬克宏提到的“歐亞聯盟”是不包含東大的。他的這番話,其實就是當年我們“三個世界”論斷的翻版:當年是美蘇爭霸,一些國家被裹挾了進去,但也有一些不願意成為美蘇地緣工具的國家,成為“第三世界”;馬克宏的話,如出一轍,只是將美蘇爭霸換成了所謂的“中美爭霸”,“第三世界”變成“第三種力量”——如果從這個角度來理解,馬克宏的野心是一目瞭然,他不僅要做歐洲的領袖,還想做世界的領袖,戴高樂一定會覺得,你小子有出息了哈!馬克宏怎麼就有了“歐羅巴正白旗話事人”一下子跳到“新不結盟運動領袖”這樣的想法?這很大機率是被懂王給刺激了。話說懂王上台後,直接拋下歐盟,單獨和俄羅斯討論俄烏衝突,在教皇方濟各的葬禮期間,懂王要和澤倫斯基談事,直接把馬克宏轟走,當時懂王說的是,“你現在應該走開”,這話很不客氣,換誰都嚥不下這口氣,更何況“我是五常的總統耶,說攆就攆,我不要面子啊”。這件事是打碎馬克宏“大國領導人”幻想的最後一根稻草。去年非洲薩赫勒地區頻繁發生政變,馬里、布吉納法索、尼日爾相繼趕走了法國駐軍,法國在非洲的影響力一落千丈,在加上今年懂王上台後,在各種場合都將歐盟視若無物,不少歐洲國家都陷入了精神內耗,“我不會是戰五渣吧?”馬克宏也意識到了這樣一個問題,歐盟雖然有19.4兆美元的經濟總量、4.5億的人口,但是在地緣政治環境裡,缺乏獨立自主,依舊處於被邊緣化的風險。在國際上,被邊緣化是一件很危險的事情,簡單來說,就是隨時可能被端上餐桌;這也是很多國家想盡辦法增加存在感的原因,你看隔壁的小日子,隔三差五就整個活,讓世界記住還有自己這麼一個國家。馬克宏提出應對邊緣化危機的方法是什麼?就是所謂“第三種力量”的說法。戎評覺得,他這個構思,底層邏輯是“戴高樂主義”,屬於全球化的Plus版,具體的靈感來自於英國的“全球英國”和東大的“三個世界”論斷,所以馬克宏打的是什麼主意,我們是一清二楚。可能有小夥伴想問了,馬克宏能撐起這麼高的調子嗎?其實在戎評看來,馬克宏這是犯了“東大行,我也行”的錯;東大能走出“第三世界”的路子,並且成為全球公認的“南方國家領袖”,是因為我們有足夠的實力作為底氣,法國有什麼呢?其實什麼都沒有。法軍除了“傳統藝能”之外,最值得稱道的,只有“陣風”戰鬥機和“戴高樂”號航母,但是“陣風”剛被咱們得殲-10狠狠修理了一頓,至於“戴高樂”,其實是一個半吊子的核動力航母,4萬噸級的排水量,戰鬥力相當有限;至於法國陸軍,如今進步到可以和輕裝步兵游擊隊打得你來我往,拿破崙、讓·拉納的棺材板都要摁不住了!這樣的實力根本撐不起馬克宏的亞太野心,他假裝自己有能力“和中美掰手腕”,試圖重塑法國的全球地緣形象,只能是給別人看一個大大的笑話。不是戎評瞧不起法國,而是事實如此,英國皇家海軍派航母來亞太,還要跟挪威、美國借軍艦和艦載機,最後還跑得狼狽不堪,實力不如英國的法國海軍,拿什麼來證明自己有能力“遠征亞太”?就算“戴高樂”號航母來過,但在東大海軍面前,根本談不上“可信的威懾力”。而且戎評覺得,虧得是咱們東大做事一直比較含蓄,如果換成一個“暴躁”一點的國家,要是有咱們這樣的實力,一堆055護送著航母,第二天就去歐洲“友好”訪問了!馬克宏這番話,估計在亞太地區引發不了多少共鳴。曾在亞洲殖民過的法國,離開這個地方已經太久了,雖然因為太平洋上的領地,法國可以自稱“亞太國家”,但它在這裡是陌生人、外來人,在這裡是多餘的。在戎評看來,馬克宏的這番話,最好只是一場政治表演、一場脫口秀,如果他真想按照自己說的來做,對法國乃至歐洲,不會有一個的結果!(戎評)