【輝達GTC大會】見證AI的「iPhone時刻」 2024黃仁勳GTC演講實錄!

時間3月19日4時-6時,輝達創辦人黃仁勳在美國加州聖荷西SAP中心登台,發表GTC 2024的主題演講《見證AI的變革時刻》。黃仁勳展示了旨在鞏固該公司在人工智慧運算領域主導地位的新晶片。

他表示,名為Blackwell的新處理器在處理支援人工智慧的模型方面可以將速度提高數倍。這包括被稱為訓練階段的技術開發過程和稱為推理階段的技術運行過程。

由2080億個電晶體構成的Blackwell晶片將成為亞馬遜、微軟、Alphabet Inc.旗下谷歌、甲骨文等全球最大資料中心營運商部署的新電腦和其他產品的基石。隨後黃仁勳也宣布一項名為GR00T的項目,旨在進一步推動輝達在機器人和具身智能的突破性工作。


黃仁勳演講核心要點:

●「AI 核彈」 B200晶片:採用雙晶片設計,電晶體數量達到2080億個。單GPU AI效能達20 PFLOPS(即每秒2兆次)。記憶體192GB,基於第五代NVLink,頻寬達到8TB/s。

● Blackwell架構GPU :DGX GB200 NVL 72,內建億次)。

● SuperPOD超算:搭載8顆DGX GB200,即288顆Grace CPU和576顆B200 GPU,記憶體達到240TB,FP4精度運算效能達到11.5EFLOPs(每秒11.5百億億次)

●人形機器人:人型機器人專案-包含了人型機器人基礎模型,ISAAC Lab開發工具庫和Jetson Thor SoC晶片上系統開發硬件,頻寬達到100GB/s,AI運算效能達到800TFLOPs。

● NIM軟體:針對AI推理系統的新軟體,開發人員可以在其中直接選擇模型來建立利用自己資料的人工智慧應用程式。


/ /以下為演講內容回顧: / /

播放開場影片

黃仁勳登台,對觀眾們強調:我希望你們搞清楚今天這裡不是演唱會,而是一場開發者大會。

黃仁勳介紹了本屆GTC的一些參與者,並強調這些公司不只是來參會,而是有自己的東西要來展示。

黃仁勳展示輝達發展史,並提了將首台DGX One送給OpenAI的故事。

黃仁勳:今天我們將討論這個新產業的許多問題。我們要談談如何進行計算、我們要談談你所建立的軟體類型,你將如何看待這個新軟體,新產業中的應用。然後,也許(再談談)下一步是什麼,我們如何從今天開始做準備,下一步會發生什麼。


黃仁勳:我們使用模擬工具來創造產品,不是為了降低運算成本,而是為了擴大運算規模。我們希望能夠以完全保真、完全數位化的方式模擬我們所做的整個產品。從本質上講,我們稱之為數位孿生。


老黃開始介紹一系列「新加速生態系統」合作夥伴,包括ANSYS、Synopsis、Cadence等。他也提及,台積電和Synopsys將突破性的輝達運算微影平台投入生產。


隨著transformer模型被發明,我們能以驚人的速度擴展大型語言模型,實際上每六個月就能翻倍。而為了訓練這些越來越大的模型,我們也需要更強的算力。


「非常強大」的Blackwell架構GPU登場


老黃現場對比Blackwell架構與Grace Hopper架構的GPU


老黃現場展示Grace-Blackwell系統(兩個Blackwell GPU、四個die與一個Grace Cpu連接在一起)。GB200將兩台B200 Blackwell GPU與一個基於Arm的Grace CPU進行配對。新晶片擁有2080億個晶體管,所有這些晶體管幾乎同時存取與晶片連接的記憶體。


為了處理大規模資料中心的GPU互動問題,也需要更強的連結(NVlink)能力。


這個GB200新系統提昇在哪裡呢?老黃舉例稱,如果要訓練一個1.8兆參數量的GPT模型,需要8,000張Hopper GPU,消耗15兆瓦的電力,連續跑上90天。但如果使用Blackwell GPU,只需要2000張,同樣跑90天只要消耗四分之一的電力。當然不只是訓練,生成Token的成本也會隨之降低。


將晶片做大的好處:單GPU每秒Token吞吐量翻了30倍


毫無疑問,微軟Azure、AWS、Google雲端等一眾科技巨頭都是Blackwell架構的首批使用者。


接下來應該是應用側的部分,先展示的是生物醫藥的部分,包括NVIDIA DGX雲中的多項更新。


黃仁勳宣布新的AI微服務,用於開發和部署企業級生成式AI應用。老黃表示,未來如何開發軟體?與現在寫一行行程式碼不同,未來可能就要靠一堆NIMs(Nvidia inference micro service),用與AI聊天的形式調動一堆NIMS來完成訓練、應用的部署。輝達的願景是成為AI軟體的「晶圓廠」。


輝達的AI微服務NIM網站已經上線。


NIM微服務提供了最快、效能最高的AI生產容器,用於部署來自NVIDIA、A121、Adept、Cohere、Getty Images和Shutterstock的模型,以及來自Google、Hugging Face、Meta、Microsoft、Mistral AI和Stability AI的開放模型。

NVIDIA AI Enterprise軟體平台更新,包括NIM、建置RAG應用程式的工具等。隨後老黃又分享了西門子科技、日產汽車等用如何在將Omiverse Cloud應用在工作流程中。


黃仁勳宣布,現在支援將Omniverse雲推流至Vision Pro。


可能是時間不太夠了,老黃開始加速官宣一系列合作。其中提到全球最大電動車公司比亞迪將採用輝達下一代智慧汽車晶片Thor。比亞迪同時將使用輝達基礎設施進行自動駕駛模型訓練,以及輝達Isaac設計/模擬智慧工廠機器人。


開始提機器人了。黃仁勳表示,在我們的世界裡,類人機器人很有可能會發揮更大的作用,我們設置工作站、製造和物流的方式,不是為人類設計的,而是為機器人設計的。因此,這些人類或機器人的部署可能會更有成效。黃仁勳同時宣布一項名為GR00T的項目,旨在進一步推動輝達在機器人和具身智慧的突破性工作。由GR00T驅動的機器人可以理解自然語言,並透過觀察人類動作來模擬運動。

除了機器人影像外,迪士尼的orange和green機器人也來到現場,這款機器人用的是輝達為機器人設計的首款AI晶片Jetson。


黃仁勳帶著機器人下場,現場播放ending影片


黃仁勳返場告別,全場記者會結束。


總結:

1.雖然Blackwell架構之前傳出的資訊已經比較充分了:一個GPU包含兩個運算單元等產業鏈也早就明確了。但是「GB200 NVL72」這種連接方式還是略超預期的,只不過這些產品針對的客戶群開始變得越來越集中了;如果能夠快速出貨,對AMD的打擊不小;

2.FP4表現搶眼。輝達已經充分體認到了,推理市場才是下一個重要戰場;

3.黃仁勳兩小時的演講或說show,是在很有自信的告訴大家一個明確訊號:輝達就是AI的基礎設施,沒有之一

4.正如開場白講的一樣:這是一個正在快速改變百萬億美金行業的市場,計算。

5.這其中,最大的機會是:數位孿生。(財聯社)