【CES 2025】老黃重磅發佈5090,定價15000!22000元的世界最小AI超級電腦也來了

就在剛剛,老黃穿著全新的皮衣,在CES上一波接一波放大招。

先是發佈了自家最新的GPU——RTX 5090

直接來看下基於Blackwell架構的最新GPU主要性能:

  • 擁有920億個電晶體
  • 具備4000 AI TOPS(每秒兆次操作)的性能
  • 能夠實現380 RT TFLOPS(每秒兆次浮點運算)的光線追蹤性能
  • 具備1.8 TB/s 的記憶體頻寬,能夠快速地讀取和寫入資料
  • 具有125 Shader TFLOPS 的著色器性能

這一50系列GPU的價格也直接一道公佈:

  • RTX 5090:1999美元(約14651元)
  • RTX 5080:999美元(約7321元)
  • RTX 5070 Ti:749美元(約5489元)
  • RTX 5070:549美元(約4023元)

而Blackwell架構關鍵的互聯技術也上了波新的——NVLink72

依舊是快速來看下主要性能亮點:

  • 72個Blackwell GPU具備1.4 ExaFLOPS TE FP4計算能力
  • 電晶體數量達到130兆
  • 擁有2592個 Grace CPU核心
  • 72個ConnectX - 8網路介面卡
  • 576個儲存晶片,總容量14TB,頻寬1.2PB/s
  • 18個NVLink交換機,全連接頻寬130 TB/s

非常有意思的是,老黃現場還手持巨大的樣品,宛如一個盾牌,開始了整活兒:

除此之外,AI超算,現在迎來了PC時刻。

因為就在剛剛,老黃一道還發佈全球最小的個人AI超級電腦——Project Digits

有多強悍?

2000億參數的大模型,直接在你辦公桌上(自己的桌面系統)就能跑!

如果把兩台Project Digits一塊“食用”,那麼還可以跑4050億參數的大模型。

據瞭解,每個Project DIGITS配備了128GB統一、相干記憶體和高達4TB的NVMe儲存,僅需標準電源插座即可運行。

並且在桌面系統上對大模型搞完開發或推理之後,還可以無縫部署到加速雲或資料中心基礎設施裡。

正如老黃在現場所說的那樣:

AI將成為每個行業、每個應用的主流。
在每位資料科學家、AI研究人員和學生的辦公桌上都可以放置像Project DIGITS一樣的個人AI超級電腦,讓他們能夠參與並塑造人工智慧時代。

而且Project DIGITS不用等太久哦,今年5月份就會開始提供,起售價3000美元(約21978元)。

那麼Project DIGITS又是如何做到又小又彪悍的呢?

搭載了全新的GB10超級晶片

Project DIGITS的關鍵,就在於它搭載的全新Grace Blackwell超級晶片(GB10)

這個系列晶片想必大家並不陌生了,基於Grace Blackwell架構,是一款片上系統(SoC)。

在FP4精度下可以提供高達1千兆次浮點運算的AI性能。

GB10包含了輝達Blackwell GPU(具有最新一代 CUDA 核心和第五代 Tensor Cores),通過 NVLink-C2C 晶片到晶片互連連接到高性能 NVIDIA Grace CPU(採用 Arm 架構的 20 個節能核心)。

據瞭解,聯發科參與了GB10的設計,對提升能效、性能和連接性等方面起到了一定作用。

基於這樣的架構,企業和研究人員可以在本地運行Linux系統的Project DIGITS上進行模型原型設計、微調與測試,再部署到NVIDIA DGX Cloud等上面。

使用者還可以訪問因為大的AI軟體庫,包括NGC目錄和開發者門戶中的軟體開發工具包、編排工具、框架和模型等,可用NVIDIA NeMo框架微調模型、NVIDIA RAPIDS庫加速資料科學,運行PyTorch等常見框架。

還可利用NVIDIA Blueprints和NVIDIA NIM微服務建構智能AI應用;據瞭解,從實驗到生產環境時,NVIDIA AI Enterprise許可證提供企業級安全等支援。

允許商用的世界基礎模型Cosmos

與此同時,老黃還宣佈輝達將開源允許商用的世界基礎模型——Cosmos

Cosmos平台既包括用於生成物理世界合成資料的擴散及自回歸Transfomer模型,還有視訊Tokenizer以及用來加速視訊處理的管道。

其中,Cosmos基礎模型在2000萬小時的駕駛和機器人視訊資料上訓練而成,主要用來加速自動駕駛和下一代機器人訓練研發。

開發者既可以用Cosmos生成物理合成資料,也可以用輝達NeMo框架+私有視訊資料進行微調。

而如此發佈也是基於目前AI技術的發展大勢。

具體而言,本次CES大會上,老黃一共介紹了三類模型:

  • Nano:超低延遲的即時模型,最佳化用於邊緣部署;
  • Super:高性能基線模型,適用於開箱即用的微調和部署;
  • Ultra:最高精準度和質量,適合模型定製;

據介紹,這些模型的參數大約為40億~140億,任何企業無論規模大小,都可以自由使用Cosmos模型。

目前已公佈的第一批試用者包括機器人公司1X、Agility Robotics,以及自動駕駛領域的Uber、小鵬、比亞迪等。

對了,老黃這次特意官宣豐田將基於輝達晶片和作業系統開發下一代新能源汽車。

從用法展示來看,Cosmos已經能夠幫助工業界和自動駕駛生成大量資料,從而加速相關AI技術研發了。

即日起,開發者可以在輝達API目錄中預覽第一批Cosmos模型,並從NGC目錄和Hugging Face下載模型和微調框架。

另外,Cosmos也為進一步擴展Omniverse(輝達工業數位化和物理AI模擬平台)提供了新的可能。

開發者可在Omniverse中建構3D場景,渲染輸出後用於Cosmos模型生成合成虛擬環境,最終用於物理人工智慧訓練。

還有比較壯觀的場面,就是老黃站在一排機器人的中間,頗有具身智能boom時代的意味。

還有兩個新模型服務

除了非常fashion的世界模型之外,老黃這次還發佈了兩個大方向的模型服務。

一個是AI基礎模型,主要適用於RTX AI PC,主打的就是輕鬆、靈活開發。

具體而言,通過連接到圖形使用者介面(GUI)的NIM微服務,使用者可輕鬆訪問和部署最新生成式 AI 模型。

輝達發佈了來自Black Forest Labs、Meta等頂級模型開發者的一系列NIM微服務,涵蓋多種類型,如Llama Nemotron系列中的Nano模型可作為RTX AI PC和工作站的微服務,擅長智能體AI任務。

這些微服務包含在PC上運行AI的關鍵元件,並針對輝達GPU進行了最佳化,可在Windows 11 PC(搭配 WSL)上快速下載、設定和運行,且與諸多AI開發和智能體框架相容。

NIM微服務之外,AI藍圖(AI Blueprints)也即將在PC上可用。

AI藍圖是基於NIM微服務建構而來,主要為數字人類、內容創作等提供預組態參考工作流程。

例如PDF轉播客藍圖可提取PDF內容生成指令碼及音訊,3D引導生成式AI藍圖能讓藝術家利用3D場景更好地控製圖像生成。

具體到產品,輝達預覽了Project R2X,這是一個具有視覺功能的PC虛擬形象,可通過NVIDIA RTX Neural Faces演算法渲染面部,並由新的Audio2Face - 3D模型驅動動畫,能連接多種AI服務和微服務。

據瞭解,從今年2月開始,NIM微服務和AI藍圖就可以使用了,多家PC製造商和系統建構商將推出支援NIM的RTX AI PC。

同樣是基於NIM微服務,輝達這次還推出了Nemotron模型家族,包括:

  • Llama Nemotron大型語言模型
  • Cosmos Nemotron視覺語言模型

這兩個大模型則是更傾向於AI智能體方向。

Llama Nemotron是基於開源Llama基礎模型建構,採用輝達最新技術和高品質資料集進行剪枝和訓練,最佳化了計算效率和精準性。

擅長指令遵循、聊天、函數呼叫、編碼和數學等,尺寸經過最佳化可在多種輝達加速計算資源上運行。

尺寸方面同樣包含Nano、Super 和 Ultra三種大小:

  • Nano成本效益高,適用於低延遲即時應用和PC及邊緣裝置;
  • Super在單個GPU上提供高吞吐量和高精度;
  • Ultra為資料中心規模應用設計,精度最高。

Cosmos Nemotron視覺語言模型則是結合了輝達的NIM微服務,可以讓開發者建構能分析和響應圖像及視訊的智能體,應用於多個領域。

One More Thing

就在老黃登上CES之前,輝達股價又又又創下了歷史新高!

漲幅超3%,收盤價為149.43美元(高於去年11月7日創下的每股148.88美元收盤紀錄),最新估值達到3.66兆美元,成為僅次於蘋果的全球第二大上市企業。

圖源𝕏 @YahooFinance
不知道這次發佈的東西是否符合大家的期待捏?

參考連結:
[1]https://www.youtube.com/live/k82RwXqZHY8
[2]https://x.com/YahooFinance/status/1876376522766024882 (量子位)