【CES 2025】每個人都能買得起 輝達個人AI超級電腦 能運行2000億參數的大模型

一句話總結:能放在你桌面上的個人AI超級電腦

NVIDIA 今天在CES 2025大會上發佈了 NVIDIA Project DIGITS,這是一款能放在你桌面上的個人AI超級電腦。

  • 將傳統上需要大型資料中心才能完成的 AI 計算,帶到每個人的桌面。
  • 提供經濟高效的計算解決方案,支援從小型實驗到大規模生產的整個開發流程。

這個東西是幹什麼的?

Project DIGITS 提供了一個超強的AI計算工具,可以讓普通使用者在自己的電腦上完成:

Project DIGITS 採用全新的 NVIDIA GB10 Grace Blackwell Superchip,能夠提供 1 PFLOP(每秒一千兆次浮點運算)的AI計算性能。

設計用於原型開發、微調以及運行大型AI模型,使使用者能夠在本地桌面系統上開發和運行推理模型,然後無縫部署到雲或資料中心

也就是它能在你的本地就能運行超大的AI模型,能夠運行高達 2000億 參數的大語言模型(比如...)。

而且支援在本地電腦上開發和測試AI模型,然後快速部署到雲端或資料中心。

簡單來說,它就像是給每個開發者配了一台袖珍的AI超級電腦!

就這個東西,比Mac mini還小

它的核心技術是什麼?

Project DIGITS 的核心是一顆叫 GB10 Superchip 的晶片:

SoC設計:基於 NVIDIA Grace Blackwell 架構,整合 NVIDIA Blackwell GPU(搭載最新一代CUDA核心和第五代Tensor Cores)與高性能 NVIDIA Grace CPU,專為深度學習最佳化。

高效性能:在 FP4 精度下提供 1 PFLOP(每秒一千兆次浮點運算)的計算性能。同時具有 20 個基於 Arm 架構的高效能核心,能耗低但性能強。。

能耗與儲存:

只需要普通電源插座供電,不需要特殊的裝置

配備 128GB 統一記憶體和 4TB NVMe 儲存。

性能超強:可以運行非常複雜的AI任務,能處理 2000億 參數的大語言模型。

可擴展性:通過 NVIDIA ConnectX 網路,兩台 Project DIGITS 超級電腦連接起來,可以運行 4050億 參數模型

連接性能:通過 NVLink-C2C 實現 GPU 和 CPU 高速互聯。

有什麼用,適合誰用?

有什麼用?

本地開發與測試:允許開發者在本地環境中快速進行 AI 模型原型設計和實驗。

雲端擴展:本地開發的模型可以直接遷移到雲端加速部署。

高效性能與成本:提供媲美大型資料中心的計算能力,但僅需少量成本和能耗。

多樣化應用場景:支援深度學習、自然語言處理、電腦視覺等多個領域的 AI 應用。

適合誰用?

適合AI 研究人員、資料科學家、學生以及初創企業使用。

更容易上手:只需普通電腦的組態即可使用。

靈活性強:從本地開發到雲端部署無縫銜接。

典型應用場景

AI研究與創新

開發和測試複雜的 AI 模型,如大規模語言模型(LLM)或生成式AI應用。

進行原型開發、模型微調和實驗。

資料科學

使用 RAPIDS 和其他工具,快速處理和分析大型資料集。

加速資料清理、特徵工程和建模工作。

教學與學習

面向高校和學生,提供負擔得起的 AI 計算資源,支援 AI 教學和學習實踐。

軟體與生態支援

NVIDIA 提供豐富的軟體生態,讓使用者能夠快速開始開發和部署AI模型:

(1) 開發工具

NVIDIA NGC:提供一個全面的軟體庫,包含開發工具包(SDK)、框架和預訓練模型。

NVIDIA NeMo:用於微調大型語言模型(LLM)的框架。

NVIDIA RAPIDS:用於加速資料科學工作流。

相容常用框架:支援 PyTorch、Python 和 Jupyter Notebook 等流行工具。

(2) 部署支援

使用者可以在本地開發模型,隨後直接部署到 NVIDIA DGX Cloud 或其他加速的雲和資料中心架構中,無需改動程式碼。

(3) 企業級支援

提供 NVIDIA AI Enterprise 軟體,保障企業級安全性、支援和生產環境發佈。

為什麼重要?

過去只有大企業或實驗室才能用得起的AI計算能力,現在變成了普通開發者都能負擔得起的工具。這意味著:

小團隊或個人可以開發和測試自己的AI模型。

AI研究和創新的門檻大大降低。

AI 計算的普及:通過降低硬體成本和部署難度,推動 AI 技術的普及。

創新驅動力:為個人和小型團隊提供前所未有的計算能力,激發更多創新。

生態系統的整合:將 NVIDIA 的硬體與軟體生態系統無縫結合,為使用者提供一站式解決方案。

多少錢?什麼時候能買到?

發售日期:2025年5月

售價:起步價為 3000美元,由 NVIDIA 和頂級合作夥伴聯合發售。

可在 NVIDIA 官網註冊獲取通知

評價

非常 🐂 P

一定要買個!

於此同時

NVIDIA 推出了全新 GeForce RTX 50 系列顯示卡和筆記型電腦

這些產品基於 Blackwell RTX 架構,帶來了革命性的性能提升和 AI 驅動的神經渲染技術。

RTX 50 系列提供高達 8 倍的性能提升(通過 DLSS 4)、高達 75% 的延遲降低(通過 Reflex 2),為遊戲玩家和內容創作者開啟了全新的可能性。

強大的 Blackwell 架構

包含 920 億個電晶體,採用最新的 GDDR7 視訊記憶體(速度高達 30Gbps),提供高達 1.8TB/s 的記憶體頻寬。

新一代 Tensor 核心和光線追蹤(RT)核心,支援即時渲染和更高效的 AI 模型處理。

DLSS 4 和 Reflex 2 的支援,提升遊戲流暢度和響應速度。

GeForce RTX 5090

規格參數:

CUDA 核心數:21,760

視訊記憶體:32GB GDDR7

視訊記憶體頻寬:1792 GB/s

Tensor 核心:680(第 5 代)

RT 核心:170(第 4 代)

主要性能提升:

性能是 RTX 4090 的 2 倍。

通過 DLSS 4 和 Multi Frame Generation,可支援 4K 解析度、240 FPS 和全光追遊戲。

支援生成式 AI 應用,圖像生成速度提升 2 倍,同時視訊記憶體佔用減少(FP4 模式)。

價格:起售價 $1,999

上市日期:2025 年 1 月 30 日

GeForce RTX 5080

規格參數:

CUDA 核心數:16,384

視訊記憶體:16GB GDDR7

視訊記憶體頻寬:960 GB/s

主要性能提升:

性能是 RTX 4080 的 2 倍。

可在 4K 解析度下暢玩支援光追的遊戲(如《賽博朋克 2077》和《Alan Wake 2》)、《黑神話:悟空》 等大作

滿足創作者對 3D 渲染和視訊編輯的高需求。

價格:起售價 $999

上市日期:2025 年 1 月 30 日

GeForce RTX 5070Ti

規格參數:

CUDA 核心數:12,288

視訊記憶體:16GB GDDR7

視訊記憶體頻寬:896 GB/s(相比 RTX 4070 Ti 提升 78%)

主要性能提升:

性能是 RTX 4070 Ti 的 2 倍。

在 2560x1440 解析度下,可高影格率運行光追遊戲。

價格:起售價 $749

上市日期:2025 年 2 月

GeForce RTX 5070

規格參數:

CUDA 核心數:10,240

視訊記憶體:12GB GDDR7

視訊記憶體頻寬:672 GB/s(相比 RTX 4070 提升顯著)

主要性能提升:

性能是 RTX 4070 的 2 倍。

在 2560x1440 解析度下,可高影格率運行光追遊戲,支援 DLSS Multi Frame Generation。

價格:起售價 $549

上市日期:2025 年 2 月

下一代創新技術

DLSS 4 神經渲染技術

DLSS 4 是 NVIDIA 最新的神經渲染技術,由 GeForce RTX Tensor 核心驅動,可顯著提升影格率的同時保持清晰的畫質。

每個傳統渲染幀可生成多達3個額外幀

影格率提升高達8倍

支援4K 240FPS全光線追蹤遊戲

首次在遊戲中應用 Transformer AI 模型

改進的時序穩定性和運動細節

Reflex 2 幀變形技術

NVIDIA Reflex 2 通過全新的幀變形技術將遊戲延遲降低高達75%,讓遊戲體驗更加流暢。

將遊戲延遲降低75%

同步CPU和GPU工作流程

基於最新滑鼠輸入更新渲染幀

為多人遊戲提供競爭優勢

讓單人遊戲更具響應性

NVIDIA ACE AI角色

NVIDIA ACE 是一套數字人物技術,通過生成式AI為遊戲角色和數字助手注入生命力。

AI驅動的遊戲角色行為

持續學習的敵人AI

自主行動的NPC系統

支援多款知名遊戲

即時響應玩家行為

Project R2X PC數字人

Project R2X 是一個基於視覺的PC化身,可以幫助使用者處理日常任務和提供AI輔助。

R2X 提供一個基於視覺的虛擬化身,可作為使用者的桌面助手。

它可以協助使用者完成多種任務,例如讀取和總結文件、管理應用程式、視訊會議等

支援視訊會議輔助

文件閱讀與總結

連接GPT4、Grok等雲端AI

支援多種開發框架

即時桌面應用輔助


機器人軍團

NVIDIA 還發佈了 NVIDIA Cosmos™ 平台,這是一種專為加速物理 AI 系統(如自動駕駛車輛和機器人)開發而設計的先進工具套件。

Cosmos 包括生成式世界基礎模型(WFMs)、高級視訊標記器(tokenizers)、安全保障機制和加速視訊處理管道。

該平台旨在通過生成逼真、基於物理的合成資料,幫助開發者大幅降低物理 AI 模型開發的成本。

簡單來說就是:Cosmos專門用來幫助開發機器人和自動駕駛系統。它通過 AI 模型生成虛擬資料和模擬場景,讓開發者可以更快、更便宜地訓練和測試他們的 AI 系統,而不用花費大量時間和金錢去採集真實資料。

  • 可實現文字到世界、視訊到世界的生成。
  • 提供三種模型:Nano(低延遲邊緣部署)、Super(高性能基線模型)、Ultra(高保真模型)。
  • 通過18000兆次 tokens 的訓練,涵蓋2000萬小時的真實及合成資料。
  • Tokenizers 壓縮效率提高 8 倍,處理速度提升 12 倍。

Cosmos主要能力

1. 生成虛擬資料

    • 雪天的駕駛環境
    • 倉庫中機器人的複雜操作
    • 可以建立超逼真的虛擬場景,比如:
    • 這些資料可用於訓練 AI 系統,減少對真實世界資料的依賴。

2. 快速處理視訊資料

    • Cosmos 的工具可以快速整理和標記大規模的視訊資料,比傳統方法快 10 多倍,節省時間和成本。

3. 模擬和測試

    • 模擬不同天氣和道路條件(雨天、霧天、擁堵)。
    • 測試機器人在工廠或倉庫裡的行動能力。
    • 可以在虛擬環境中測試機器人或自動駕駛系統,比如:

4. 幫助開發 AI 模型

    • 提供開放原始碼的基礎模型,開發者可以根據自己的需求定製,用於機器人或自動駕駛技術。

5. 多種應用場景

    • 用於自動駕駛訓練:比如 Uber 和 Waabi 使用它來建立虛擬駕駛測試場景。
    • 用於機器人研發:Agility 和 XPENG 使用它來訓練和最佳化機器人操作。

現場展示的機器人公司:

國際

  1. Apptronik:Apollo 機器人
  2. Agility Robotics:Digit 機器人
  3. NEURA Robotics:4NE-1 機器人
  4. Figure:Figure 02 機器人
  5. 1X:NEO 機器人
  6. Mentee:MenteeBot 機器人
  7. Sanctuary AI:Phoenix 機器人

中國

  1. 宇樹科技(Unitree Robotics):H1 機器人
  2. 智元機器人:遠征 A2 機器人
  3. 星動紀元:Star1 機器人
  4. 銀河通用:G1 機器人
  5. 傅利葉智能(Fourier Intelligence):GR-2 機器人
  6. 小鵬汽車:Iron 機器人


總結

本次輝達發佈,將推進人工智慧更加應用化,使得模型訓練、微調進入消費級領域,同時也將推動AI應用、智能硬體和機器人大爆發! (小互AI)