一句話總結:能放在你桌面上的個人AI超級電腦
NVIDIA 今天在CES 2025大會上發佈了 NVIDIA Project DIGITS,這是一款能放在你桌面上的個人AI超級電腦。
這個東西是幹什麼的?
Project DIGITS 提供了一個超強的AI計算工具,可以讓普通使用者在自己的電腦上完成:
Project DIGITS 採用全新的 NVIDIA GB10 Grace Blackwell Superchip,能夠提供 1 PFLOP(每秒一千兆次浮點運算)的AI計算性能。
設計用於原型開發、微調以及運行大型AI模型,使使用者能夠在本地桌面系統上開發和運行推理模型,然後無縫部署到雲或資料中心
也就是它能在你的本地就能運行超大的AI模型,能夠運行高達 2000億 參數的大語言模型(比如...)。
而且支援在本地電腦上開發和測試AI模型,然後快速部署到雲端或資料中心。
簡單來說,它就像是給每個開發者配了一台袖珍的AI超級電腦!
就這個東西,比Mac mini還小
它的核心技術是什麼?
SoC設計:基於 NVIDIA Grace Blackwell 架構,整合 NVIDIA Blackwell GPU(搭載最新一代CUDA核心和第五代Tensor Cores)與高性能 NVIDIA Grace CPU,專為深度學習最佳化。
高效性能:在 FP4 精度下提供 1 PFLOP(每秒一千兆次浮點運算)的計算性能。同時具有 20 個基於 Arm 架構的高效能核心,能耗低但性能強。。
能耗與儲存:
只需要普通電源插座供電,不需要特殊的裝置
配備 128GB 統一記憶體和 4TB NVMe 儲存。
性能超強:可以運行非常複雜的AI任務,能處理 2000億 參數的大語言模型。
可擴展性:通過 NVIDIA ConnectX 網路,兩台 Project DIGITS 超級電腦連接起來,可以運行 4050億 參數模型。
連接性能:通過 NVLink-C2C 實現 GPU 和 CPU 高速互聯。
有什麼用?
本地開發與測試:允許開發者在本地環境中快速進行 AI 模型原型設計和實驗。
雲端擴展:本地開發的模型可以直接遷移到雲端加速部署。
高效性能與成本:提供媲美大型資料中心的計算能力,但僅需少量成本和能耗。
多樣化應用場景:支援深度學習、自然語言處理、電腦視覺等多個領域的 AI 應用。
更容易上手:只需普通電腦的組態即可使用。
靈活性強:從本地開發到雲端部署無縫銜接。
開發和測試複雜的 AI 模型,如大規模語言模型(LLM)或生成式AI應用。
進行原型開發、模型微調和實驗。
使用 RAPIDS 和其他工具,快速處理和分析大型資料集。
加速資料清理、特徵工程和建模工作。
面向高校和學生,提供負擔得起的 AI 計算資源,支援 AI 教學和學習實踐。
NVIDIA NGC:提供一個全面的軟體庫,包含開發工具包(SDK)、框架和預訓練模型。
NVIDIA NeMo:用於微調大型語言模型(LLM)的框架。
NVIDIA RAPIDS:用於加速資料科學工作流。
相容常用框架:支援 PyTorch、Python 和 Jupyter Notebook 等流行工具。
使用者可以在本地開發模型,隨後直接部署到 NVIDIA DGX Cloud 或其他加速的雲和資料中心架構中,無需改動程式碼。
提供 NVIDIA AI Enterprise 軟體,保障企業級安全性、支援和生產環境發佈。
過去只有大企業或實驗室才能用得起的AI計算能力,現在變成了普通開發者都能負擔得起的工具。這意味著:
小團隊或個人可以開發和測試自己的AI模型。
AI研究和創新的門檻大大降低。
AI 計算的普及:通過降低硬體成本和部署難度,推動 AI 技術的普及。
創新驅動力:為個人和小型團隊提供前所未有的計算能力,激發更多創新。
生態系統的整合:將 NVIDIA 的硬體與軟體生態系統無縫結合,為使用者提供一站式解決方案。
多少錢?什麼時候能買到?
發售日期:2025年5月
售價:起步價為 3000美元,由 NVIDIA 和頂級合作夥伴聯合發售。
可在 NVIDIA 官網註冊獲取通知
評價
非常 🐂 P
一定要買個!
於此同時
NVIDIA 推出了全新 GeForce RTX 50 系列顯示卡和筆記型電腦
這些產品基於 Blackwell RTX 架構,帶來了革命性的性能提升和 AI 驅動的神經渲染技術。
RTX 50 系列提供高達 8 倍的性能提升(通過 DLSS 4)、高達 75% 的延遲降低(通過 Reflex 2),為遊戲玩家和內容創作者開啟了全新的可能性。
強大的 Blackwell 架構
包含 920 億個電晶體,採用最新的 GDDR7 視訊記憶體(速度高達 30Gbps),提供高達 1.8TB/s 的記憶體頻寬。
新一代 Tensor 核心和光線追蹤(RT)核心,支援即時渲染和更高效的 AI 模型處理。
DLSS 4 和 Reflex 2 的支援,提升遊戲流暢度和響應速度。
GeForce RTX 5090
CUDA 核心數:21,760
視訊記憶體:32GB GDDR7
視訊記憶體頻寬:1792 GB/s
Tensor 核心:680(第 5 代)
RT 核心:170(第 4 代)
主要性能提升:
性能是 RTX 4090 的 2 倍。
通過 DLSS 4 和 Multi Frame Generation,可支援 4K 解析度、240 FPS 和全光追遊戲。
支援生成式 AI 應用,圖像生成速度提升 2 倍,同時視訊記憶體佔用減少(FP4 模式)。
價格:起售價 $1,999
上市日期:2025 年 1 月 30 日
GeForce RTX 5080
CUDA 核心數:16,384
視訊記憶體:16GB GDDR7
視訊記憶體頻寬:960 GB/s
主要性能提升:
性能是 RTX 4080 的 2 倍。
可在 4K 解析度下暢玩支援光追的遊戲(如《賽博朋克 2077》和《Alan Wake 2》)、《黑神話:悟空》 等大作
滿足創作者對 3D 渲染和視訊編輯的高需求。
價格:起售價 $999
上市日期:2025 年 1 月 30 日
GeForce RTX 5070Ti
CUDA 核心數:12,288
視訊記憶體:16GB GDDR7
視訊記憶體頻寬:896 GB/s(相比 RTX 4070 Ti 提升 78%)
主要性能提升:
性能是 RTX 4070 Ti 的 2 倍。
在 2560x1440 解析度下,可高影格率運行光追遊戲。
價格:起售價 $749
上市日期:2025 年 2 月
GeForce RTX 5070
CUDA 核心數:10,240
視訊記憶體:12GB GDDR7
視訊記憶體頻寬:672 GB/s(相比 RTX 4070 提升顯著)
主要性能提升:
性能是 RTX 4070 的 2 倍。
在 2560x1440 解析度下,可高影格率運行光追遊戲,支援 DLSS Multi Frame Generation。
價格:起售價 $549
上市日期:2025 年 2 月
下一代創新技術
DLSS 4 神經渲染技術
DLSS 4 是 NVIDIA 最新的神經渲染技術,由 GeForce RTX Tensor 核心驅動,可顯著提升影格率的同時保持清晰的畫質。
每個傳統渲染幀可生成多達3個額外幀
影格率提升高達8倍
支援4K 240FPS全光線追蹤遊戲
首次在遊戲中應用 Transformer AI 模型
改進的時序穩定性和運動細節
Reflex 2 幀變形技術
NVIDIA Reflex 2 通過全新的幀變形技術將遊戲延遲降低高達75%,讓遊戲體驗更加流暢。
將遊戲延遲降低75%
同步CPU和GPU工作流程
基於最新滑鼠輸入更新渲染幀
為多人遊戲提供競爭優勢
讓單人遊戲更具響應性
NVIDIA ACE AI角色
NVIDIA ACE 是一套數字人物技術,通過生成式AI為遊戲角色和數字助手注入生命力。
AI驅動的遊戲角色行為
持續學習的敵人AI
自主行動的NPC系統
支援多款知名遊戲
即時響應玩家行為
Project R2X PC數字人
Project R2X 是一個基於視覺的PC化身,可以幫助使用者處理日常任務和提供AI輔助。
R2X 提供一個基於視覺的虛擬化身,可作為使用者的桌面助手。
它可以協助使用者完成多種任務,例如讀取和總結文件、管理應用程式、視訊會議等
支援視訊會議輔助
文件閱讀與總結
連接GPT4、Grok等雲端AI
支援多種開發框架
即時桌面應用輔助
NVIDIA 還發佈了 NVIDIA Cosmos™ 平台,這是一種專為加速物理 AI 系統(如自動駕駛車輛和機器人)開發而設計的先進工具套件。
Cosmos 包括生成式世界基礎模型(WFMs)、高級視訊標記器(tokenizers)、安全保障機制和加速視訊處理管道。
該平台旨在通過生成逼真、基於物理的合成資料,幫助開發者大幅降低物理 AI 模型開發的成本。
簡單來說就是:Cosmos專門用來幫助開發機器人和自動駕駛系統。它通過 AI 模型生成虛擬資料和模擬場景,讓開發者可以更快、更便宜地訓練和測試他們的 AI 系統,而不用花費大量時間和金錢去採集真實資料。
Cosmos主要能力
1. 生成虛擬資料
2. 快速處理視訊資料
3. 模擬和測試
4. 幫助開發 AI 模型
5. 多種應用場景
現場展示的機器人公司:
本次輝達發佈,將推進人工智慧更加應用化,使得模型訓練、微調進入消費級領域,同時也將推動AI應用、智能硬體和機器人大爆發! (小互AI)