他的目標,可能是整個地球。
還有人比輝達的創始人黃仁勳,更適合做 2025 年 CES 的開幕主講人嗎?
作為標誌著 CES2025 正式揭幕的活動,黃仁勳的主題演講從一開始就是點燃眾人期待的開年盛事。
當地時間 1 月 6 日,黃仁勳換了一身閃亮的蛇皮夾克——而不是他經常在發佈會上穿的那件標誌性夾克。「我夾克怎麼樣?」老黃在開場就用這身皮衣和人們開起了玩笑。
畢竟,這裡是賭城拉斯維加斯,不「浮誇」一些都是對 CES 舉辦地的不尊重。
黃仁勳身上閃亮的皮衣,既代表了輝達今年誇張的市值表現,同樣意味著當晚的開場演講中,他將發佈一系列炸裂的產品。
如果你認為 RTX 5090 這樣的新「核彈」是老黃演講的重心,那顯然看輕了當晚的發佈會。輝達早已經成為 AI 行業的「兵工廠」,發佈會上黃仁勳不僅公佈了 Omniverse+Cosmos 這樣立足於物理世界的 AI 模型和整套生產流程,同時還曝光了一款仍未定名的桌面級 AI 超算「Project Digits」。
總結一句話,那就是,AI 發展的韁繩,依然牢牢掌控在輝達的手中。
首先登場的是今年的旗艦顯示卡重頭戲:RTX50 系列。
雖然經受著來自 AMD 的壓力,但在經曆數月的傳聞後,輝達終於在 CES 2025 上正式發佈了下一代 RTX Blackwell GPU 系列,共包括四款型號:
其中,RTX 5090 和 RTX 5080 將於 1 月 30 日發售,RTX 5070 Ti 和 RTX 5070 將於 2 月發佈。
RTX 50 系列採用全新的 Founders Edition 設計,配備雙向流通風扇以及 GDDR7 視訊記憶體,所有型號均支援 PCIe Gen 5 和 DisplayPort 2.1b 介面,可驅動高達 8K/165Hz 的顯示輸出。
得益於新架構 Blackwell 和 DLSS 4,RTX 5090 的性能據稱比 RTX 4090 快兩倍。不過功耗也增加了 125 瓦,但輝達表示其效率更高,只有在滿負荷時才會達到 575 瓦。
RTX 5080 性能同樣提升巨大,據稱比 RTX 4080 快兩倍;黃仁勳同時表示 RTX 5070 的性能等同於 RTX 4090,但售價僅有 $549。
輝達聲稱,RTX 5070 Ti 比 RTX 4070 Ti 快兩倍,而 RTX 5070 的性能等同於 RTX 4090,售價僅 $549。
但這個「翻倍」的性能提升中,新一代支援多幀生成的 DLSS 4 技術同樣功不可沒,它能在傳統渲染的基礎上生成最多 3 個額外幀,影格率可提升高達 8 倍。同時利用生成式 AI 提升材質壓縮與遊戲角色面部質量。
黃仁勳也直言「沒有生成式 AI,我們無法走到今天這一步」。
在演示中,輝達展示了 RTX 5090 在《賽博朋克 2077》中開啟 DLSS 4 後達到 238fps,而 RTX 4090 在 DLSS 3.5 下僅能達到 106fps。兩款 GPU 均啟用了完整的光線追蹤功能。
DLSS 4 還應用了即時 Transformer 模型,可改進影像品質、減少拖影並在動態畫面中提供更高細節。DLSS 4 的部分升級也將適配現有的 RTX GPU。
除了桌面級顯示卡系列,輝達還將在筆記型電腦上推出 RTX50 系列 GPU,將於 3 月起由多家 PC 製造商發佈產品登場。
當然也不能忘記針對中國市場特供的 RTX5090D 版本:從目前輝達官網公開的資訊來看,RTX5090D 在主要在 AI 算力上進行了削減,其他部分的性能沒有改變。
除了 RTX5090 系列顯示卡,支撐起輝達股價暴漲的,還有輝達在世界模型領域的進展。
在主題演講中,黃仁勳介紹了名為 Cosmos 的一系列世界基礎模型:這些模型能夠預測並生成「物理感知」(physics-aware)的視訊,其目的是為瞭解決當前 AI 模型「知其然不知其所以然」的問題。
目前,輝達發佈的 Cosmos 系列模型分為三大類:
這些模型參數規模從 40 億到 140 億不等,Nano 是最小的模型,Ultra 是最大的。雖然參數越多性能通常越好,但開發者仍然可根據具體應用進行微調,並可通過輝達的 API 和 NGC 目錄、GitHub 以及 Hugging Face AI 開發平台獲取。
據黃仁勳在演講中介紹,這些模型基於 9000 兆個標記(tokens)和 2000 萬小時的真實世界人機互動、環境、工業、機器人及駕駛資料訓練而成,但並未透露這些學習資料的具體來源:此前已經有報導表示這些資料來源是 YouTube 視訊。
對此,輝達只是表示「使用的資料來自多種公共和私人來源,這些都符合法律規定」。
回到世界模型本身,有了海量的現實世界視訊資料作為支撐,Cosmos WFM 模型能夠根據文字或視訊幀生成「可控的高品質」合成資料,用於機器人、自動駕駛汽車等領域的模型訓練和開發。
雖然與傳統意義上的「開源模型」有些偏差,但輝達還是允許無論公司規模如何,研究人員和開發者都可以根據輝達的開放模型許可協議自由使用 Cosmos 模型,並且該許可協議允許商業用途。
按照輝達展示的案例,Cosmos 已經被應用於模擬真實環境,如工廠車間或駕駛場景。或者與 Sora 類似,使用多模態內容(如文字、圖像、視訊以及機器人感測器資料)的輸入生成基於物理定律的視訊。
目前,已經有包括 Wayve、Uber 這樣的自動駕駛公司,在使用 Cosmos 用於加速自動駕駛技術的推進。黃仁勳也表示希望 Cosmos「能為機器人和工業 AI 領域帶來像 Llama 為企業 AI 所帶來的變革。」
除了世界模型,一同公佈的還有輝達數字孿生領域的新成果:Mega Omniverse Blueprint,一個用於建立工業數字孿生的框架。
輝達表示,這一全新框架通過軟體定義的測試和最佳化,為工廠和倉庫帶來了工業 AI 和機器人模擬的新平台。
據黃仁勳介紹,當前全球的 1000 萬工廠、近 20 萬個倉庫和 4000 萬英里高速公路構成了我們物理世界的「計算」網路。然而,這個龐大網路中的生產設施和配送中心網路仍然需要手動設計、操作和最佳化。
在倉儲和配送中,操作員面臨高度複雜的決策最佳化問題——包括人類工人、機器人、代理系統和裝置之間的變數和相互依賴性仍然複雜,,當前的數字孿生仍然很難實現在這種複雜環境下的分析與處理。
針對這種物理世界的需求,輝達發佈了名為「Mega」的 Omniverse Blueprint 框架,用於在數字孿生環境中大規模開發、測試和最佳化物理 AI 和機器人佇列,然後再部署到現實設施中。
目前,先進的倉庫和工廠已經開始使用超過數百個自主移動機器人、機械臂和人形機器人與人類協作工作。由於越來越複雜的感測器和機器人自主系統的實現,因此需要在模擬中進行協調訓練以最佳化操作、確保安全並避免中斷。
針對這種需求,Mega 提供了一個參考架構,基於輝達加速計算、AI、Nvidia Isaac 和 Nvidia Omniverse 技術,用於開發和測試數字孿生。這些數字孿生可用於測試驅動機器人的 AI 大腦、視訊分析 AI 代理、裝置等,從而處理龐大的複雜性和規模。
通過這種數字孿生,企業可以不斷更新其設施中的機器人大腦,以實現智能化的路徑規劃和任務分配,從而提升營運效率。
在模擬環境中,這些機器人可以通過感知和推理完成任務,規劃下一步動作並在數字孿生中執行。這種循環會持續進行,Mega 精確跟蹤數字孿生中所有資產的狀態和位置。
與 IT 行業不同,物理工業市場仍在等待自己的軟體定義時刻。「未來,每個工廠都會有一個數字孿生」黃仁勳說道。
隨著大模型「煉丹」在最近幾年迅速成為全民浪潮,就連普通使用者中都湧現出了了不少對高算力有需求的使用場景——但顯然不是每個人都有條件搞 GPU 叢集來訓練自己的大模型。
針對這種需求與現實的落差,這次輝達拿出了一個專屬的解決方案:一台相當於 Mac mini 大小的計算單元 Project Digits。
Project Digits的核心是新一代 GB10 Grace Blackwell 晶片,這款桌面級系統可以處理高達 2000 億參數 的 AI 模型,同時使用標準家用電源插座實現供電——這點在以往同等算力需要更大且耗電更多的硬體上來講通常是難以想像的事。
在 CPU 部分,Project Digits 採用輝達自家的 Grace CPU,採用定製 20 核心 ARM 架構,每台系統配備了 128GB 的統一記憶體(普通筆記型電腦可能只有 16GB 或 32GB 的 RAM)以及高達 4TB 的 NVMe 儲存空間。
輝達還為 Project Digits 使用者提供了各種 AI 軟體,包括開發工具包、編排工具,以及通過輝達 NGC 目錄提供的預訓練模型。作業系統運行基於 Linux 的 輝達 DGX OS,並支援主流框架,如 PyTorch、Python 和 Jupyter。
開發者可以利用輝達 NeMo 框架對模型進行微調,還可以使用輝達 RAPIDS 庫 加速資料科學工作流程。
在本地開發和測試 AI 模型後,使用者可以將這些模型部署到雲服務或資料中心基礎設施中,保持與 Grace Blackwell 架構和 輝達 AI 企業軟體平台的無縫對接。
不僅外觀與 Mac mini 相似,Project Digits 甚至就連用法都與 Mac mini 異常接近:對於需要更強大算力的應用,兩台 Project Digits 系統可以連接在一起,獲得足以處理高達 4050 億參數模型的性能。
換言之,有了兩台這樣的「Mac mini」,你就能實現在家搭建起一個能跑起來目前最頂級的大模型的「超算中心」。
Project Digits 將於今年五月正式推出,起售價為 3000 美元。雖然這仍然不是一個便宜的價格,但仍然是輝達為個人開發者提供的一種能夠接觸到超級算力的解決方案,同時也為 AI 應用的研發與部署,帶來了更高的靈活性和效率。
雖然 CES 上,消費電子才是主流,但是黃仁勳的開場,再次證明在仍在發展的 AI 浪潮中,基建的快速進化,才是重中之重。
算力、模型、應用落地,輝達的「AI 基建三件套」已經越來越成熟,這才是為什麼老黃並沒有再次說出那句經典得「買得多、省得多」——他早已不需要說了,輝達的重心早已不是單純的「賣卡」,他們有了更大的目標和野心。而當晚的發佈會上,黃仁勳已經將公司的計畫「提前劇透」了。 (極客公園)