【CES 2026】黃仁勳的推理戰爭-AI推理成本暴跌90%

上一會還在沉浸在機器人,車機在 CES 的震撼(見當科技停止講故事,開始拼執行力:從 CES 2026,看全球科技進入“現即時代”),下一秒拉斯維加斯的CES展會剛結束,那個永遠穿黑色皮衣的老黃——黃仁勳,又讓整個科技圈坐不住了。

這次他沒有再站在台上喊"我們的算力有多強",而是拋出了一個更實在的問題:

"用AI太貴了,得降價。"

聽起來有點像淘寶商家的思路?但這次不一樣。

當大家還在為搶到NVIDIA上一代晶片擠破頭時,他直接甩出了下一代平台——Rubin。更關鍵的是,他喊出了一句話:

訓練AI的戰爭結束了,接下來打的是推理戰爭。

(圖片來源@dotey)

01 什麼是"推理戰爭"?

先說個簡單的例子。

想像你在學開車。

"訓練"就是駕校教練一遍遍教你的過程,需要時間和教練的精力。AI公司這幾年就是這麼幹的——砸錢買幾萬塊GPU,沒日沒夜地訓練模型。

"推理"就是你自己開車上路,每次看到紅綠燈做判斷、遇到行人踩剎車。這才是AI真正被使用的時候。

過去三年,科技巨頭們瘋狂干的事就是"訓練"——花大錢、用成千上萬塊GPU,把ChatGPT、Claude這些模型訓練得越來越聰明。

但問題來了:模型是聰明了,真正用的時候太貴了。

就像你花100萬請了個世界冠軍教你開車,結果每次出門還得再付100塊"使用費"。出門一趟兩趟還好,天天誰受得了?

這就是黃仁勳要解決的問題:讓AI真正用得起。

這次CES上,他沒再吹"我們的晶片有多牛",而是一直在講"怎麼把成本打下來"。

Rubin平台這次能做到什麼程度?

同樣的AI任務,成本只要原來的十分之一。
以前花1美元能做的事,現在10美分就夠了。

什麼概念?就像你原來打一次車要100塊,現在降到10塊,原本偶爾打打車,現在可能天天打都無所謂。

只有算力便宜到這個份上,AI應用才能真正爆發。

02 Rubin是怎麼做到的?

NVIDIA這次玩了個新花樣。


以前顯示卡時代,大家都想著怎麼把單塊顯示卡做更強。有點像小時候搭積木,總想著搭個最高的塔。

但黃仁勳說:單塊積木再高也有限制,不如搭個"團隊"。

所以Rubin平台一口氣放出了6塊不同的晶片

  • Rubin GPU:負責"計算"的大腦
  • Vera CPU:負責調度的管家
  • NVLink 6:連接所有晶片的高速公路
  • 還有其他幾塊專門負責網路、資料流動的晶片

這6塊晶片不是隨便湊一起,而是像一支配合默契的足球隊——前鋒、中場、後衛、守門員各司其職,比一個人單打獨鬥強多了。

最終結果呢?

整個平台的推理性能達到上一代的5倍
成本反而降到了1/10

這就是"團隊作戰"的威力。

特別要說一下NVLink 6。

精準地說:NVLink 6是連接多塊GPU的"高速公路",頻寬達到3.6TB/s。它讓多塊GPU能像一塊一樣協同工作,是實現相較於上一代有"5倍性能提升"的關鍵一環,但不是唯一因素。

整個5倍提升是6塊晶片一起發力的結果。

有點像裝修房子:

  • NVLink 6是寬敞的走廊,讓各房間連接順暢
  • 但房子好不好用,還得看客廳、臥室、廚房怎麼配合

03 讓AI學會"思考"

光有便宜的算力還不夠,AI還得"聰明"。

之前很多自動駕駛AI像什麼?

像只會條件反射的蟲子。看到紅燈停,看到綠燈行,遇到沒見過的情況就懵了。

NVIDIA這次開放原始碼的Alpamayo模型,想教AI學會"思考"。

什麼意思?

想像你在開車,突然遇到一個壞掉的紅綠燈——既不紅也不綠,就那麼黃燈閃啊閃的。

條件反射式的AI會怎麼做?可能直接卡住,因為"題庫"裡沒這題。

但真正會"思考"的AI會琢磨:

周圍的車在幹嘛?
大家都在慢慢通過,看來可以走。
但要小心點,隨時準備剎車。

這種"琢磨"的過程,就是Alpamayo想教給AI的能力。它加入了"思維鏈"功能,讓AI不再是死記硬背,而是學會像人一樣推理。

有人說得挺形象:以前的AI是背題庫,Alpamayo是教機器解題的方法。

更關鍵的是,NVIDIA把這個模型開源了——相當於把解題思路免費公開,讓誰都能拿去用。

為何這麼做?

用黃仁勳的話說:軟體都免費了,開發者想用好,自然就得買NVIDIA的硬體來跑它。

這招挺聰明的。

就像印表機廠家把印表機賣得很便宜,靠賣墨盒賺錢。NVIDIA是把"墨盒"免費了,但你要用還得買它的"印表機"。

04 這對普通人意味著什麼?

說了這麼多,跟普通人有啥關係?

如果你是個使用者:

以後你用的AI應用可能會更便宜。因為算力成本降了,那些靠AI生成的圖片、視訊、客服聊天,價格都可能跟著降。

如果你是個開發者:

搭AI應用的成本會大幅降低。以前可能因為太貴不敢做的項目,現在可以試試了。而且NVIDIA開源了Alpamayo,你可以直接拿去用,不用從零開始。

如果你是投資者:

NVIDIA在賭下一個大方向:AI從"實驗室"走向"真實世界"。

你看它這次和奔馳合作,直接把整套自動駕駛系統裝到2026年上市的CLA車型上。還在往人形機器人領域使勁。

ChatGPT只是AI的開始,真正的大市場是那些能跑、能跳、能幹活的機器。

總之,AI可能真的要從"昂貴的高科技玩具"變成"像水電一樣的基礎設施"了。

至於這一天什麼時候真正到來?

那就看Rubin平台2026年下半年正式出貨後的表現了。

05 摩爾定律慢下來了,黃仁勳沒有

摩爾定律說的是晶片性能每18個月翻一番。但現在這個定律已經明顯慢下來了——物理快到極限了。

但黃仁勳沒有等。

從Hopper到Blackwell,再到現在的Rubin,NVIDIA的節奏從來不是等摩爾定律來推自己,而是自己去推摩爾定律。

這次CES傳達的訊號很明確:

造更聰明的AI時代過去了,接下來要讓AI用得起。

這才是AI真正走進千家萬戶的開始。 (白羊武士弗拉明戈)