輝達計畫推出一款專為幫助 OpenAI 和其他客戶建構更快、更高效的工具而量身定製的新處理器,這將對其業務進行重大變革,並有望重塑人工智慧競賽格局。
據知情人士透露,該公司正在設計一套用於“推理”計算的新系統,這種處理方式可以讓人工智慧模型響應查詢。知情人士稱,這個新平台將於下個月在聖何塞舉行的輝達GTC開發者大會上亮相,並將採用初創公司Groq設計的晶片。
推理計算一直是行業競爭的焦點。Google和亞馬遜等競爭對手都設計出了能夠與輝達旗艦級系統相媲美的晶片。此外,科技行業自主程式設計能力的爆炸式增長,也催生了對能夠更高效處理複雜人工智慧相關任務的新型晶片的需求。
據知情人士透露,OpenAI已同意成為這款新型處理器的最大客戶之一,這對輝達來說是一項重大勝利。作為輝達最大的客戶之一,ChatGPT的開發商OpenAI在過去幾個月裡一直在尋找比輝達晶片更高效的替代方案,並於上個月與一家晶片初創公司簽署了一項協議,為其提供了新的選擇。
周五早些時候,OpenAI在宣佈將從輝達購買大量“專用推理能力”以及獲得這家晶片巨頭300億美元投資時,就暗示了這款新型處理器的存在。此外,OpenAI還簽署了一項重要新協議,使用亞馬遜的Trainium晶片。
輝達一直主導著GPU(圖形處理器)的設計和銷售業務,GPU是一種可以同時執行數十億個簡單任務的處理器。但自人工智慧熱潮興起以來,它首次面臨其旗艦產品的侷限性。隨著市場向推理方向轉變,輝達感受到來自部分客戶的壓力,要求其生產能夠更高效地驅動人工智慧應用的晶片。
該公司強大的 Hopper、Blackwell 和 Rubin 系列 GPU 被認為是訓練大型 AI 模型的最佳選擇,價格也居高不下。大多數分析師估計,輝達控制著 90% 或以上的 GPU 市場份額。
輝達首席執行長黃仁勳一直聲稱,輝達的 GPU 在訓練和推理方面都是市場領導者,這種多功能性是該產品的一個關鍵吸引力。
但過去一年,隨著企業部署人工智慧代理和其他工具,對高級計算的需求已從訓練轉向推理。企業希望這些工具能夠顛覆數百個行業,並通過訂閱費創造巨額利潤。人工智慧代理是一種相對自主地代表使用者執行任務的人工智慧系統。
許多建構和營運人工智慧代理的公司發現,GPU成本過高、能耗過大,而且並不適合實際運行他們的模型。隨著智能體人工智慧的迅猛發展,輝達面臨著開發成本更低、能效更高的推理晶片的壓力。
上個月,OpenAI與Cerebras簽署了一項價值數十億美元的計算合作協議。Cerebras提供一款專注於推理的晶片,其首席執行長Andrew Feldman稱該晶片比輝達的GPU速度更快。《華爾街日報》此前報導稱,OpenAI的工程師去年秋天向Cerebras提出需求,希望獲得一款速度更快的推理晶片,用於智能體編碼應用,之後OpenAI便與Cerebras展開了談判。
據《華爾街日報》報導,輝達去年底同意支付 200 億美元,從 Groq 獲得關鍵技術許可,並聘請其高層領導,包括創始人喬納森·羅斯,這是矽谷有史以來規模最大的“收購式招聘”交易之一。
Groq設計的晶片採用了一種與Nvidia不同的架構,稱為“語言處理單元”,這種晶片在推理功能方面效率極高。然而,到目前為止,Nvidia對如何使用Groq的技術一直保持沉默。
人工智慧推理計算分為兩大任務:預填充,即模型解讀使用者提示的過程;以及解碼,即模型逐字生成響應的過程。預填充通常速度更快,而解碼對於大型人工智慧模型而言往往速度較慢。
編碼應用已成為企業級人工智慧最重要且最賺錢的應用之一,Anthropic 的 Claude Code通常被認為是市場領導者。但 Anthropic 主要依賴亞馬遜網路服務 (AWS) 和Alphabet旗下Google雲部門設計的晶片,而非輝達 (Nvidia) 的晶片來驅動其模型。
然而,Claude 最強勁的競爭對手之一是 OpenAI 快速發展的 Codex 工具。知情人士透露,ChatGPT 的開發者 OpenAI 計畫利用輝達的新系統來改進 Codex。
通常情況下,輝達會將Vera晶片(中央處理器,即CPU)與Rubin GPU搭配使用,建構高性能資料中心伺服器。但一些大型客戶發現,某些智能體AI工作負載僅使用CPU運行效率更高。
本月,輝達宣佈擴大與Meta Platforms的合作關係,其中包括首次大規模部署純CPU架構,以支援Meta的廣告定向AI代理。這項合作讓我們得以窺見輝達的戰略:不再侷限於GPU,而是通過其他方式來鎖定部分AI市場份額。 (半導體芯聞)