有錢真土豪!馬斯克用10萬顆輝達晶片訓練特斯拉FSD和人形機器人

馬斯克在參觀了最近建成的德克薩斯州超級計算叢集後,透露了叢集的名稱。德州超級工廠的超級計算叢集被命名為“Cortex”,馬斯克指出他剛剛完成了新設施的演練。

特斯拉德州超級電腦群規模之大,讓網友感嘆遠遠超越了自己的想像:有錢真土豪!

德克薩斯州超級計算叢集擁有10萬顆輝達H100和H200晶片助力,10萬張H100/H200,專門用來訓練特斯拉的FSD和人形機器人Optimus。



按照一般市場價,H100單卡價格為21000到23000美金,H200單卡價格為26000到28000美金,也就是說,單單晶片就上億的成本。

馬斯克在 6 月份估計,特斯拉今年在輝達晶片上的支出可能達到 30 億至 40 億美元,佔公司總人工智慧相關支出 100 億美元的一半。

“計算超級工廠”每天都需要消耗大量的水力和電力。據馬斯克介紹,Cortex 超級計算叢集今年將需要約 130 MW 的電力, 18 個月內的電力需求有可能突破 500 兆瓦;冷卻需求同樣也非常巨大,為此特斯拉在電腦中心內安裝了巨大的風扇和四個水箱進行冷卻。

不過,馬斯克不是也自己研發晶片嗎,為什麼還要花那麼多錢買輝達的晶片?



特斯拉自己一直在搞晶片研發,比如:

FSD晶片:2016年左右開始研發,用於自動駕駛系統的核心處理器,如今這款晶片被計畫部署在更多車型上。

Dojo晶片:2019年左右開始研發,是為訓練自動駕駛神經網路而設計的超級電腦核心元件。

D1晶片:2019年左右開始研發,是特斯拉Dojo超級電腦的關鍵元件,採用台積電7納米工藝製造,具有極高的電晶體密度和計算能力,支援自動駕駛和機器人技術的研發。

不過特斯拉的自研晶片性能上始終與專業生產晶片的輝達存在差距

輝達自1993年成立以來,經歷了從顯示卡製造商到全球GPU領導者的蛻變。初期專注於圖形處理,隨後拓展到專業工作站和遊戲市場。2006年,推出CUDA平台,開啟GPU通用計算時代。2010年後,輝達進軍資料中心和自動駕駛領域,推出Tesla和DGX系列GPU,成為AI和深度學習的重要推動者。



輝達的很多款產品在性能上都是很多企業難以完全複製的。

NVIDIA的GeForce系列顯示卡具有強大的圖形處理能力、NVIDIA RTX具備即時光線追蹤技術;Titan RTX、Titan V等多款產品,可為專業的遊戲玩家、深度學習從業者、科研人員等提供強大的計算能力和體驗;Quadeo 系列顏色處理的精度以及穩定性都非常高;Tesla V100適合資料中心用來進行大規模資料分析和深度學習等等。

馬斯克購買的H100和H200則是NVIDIA推出的更新一代的GPU,輝達的H100和H200晶片是目前市場上最先進的AI計算晶片之一,專為深度學習和神經網路訓練而設計。這些晶片具備高性能、低功耗和高度可擴展性的特點,使得“Cortex”叢集能夠處理海量的資料和複雜的計算任務。



相位元斯拉自研晶片的定製化和專注自行駕駛領域,輝達的通用計算能力更勝一籌、也更能適應廣泛的計算任務。

據馬斯克透露,他希望在2025年秋季之前讓超級電腦運行起來,並將親自負責按時交付,“計算超級工廠”完成後,連接的晶片組的規模將至少是當今最大的GPU叢集的四倍。 (蜂耘網)