馬斯克的AI野心從20萬GPU開始

埃隆·馬斯克的Colossus AI基礎設施,據說是世界上最強大的AI計算叢集之一,剛剛達到滿負荷運行。這個龐大的計算系統旨在突破人工智慧的界限,現在由20萬個GPU組成,全部運行在特斯拉Megapack電池上。這是馬斯克進軍人工智慧領域的一個重要里程碑。

隨著現場變電站上線並連接到主電網,位於田納西州孟菲斯的Colossus AI基礎設施的第一階段現已完成。據稱,這台超級電腦現在以150兆瓦的功率在電網中運行。額外的150兆瓦Megapack電池系統將作為備用電源,確保在停電或電力需求增加期間繼續運行。

Colossus AI是馬斯克AI公司xAI的旗艦產品。這台超級電腦在以驚人的速度建造後,於去年7月首次啟用了10萬個輝達(Nvidia) GPU。整個項目在122天內完成,而硬體安裝到偵錯階段只花了19天。該項目的速度給Nvidia首席執行官黃仁勳留下了深刻印象,他指出,這種規模的項目通常需要四年左右的時間,部署速度非常快。

黃仁勳說:“據我所知,世界上只有一個人能做到這一點。”“埃隆對工程、建築、大型系統和資源調配的理解是獨一無二的;這簡直令人難以置信。”

然而,這種速度是有代價的,因為該設施最初缺乏與電網的直接連接。為了保持營運,該工廠依賴天然氣渦輪發電機供電,這引發了人們對排放和可持續性的擔憂。

早期報告顯示,有14台渦輪機正在供電,每台發電2.5兆瓦,但居民的觀察表明,周邊地區的渦輪機數量可能已超過35台。這是允許限額的兩倍多。這種對臨時電源的依賴引發了關於該設施長期能源計畫的討論,尤其是在xAI尋求進一步擴大營運規模的情況下。

在基礎設施中加入更多的GPU意味著AI叢集現在可以更多地依賴電網電力,而不是燃氣發電機。這將有助於提高效率並解決環境問題。據報導,xAI計畫在夏末前拆除一半的臨時發電機。另一半臨時發電機將不得不留下來滿足第二階段的電力需求。

馬斯克計畫在今年年底前將Colossus AI的容量翻一番。另外還將增加150兆瓦,使總容量達到300兆瓦。這相當於為30萬戶家庭供電。毫不奇怪,這種巨大的電力需求引發了人們對田納西河流域管理局(TVA)是否有足夠能力支援它的擔憂。

xAI已公開表示計畫將其Colossus超級電腦擴展到100多萬個GPU。對於當地經濟,Colossus AI承諾經濟發展和基礎設施投資。然而,人們仍然擔心居民的電能質量會受到干擾,以及該項目對環境的影響。

基層組織孟菲斯社區反污染組織(MCAP)主任KeShaun Pearson說:“你不會獲得技術創新的綽號,如果有人進來利用你的自然資源、水,利用漏洞污染空氣。”“這種趨勢是危險的,因為它使我們的城市更容易被利用。”

為100萬個GPU供電的道路始於馬斯克於2023年7月創立xAI。明確的目標是“瞭解宇宙的真實本質”。更實際地說,馬斯克希望在自己的指導下建立一個人工智慧實驗室,不受微軟、Google或其他主要科技公司的影響。

該公司是對OpenAI(現在有微軟作為親密合作夥伴)和GoogleDeepMind日益增長的主導地位的回應。xAI還與馬斯克的其他企業進行了整合,包括SpaceX和特斯拉。隨著Colossus現在滿負荷運行,xAI有能力在馬斯克更廣泛的生態系統中加速人工智慧的開發和部署。 (Ai時代前沿)