馬斯克有10萬張H100 GPU!OpenAI基礎設施計畫曝光



1、馬斯克AI超級電腦再升級!再加10萬張

馬斯克打造的超級AI訓練叢集Colossus,7月份就已初步建成,10萬張H100 GPU的恐怖算力已經讓業界震驚。但這對馬斯克來說還不夠,他還要再加10萬張。


Colossus位於德克薩斯州的孟菲斯,距離特斯拉超級工廠約6.5小時車程,方便特斯拉團隊就近使用。它採用了單一RDMA架構,所有GPU都連接在同一個高速、低延遲的網路上,允許它們高效地相互通訊,協同工作效率大幅提升。

Colossus 已經正式上線,從開始建設到上線,只用了 122 天。馬斯克還透露,Colossus 將在未來幾個月內再增加 10 萬張 GPU,其中 5 萬張是更先進的 H200,這意味著 Colossus 的算力將再次翻倍。 (來源:AI寒武紀)


2、OpenAI AI基礎設施藍圖曝光,首站美國各州,預計耗資數百億美元

據知情人士透露,OpenAI首席執行官Sam Altman正在逐步明確其大規模建設人工智慧所需機器和系統的計畫,預計首先在美國各州實施的項目將耗資數百億美元。

正在討論的項目包括建設資料中心、增加能源容量和傳輸以及擴大半導體製造。支持者可能包括加拿大、韓國、日本和阿聯的投資者,同時,OpenAI也期待其他私營公司的參與。

微軟作為ChatGPT製造商的最大投資者,可能是潛在合作夥伴之一,儘管微軟未對具體項目發表評論,但表示參與了OpenAI與基礎設施相關的廣泛努力。

最近幾周,包括Altman在內的OpenAI高管一直在與投資者會面,推進這一計畫。OpenAI首席戰略官Jason Kwon前往日本和韓國討論該計畫,全球政策副總裁Chris Lehane與加拿大投資者進行了交談,而Altman本人也與阿聯投資者進行了進一步的對話,並與美國投資者進行了交流。

這些談判正值OpenAI即將進行新一輪數十億美元的融資,公司估值預計將超過1000億美元。預計該交易將由Thrive Capital牽頭,微軟、蘋果和輝達也將參與。(來源:智通財經)


3、英特爾酷睿Ultra 200V系列處理器發佈:平台AI算力沖上120 TOPS

英特爾在德國柏林召開全球新品發佈會,正式發佈專為輕薄本設計的英特爾酷睿Ultra 200V系列處理器。該系列產品進一步提升性能的同時,再次突破了x86能效,並且在圖形性能、應用相容性和AI計算能力方面有著突出表現。

隨著英特爾酷睿Ultra 200V系列處理器發佈,有超過80款搭載該系列處理器的AI PC亮相,這些產品來自包括宏碁、華碩、戴爾、惠普、聯想、LG、微星和三星在內的超過20家PC製造商。

新產品今日開啟預購,並在全球30多家零售商於9月24日起發售。搭載英特爾酷睿Ultra 200V系列處理器並運行最新版本Windows的所有產品都能夠從11月起免費更新并包括Windows 11 AI+ PC功能。(來源:新浪數位)


4、Google AI 推出 CardBench 評估框架:含 20 個真實資料庫,更全面評估基數估計模型

Google AI 研究人員最新推出了CardBench 基準,主要為學習型基數估計(cardinality estimation)滿足系統評估框架需求。

CardBench 基準是個綜合評估框架,包含 20 個不同真實資料庫中的數千次查詢,大大超過了以往的任何基準。


CardBench 代表了在學習的基數估計方面的重大進步。研究人員可以通過提供全面、多樣的基準,系統地評估和比較不同的 CE 模型,從而促進這一關鍵領域的進一步創新。該基準能夠支援需要較少資料和訓練時間的微調模型,為訓練新模型成本過高的實際應用提供了切實可行的解決方案。(來源:IT之家)


5、李飛飛團隊提出ReKep,讓機器人具備空間智能,還能整合GPT-4o

近日,李飛飛團隊在這一研究方向取得了一個突破,提出了關係關鍵點約束(ReKep/Relational Keypoint Constraints)。簡單來說,該方法就是將任務表示成一個關係關鍵點序列。


並且,這套框架還能很好地與 GPT-4o 等多模態大模型很好地整合。從演示視訊來看,這種方法的表現相當不錯。該團隊也已發佈相關程式碼。本文一作為 Wenlong Huang。

李飛飛表示,該工作展示了視覺與機器人學習的更深層次融合!雖然論文中沒有提及李飛飛在今年 5 年初創立的專注空間智能的 AI 公司 World Labs,但 ReKep 顯然在空間智能方面大有潛力。(來源:機器之心)


6、專用於理解遊戲場景的開源大模型 VideoGameBunny

加拿大阿爾伯塔的研究人員專門開源了一款針對遊戲領域的大模型VideoGameBunny(以下簡稱“VGB”)。


VGB可以作為視覺AI助理,能夠理解遊戲環境並提供即時反饋。例如,在探索型的3A遊戲中,可以幫助玩家識別關鍵物品或進行問答,幫助玩家能夠更快地掌握遊戲技巧,從而增強遊戲的互動性和沉浸感。

VGB也可以通過分析大量的遊戲圖像資料,夠檢測到圖形渲染的錯誤、物理引擎的不一致性等,幫助開發人員快速識別和修復遊戲中的bug和異常。(來源:AIGC開放社區)


7、Meta 公佈 Llama AI 模型家族下載量資料:全球超 3.5 億

Meta 公司昨日披露了 Llama 開源AI模型家族在 Hugging Face 的下載量情況,上個月(8 月 1 日- 8 月 31 日),相關模型的下載次數就超過了 2000 萬次,截至9月1日,Llama模型家族全球下載量已突破3.5億次。


Meta 公司在今年 4 月發佈了 LLM Llama 3,於今年 7 月推出了 Llama 3.1,將上下文長度擴展至 128K,新增支援 8 種語言,並首次提供了 405B 參數版本,Meta提到,目前“Llama 3.1-405B”版本“最受使用者歡迎”。

而在合作夥伴方面,Meta 提到他們繼亞馬遜 AWS 和微軟 Azure 後已陸續與 Databricks、戴爾、Google雲、Groq、輝達、IBM watsonx、Scale AI、Snowflake 等平台合作提供Llama 模型。該公司自 7 月發佈 Llama 3.1 以來,在“主要雲端合作夥伴平台”上的 Llama 使用量(以 token 計算)據稱已增至為原來的兩倍。(來源:IT之家)


8、DataGrail峰會爐邊談話:AI發展超速,安全護欄建設“追不上”了

據VentureBeat報導,在2024年DataGrail峰會上,Instacart首席資訊安全官(CISO)David Tsao和Anthropic首席資訊安全官Jason Clinton進行一場深入對話,就人工智慧(AI)的快速發展所帶來的風險發出了警告。

Clinton稱:“AI的計算能力目前正處於一個指數增長的階段,而這種指數增長的趨勢非常難預測。指數的快速增長正在將AI推向未知領域,這意味著目前的保護措施可能很快將不再適用。”(來源:智東西)

(奇偶工作室)