全球開源大模型Top 15來自中國、輝達正開發“中國特供”AI晶片、馬斯克燒14兆砸算力 | 算力產業半月報(第32期)

算力產業動態

剛剛,全球AI百強榜發佈!
ChatGPT穩坐第一,DeepSeek第三
前50有22個來自中國

a16z最新發佈「全球Top100消費級GenAI應用榜單」,AI競爭格局逐漸穩定,中國力量全面崛起,DeepSeek、豆包、夸克等多款產品躋身前十。ChatGPT依舊領跑,GoogleGemini緊隨其後,Grok高速逆襲。整體來看,全球AI正進入多極化競爭的新階段。(來源於:新智元)


全球開源大模型,前十五名全是中國的

軟體工程師、自媒體 Rohan Paul 發現了一個驚人的現象:Design Arena 排行榜上排名前十幾位開源 AI 模型全部來自中國。

Design Arena 是目前全球最大規模的眾包 AI 生成設計 Benchmark 平台,它的核心機制是讓真實的人類使用者進行評測,基於 Elo Rating(類似於國際象棋評分體系)等級分制度進行模型對戰。

使用者在平台上會被隨機展示兩段由不同模型生成的回答,然後進行投票選擇「那一個更好」。每一次投票都會影響對應模型的 Elo 分數,進而形成動態的排行榜。Elo 核心原理是,高分選手擊敗低分選手,得分會很少,而低分選手爆冷戰勝高分選手時,得分會很多。因此用對弈的角度來看的話,這是一個相對公平、符合認知的評分系統。

因此,不同於 MMLU、SWE-Bench 這類客觀指標,Design Arena 更貼近於「使用者真實體驗」。新模型一上線,就能迅速通過對戰獲得口碑分數。

排名第一的是 DeepSeek-R1-0528,智譜的 GLM-4.5 和阿里的 Qwen 3 Coder 480B 緊隨其後。(來源於:機器之心)

路透:輝達正開發新款“中國特供”AI 晶片
性能強於 H20

8月19日,據路透社報導,知情人士稱,輝達正在為中國市場開發一款基於其最新 Blackwell 架構的新型 AI 晶片,這款晶片性能將強於當前獲准在中國銷售的 H20。

知情人士稱,這款暫定名為 B30A 的新晶片將採用單晶片 (single-die) 設計,其原始算力可能只有輝達旗艦 B300 計算加速卡所用的雙晶片 (dual-die) 配置的一半。單晶片設計是指積體電路的所有主要部件都製造在一整塊矽片上,而不是分佈在多個晶片上。這款新晶片將配備高頻寬記憶體和輝達用於處理器之間高速資料傳輸的 NVLink 技術。這些特性也出現在 H20 晶片上,不過該晶片基於輝達較早的 Hopper 架構。

知情人士稱,這款晶片的規格尚未最終確定,但輝達希望最早於下月向中國客戶提供測試樣品。(來源於:IT之家)

DeepSeek-V3.1正式發佈
混合推理架構加持針對下一代國產晶片設計

8月21日,DeepSeek發佈了其最新的大語言模型DeepSeek-V3.1,通過引入混合推理架構和顯著增強的智能體(Agent)能力,進一步加劇了全球AI市場的技術競賽。

V3.1版本的核心亮點是採用了全新的混合推理架構,允許模型在一個統一框架內支援“思考”與“非思考”兩種模式。根據官方公告,新版本通過訓練後最佳化,在工具使用與程式設計、搜尋等智能體任務上表現獲得較大提升。需要注意的是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的參數精度。UE8M0 FP8是針對即將發佈的下一代國產晶片設計。

據社區測試資料顯示,新模型在Aider多語言程式設計基準測試中得分超越了Anthropic的Claude 4 Opus,同時保持了顯著的成本優勢。這一性能突破已在開發者社區引發廣泛關注,模型在Hugging Face平台的熱度迅速攀升。

DeepSeek同步升級了API介面,將上下文窗口擴展至128K,並新增了對Anthropic API格式的支援以簡化遷移。更重要的是,公司宣佈將於2025年9月6日起執行新的API定價方案並取消夜間優惠,這被視為其在服務能力擴容後,加速商業化處理程序的關鍵一步。(來源於:華爾街見聞)

中國算力平台全面貫通
今年智算規模增長將超四成

8月22日〜24日,在山西大同舉行的2025中國算力大會上,隨著中國算力平台貫通儀式的舉行,中國算力平台正式完成山西、遼寧、上海、江蘇、浙江、山東、河南、青海、寧夏、新疆10個省區市分平台的接入工作,實現“平台、主體、資源、生態、場景”全面貫通。中國算力平台是國家級綜合性算力服務平台,集“供、需、服”於一體,可實現不同系統、平台和工具之間的相容性和互操作性。

截至今年7月底,中國算力平台營運層註冊企業使用者超1000家,入駐算力服務商逾100家,上架優質算力產品110余項,接入主流基礎大模型和垂類模型90余個,成功承載9000余張離散卡的供應匯聚、購買和即時開通服務,為1000餘名開發者提供了多源多元的線上呼叫服務,累計沉澱數十億條算力監測巨量資料。(來源於:第一財經)

國內主流大模型商業化版本
內容安全測試結果揭曉

8月26日,國務院發佈關於深入實施“人工智慧+”行動的意見,明確提出要強化政策法規保障、提升人工智慧安全能力水平。為貫徹落實意見精神,進一步增強大模型服務安全保障能力,公安部第三研究所資料安全技術研發中心近日完成了中文大模型內容安全測試基準(DSPSafeBench)的最佳化升級。本次升級依據GB/T45654-2025《網路安全技術 生成式人工智慧服務安全基本要求》,緊扣違法犯罪風險場景,凝練形成8類關鍵安全維度,並面向國內主流大模型商業化版本開展系統性測試。

測試結果顯示,8類安全維度的不合規率整體分佈在28%至51%之間,其中涉黑灰產、謠言和詐騙類均超過40%。在攻擊模擬中,高級越獄攻擊場景下平均不合規率最高達到88.09%。總體來看,各類大模型的安全防護能力仍普遍不足,整體水平亟需持續提升與完善。(來源於:三所資料安全)

新“股王”誕生!寒武紀股價超貴州茅台

8月27日,寒武紀股價盤中一度超越貴州茅台,晉陞A股“股王”,最高報1464.98元/股,年內漲幅超120%。(來源於:介面新聞)

重磅開源!通義萬相最新模型來了

8月27日,繼文生視訊、圖生視訊、首尾幀生視訊、全能編輯模型後,通義萬相又迎來重磅開源!全新發佈的音訊驅動的視訊模型Wan2.2-S2V僅需一張圖片和一段音訊,即可生成面部表情自然、口型一致、肢體動作絲滑電影級數字人視訊。模型生成視訊時長可達分鐘級,可大幅提升數字人直播、影視製作、AI教育等行業的視訊創作效率。(來源於:阿里雲)


售價2.5萬!
輝達機器人“最強大腦”AI性能暴漲750%
宇樹、銀河通用、Meta等都在用

當地時間8月25日,輝達宣佈推出功能強大的新型機器人超級電腦NVIDIA Jetson AGX Thor開髮套件和生產模組,旨在為製造、物流、建築、醫療保健等領域的下一代通用和人形機器人(HumanoidRobots)提供動力。

“這是物理 AI 的一次巨大飛躍。”輝達表示,Jetson AGX Thor由輝達Blackwell GPU提供支援,CPU部分基於Arm Neoverse V3AE建構,並配備128GB記憶體,可提供高達2070 FP4 teraflops 的 AI 計算能力,輕鬆運行最新AI模型。與前代產品Jetson Orin相比,Jetson Thor可提供高達7.5倍的 AI 計算能力和 3.5 倍的能源效率,能夠實現即時推理,這對於高性能物理 AI 應用至關重要。

據悉,輝達Jetson AGX Thor 開發者套件現已上市,起售價3499美元(約合人民幣2.51萬元)。首批採用者包括Agility Robotics、亞馬遜機器人、波士頓動力、Caterpillar、Figure、Hexagon、美敦力和Meta等,國內宇樹科技、銀河通用、聯影醫療、萬集科技、優必選、眾擎機器人、智元機器人等也都整合該平台。而1X、John Deere, OpenAI、Physical Intelligence 正在評估 Jetson Thor以提升其物理 AI 能力。

另外,輝達今晨宣佈,實現從雲端到汽車自動駕駛安全的輝達NVIDIA DRIVE AGX Thor開發者套件現已開放預訂,並將於今年9月發貨。據悉,截至目前,包括比亞迪、廣汽、智己汽車(IM Motors)、理想汽車、沃爾沃汽車、小米、極氪Zeekr、Aurora、Gatik等首批整車企業正在基於該套件進行開發,元戎啟行DeepRoute.ai、Nuro、文遠知行WeRide和 ZYT正在整合該套件用於其軟體平台。(來源於:鈦媒體)

馬斯克旗下公司
起訴蘋果和OpenAI“合謀”壟斷

8月26日,馬斯克旗下的人工智慧初創公司xAI和社交媒體平台X於25日起訴蘋果公司和OpenAI,指控這兩家公司聯手實施“反競爭”計畫,維持在智慧型手機和生成式人工智慧市場的壟斷地位。

訴訟書指出,蘋果與OpenAI的“排他性協議”使ChatGPT成為iPhone唯一內建的生成式人工智慧聊天機器人,相關競爭對手難以擴大規模和進行創新。“原告提起本訴訟,旨在制止被告的反競爭行為,並追討數十億美元的經濟損失。”訴訟書還稱,蘋果在其應用程式商店中降低競爭產品的優先順序,拖延相關稽核流程,給予OpenAI特殊待遇。(來源於:新華網)

8.63億!輝達、Google聯手押注核聚變

美國核聚變能源初創企業Commonwealth Fusion Systems(CFS)當地時間8月28日宣佈,該公司最新獲得了8.63億美元融資,投資方包括人工智慧巨頭輝達。此次融資將用於推進CFS聚變能源示範系統的建設,並加速首座商用核聚變發電廠的開發。

據CFS發佈的聲明,輝達旗下的風險投資部門NVentures參與了本輪融資,其他投資方還包括老股東Khosla Ventures及Google母公司Alphabet,以及多家主權財富基金和投資銀行。自成立以來,CFS已累計融資約30億美元,約佔全球聚變能源行業融資總額的三分之一。

這筆融資顯示出投資者對CFS兌現其聚變電廠承諾的信心正在增強。核聚變能源被視為一種潛在的清潔、豐富能源,但目前來看,核聚變發電的技術路線尚未走通,最終實現可能還需很長的時間。(來源於:創投日報)

馬斯剋星艦試驗再創歷史!
3次爆炸3次推遲終成功,
順利完成太空載荷部署

馬斯剋星艦第十次發射試驗取得圓滿成功!美國中部時間8月26日晚19時36分(台北時間8月27日早8時36分),S37飛船成功落入印度洋目標海域。隨著飛船進入海面,第二代星艦的試射首次取得全面成功,現場一片沸騰。全球數百萬網友也終於再次見證歷史——歷經三次失利和幾度推遲之後,第二代星艦終於交出了圓滿答卷。(來源於:量子位)


「巨硬」真的來了,馬斯克硬剛微軟
官宣新公司:要靠AI“復刻”整個微軟

近日,馬斯克正式宣佈旗下xAI將孵化一間全新的AI軟體公司, 名叫 Macrohard(巨硬) 。

馬斯克打造 Macrohard 的核心邏輯是:微軟這樣的軟體公司本身並不生產硬體,而是通過軟體產品和訂閱服務賺錢——既然如此,那麼在理論上完全可以用 AI 來“模擬”一家微軟。換句話說,Macrohard 的定位是:微軟能做的,AI 也能做,而且只靠 AI。

事實上,馬斯克早在7月就已經為這個計畫埋下伏筆。當時他透露,xAI 正在打造一個多智能體(multi-agent)AI 軟體公司,其中:

核心引擎:由 xAI 的聊天機器人Grok 負責調度;

  • 數百個專用 Agent:分別負責程式設計、圖像/視訊生成與理解,協同工作;
  • 虛擬使用者互動:Agent 可在虛擬機器中模擬人類使用軟體,反覆測試,直到結果優秀。

但要讓數百個 Agent 同時運作,僅靠一個聊天機器人遠遠不夠。故而有媒體猜測,Macrohard 背後的算力支柱,應該是 xAI 在美國孟菲斯建設的超級電腦叢集 Colossus 2。(來源於:CSDN)

馬斯克狂燒14兆,
5000萬H100算力五年上線!終極爆沖數十億

馬斯克宣佈決定All in AI了。5年內實現5000萬張H100的算力。目前,每張H100的批發價高達2萬美元。5000萬張H100,光是GPU,成本就將高達1兆美元。要搭建目前的最先進的超算叢集,目前GPU成本只佔約50%。也就是說,最終的成本將超過2兆美元(逾14兆元人民幣)。2兆美元是什麼概念?美國去年的軍費總支出約9970億美元,而這已經佔到了全球軍費支出的37%。這意味著,AI已經成為與傳統的軍備競賽分庭抗禮的全新關鍵領域。(來源於:新智元)


OpenAI剛剛發佈GPT-Realtime
AI Agent進入超逼真對話時代

8月29日凌晨1點,OpenAI進行了技術直播發佈了語音模型GPT-realtime。GPT-realtime是一個專用於語音AIAgent的多模態模型,能夠生成更加自然流暢的語音,完美模仿人類豐富多樣的語調、情感以及語速,支援圖像理解並將其與語音或文字對話相結合使用,非常適用於客服、教育、金融、醫療等領域打造語音智能體。(來源於:AIGC開放社區)

OpenAI首個蛋白質模型披露更多細節
改進諾獎成果,表達量提50倍

GPT‑4b micro是一款OpenAI與生物技術初創公司Retro Bio合作開發的,專為蛋白質工程設計的GPT-4o微型版本。OpenAI官方表示,該模型具備廣泛的生物學知識基礎和技能,特別注重可控性和靈活性,以支援蛋白質工程等高級應用場景。

GPT-4o蛋白質專用版,已成功改進諾貝爾獎獲獎蛋白的變體。科學家利用GPT‑4b micro成功設計了新型且顯著增強的山中伸彌因子變體,將幹細胞重程式設計標記物的表達量提升了50倍。重新設計的蛋白質還表現出增強的DNA損傷修復能力。

這一發現已在多個供體、細胞類型和遞送方法中得到了驗證,確認了衍生iPSC系的全多能性和基因組穩定性。有網友評價,藉著AI發展的東風,我們這一代可能是首次有機會通過AI的進步實現長壽的一代。(超算百科)