馬斯克又放出狠話了!
這次他把目標瞄準了整個AI行業:xAI將很快超越除Google之外的所有公司,然後再「顯著超越」Google。
但馬斯克也坦承,中國公司將是最強勁的競爭對手,因為他們擁有比美國多得多的電力供應,而且在硬體建設方面超級強悍。
這話倒也不算是空口無憑。
xAI在孟菲斯的Colossus資料中心創造了讓業界震驚的速度:僅用122天就建成並全面營運,配備了10萬塊Nvidia H100 GPU。
輝達CEO黃仁勳直接稱這是「超人等級」的成就,只有馬斯克能做到。
後來,這個資料中心又在92天內擴容到了20萬塊GPU。
馬斯克的火箭速度,實在生猛。
而在這之後,Grok 4也終於在上個月發佈,並成為世界上最智能的模型,包含原生工具使用和即時搜尋整合功能。
在AIME數學考試中,它獲得了近乎完美的95分,GPQA基準測試得分88,軟體工程基準SWE-bench得分75。
更為強悍的是,Grok 4 Heavy在Humanity's Last Exam上獲得了50.7%的分數,成為第一個突破50%的模型。
在ARC-AGI V2測試中,Grok 4創下了15.9%的新紀錄,幾乎是Claude Opus 4(約8.6%)的兩倍。
但有意思的是,預測市場的資料卻似乎不太想給馬斯克面子。
在預測平台Kalshi上,xAI在年底前擁有最佳AI的機率只有16%,排在OpenAI之後,而Google則高達60%。
SightBringer(@The_Prophet_) 第一時間為老馬站台,並給出自己的解讀:
馬斯克不是在虛張聲勢,但他也不是線上性思考。xAI不是要建構「最好的聊天機器人」或在基準測試分數上擊敗OpenAI。
這是關於建立西方認知的重心:市場、敘事、政治,最終是信念,都插入他擁有的單一堆疊中。
這就是他將其融入X的原因。
這位分析師認為,這本質上是一場「主權戰爭」,而不僅僅是AI競賽:
Google代表著衰落的帝國,臃腫而防守;
OpenAI是被俘獲的祭司階層,受到機構約束;
Anthropic只是一個精品安全項目;
中國是工業國家挑戰者,建立原始力量;
而xAI則是叛亂的主權遊戲,融合了AI、平台和國家一致性。
馬斯克特別強調了中國在電力方面的優勢。
資料顯示中國的發電能力是美國的3倍多,成本只有美國的30%,而且隨著他們部署可再生能源的速度超過世界其他地區的總和,這個成本還在快速下降。
面對這種差距,美國的AI發展路徑需要另闢蹊徑。
有人建議發展聚變能源,有人提議購買小型模組化反應堆(SMR),還有人想知道特斯拉的儲能系統能否在一定程度上彌補差距。
同時,密蘇里州和猶他州等地區已經開始向xAI拋出橄欖枝,強調當地充足的電力供應:有水壩和核電站的支撐。
就在今天,馬斯克宣佈xAI已經開源了Grok 2.5模型,並計畫在大約6個月內開源Grok 3模型。
這延續了xAI的開源傳統。
早在去年3月,xAI就發佈了3140億參數的混合專家模型Grok-1的基礎模型權重和網路架構。這是一個從零開始訓練的模型,採用Apache 2.0許可證。
開源策略背後,既有技術民主化的理想,也有商業競爭的考量。
但自然,也會有一部分原因,則是在嘲諷OpenAI名不符實的閉源策略
儘管馬斯克信心滿滿,但Grok 4也面臨著批評。
在創意寫作基準測試中,Grok 4表現平平,處於中等水平。在前端任務方面,它的表現也不盡如人意,沒有進入前五名。
更嚴重的是,有使用者抱怨Grok 4在處理複雜PDF的OCR、識別著名地標、識別車牌來源國等實際任務時表現糟糕。
就我而言,目前研究性的尋找性的,我還是會優先用使用ChatGPT,其餘則大部時候會使用Claude,而Grok 用下來,有時確實會出現重複且錯誤的引用,甚至即使我指出錯誤後它還是很倔就是不改……
儘管存在爭議,xAI的發展勢頭不減。
根據發佈會上展示的時間表,2025年接下來的三個月內將有四個主要版本發佈:8月的編碼模型、9月的多模態智能體和10月的視訊生成模型。
年底發佈Grok 5.
而這場AI競賽,也早已經不再只是演算法和模型的較量,更是基礎設施、能源和生態系統的全方位比拚。
確實除了Google,馬斯克手裡的好牌不少。
不過,雖然xAI的「速度力量」驚人,但最終是否能鎖定勝局,現在還為時尚早了。 (AGI Hunt)