吊打OpenAI和Google？！馬斯克坐鎮發布最強AI模型Grok 3，DeepSeek也是PK對象

2025/02/18

•

在預熱了好幾天之後，馬斯克終於把憋了很久的「地球上最聰明的AI」聊天機器人推了出來：Grok 3。

陪同馬斯克一起做直播的xAI三位工程師有兩位華人面孔，開發人員表示，Grok 3於1月初完成了預訓練。在數學、科學和編碼基準測試中，Grok 3擊敗了Google的Gemini、DeepSeek、Anthropic的Claude和OpenAI的GPT-4o等一眾頂尖模型，並同時發布了適用於iOS和桌面的Grok應用程式。

Grok 3有點姍姍來遲，馬斯克的原計劃是於2024年年底問世，但最終未能達到預期，又經過數月打磨才推出來。

目前，AI產業的關注點聚焦在OpenAI下一代模型GPT-5上，馬斯克的xAI能否靠Grok 3打好翻身仗尚未可知。

多項性能參數霸榜

沒有太多花俏的表演，上來就是一波硬核參數對比輸出，雖然形式有點模仿OpenAI發表會。

根據介紹，xAI公司一直在孟菲斯的一個大型資料中心，利用約20萬個GPU訓練Grok 3，相比其前身Grok 2，Grok 3在開發過程中運算量提升了10倍，且訓練資料集有所擴充，據稱其中包含法庭案件文件，超級算力支撐對於AI發展的效能仍然存在巨大助力。

Grok 3有兩個變體，即Grok 3推理版和Grok 3 mini推理版，它們能夠像OpenAI的o3-mini以及中國DeepSeek的R1這類“推理” 模型一樣，仔細地“思考” 問題。亮點在於，Grok 3推理模型在給出結果之前會全面地對事實進行一輪核查，這有助於它們避免一些通常會難倒其他模型的陷阱。

在包括AIME（透過抽樣數學問題評估模型表現）和GPQA（使用博士級的物理、生物和化學問題評估模型）等基準測試中，Grok 3的表現超越了GPT-4o，在包括名為AIME 2025的最新數學基準測試等多個流行的基準測試中，Grok 3推理版也超越了o3-mini 3-mini 的最佳版本。

據xAI稱，Grok 3的早期版本在Chatbot Arena（一個眾包測試平台，讓不同的人工智慧模型相互較量，由用戶對偏好的回答進行投票）中也取得了頗具競爭力的成績，Grok-3的早期版本（代號「巧克力」）是業界首個突破1400分的大模型。

就功能介面而言，使用者可以要求Grok 3 「思考」（Think），或針對更難的問題，利用「大腦」（Big Brain）模式進行額外、更細緻的推理，工作人員表示，這些模式最適合解決與數學、科學和程式相關問題。

此外，Grok3有一項名為「深度搜尋」（DeepSearch）的功能一同推出。「深度搜尋」是xAI針對諸如OpenAI的「深度研究」（Deep Research）這類人工智慧驅動的「深度研究」工具給出的應對方案，該功能會掃描互聯網和X平台，分析信息，並針對查詢給出內容摘要。

Grok3目前不是免費的，但未來可能會開源。 X平台的Premium +訂閱用戶將率先用上Grok 3 ，而其他功能則需訂閱xAI推出的SuperGrok服務才能使用，SuperGrok定價為每月30美元或每年300美元，訂閱後可解鎖更多推理和“深度搜索” 查詢次數，還能無限次進行圖像生成。

馬斯克表示，未來最快大約一周後，Grok將增加“語音模式”，幾周後，Grok 3系列模型將與“深度搜索” 功能一同接入xAI的企業應用程序編程接口（API），再過幾個月，xAI將開源上一代模型Grok 2。

「我們的整體策略是，當下版本完全推出後，就開源Grok的上一版本。」馬斯克說。所以，Grok3也有開源的那一天。

還有一些有趣的小插曲。馬斯克一心奔赴火星，「Grok」這個詞也是來自羅伯特·海因萊因的小說《異鄉異客》，這個詞語被一個在火星長大的角色使用，意思是充分而深刻地理解某事。

此外，馬斯克還表示，Grok3正在開發俄羅斯方塊和寶石迷陣的混合版，“我們將在xAI推出一個人工智能遊戲工作室，如果你有興趣開發人工智能驅動的遊戲，請加入我們。我們今晚將宣布這一消息。”

Grok 3還將與特斯拉汽車整合在一起，具有語音版本，可增強駕駛體驗。

值得注意的是，Grok模型下一代運算集群也在籌備之中，其功率將提高約五倍，將不是四分之一千兆瓦，而是大約1.2千兆瓦，具備極為強勁的運算能力，可處理大規模、高複雜度的運算任務。

一款有「個性」的AI

大約兩年前馬斯克宣布推出Grok時，他將這款人工智慧定位為大膽、無過濾且反「覺醒主義」的，總體而言，它願意回答其他人工智慧系統不願回答的爭議性問題。

例如有網友問上帝是否真實存在？如果你要讓它限定回答「yes or no」,它會選擇yes。但如果不限定，它會根據宗教信仰、哲學演化、科學視角等方面去論證存在與否。

不過，網友認為Grok 3深度搜尋功能或將是其最重要的特色抓手功能之一。與其他模型不同的是，它可以將社交媒體X的海量帖子+網絡內容結合起來作為來源，如果傳統媒體內容撒謊，它可以進行交叉驗證，並得出在互聯網上發布的最接近事實的真相。

此外，Grok 3可能是目前現實世界物理學的最佳基礎LLM，開發者提示：「編寫一個關於球在旋轉的超立方體內彈跳的Python腳本」。在沒有啟用「思考」或「大腦」模式的情況下，僅基礎模型就有不錯效果。

不過就在Grok 3直播發布的前幾小時，OpenAI創始人Sam Altman也放了一波預告進行截擊：對於高要求的測試者來說，試用GPT-4.5帶來的“感受通用人工智能（AGI）” 的體驗，遠比我預期的要深刻得多！

此外，他還向網友拋出一個小懸念，對於OpenAI下一個開源專案來說，做一個O3-mini等級的模型（相當小但仍需要在GPU上運行），還是做一個最適合手機端的模型，那個會更有用呢？

業界預測，如果接下來Grok-3在市場上很搶風頭，那麼OpenAI可能就會提前祭出大招GPT-4.5先來打壓一下。

AI頂尖模型的較量

在美國，人工智慧競賽前列的兩位科技領袖薩姆·奧特曼和伊隆·馬斯克之間的恩怨較量你來我往。

近期，馬斯克曾向競爭對手OpenAI旗下非營利組織提出974億美元的收購要約，但遭到了奧特曼的拒絕。馬斯克近幾年也對OpenAI和奧特曼提起了多起訴訟，並指責該公司違背了當初成為非營利組織的承諾，稱奧特曼為「騙子」。

「我希望他能透過開發更好的產品來競爭。」奧特曼在近期接受採訪時表示。 “很多很多的訴訟，各種瘋狂的事情，現在又發生收購這樣的操作，我們只能埋頭苦幹，繼續努力。”

這場AI戰爭還遠遠沒有結束。在奧特曼敦促馬斯克專注於打造更好的AI產品情況下，Grok-3應運而生，OpenAI接下來如何接招一起期待。(頭部科技)

吊打OpenAI和Google？ ！馬斯克坐鎮發布最強AI模型Grok 3，DeepSeek也是PK對象

吊打OpenAI和Google？！馬斯克坐鎮發布最強AI模型Grok 3，DeepSeek也是PK對象