在預熱了好幾天之後,馬斯克終於把憋了很久的「地球上最聰明的AI」聊天機器人推了出來:Grok 3。
陪同馬斯克一起做直播的xAI三位工程師有兩位華人面孔,開發人員表示,Grok 3於1月初完成了預訓練。在數學、科學和編碼基準測試中,Grok 3擊敗了Google的Gemini、DeepSeek、Anthropic的Claude和OpenAI的GPT-4o等一眾頂尖模型,並同時發布了適用於iOS和桌面的Grok應用程式。
Grok 3有點姍姍來遲,馬斯克的原計劃是於2024年年底問世,但最終未能達到預期,又經過數月打磨才推出來。
目前,AI產業的關注點聚焦在OpenAI下一代模型GPT-5上,馬斯克的xAI能否靠Grok 3打好翻身仗尚未可知。
多項性能參數霸榜
沒有太多花俏的表演,上來就是一波硬核參數對比輸出,雖然形式有點模仿OpenAI發表會。
根據介紹,xAI公司一直在孟菲斯的一個大型資料中心,利用約20萬個GPU訓練Grok 3,相比其前身Grok 2,Grok 3在開發過程中運算量提升了10倍,且訓練資料集有所擴充,據稱其中包含法庭案件文件,超級算力支撐對於AI發展的效能仍然存在巨大助力。
Grok 3有兩個變體,即Grok 3推理版和Grok 3 mini推理版,它們能夠像OpenAI的o3-mini以及中國DeepSeek的R1這類“推理” 模型一樣,仔細地“思考” 問題。亮點在於,Grok 3推理模型在給出結果之前會全面地對事實進行一輪核查,這有助於它們避免一些通常會難倒其他模型的陷阱。
在包括AIME(透過抽樣數學問題評估模型表現)和GPQA(使用博士級的物理、生物和化學問題評估模型)等基準測試中,Grok 3的表現超越了GPT-4o,在包括名為AIME 2025的最新數學基準測試等多個流行的基準測試中,Grok 3推理版也超越了o3-mini 3-mini 的最佳版本。
據xAI稱,Grok 3的早期版本在Chatbot Arena(一個眾包測試平台,讓不同的人工智慧模型相互較量,由用戶對偏好的回答進行投票)中也取得了頗具競爭力的成績,Grok-3的早期版本(代號「巧克力」)是業界首個突破1400分的大模型。
就功能介面而言,使用者可以要求Grok 3 「思考」(Think),或針對更難的問題,利用「大腦」 (Big Brain)模式進行額外、更細緻的推理,工作人員表示,這些模式最適合解決與數學、科學和程式相關問題。
此外,Grok3有一項名為「深度搜尋」(DeepSearch)的功能一同推出。 「深度搜尋」 是xAI針對諸如OpenAI的「深度研究」(Deep Research)這類人工智慧驅動的「深度研究」 工具給出的應對方案,該功能會掃描互聯網和X平台,分析信息,並針對查詢給出內容摘要。
Grok3目前不是免費的,但未來可能會開源。 X平台的Premium +訂閱用戶將率先用上Grok 3 ,而其他功能則需訂閱xAI推出的SuperGrok服務才能使用,SuperGrok定價為每月30美元或每年300美元,訂閱後可解鎖更多推理和“深度搜索” 查詢次數,還能無限次進行圖像生成。
馬斯克表示,未來最快大約一周後,Grok將增加“語音模式”,幾周後,Grok 3系列模型將與“深度搜索” 功能一同接入xAI的企業應用程序編程接口(API),再過幾個月,xAI將開源上一代模型Grok 2。
「我們的整體策略是,當下版本完全推出後,就開源Grok的上一版本。」馬斯克說。所以,Grok3也有開源的那一天。
還有一些有趣的小插曲。馬斯克一心奔赴火星,「Grok」這個詞也是來自羅伯特·海因萊因的小說《異鄉異客》,這個詞語被一個在火星長大的角色使用,意思是充分而深刻地理解某事。
此外,馬斯克還表示,Grok3正在開發俄羅斯方塊和寶石迷陣的混合版,“我們將在xAI推出一個人工智能遊戲工作室,如果你有興趣開發人工智能驅動的遊戲,請加入我們。我們今晚將宣布這一消息。”
Grok 3還將與特斯拉汽車整合在一起,具有語音版本,可增強駕駛體驗。
值得注意的是,Grok模型下一代運算集群也在籌備之中,其功率將提高約五倍,將不是四分之一千兆瓦,而是大約1.2千兆瓦,具備極為強勁的運算能力,可處理大規模、高複雜度的運算任務。
一款有「個性」的AI
大約兩年前馬斯克宣布推出Grok時,他將這款人工智慧定位為大膽、無過濾且反「覺醒主義」 的,總體而言,它願意回答其他人工智慧系統不願回答的爭議性問題。
例如有網友問上帝是否真實存在?如果你要讓它限定回答「yes or no」,它會選擇yes。但如果不限定,它會根據宗教信仰、哲學演化、科學視角等方面去論證存在與否。
不過,網友認為Grok 3深度搜尋功能或將是其最重要的特色抓手功能之一。與其他模型不同的是,它可以將社交媒體X的海量帖子+網絡內容結合起來作為來源,如果傳統媒體內容撒謊,它可以進行交叉驗證,並得出在互聯網上發布的最接近事實的真相。
此外,Grok 3可能是目前現實世界物理學的最佳基礎LLM,開發者提示:「編寫一個關於球在旋轉的超立方體內彈跳的Python腳本」。在沒有啟用「思考」或「大腦」模式的情況下,僅基礎模型就有不錯效果。
不過就在Grok 3直播發布的前幾小時,OpenAI創始人Sam Altman也放了一波預告進行截擊:對於高要求的測試者來說,試用GPT-4.5帶來的“感受通用人工智能(AGI)” 的體驗,遠比我預期的要深刻得多!
此外,他還向網友拋出一個小懸念,對於OpenAI下一個開源專案來說,做一個O3-mini等級的模型(相當小但仍需要在GPU上運行),還是做一個最適合手機端的模型,那個會更有用呢?
業界預測,如果接下來Grok-3在市場上很搶風頭,那麼OpenAI可能就會提前祭出大招GPT-4.5先來打壓一下。
AI頂尖模型的較量
在美國,人工智慧競賽前列的兩位科技領袖薩姆·奧特曼和伊隆·馬斯克之間的恩怨較量你來我往。
近期,馬斯克曾向競爭對手OpenAI旗下非營利組織提出974億美元的收購要約,但遭到了奧特曼的拒絕。馬斯克近幾年也對OpenAI和奧特曼提起了多起訴訟,並指責該公司違背了當初成為非營利組織的承諾,稱奧特曼為「騙子」。
「我希望他能透過開發更好的產品來競爭。」奧特曼在近期接受採訪時表示。 “很多很多的訴訟,各種瘋狂的事情,現在又發生收購這樣的操作,我們只能埋頭苦幹,繼續努力。”
這場AI戰爭還遠遠沒有結束。在奧特曼敦促馬斯克專注於打造更好的AI產品情況下,Grok-3應運而生,OpenAI接下來如何接招一起期待。(頭部科技)