Grok 4馬上發佈！馬斯克的 AI 將如何搶走 GPT-5 的風頭？

2025/07/10

•

就在OpenAI還在遮遮掩掩GPT-5發佈時間時，馬斯克卻要在明天晚上給全世界一個"驚喜"！ 🚀

這一次，xAI直接跳過了Grok 3.5，將在明天晚上8點（太平洋時間）的直播中震撼發佈Grok 4！這個被稱為"世界還沒準備好的模型"，究竟有什麼過人之處？

根據洩露的測試資料，Grok 4在"人類最後考試"基準測試中取得了45%的成績，而Google的Gemini 2.5 Pro只有21%！😱

這個"人類最後考試"可不是普通測試，它專門設計來衡量AI模型離人類推理能力還有多遠。要知道，就連OpenAI在深度研究模式下，使用了瀏覽器和Python工具，也沒能突破25%的成績。

更令人矚目的是，Grok 4在AIME'25測試中達到了95%的精準率，在GPQA測試中更是取得了88%的好成績。這些數字直接將它推向了當今最強AI模型的行列。

Grok 4最聰明的地方在於它的雙重設計：一個面向日常任務的通用模型，另一個專門為開發者打造的"Grok 4 Code"程式設計伴侶。💻

已經有API使用者在控制台中發現了程式碼名為"grok-4-code-0629"的程式設計版本，這表明xAI已經在與特定合作夥伴進行測試了。

還記得Grok 2曾經用"sus-column-r"這個代號悄悄進入LMSYS聊天機器人競技場嗎？它擊敗了Claude和GPT-4，登頂排行榜，驚豔了整個行業。

雖然Grok 4目前的令牌上下文窗口只有130,000個，相比GPT-5預期的100萬+令牌似乎不夠亮眼，但xAI選擇了速度而非容量。⚡

在即時應用中，處理速度往往比容量更重要。早期測試者反映，Grok 4處理請求的速度明顯快於競爭對手。

洩露的UI元素顯示，Grok可能會整合到特斯拉車載系統中，提供其他汽車還沒有的獨特語音啟動功能。🚗

馬斯克甚至承諾，第一款用Grok開發的AAA級遊戲將在明年發佈！雖然現在的AI模型只能生成簡單的遊戲，但Grok 4可能會改變這一現狀。

與其他依賴靜態訓練資料的模型不同，Grok直接從X平台獲取即時資訊。📱

在重大新聞事件或熱門話題爆發時，這種即時感知能力成為了巨大優勢。

xAI的快速發佈周期令人印象深刻：從2023年11月的Grok 1到2025年7月的Grok 4，這種速度在AI開發領域相當罕見。

公司在由20萬塊輝達GPU組成的超級叢集上訓練Grok 3，馬斯克聲稱這是"世界上最強大的AI訓練叢集"。

雖然GPT-5旨在服務OpenAI的1.23億日活躍使用者，但xAI似乎在瞄準特定的使用者群體：需要可靠程式碼生成的開發者、需要快速即時處理的企業，以及重視更少過濾響應的使用者。

如果按照xAI的商業模式，早期存取權可能會先給X Premium+訂閱者和SuperGrok使用者，API介面隨後開放。

你認為Grok 4能否在AI競爭中脫穎而出？它的即時資料優勢是否足以挑戰GPT-5的地位？在評論區分享你的看法，並轉發給你的朋友們一起討論吧！ 💭 (澤問科技)