剛剛，馬斯克宣佈：Grok 4 將於7月4日後發售！

2025/06/28

•

馬斯克又在熬夜了！

這次他和xAI團隊整夜在打磨Grok，而且進展不錯。

更重要的是，下一代模型將直接跳到Grok 4，計畫在7月4日之後發佈。

馬斯克在深夜發推透露，他正在和@xAI團隊一起"grinding on @Grok all night"（整夜打磨Grok）。

看來這位矽谷鋼鐵人的工作強度依然驚人。

但Grok 4還需要什麼？

馬斯克明確提到：還需要為專門的編碼模型進行一次大規模訓練（one more big run for a specialized coding model ）。

這意味著，Grok 4 或將在程式碼生成和理解方面有重大突破。

Grok 4的野心：重寫人類知識庫

實際上，馬斯克對Grok 4的野心遠不止於此。

早在6月21日，他就在X上放出了一個更瘋狂的項目：用Grok 3.5（或許直接叫Grok 4）重寫整個人類知識庫，加入缺失資訊，刪除錯誤內容，然後基於這個“純淨版”知識庫重新訓練模型。

只是馬斯克曾宣稱「下周發佈」的Grok 3.5 一直久久沒有發佈…

馬斯克指出：「現在任何基於未修正資料訓練的基礎模型裡垃圾太多了。」

簡單來說，馬斯克想讓Grok成為人類知識的 「審計員」和「補全者」。

先前Grok官方帳號解釋了這個計畫的技術路徑：

Grok 3.5可能會交叉引用大量資料集，使用邏輯推理髮現空白，並從第一原理推理來假設應該存在什麼。它可能會分析科學文獻或歷史中的模式…

這相當於讓AI成為知識界的福爾摩斯，透過蛛絲馬跡找出人類知識體系中的漏洞。

關鍵技術挑戰

但這個宏大計畫面臨嚴峻的現實挑戰。

David McKenzie Jr.(@Manitu06351) 表達了對Grok 3 的批評和對Grok 4 的期待：

太好了，我已經厭倦了和Grok爭論才能得到真相。舊版的Grok太容易接受主流敘事而沒有支援證據，然後還要我詳細解釋為什麼我不接受它。我最後花更多時間在和Grok辯論而不是把它當作搜尋引擎用，因為它會隱藏那些不支援它論點的資訊。太令人沮喪了！

當前Grok在資訊檢索和推理邏輯上確實還存在著不少偏差問題——要能擔當好「知識稽核員」的重任，Grok 4 壓力不小。

更尷尬的是，Erik G.(@egrindhe)指出了Grok的基礎計算能力問題：

請先別這麼做！至少在Grok能正確計算數字之前！ Grok 3現在連指數運算都會失敗，每次嘗試都會得到不同答案。

他舉例說，1.29^21的正確答案是210.0796，但Grok給的答案五花八門，沒一次對的。

Jocelyn Chew(@jocelynchew)也遇到了類似問題：

我讓Grok從一個日期減去90天，它做不到──非常失望。

“連基礎數學和日期計算都出錯，談何重寫人類知識庫？”

mardahay(@Mardahay) 提出：

大部分知識要麼丟失了，要麼被鎖起來了。你如何判斷什麼是事實，什麼不是？什麼是知識，什麼是觀點？本體論、認識論、形形之間的區別呢？

這涉及了判斷知識真偽的哲學根基──沒有明確的認識論框架，AI如何區分事實與觀點？

Armando N(@anoriega007)提出了一個建設性建議：

與其刪除錯誤資訊，是否可以將資料標記為“正確”或“錯誤”？保留過去的錯誤資訊可以獲得很多洞察，只要它被正確分類。

這個想法值得參考──錯誤本身，也是知識演進的一部分。

Alexandre N(@AlexandreNault) 對專業化訓練充滿期待：

最後能有一些專業化訓練就好了。例如工程公司資料庫、建築師之類的。

關於垂直領域深度最佳化的方向，考慮到馬斯克提到的“specialized coding model”，Grok 4可能會在特定領域實現突破。

Matty McCann(@Matty_McCann_)關心透明度問題：

「未修正資料」－我們如何以最透明的方式看到這一點，讓人們信任它？ AI的一些明顯測試是它如何處理新冠問題——它是相信官方敘述還是真相？

而Missgevious(@Missgevious1) 的抱怨則很實際：

我只希望X上的Grok在一個對話超過20個基礎回答時不要崩潰！

TimeForRealChange(@WillWeMakeIt29) 則比較關心垃圾內容的影響：

希望它有一些好的垃圾過濾器，因為到目前為止表現不太好。

開源承諾何在

Ben 🌲(@Lewified) 則直接問到：

那你們會開源Grok 3嗎？

考慮到xAI先前的開源承諾，Grok 3的開源計畫是否該提上議程了…

也更有網友戲稱：AGI 只剩下20 次小升級了！

從「整夜打磨」到「重寫知識庫」，馬斯克的野心依舊美麗且偉大。但技術發展有其客觀規律，跨越式進步需要紮實的基礎——當前版本Grok 的使用者槽點，確實還挺有點多…

「specialized coding model」或許是正確的方向－先在特定領域做深做透，再逐步擴展到更廣闊的知識領域。

當使用者還在為日期計算、圖像識別、長對話穩定性等基礎問題困擾時，Grok 4 需要的不只是更宏大的願景，還需要更紮實的基本功。

7月4日之後，我們將看到的是一個真正的技術突破，還是另一個「過度承諾」的鴿rok？

很快，我們就會看到答案。（AGI Hunt）