馬斯克又在熬夜了!
這次他和xAI團隊整夜在打磨Grok,而且進展不錯。
更重要的是,下一代模型將直接跳到Grok 4,計畫在7月4日之後發佈。
馬斯克在深夜發推透露,他正在和@xAI團隊一起"grinding on @Grok all night"(整夜打磨Grok)。
看來這位矽谷鋼鐵人的工作強度依然驚人。
但Grok 4還需要什麼?
馬斯克明確提到:還需要為專門的編碼模型進行一次大規模訓練(one more big run for a specialized coding model )。
這意味著,Grok 4 或將在程式碼生成和理解方面有重大突破。
實際上,馬斯克對Grok 4的野心遠不止於此。
早在6月21日,他就在X上放出了一個更瘋狂的項目:用Grok 3.5(或許直接叫Grok 4)重寫整個人類知識庫,加入缺失資訊,刪除錯誤內容,然後基於這個“純淨版”知識庫重新訓練模型。
只是馬斯克曾宣稱「下周發佈」的Grok 3.5 一直久久沒有發佈…
馬斯克指出:「現在任何基於未修正資料訓練的基礎模型裡垃圾太多了。」
簡單來說,馬斯克想讓Grok成為人類知識的 「審計員」和「補全者」。
先前Grok官方帳號解釋了這個計畫的技術路徑:
Grok 3.5可能會交叉引用大量資料集,使用邏輯推理髮現空白,並從第一原理推理來假設應該存在什麼。它可能會分析科學文獻或歷史中的模式…
這相當於讓AI成為知識界的福爾摩斯,透過蛛絲馬跡找出人類知識體系中的漏洞。
但這個宏大計畫面臨嚴峻的現實挑戰。
David McKenzie Jr.(@Manitu06351) 表達了對Grok 3 的批評和對Grok 4 的期待:
太好了,我已經厭倦了和Grok爭論才能得到真相。舊版的Grok太容易接受主流敘事而沒有支援證據,然後還要我詳細解釋為什麼我不接受它。我最後花更多時間在和Grok辯論而不是把它當作搜尋引擎用,因為它會隱藏那些不支援它論點的資訊。太令人沮喪了!
當前Grok在資訊檢索和推理邏輯上確實還存在著不少偏差問題——要能擔當好「知識稽核員」的重任,Grok 4 壓力不小。
更尷尬的是,Erik G.(@egrindhe)指出了Grok的基礎計算能力問題:
請先別這麼做!至少在Grok能正確計算數字之前! Grok 3現在連指數運算都會失敗,每次嘗試都會得到不同答案。
他舉例說,1.29^21的正確答案是210.0796,但Grok給的答案五花八門,沒一次對的。
Jocelyn Chew(@jocelynchew)也遇到了類似問題:
我讓Grok從一個日期減去90天,它做不到──非常失望。
“連基礎數學和日期計算都出錯,談何重寫人類知識庫?”
mardahay(@Mardahay) 提出:
大部分知識要麼丟失了,要麼被鎖起來了。你如何判斷什麼是事實,什麼不是?什麼是知識,什麼是觀點?本體論、認識論、形形之間的區別呢?
這涉及了判斷知識真偽的哲學根基──沒有明確的認識論框架,AI如何區分事實與觀點?
Armando N(@anoriega007)提出了一個建設性建議:
與其刪除錯誤資訊,是否可以將資料標記為“正確”或“錯誤”?保留過去的錯誤資訊可以獲得很多洞察,只要它被正確分類。
這個想法值得參考──錯誤本身,也是知識演進的一部分。
Alexandre N(@AlexandreNault) 對專業化訓練充滿期待:
最後能有一些專業化訓練就好了。例如工程公司資料庫、建築師之類的。
關於垂直領域深度最佳化的方向,考慮到馬斯克提到的“specialized coding model”,Grok 4可能會在特定領域實現突破。
Matty McCann(@Matty_McCann_)關心透明度問題:
「未修正資料」-我們如何以最透明的方式看到這一點,讓人們信任它? AI的一些明顯測試是它如何處理新冠問題——它是相信官方敘述還是真相?
而Missgevious(@Missgevious1) 的抱怨則很實際:
我只希望X上的Grok在一個對話超過20個基礎回答時不要崩潰!
TimeForRealChange(@WillWeMakeIt29) 則比較關心垃圾內容的影響:
希望它有一些好的垃圾過濾器,因為到目前為止表現不太好。
Ben 🌲(@Lewified) 則直接問到:
那你們會開源Grok 3嗎?
考慮到xAI先前的開源承諾,Grok 3的開源計畫是否該提上議程了…
也更有網友戲稱:AGI 只剩下20 次小升級了!
從「整夜打磨」到「重寫知識庫」,馬斯克的野心依舊美麗且偉大。但技術發展有其客觀規律,跨越式進步需要紮實的基礎——當前版本Grok 的使用者槽點,確實還挺有點多…
「specialized coding model」或許是正確的方向-先在特定領域做深做透,再逐步擴展到更廣闊的知識領域。
當使用者還在為日期計算、圖像識別、長對話穩定性等基礎問題困擾時,Grok 4 需要的不只是更宏大的願景,還需要更紮實的基本功。
7月4日之後,我們將看到的是一個真正的技術突破,還是另一個「過度承諾」的鴿rok?
很快,我們就會看到答案。 (AGI Hunt)