“如果一切順利,SpaceX 將於 2026 年將搭載 柯博文機器人和 Grok 的星際飛船送上火星。”——埃隆·馬斯克
2月18日,馬斯克在X平台直播,重磅發佈了“地球最強AI”Grok 3。
背景上寫了xAI的使命:理解宇宙。Our mission is to understand the universe。
兩位華人研究員坐在C位撐場,分別是曾就職於Google研發小組N2Formal的吳宇懷(Yuhuai “Tony” Wu)2021年博士畢業於多倫多大學機器學習專業,博士期間曾在DeepMind和OpenAI實習,並在斯坦福大學從事博士後研究。
以及多倫多大學電腦科學助理教授Jimmy Ba。多倫多大學電腦科學博士,師從“AI教父”Geoffrey Hinton 2024年諾貝爾獎得主。
馬斯克只是負責大方向,在發佈會上多負責聽。
看來中美AI競爭,依舊是智力上的競爭。
Grok3將立即對X平台的Premium+訂閱使用者開放。
還推出了SuperGrok高級訂閱服務,能夠提供額外的推理和DeepSearch查詢功能,月費30美元,年費300美元。
Grok3背後的xAI團隊,已經在慶祝歡呼~
xAI 的創始團隊中,有很多曾在 DeepMind、OpenAI、Google、微軟、特斯拉、多倫多大學等公司和機構的 AI 研究者。
目前公佈的 12 位成員裡,華人有 5 位,華人成創始團隊主力:吳宇懷、Jimmy Ba、楊格、張國棟、戴子航。
用20萬顯示卡堆砌出來的Grok 3,到底表現如何?
Grok 3在Chatbot 競技場盲測中,程式碼、指令響應各方面排名第一。
超過OpenAI,也超越了DeepSeek。
基準測試顯示,Grok-3在數學能力測試、科學知識評估、程式設計能力測試中分別得分為52分、75分、57分,超過了DeepSeek-V3、GPT-4o、Gemini-2 Pro、Claude 3.5 Sonnet等大模型。
看來有錢真的能為所欲為,力大飛磚依舊有效,20萬張GPU讓Grok3登頂全球第一。
為了支援Grok3訓練,xAI在短短三個月,將資料中心訓練叢集翻倍20萬塊GPU。
xAI 已經與伺服器大廠戴爾達成一份協議,xAI將向戴爾採購價值50億美元的AI伺服器。輝達GB200晶片將於今年交付給馬斯克的xAI。
AI大佬Andrej Karpathy試用Grok3後點評:
Grok3+Thinking大概和 OpenAI 最強的模型(比如 o1-pro,月費 200 美元)相當,比 DeepSeek-R1和 Gemini 2.0 Flash Thinking 略好一些。
有網友發現了Grok 3的缺陷,比如不擅長編碼。
也已經有網友,製作了100%GROK3創作的遊戲了。
只需告訴它想要什麼,然後將程式碼放在正確的位置,就搞定。
有網友評價Grok 3,是目前世界物理學的最佳基礎 大語言模型了。
提示:“編寫一個關於球在旋轉的超立方體內彈跳的 Python 指令碼”。
山姆奧特曼的AI梗圖。
Grok 3支援“Big Brain”模式,能夠使用更多算力進行更深度的思考。
比如:如何從地球上發射火箭到火星上並返回地球?
這個問題涉及到大量的數學、物理邏輯的演算。
Grok 3不僅完成了準確的推理計算,包括登入火星的任務、火星探索的發射方式、宇航員的出艙時間、火星探索的軌道的運轉等,而且根據程式碼生成了3D動畫。
另外,馬斯克在X上確認,xAI將成立一家AI遊戲公司。Grok要讓遊戲再次偉大。
不同於常規遊戲,Grok 3可以將兩個遊戲的要素融合在一起打造全新的遊戲。
現場演示中,他們將經典遊戲“俄羅斯方塊”和“消消樂遊戲”,喂給了Grok 3,最終生成了一個結合兩款遊戲特色的新遊戲。
不過演示環節慘遭翻車,馬斯克也直言吐槽“oh man”,好在後續恢復“正常”。
工程師稱,將很快發佈AI遊戲設計社區,以後可以在xAI上設計遊戲、玩遊戲。
發佈會最後是Q&A環節。
“Grok是男孩還是女孩?”
馬斯克無奈一笑:“Grok可以想做什麼就做什麼(Grok can be whatever it wanted to be)。"
緊接著他又補充道,人們會愛上Grok。
馬斯克提到了開源計畫,在 Grok 3 正式發佈後開源 Grok 2,也就是會有開源舊版本 Grok 的計畫,之前也開源了 Grok 1。
所以可能 Grok 3 也會在 Grok 4 出來之後開源。
xAI公司在去年5月份完成了一輪60億美元的融資。去年12月,公司又宣佈完成了一輪60億美元的C輪融資。有資料稱,該公司上一次估值約為510億美元。
馬斯克作為一個擁有很多個不同領域的公司,不出意外一定會把 Grok、Starship、Optimus 這些東西結合起來。 (奇偶工作室)