馬斯克，放大招！Grok-3來了

2025/02/18

•

馬斯克，放大招！

台北時間2月18日中午，馬斯克旗下人工智慧初創公司xAI開發的Grok-3模型正式發佈。此前，馬斯克將Grok-3描述為“地球上最聰明的AI”。他在X平台上表示：“自己整個周末都在和團隊打磨產品”。

台北時間12:18，Grok-3發佈會正式開始。在發佈會背景板上，寫著"our mission is to understand universe（我們的使命是瞭解宇宙）"。馬斯克曾表示，xAI公司的目標就是“瞭解宇宙”。截至發稿時，直播觀看人次超300萬次。

馬斯克在直播中表示，Grok的名字來自海因萊因的小說《異鄉異客》，主角是一個在火星上長大的人類，而Grok這個詞代表了全面深刻地理解事物。

xAI團隊介紹，Grok-3的性能比Grok-2提升了一個數量級，和Grok-3聊天會覺得非常有趣。

xAI團隊在直播中展示稱，Grok-3和Grok-3 mini在多方面的測試得分上都超過或媲美Gemini和ChatGPT等對手。在訓練Grok的過程中，團隊搭建了大型算力叢集，並克服了散熱、電力等問題帶來的挑戰，用了122天讓首批10萬張GPU投入使用並正常運行，現在他們計畫將叢集規模繼續擴大一倍。

團隊還演示用Grok-3生成程式碼，並運行了這段程式碼。畫面上顯示出了飛船在地球和火星間往返的動畫。隨後，Gork-3又演示了製作一款類似於俄羅斯方塊的遊戲。馬斯克稱，將在xAI推出一個人工智慧遊戲工作室。

此外，xAI宣佈推出名為Deepsearch的Grok-3智能搜尋引擎。名字和最近大熱的Deepseek頗有幾分相似。

Grok 3聰明在那？

在此前舉行的世界政府峰會上，馬斯克通過視訊通話表示，Grok-3是“地球上最聰明的人工智慧”。他表示，Grok-3將在推理、程式設計能力以及文字和圖像分析等多模態能力方面有顯著提升，它的表現“優於目前所有已發佈的產品”。

馬斯克強調，Grok-3可以減少AI幻覺，方法是通過來回檢查資料並嘗試實現邏輯一致性。他還透露，訓練Grok-3所使用的算力遠多於此前的版本，並使用了大量合成資料。

不同於DeepSeek的演算法最佳化路徑（DeepSeek-V3用2048個H800 GPU，訓練2788千小時），xAI透露，Grok-3的開發的得益於用8個月時間建成的Colossus超級電腦，它由10萬個輝達的H100 GPU驅動，為訓練提供了2億個GPU小時，比Grok-2多十多倍。

2023年7月，馬斯克成立xAI公司。2023年11月，xAI發佈第一款大模型 Grok-1，擁有3140億參數，成為當時參數量最大的開源大語言模型；2024年8月發佈的Grok-2，在性能上與ChatGPT最新模型相媲美。該系列大模型可以通過聯網獲取即時資訊，瀏覽和使用X平台（原推特）上的資訊，使其具有資訊獲取的時效性。

AI大模型群雄逐鹿

馬斯克的xAI成為AI大模型領域強有力的競爭者，同樣參與這場競技的還有OpenAI、Google、Anthropic以及近期引發全球關注的中國初創企業DeepSeek。

OpenAI於近日宣佈，公司將在未來幾個月內推出新一代人工智慧模型GPT-5和GPT-4.5。據稱，GPT-5將整合OpenAI的多項核心技術，包括o3推理模型。

OpenAI首席執行官兼聯合創始人SamAltman今日凌晨在社交平台表示：“對於高要求的測試者來說，試用GPT-4.5的體驗，遠比我預期的要深刻得多！”業內人士預計，這說明GPT-4.5已經進入測試階段，離正式發佈非常近了。

2月初，DeepSeek新模型發佈後，Google公司發佈Gemini2.0系列模型，該系列模型強化了編碼與推理能力，全面開放使用並降低成本。

另有消息稱，Anthropic計畫在未來幾周內發佈新的混合型大模型Claude 4，使用者可以自行控制使用時的推理成本。

當地時間本周一，總部位於法國巴黎的Mistral發佈名為Mistral Saba的定製大模型，特點是具有高精準率的阿拉伯語互動能力。

今年春節以來，中國初創企業DeepSeek發佈新模型DeepSeek-R1，以極低的訓練成本和使用成本，超越OpenAI對標模型，攪動AI大模型競爭，也在國內各大行業帶起了大模型接入潮。

據不完全統計，已經有數百家公司正式接入DeepSeek研發的大模型。包括國內三大基礎營運商、超過15家晶片廠商，以及包括雲服務、網路科技、金融在內的200多家企業，多個手機廠商和車企，地方政府政務系統，以及微軟、輝達、亞馬遜等世界級雲端運算巨頭都宣佈接入DeepSeek。

騰訊集團確認，微信自2月15日起開始灰度測試接入DeepSeek-R1模型，增強其搜尋功能。消息一出，引發騰訊股價大漲。2月16日晚間，百度搜尋宣佈將全面接入DeepSeek和文心大模型最新的深度搜尋功能。

智能、免費

大模型加速走入日常生活

值得關注的是，在DeepSeek的推動下，大模型正朝著越來越智能且免費的方向發展，這也加快了大模型走入日常生活的腳步。

百度官方宣佈，文心一言將於4月1日起全面免費，所有PC端和APP端使用者均可體驗其最新模型，包括超長文件處理、專業檢索增強、高級AI繪畫、多語種對話等功能。2月13日凌晨，OpenAI也公佈了GPT-5的最新消息，OpenAI將在未來幾個月內推出GPT-5的模型，免費版ChatGPT能在標準智能設定下無限制地使用GPT-5進行對話。此外，Google也在早些時候宣佈其最新AI模型套件Gemini 2.0正式向所有使用者開放使用。

中國資訊通訊研究院技術與標準研究所工程師龔正表示，AI技術的成熟正在改寫商業模式，DeepSeek等開源模型的崛起正在重構行業生態。OpenAI首席執行官薩姆·奧爾特曼則預言，使用AI的成本每12個月下降10倍。

走向免費的大模型如何賺錢？一位關注AI創新的投資服務業人士告訴記者：“AI大模型實際從去年就開始了降價潮，而大模型企業目前還沒有完成商業化。”他表示，“AI大模型企業要想掙錢，可以提供面向企業端的解決方案，同時大模型企業的估值也不是根據模型，而是看其生態。”

上述業內人士稱，對於大模型企業來說，未來的估值將不再單純依賴於模型本身，而是更多地關注其生態建設、使用者規模、資料質量以及增值服務的盈利能力。擁有龐大使用者基礎和完善生態的企業，將在未來的市場競爭中佔據優勢。

產業鏈迎來更多機會

國信證券表示，三大營運商年後陸續接入DeepSeek，營運商龐大的資料有助於為DeepSeek的模型訓練與最佳化提供豐富素材，營運商接入DeepSeek有助於開發新的AI驅動型業務，營運商雲平台有望實現AI能力深度整合，加速雲業務增長，促進營運商第二曲線增長。

在內容創作領域，大模型可以幫助企業快速生成文案、圖片、視訊等內容，提高創作效率。在智能客服領域，大模型可以實現更智能的互動，提升客戶滿意度。在金融領域，大模型可以用於風險評估、投資決策等，提高金融機構的營運效率和風險管理能力。

清華大學公共管理學院教授、清華大學人工智慧國際治理研究院副院長梁正在近期採訪中談到，AI未來的發展將向終端化與輕量化發展，隨著多模態、強化學習等技術進步，服務機器人、無人駕駛車輛、無人機的規模化部署將成為可能。

隨著AI大模型快速發展，相關產業鏈迎來更多機會。路博邁基金認為，短期內，半導體行業將面臨顯著波動，市場正在重新評估DeepSeek的技術突破對更廣泛AI生態系統可能產生的影響；但從中期來看，隨著代理型AI的崛起，對先進推理演算法及其下一代晶片的需求將繼續增長。摩根資產管理稱，將關注以人工智慧為驅動力的科技產業、新能源產業、高端製造業以及以創新藥為主的醫療健康產業。 (中國證券報)