馬斯克,放大招!
台北時間2月18日中午,馬斯克旗下人工智慧初創公司xAI開發的Grok-3模型正式發佈。此前,馬斯克將Grok-3描述為“地球上最聰明的AI”。他在X平台上表示:“自己整個周末都在和團隊打磨產品”。
台北時間12:18,Grok-3發佈會正式開始。在發佈會背景板上,寫著"our mission is to understand universe(我們的使命是瞭解宇宙)"。馬斯克曾表示,xAI公司的目標就是“瞭解宇宙”。截至發稿時,直播觀看人次超300萬次。
馬斯克在直播中表示,Grok的名字來自海因萊因的小說《異鄉異客》,主角是一個在火星上長大的人類,而Grok這個詞代表了全面深刻地理解事物。
xAI團隊介紹,Grok-3的性能比Grok-2提升了一個數量級,和Grok-3聊天會覺得非常有趣。
xAI團隊在直播中展示稱,Grok-3和Grok-3 mini在多方面的測試得分上都超過或媲美Gemini和ChatGPT等對手。在訓練Grok的過程中,團隊搭建了大型算力叢集,並克服了散熱、電力等問題帶來的挑戰,用了122天讓首批10萬張GPU投入使用並正常運行,現在他們計畫將叢集規模繼續擴大一倍。
團隊還演示用Grok-3生成程式碼,並運行了這段程式碼。畫面上顯示出了飛船在地球和火星間往返的動畫。隨後,Gork-3又演示了製作一款類似於俄羅斯方塊的遊戲。馬斯克稱,將在xAI推出一個人工智慧遊戲工作室。
此外,xAI宣佈推出名為Deepsearch的Grok-3智能搜尋引擎。名字和最近大熱的Deepseek頗有幾分相似。
在此前舉行的世界政府峰會上,馬斯克通過視訊通話表示,Grok-3是“地球上最聰明的人工智慧”。他表示,Grok-3將在推理、程式設計能力以及文字和圖像分析等多模態能力方面有顯著提升,它的表現“優於目前所有已發佈的產品”。
馬斯克強調,Grok-3可以減少AI幻覺,方法是通過來回檢查資料並嘗試實現邏輯一致性。他還透露,訓練Grok-3所使用的算力遠多於此前的版本,並使用了大量合成資料。
不同於DeepSeek的演算法最佳化路徑(DeepSeek-V3用2048個H800 GPU,訓練2788千小時),xAI透露,Grok-3的開發的得益於用8個月時間建成的Colossus超級電腦,它由10萬個輝達的H100 GPU驅動,為訓練提供了2億個GPU小時,比Grok-2多十多倍。
2023年7月,馬斯克成立xAI公司。2023年11月,xAI發佈第一款大模型 Grok-1,擁有3140億參數,成為當時參數量最大的開源大語言模型;2024年8月發佈的Grok-2,在性能上與ChatGPT最新模型相媲美。該系列大模型可以通過聯網獲取即時資訊,瀏覽和使用X平台(原推特)上的資訊,使其具有資訊獲取的時效性。
馬斯克的xAI成為AI大模型領域強有力的競爭者,同樣參與這場競技的還有OpenAI、Google、Anthropic以及近期引發全球關注的中國初創企業DeepSeek。
OpenAI於近日宣佈,公司將在未來幾個月內推出新一代人工智慧模型GPT-5和GPT-4.5。據稱,GPT-5將整合OpenAI的多項核心技術,包括o3推理模型。
OpenAI首席執行官兼聯合創始人SamAltman今日凌晨在社交平台表示:“對於高要求的測試者來說,試用GPT-4.5的體驗,遠比我預期的要深刻得多!”業內人士預計,這說明GPT-4.5已經進入測試階段,離正式發佈非常近了。
2月初,DeepSeek新模型發佈後,Google公司發佈Gemini2.0系列模型,該系列模型強化了編碼與推理能力,全面開放使用並降低成本。
另有消息稱,Anthropic計畫在未來幾周內發佈新的混合型大模型Claude 4,使用者可以自行控制使用時的推理成本。
當地時間本周一,總部位於法國巴黎的Mistral發佈名為Mistral Saba的定製大模型,特點是具有高精準率的阿拉伯語互動能力。
今年春節以來,中國初創企業DeepSeek發佈新模型DeepSeek-R1,以極低的訓練成本和使用成本,超越OpenAI對標模型,攪動AI大模型競爭,也在國內各大行業帶起了大模型接入潮。
據不完全統計,已經有數百家公司正式接入DeepSeek研發的大模型。包括國內三大基礎營運商、超過15家晶片廠商,以及包括雲服務、網路科技、金融在內的200多家企業,多個手機廠商和車企,地方政府政務系統,以及微軟、輝達、亞馬遜等世界級雲端運算巨頭都宣佈接入DeepSeek。
騰訊集團確認,微信自2月15日起開始灰度測試接入DeepSeek-R1模型,增強其搜尋功能。消息一出,引發騰訊股價大漲。2月16日晚間,百度搜尋宣佈將全面接入DeepSeek和文心大模型最新的深度搜尋功能。
值得關注的是,在DeepSeek的推動下,大模型正朝著越來越智能且免費的方向發展,這也加快了大模型走入日常生活的腳步。
百度官方宣佈,文心一言將於4月1日起全面免費,所有PC端和APP端使用者均可體驗其最新模型,包括超長文件處理、專業檢索增強、高級AI繪畫、多語種對話等功能。2月13日凌晨,OpenAI也公佈了GPT-5的最新消息,OpenAI將在未來幾個月內推出GPT-5的模型,免費版ChatGPT能在標準智能設定下無限制地使用GPT-5進行對話。此外,Google也在早些時候宣佈其最新AI模型套件Gemini 2.0正式向所有使用者開放使用。
中國資訊通訊研究院技術與標準研究所工程師龔正表示,AI技術的成熟正在改寫商業模式,DeepSeek等開源模型的崛起正在重構行業生態。OpenAI首席執行官薩姆·奧爾特曼則預言,使用AI的成本每12個月下降10倍。
走向免費的大模型如何賺錢?一位關注AI創新的投資服務業人士告訴記者:“AI大模型實際從去年就開始了降價潮,而大模型企業目前還沒有完成商業化。”他表示,“AI大模型企業要想掙錢,可以提供面向企業端的解決方案,同時大模型企業的估值也不是根據模型,而是看其生態。”
上述業內人士稱,對於大模型企業來說,未來的估值將不再單純依賴於模型本身,而是更多地關注其生態建設、使用者規模、資料質量以及增值服務的盈利能力。擁有龐大使用者基礎和完善生態的企業,將在未來的市場競爭中佔據優勢。
國信證券表示,三大營運商年後陸續接入DeepSeek,營運商龐大的資料有助於為DeepSeek的模型訓練與最佳化提供豐富素材,營運商接入DeepSeek有助於開發新的AI驅動型業務,營運商雲平台有望實現AI能力深度整合,加速雲業務增長,促進營運商第二曲線增長。
在內容創作領域,大模型可以幫助企業快速生成文案、圖片、視訊等內容,提高創作效率。在智能客服領域,大模型可以實現更智能的互動,提升客戶滿意度。在金融領域,大模型可以用於風險評估、投資決策等,提高金融機構的營運效率和風險管理能力。
清華大學公共管理學院教授、清華大學人工智慧國際治理研究院副院長梁正在近期採訪中談到,AI未來的發展將向終端化與輕量化發展,隨著多模態、強化學習等技術進步,服務機器人、無人駕駛車輛、無人機的規模化部署將成為可能。
隨著AI大模型快速發展,相關產業鏈迎來更多機會。路博邁基金認為,短期內,半導體行業將面臨顯著波動,市場正在重新評估DeepSeek的技術突破對更廣泛AI生態系統可能產生的影響;但從中期來看,隨著代理型AI的崛起,對先進推理演算法及其下一代晶片的需求將繼續增長。摩根資產管理稱,將關注以人工智慧為驅動力的科技產業、新能源產業、高端製造業以及以創新藥為主的醫療健康產業。 (中國證券報)