就在前兩天,馬斯克帶著團隊搞了一場大事情,全球直播發佈了號稱"史上最聰明AI"的Grok3。
這位科技狂人帶著自家xAI團隊的最新作品Grok3閃亮登場,這場發佈會可沒讓人失望,畢竟老馬提前那麼久就開始吊大家胃口,現在終於見到真身了!
先給沒追直播的朋友劃個重點:這次亮相的Grok3號稱是"地球最聰明AI",不僅在數學程式設計這些硬核領域碾壓同行,還要幫SpaceX算火星軌道!
Grok3是馬斯克用20萬塊H100 GPU堆出的算力怪獸,咱們先來看看它的硬核成績。
根據xAI團隊現場甩出的成績單,Grok3在數學、程式設計和科學領域的測試資料簡直亮瞎眼:
數學競賽AIME'24:連拿90和93分(滿分100)。
科學測試GPQA:75分碾壓全場。
程式設計實戰:解題速度比GPT快1.8倍。
不過跑分歸跑分,作為一個經歷過無數"PPT革命"的設計從業者,我還是更期待看到實際落地的案例,畢竟再酷炫的技術,最後都要通過使用者體驗這關。
但問題來了,這麼學霸型AI,怎麼栽在了小學數學題上?
發表會後不少科技部落客實測發現,當被問到"9.11和9.9那個大"時,Grok3居然支支吾吾算錯了。
這事兒在推特上直接炸鍋,有網友調侃說:"原來天才的軟肋是小數點!"
正好看到今天馬斯克宣佈Grok3全量免費開放了:
我就想著拋開天花亂墜的宣傳話術,來一場AI界的新老對決,看看Grok3和DeepSeek來PK一下會怎麼樣:
DeepSeek的攻擊性明顯更強一點。
本來我還想測試更多的,但發現Grok3的深度思考免費額度竟然只有2條...
而DeepSeek的現狀大家都懂的:
這是Grok3的地址,大家可以自己去玩:grok.com
技術參數再漂亮,最終還是要落到實際應用場景。
馬斯克團隊明顯在走"極致專業化"路線,把AI往科研助手的角色培養;而DeepSeek則更像"全能型選手",試圖在通用性和專業性之間找平衡點。
這兩種想法沒有絕對優劣,就像建築設計中的結構派與功能派,最後還是要看市場買不買單。
不過話說回來,Grok3預告的太空應用確實讓人浮想聯翩,如果真能幫SpaceX搞定火星任務的計算難題,那絕對是AI發展史上的里程碑事件。
現在我最關心的是,Grok3會不會重蹈當年自動駕駛的覆轍?記得馬斯克五年前畫的那張"完全自動駕駛"大餅嗎?到現在咱們還在用L2級輔助駕駛。
所以這次看到他說"三年內實現諾獎級突破",我下意識看了眼日曆,希望這次的時間表能準點。
Grok3確實在硬派技術指標上領先半個身位,但DeepSeek畢竟成本低的多,這場較量遠沒到終局。
今天的乾貨時間,就再給大家推薦一下@CK菜殼兒的DeepSeek本地部署教學:
手把手教你如何在Windows 系統上輕鬆部署DeepSeek 模型,從下載Ollama 軟體到完成模型組態,再到使用Chatbox AI 工具進行模型載體搭建,每一步都配有詳細的操作說明和截圖,讓你輕鬆上手。
設定好之後可以不用再擔心伺服器繁忙問題了。(優設AIGC)