#FAST
性價比之王!馬斯克發佈Grok 4 Fast!200萬上下文窗口,輸出百萬token價格僅3塊5!附生成環境評估建議
昨天馬斯克的 xAI 發佈了新模型 Grok 4 Fast。作為 Grok 4 的“兄弟型號”,它更便宜、更快、可大規模擴展,目標是在長上下文推理和智能體工具使用上進一步突破。🚀 核心看點Grok 4 Fast 是 xAI 的 Grok 4 的一個變體,強調效率和可用性,同時不犧牲性能。200萬token上下文窗口:可以一次性處理整本書等級的文件、龐大的程式碼庫或數月的聊天記錄。(全球天花板水平)統一推理與非推理模型:單一權重集,可根據指令切換行為。比 Grok 4 少用 40% 的“思考 token”,在深度推理時更高效。原生工具使用:通過強化學習訓練,能夠判斷何時以及如何上網瀏覽、呼叫 X或執行程式碼。激進的價格策略:社區報告顯示,輸入約 $0.20 / 百萬 token,輸出約 $0.50 / 百萬 token(折3.5元),相比 Grok 4 之前的 $3 / $15,便宜了一個數量級。💡 為什麼這很重要長上下文突破:200萬token 讓“分塊+檢索”的做法成為了非必要。無論是法律檔案、程式碼庫還是學術檔案,都能一次性放進prompt。成本優勢:對初創公司、研究人員和需要高並行任務的企業來說,價格比DS都便宜一大半。智能體工作流:Grok 4 Fast 原生支援瀏覽、多步推理和工具編排,這是建構自主智能體的關鍵能力。競爭性測試:從GPQA到LMArena,Grok 4 Fast 與頂尖模型正面較量,尤其在搜尋任務中表現出色。⚠️ 需要注意的限制透明度缺口:尚不清楚200萬token窗口是密集注意力機制,還是混合方案。這會影響延遲與可擴展性。領域差異:在瀏覽/搜尋上表現優秀,但在金融或法律等細分任務中表現參差不齊。務必針對你的場景做驗證。🛠️ 如何生產評估如果你想在生產環境中驗證 Grok 4 Fast,建議清單:✅ 在保留集上運行可復現的測試(MMLU、GPQA、AIME)。✅ 壓測長上下文輸入(10 萬 → 200 萬 token)。✅ 基準測試智能體工作流(瀏覽 + 工具呼叫)。✅ 按預計token規模計算模型成本。✅ 在你的領域內對比 Claude、GPT-5 和 Gemini。🎯 入手建議特別適合智能體搜尋、超大輸入場景、成本敏感的部署場景,比如法律科技工具、研究助手或大規模總結系統等,都值得嘗試。 (51CTO技術堆疊)
馬斯克Grok 4 Fast首發霸榜!2.5倍速秒殺GPT-5,成本暴降98%直追Gemini
【新智元導讀】xAI重磅推出Grok 4 Fast,創新融合推理與非推理雙模式,支援200萬token上下文。在NYT Connections基準和AA智能指數中表現卓越,超越多家頂級模型,標誌著AI智能獲取門檻的進一步降低。Grok 4 Fast官宣上線,馬斯克再次兌現了承諾!它首次將推理/非推理「雙模式」合一,支援200萬上下文,直接刷爆性價比SOTA。推理測試中,Grok 4 Fast直接碾壓前代Grok 3 Mini,尤其是數學、編碼性能大增。基準測試顯示,Grok 4 Fast Reasoning登頂了擴展版NYT Connections Benchmark(紐約時報連線謎題基準測試,共759道題)。Grok 4則排名第2,xAI在這個項目上展現了絕對的統治力。對此,馬斯克自豪地表示,這就是進展!Grok 4 Fast Reasoning不僅擊敗了自家大哥Grok 4,也將GPT-5、o3-pro、Gemini 2.5 Pro、DeepSeek和Qwen 3等一眾模型斬於馬下。Grok 4發佈之後,基本上xAI一月一迭代,速度堪稱驚人。25/1成本,堪比Gemini 2.5 Pro技術部落格中,介紹了Grok 4 Fast所具備的四大核心優勢:行業SOTA級性價比最強網頁與X平台搜尋能力支援200萬token的超長上下文創新統一架構:單模型融合推理與非推理雙模式基於大規模RL技術,xAI團隊將Grok 4 Fast智能密度推向了極致。實測表明,新模型性能直逼Grok 4,但平均節省了40%推理token的消耗,成本直降98%。Grok 4 Fast不僅在NYT Connections Benchmark上表現出色,在著名的Artificial Analysis Intelligence Index(AA智能指數)上同樣表現不俗。它以大約25分之一的成本就實現了Gemini 2.5 Pro等級的智能!Grok 4 Fast是一個將reasoning和non-reasoning融合統一的模型。在推理模式下,Grok 4 Fast Reasoning在AA智能指數上取得了60分的亮眼成績,與Gemini 2.5 Pro和Claude 4.1 Opus相當。低於此前發佈的Grok 4和GPT-5(high)。在編碼評測中,Grok 4 Fast表現尤為出色,在他們的LiveCodeBench榜單上登頂第一,甚至超越其體量更大的自家大哥Grok 4。成本方面Grok 4 Fast也挺有優勢:輸入0.2美元每百萬Tokens,輸出0.5美元每百萬Tokens。而且輸出效率很高。Artificial Analysis在對Grok 4 Fast的預發佈API進行基準測試時,發現它的速度驚人非常迅速,達到了每秒344個輸出Token——約為 OpenAI GPT-5 API的2.5倍。端到端時延僅3.8秒,是目前最快的前沿模型。Grok 4 Fast的發佈延續了這個趨勢:獲取AI智能的成本正在快速下降。在過去一年半里,獲取GPT-4等級智能的成本已下降約500倍;而且隨著智能前沿不斷被推進,獲取成本仍在持續走低。原生工具呼叫通過端到端工具使用RL訓練,Grok 4 Fast特別擅長智能判斷,何時呼叫程式碼執行、網頁瀏覽等工具。舉個栗子,在搜尋時,它可以像人類一樣流暢地瀏覽網頁和X平台,並用即時資料增強查詢結果——自動跳轉連結、解析X上圖文視訊內容,並以閃電速度整合資訊得出結論。可以看出,Grok 4 Fast基準測試中,工具呼叫、深度研究等能力上完勝Grok 4。現在,通過API即可呼叫推理/非推理Grok 4 Fast,每100萬token價格再創新低。什麼是NYT Connections Benchmark?NYT Connections Benchmark(紐約時報連線謎題基準測試)的核心源於《紐約時報》推出的益智遊戲「Connections」,後被轉化為評估大語言模型「語義關聯與分類推理能力」的重要基準。其核心邏輯與原始遊戲一致:給定16個看似無關聯的詞語,AI需從語義、邏輯或常識維度,將它們精準劃分成4組(每組4個詞),且每組需符合一個明確的「潛在關聯主題」(例如不同類型的水果、電腦硬體部件、經典文學角色等)。而此次Grok 4 Fast參加的「擴展版」在基礎規則上進一步提升難度——每個謎題額外增加多達4個「技巧詞」(即易混淆、可能同時貼合多個主題的干擾詞),更考驗AI排除干擾、精準捕捉深層語義關聯的能力。舉兩個栗子。大家感受一下難度。在擴展版上模型的排名如下圖,xAI一家佔據前兩名。為排除LLM的訓練資料中包含答案的可能性,基準方還僅對最新增加的100道謎題進行了測試。結果依然是xAI家的Grok 4、Grok 4 Fast Reasoning排名前兩位,只不過這次大哥終於排第一了。看來Grok 4 Fast Reasoning在智能上確實有兩下子,結合其速度快、價格低的優勢,很有可能成為開發者的新寵。 (新智元)
極為罕見!中國天眼有重要發現
日前,中國科學院國家天文台韓金林研究員帶領團隊利用中國天眼FAST發現了一個罕見的毫秒脈衝星,與伴星以3.6小時的周期相互繞轉,且有六分之一的時間被伴星遮擋(即掩食,猶如日食或月食),這一發現對恆星演化理論、緻密星吸積物理和雙星合併的引力波源研究具有重要意義,該研究成果今天(23日)在國際學術期刊《科學》線上發表。浩瀚的銀河系中,大多數恆星都是成對出現,以雙星系統的形式共同演化。天文學家對於單個恆星如何演化已有相對清晰的認識,但雙星如何互動和演化在過去幾十年裡一直是天文學領域的前沿難題。中國天眼FAST的靈敏度極高,是發現脈衝星的利器,對處於極短周期軌道上的脈衝星更為敏銳。研究團隊利用FAST對銀河系進行脈衝星深度搜尋時,發現了一顆自轉周期為10.55毫秒的毫秒脈衝星,該團隊在多次後隨驗證觀測之後確認它處於一個半徑僅50萬公里的緻密軌道,與伴星相互繞轉的軌道周期僅為3.6小時,每個周期都有約六分之一的時間被伴星遮擋。據推測,這個伴星的質量至少有1個太陽那麼重,遠超出一般掩食脈衝星的伴星,但狹小的軌道根本容不下一個像太陽這樣的恆星。由多方面的限制推斷,這個伴星不是普通恆星,也不是演化後的緻密星,而應該是經歷過公共包層演化階段被剝去外層氣體的恆星核心,即一顆炙熱的氦星。脈衝星訊號掩食是氦星甩出的星風物質遮擋引起的。這類特殊的雙星系統極為罕見,並且難以觀測,因為它們在宇宙中存活時間僅約一千萬年,對於138億年的宇宙而言,如同夜空中稍縱即逝的流星。根據該團隊所做的模擬分析表明,在銀河系千億顆恆星中,目前類似這樣的系統僅有幾十個。此次這一罕見天體的發現有望為天文學研究帶來多方面的突破,它不僅有助於完善和深化我們對恆星,特別是雙星演化具體過程的理解,比如雙星演化過程中兩顆星如何靠近導致軌道收縮、兩顆星之間如何進行物質交流、中子星進入伴星內部之後如何自轉加速到幾個毫秒,公共氫元素包層如何被緻密星吹跑等,這個天體還是緻密星吸積大量物質後中微子散熱理論的重要例證。它還將推動引力波源預測、深度光學/紅外的氦星觀測等領域的研究,為人們更好地認識宇宙天體及其演化過程提供重要支撐。 (環球網)