Google殺瘋了!Gemini 3 Flash 突襲:這個跑腿小弟差點打敗了 GPT-5.2

一個月前,Google發佈了最新的 Gemini,從此我們進入了 Gemini 3 的時代。

那以後, Gemini 3 Pro 就成了我幹活的主力。

但說實話,它反應是真慢,而且很多時候我只是問些簡單問題,完全沒必要深度思考。

所以,一直期待速度飛快的 Flash 系列重新回來。

終於,在今天,Gemini 3 Flash 來了!

圖:Google CEO 宣佈 Gemini 3 Flash 發佈

Google這一波操作屬實把我驚到了。

官方號稱它“比快更快”,而且智商不減反增。

本來是一個“小弟”人設,但你看看它排名,居然僅次於OpenAI 最新的模型 GPT 5.2了。(就差 2 分)

真讓人情何以堪吶?

圖:第三方機構評測 Gemini 3 Flash 的綜合指標

廢話不多說,咱們趕緊來扒一扒,這個新出的 Flash 到底香不香。

01 到底是個啥?

簡單來說:把 Pro 的腦子,裝進了 Flash 的身體裡。

以前我們對“Flash(輕量級)”模型的印象是什麼?

跑得快,便宜,但是……有點“笨”。處理複雜任務時經常翻車。

但這次 Gemini 3 Flash 徹底打破了這個刻板印象。

遇到閒聊、簡單查詢: 它就輕裝上陣,秒回,省流又省錢;

遇到燒腦難題: 它能立馬調動深層算力,像老教授一樣深思熟慮。

它大腦似乎有個變速箱。

它甚至在性能、成本和速度方面突破了帕累托極限。(AI 界的性價比極限)

圖:Gemini 3 Flash 在性能、成本和速度方面突破了帕累托極限

官方資料顯示,它的 Token 消耗比 Gemini 2.5 Pro 少了 30%,但智商卻線上。

說人話就是:多快好省!

圖:Token 消耗率對比

這種“該省省,該花花”的 AI,誰不愛?

02 憑資料說話:這波“以下犯上”有點狠

咱們不整那些虛頭巴腦的形容詞,直接看跑分資料,Google這次是真的下了血本。

我看了一眼實測資料,甚至有點不敢相信:它在很多任務上接近自家最強的模型 3 Pro,甚至有些指標還幹掉了Pro 版。(這樣禮貌嗎?)

特別是那個讓無數 AI 汗流浹背的 ARC-AGI-2 測試……

還讓人意想不到的是:Gemini 3 Flash 全面碾壓了上一代的旗艦版本 2.5 Pro。(前浪死在沙灘上)

圖: Gemini 3 Flash 的各項指標

先說說這個 ARC-AGI-2。

之前 GPT 5.2 發佈讓大家印象深刻,其中有一個原因就是這個指標碾壓所有模型。

老粉都知道,ARC 評測集是 AI 圈最難啃的骨頭,甚至沒有之一, 主要測試模型到底有沒有腦子。

它是由 Keras 之父 François Chollet 搞出來的,專門用來反死記硬背的。

比如這種題目:

圖:ARC-AGI 2 題目

以前的模型,MMLU 這種考試能拿 90 分,一碰到 ARC 這種需要“舉一反三”的智力題,立馬現原形,得分低得可憐。

這項指標 Flash 竟然超過了自己的 Pro 大哥,僅次於 GPT-5.2!

這個小弟,要造反了有點腦子!

在另一項指標: GPQA Diamond(研究生等級的專家推理測試)裡,它拿了 90.4 分。

意思就是智商堪比博士。

看這個數字,它的推理能力已經和那些大塊頭的前沿模型(Pro 版)平起平坐了。

在著名的“Humanity's Last Exam(人類最後一場考試)”這種地獄級難度的測試裡,Gemini 3 Flash 居然考出了 43.5% 的高分(Tools on 模式)。

圖:HLE 分數對比

它跟 GPT-5.2(45.5%)這種超級旗艦模型,只差了不到 2 分!

朋友們,別忘了,這可是一個 Flash 模型啊!

它的定位本來是“跑腿小弟”,結果一不小心把“業界大佬”們的飯碗給砸了。(面子?不存在的。)

這那裡是“輕量版”,這分明是“披著閃電俠外衣的超人”。

在多模態測試(MMMU Pro)中得分 81.2%,看圖、看視訊的能力基本和 Gemini 3 Pro 五五開。

也就是,眼神兒更好使。

圖:MMMU-Pro 指標對比

最讓我意外的是這個——在 SWE-bench Verified(程式碼智能體測試)中,它得分 78%。

直接超越了 Gemini 2.5 全系,甚至在某些這就需要改程式碼的任務上,比 Gemini 3 Pro 還要好用!

本來以為它動動嘴還行,沒想到寫程式碼更溜!

一句話總結:它不是“丐版”,它是“精簡版戰神”。

03 為什麼我建議你立馬換用 Flash?

作為這一年多幾乎天天都在用 AI 的人,我覺得 Gemini 3 Flash 帶來的改變是肉眼可見的:

1. 真的太快了!⚡️

根據第三方測評(Artificial Analysis),它的速度是 2.5 Pro 的 3 倍。

以前問 AI 一個問題,你可能還得切出去回個消息等它寫完。

現在?你字剛打完,它答案就懟到你臉上了。

這種“跟手”的感覺,對於我們需要快速寫文案、改程式碼的人來說,簡直是救命。

2. 價格那是相當感人 💰

圖:Gemini 3 Flash 價格

輸入 100 萬 Token 只要 0.5 美刀,輸出只要 3 美刀。

想想看,它現在比 2.5 Pro 強太多了,但價格卻只有它的 30-40%。

這基本就是白菜價了,對於開發者來說,成本焦慮直接減半。

3. 智商不掉線

既有速度,又有 Pro 級的推理能力。

處理複雜的長文件分析、視訊理解,它完全都在行。

04 怎麼用?能幹啥?

好消息是,這玩意兒現在就是 Gemini 的“默認配置”。

不管你是普通使用者還是開發者,現在就能上手玩。

普通玩家:直接打開 Gemini App 或者 Google 搜尋,它已經在那裡等你了(是的,免費用)。

我們打開 Gemini,會看到 Fast 和 Thinking 兩個新增的模型。

它們就是 Gemini 3 Flash!

圖:Gemini 3 Flash

開發者大佬:去 Google AI Studio 或者 Vertex AI 就能調 api。

因為它延遲極低,拿來做那種需要即時反饋的語音助手、視訊分析工具簡直完美。

05 寫在最後

至此,Gemini 3 家族算是真正“齊活”了。

  • Pro 是全能六邊形戰士;
  • Deep Think 是深思熟慮的掃地僧;
  • Flash 則是身手敏捷的急先鋒。

回顧這一年,不得不說Google是真聽勸,也是真拼。

以前總有人吐槽大廠喜歡“擠牙膏”,但這幾次發佈,從 Pro 到 Deep Think 再到今天的 Flash(還有 Nano Banana Pro),每一次都是誠意滿滿的“硬菜”。

特別是今天的 Flash,說實話,雖然在Google家裡它定位是“小弟”,但這性能、這智商,放在其他任何一家公司,高低得掛個“旗艦(Ultra/Pro)”的名號。

當然,神仙打架,受益的是咱們。你們打吧,我喜歡。 (AI范兒)