Google殺瘋了！Gemini 3 Flash 突襲：這個跑腿小弟差點打敗了 GPT-5.2

2025/12/18

•

一個月前，Google發佈了最新的 Gemini，從此我們進入了 Gemini 3 的時代。

那以後， Gemini 3 Pro 就成了我幹活的主力。

但說實話，它反應是真慢，而且很多時候我只是問些簡單問題，完全沒必要深度思考。

所以，一直期待速度飛快的 Flash 系列重新回來。

終於，在今天，Gemini 3 Flash 來了！

Google這一波操作屬實把我驚到了。

官方號稱它“比快更快”，而且智商不減反增。

本來是一個“小弟”人設，但你看看它排名，居然僅次於OpenAI 最新的模型 GPT 5.2了。（就差 2 分）

真讓人情何以堪吶？

廢話不多說，咱們趕緊來扒一扒，這個新出的 Flash 到底香不香。

01 到底是個啥？

簡單來說：把 Pro 的腦子，裝進了 Flash 的身體裡。

以前我們對“Flash（輕量級）”模型的印象是什麼？

跑得快，便宜，但是……有點“笨”。處理複雜任務時經常翻車。

但這次 Gemini 3 Flash 徹底打破了這個刻板印象。

遇到閒聊、簡單查詢：它就輕裝上陣，秒回，省流又省錢；

遇到燒腦難題：它能立馬調動深層算力，像老教授一樣深思熟慮。

它大腦似乎有個變速箱。

它甚至在性能、成本和速度方面突破了帕累托極限。（AI 界的性價比極限）

官方資料顯示，它的 Token 消耗比 Gemini 2.5 Pro 少了 30%，但智商卻線上。

說人話就是：多快好省！

這種“該省省，該花花”的 AI，誰不愛？

02 憑資料說話：這波“以下犯上”有點狠

咱們不整那些虛頭巴腦的形容詞，直接看跑分資料，Google這次是真的下了血本。

我看了一眼實測資料，甚至有點不敢相信：它在很多任務上接近自家最強的模型 3 Pro，甚至有些指標還幹掉了Pro 版。（這樣禮貌嗎？）

特別是那個讓無數 AI 汗流浹背的 ARC-AGI-2 測試……

還讓人意想不到的是：Gemini 3 Flash 全面碾壓了上一代的旗艦版本 2.5 Pro。（前浪死在沙灘上）

先說說這個 ARC-AGI-2。

之前 GPT 5.2 發佈讓大家印象深刻，其中有一個原因就是這個指標碾壓所有模型。

老粉都知道，ARC 評測集是 AI 圈最難啃的骨頭，甚至沒有之一，主要測試模型到底有沒有腦子。

它是由 Keras 之父 François Chollet 搞出來的，專門用來反死記硬背的。

比如這種題目：

以前的模型，MMLU 這種考試能拿 90 分，一碰到 ARC 這種需要“舉一反三”的智力題，立馬現原形，得分低得可憐。

這項指標 Flash 竟然超過了自己的 Pro 大哥，僅次於 GPT-5.2！

這個小弟，~~要造反了~~有點腦子！

在另一項指標： GPQA Diamond（研究生等級的專家推理測試）裡，它拿了 90.4 分。

意思就是智商堪比博士。

看這個數字，它的推理能力已經和那些大塊頭的前沿模型（Pro 版）平起平坐了。

在著名的“Humanity's Last Exam（人類最後一場考試）”這種地獄級難度的測試裡，Gemini 3 Flash 居然考出了 43.5% 的高分（Tools on 模式）。

它跟 GPT-5.2（45.5%）這種超級旗艦模型，只差了不到 2 分！

朋友們，別忘了，這可是一個 Flash 模型啊！

它的定位本來是“跑腿小弟”，結果一不小心把“業界大佬”們的飯碗給砸了。（面子？不存在的。）

這那裡是“輕量版”，這分明是“披著閃電俠外衣的超人”。

在多模態測試（MMMU Pro）中得分 81.2%，看圖、看視訊的能力基本和 Gemini 3 Pro 五五開。

也就是，眼神兒更好使。

最讓我意外的是這個——在 SWE-bench Verified（程式碼智能體測試）中，它得分 78%。

直接超越了 Gemini 2.5 全系，甚至在某些這就需要改程式碼的任務上，比 Gemini 3 Pro 還要好用！

本來以為它動動嘴還行，沒想到寫程式碼更溜！

一句話總結：它不是“丐版”，它是“精簡版戰神”。

03 為什麼我建議你立馬換用 Flash？

作為這一年多幾乎天天都在用 AI 的人，我覺得 Gemini 3 Flash 帶來的改變是肉眼可見的：

1. 真的太快了！⚡️

根據第三方測評（Artificial Analysis），它的速度是 2.5 Pro 的 3 倍。

以前問 AI 一個問題，你可能還得切出去回個消息等它寫完。

現在？你字剛打完，它答案就懟到你臉上了。

這種“跟手”的感覺，對於我們需要快速寫文案、改程式碼的人來說，簡直是救命。

2. 價格那是相當感人 💰

輸入 100 萬 Token 只要 0.5 美刀，輸出只要 3 美刀。

想想看，它現在比 2.5 Pro 強太多了，但價格卻只有它的 30-40%。

這基本就是白菜價了，對於開發者來說，成本焦慮直接減半。

3. 智商不掉線

既有速度，又有 Pro 級的推理能力。

處理複雜的長文件分析、視訊理解，它完全都在行。

04 怎麼用？能幹啥？

好消息是，這玩意兒現在就是 Gemini 的“默認配置”。

不管你是普通使用者還是開發者，現在就能上手玩。

普通玩家：直接打開 Gemini App 或者 Google 搜尋，它已經在那裡等你了（是的，免費用）。

我們打開 Gemini，會看到 Fast 和 Thinking 兩個新增的模型。

它們就是 Gemini 3 Flash！

開發者大佬：去 Google AI Studio 或者 Vertex AI 就能調 api。

因為它延遲極低，拿來做那種需要即時反饋的語音助手、視訊分析工具簡直完美。

05 寫在最後

至此，Gemini 3 家族算是真正“齊活”了。

Pro 是全能六邊形戰士；
Deep Think 是深思熟慮的掃地僧；
Flash 則是身手敏捷的急先鋒。

回顧這一年，不得不說Google是真聽勸，也是真拼。

以前總有人吐槽大廠喜歡“擠牙膏”，但這幾次發佈，從 Pro 到 Deep Think 再到今天的 Flash（還有 Nano Banana Pro），每一次都是誠意滿滿的“硬菜”。

特別是今天的 Flash，說實話，雖然在Google家裡它定位是“小弟”，但這性能、這智商，放在其他任何一家公司，高低得掛個“旗艦（Ultra/Pro）”的名號。

當然，神仙打架，受益的是咱們。你們打吧，我喜歡。 (AI范兒)

科技