Google甩出“價格屠夫”!Gemini 3 Flash超Pro,成本僅1/4,速度如“閃電”

多領域性能比肩Pro模型。


昨晚,Google發佈了Gemini 3 Flash,旨在用更低的成本提供前沿的智能水平。

具體來看,它輸出每百萬token的價格僅為Claude Sonnet 4.5的20%GPT-5.2的21%,卻能在基準測試上達到甚至超越這些旗艦級模型的水平。

即便是和Gemini 3 Pro相比,Gemini 3 Flash也極具性價比。Flash的價格僅為Pro的25%,卻在MMMU-Pro、SWE-bench Verified這些核心基準測試上,超過了Pro版本的模型。

此前發佈的Gemini 3系列模型在複雜推理、多模態和視覺理解、智能體及Vibe Coding任務方面都展現出優勢,Gemini 3 Flash保留了這一基礎,將Gemini 3 Pro等級的推理能力與Flash等級的延遲、效率和成本相結合。

Google首席科學家Jeff Dean稱,Gemini 3 Flash不僅比2.5 Pro質量更高,速度也快3倍,而且價格僅為後者的幾分之一。以下是並排演示:

Gemini 3 Flash目前已經全面開放,開發者可通過Google AI Studio中的Gemini API、Gemini CLI以及智能體開發平台Google Antigravity使用。而普通使用者能通過Gemini應用程式和Google搜尋中的AI模式使用。

01.

專為迭代式開發打造

還幫你“用嘴程式設計”

Gemini 3 Flash究竟能做什麼?Google稱,這是一款專為迭代式開發打造的模型,能夠以低延遲提供接近Gemini 3 Pro等級的程式設計性能。

Google分享了多個案例。比如,Gemini 3 Flash可以在一個手部追蹤的“彈球解謎遊戲”中實現多模態推理,提供近乎即時的AI輔助。

它還可以近乎即時地建構和A/B測試新的載入動畫設計,簡化了從設計到程式碼的流程。

使用多模態推理,Gemini 3 Flash可快速分析帶有上下文UI覆蓋層的圖像,並生成字幕,最終將靜態圖像轉化為互動式體驗。

憑藉在推理、工具使用和多模態能力方面的出色表現,Gemini 3 Flash 特別適合希望進行更複雜視訊分析、資料提取和視覺問答的開發者。

Gemini 3 Flash的多模態推理能力可用於幫助使用者看、聽和理解任何類型的資訊。使用者可以要求Gemini理解視訊和圖像,並在幾秒鐘內將該內容轉化為有幫助且可操作的計畫。

Gemini應用程式中的Gemini 3 Flash可以分析短影片內容並給你一個計畫,比如如何改進你的高爾夫揮杆。

由於Gemini 3 Flash針對速度進行了最佳化,它可以在你仍在繪圖時就“看到”並猜出你畫的是什麼。

你可以上傳一段錄音,Gemini 3 Flash將識別你的知識盲點,建立一個自訂測驗,並對答案給出詳細解釋。

或者,也可以嘗試“用嘴程式設計”,僅用語音輸入從零開始建構有趣、有用的應用程式。Gemini 3 Flash可以在幾分鐘內將非結構化的想法轉化為一個功能正常的應用程式。

02.

多領域性能超越Pro級模型

可自動調節思考量

Gemini 3 Flash在基準測試上表現如何?它在GPQA Diamond(90.4%)和Humanity's Last Exam(不使用工具時為33.7%)等博士級推理和知識基準測試中,可與更大的前沿模型相媲美,並且在多項基準測試中顯著優於Gemini 2.5 Pro。

在評估編碼智能體能力的基準測試SWE-bench Verified中,Gemini 3 Flash取得78%的成績,不僅超越了2.5系列,也超過了Gemini 3 Pro。

它還在MMMU Pro上達到了81.2%的分數,與Gemini 3 Pro相當,實現了最先進的性能。

在下圖中展示的基準測試中,Gemini 3 Flash在幾乎所有基準測試上都超過了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。

除了前沿等級的推理和多模態能力外,Gemini 3 Flash的建構旨在實現高效率,推動了質量與成本、速度之間的帕累托邊界。下方散點圖顯示了多個語言模型的LMArena Elo得分與每百萬tokens價格的關係,其中一條線標出了穿過Gemini 3 Pro、Gemini 3 Flash和Gemini 3 Flash Lite的帕累托邊界。

在思考預算拉滿時,Gemini 3 Flash能夠調節其思考量。對於更複雜的用例,它可能會思考更長時間。但根據典型流量測量,在以更高的性能精準完成日常任務的前提下,它平均比2.5 Pro少使用30%的tokens。

03.

結語:Gemini 3模型版圖補全

有望深度嵌入日常應用

Gemini 3系列模型自發佈以來就廣受好評,不過其高昂的成本讓不少使用者望而卻步。Gemini 3 Flash補全了Gemini 3家族在輕量化、高性價比方面的佈局,回應了開發者在真實生產環境裡的訴求。

從迭代式開發、Vibe Coding,到多模態應用、即時互動和智能體系統,Gemini 3 Flash所展現的更高性價比,有望幫助智能更廣泛地嵌入日常應用和商業系統之中。 (智東西)