Google甩出“價格屠夫”！Gemini 3 Flash超Pro，成本僅1/4，速度如“閃電”

2025/12/18

•

多領域性能比肩Pro模型。

昨晚，Google發佈了Gemini 3 Flash，旨在用更低的成本提供前沿的智能水平。

具體來看，它輸出每百萬token的價格僅為Claude Sonnet 4.5的20%、GPT-5.2的21%，卻能在基準測試上達到甚至超越這些旗艦級模型的水平。

即便是和Gemini 3 Pro相比，Gemini 3 Flash也極具性價比。Flash的價格僅為Pro的25%，卻在MMMU-Pro、SWE-bench Verified這些核心基準測試上，超過了Pro版本的模型。

此前發佈的Gemini 3系列模型在複雜推理、多模態和視覺理解、智能體及Vibe Coding任務方面都展現出優勢，Gemini 3 Flash保留了這一基礎，將Gemini 3 Pro等級的推理能力與Flash等級的延遲、效率和成本相結合。

Google首席科學家Jeff Dean稱，Gemini 3 Flash不僅比2.5 Pro質量更高，速度也快3倍，而且價格僅為後者的幾分之一。以下是並排演示：

Gemini 3 Flash目前已經全面開放，開發者可通過Google AI Studio中的Gemini API、Gemini CLI以及智能體開發平台Google Antigravity使用。而普通使用者能通過Gemini應用程式和Google搜尋中的AI模式使用。

01. 專為迭代式開發打造

還幫你“用嘴程式設計”

Gemini 3 Flash究竟能做什麼？Google稱，這是一款專為迭代式開發打造的模型，能夠以低延遲提供接近Gemini 3 Pro等級的程式設計性能。

Google分享了多個案例。比如，Gemini 3 Flash可以在一個手部追蹤的“彈球解謎遊戲”中實現多模態推理，提供近乎即時的AI輔助。

它還可以近乎即時地建構和A/B測試新的載入動畫設計，簡化了從設計到程式碼的流程。

使用多模態推理，Gemini 3 Flash可快速分析帶有上下文UI覆蓋層的圖像，並生成字幕，最終將靜態圖像轉化為互動式體驗。

憑藉在推理、工具使用和多模態能力方面的出色表現，Gemini 3 Flash 特別適合希望進行更複雜視訊分析、資料提取和視覺問答的開發者。

Gemini 3 Flash的多模態推理能力可用於幫助使用者看、聽和理解任何類型的資訊。使用者可以要求Gemini理解視訊和圖像，並在幾秒鐘內將該內容轉化為有幫助且可操作的計畫。

Gemini應用程式中的Gemini 3 Flash可以分析短影片內容並給你一個計畫，比如如何改進你的高爾夫揮杆。

由於Gemini 3 Flash針對速度進行了最佳化，它可以在你仍在繪圖時就“看到”並猜出你畫的是什麼。

你可以上傳一段錄音，Gemini 3 Flash將識別你的知識盲點，建立一個自訂測驗，並對答案給出詳細解釋。

或者，也可以嘗試“用嘴程式設計”，僅用語音輸入從零開始建構有趣、有用的應用程式。Gemini 3 Flash可以在幾分鐘內將非結構化的想法轉化為一個功能正常的應用程式。

02. 多領域性能超越Pro級模型

可自動調節思考量

Gemini 3 Flash在基準測試上表現如何？它在GPQA Diamond（90.4%）和Humanity's Last Exam（不使用工具時為33.7%）等博士級推理和知識基準測試中，可與更大的前沿模型相媲美，並且在多項基準測試中顯著優於Gemini 2.5 Pro。

在評估編碼智能體能力的基準測試SWE-bench Verified中，Gemini 3 Flash取得78%的成績，不僅超越了2.5系列，也超過了Gemini 3 Pro。

它還在MMMU Pro上達到了81.2%的分數，與Gemini 3 Pro相當，實現了最先進的性能。

在下圖中展示的基準測試中，Gemini 3 Flash在幾乎所有基準測試上都超過了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。

除了前沿等級的推理和多模態能力外，Gemini 3 Flash的建構旨在實現高效率，推動了質量與成本、速度之間的帕累托邊界。下方散點圖顯示了多個語言模型的LMArena Elo得分與每百萬tokens價格的關係，其中一條線標出了穿過Gemini 3 Pro、Gemini 3 Flash和Gemini 3 Flash Lite的帕累托邊界。

在思考預算拉滿時，Gemini 3 Flash能夠調節其思考量。對於更複雜的用例，它可能會思考更長時間。但根據典型流量測量，在以更高的性能精準完成日常任務的前提下，它平均比2.5 Pro少使用30%的tokens。

03. 結語：Gemini 3模型版圖補全

有望深度嵌入日常應用

Gemini 3系列模型自發佈以來就廣受好評，不過其高昂的成本讓不少使用者望而卻步。Gemini 3 Flash補全了Gemini 3家族在輕量化、高性價比方面的佈局，回應了開發者在真實生產環境裡的訴求。

從迭代式開發、Vibe Coding，到多模態應用、即時互動和智能體系統，Gemini 3 Flash所展現的更高性價比，有望幫助智能更廣泛地嵌入日常應用和商業系統之中。 (智東西)

科技