Gemini 3.5 發佈：Google用“價格砍半、速度4倍”逼競爭對手出局

2026/05/20

•

皮查伊：延遲至關重要。Gemini 3.5背後的產品邏輯。

在今日舉行的 Google I/O 2026 開發者大會上，Google CEO 桑達爾·皮查伊（Sundar Pichai）走上台，發佈了新一代大模型系列 Gemini 3.5。

表面上，這是一次例行的大版本迭代。但把所有資訊拼在一起——性能基準、定價策略、產品路線圖、資本支出——你會發現，Google正在精心佈局一場深層較量：用“前沿智能+極速推理+超低成本”三者合力，把智能體 AI 的門檻提高到競爭對手短期內難以跟進的高度。

01. 性能與性價比：一次有備而來的反擊

這場較量的序幕，在過去半年裡已經拉開。

2025 年 1 月，OpenAI 推出 Operator，基於 CUA（Computer-Using Agent）模型，能夠自主操控瀏覽器介面執行多步驟任務，率先向“行動式 AI”邁出實質性一步。2026 年 2 月，Anthropic 發佈 Claude Opus 4.6，在智能體程式設計、電腦操控、工具呼叫等維度全面拉高行業基準；3 月，Anthropic 又密集推送 Claude Code 超過 10 個版本，加入 Computer Use、雲端定時任務和遠端控制，直接對標開發者的日常工作流。

也就是說，在 Gemini 3.5 發佈之前，智能體 AI 的敘事主導權並不在Google手裡。皮查伊今天的發佈，是一次系統性的反擊——而且是有備而來。

Gemini 3.5 系列首發推出 Gemini 3.5 Flash，定位為“迄今最強大的智能體與程式設計模型”。更強大的 Gemini 3.5 Pro 已在 Google 內部投入使用，皮查伊在台上透露，它“展現出極大的性能提升”，預計下月正式推出。

先說基準測試資料。

在 GDPval-AA 基準中，Gemini 3.5 Flash 取得 1656 Elo 評分。這個基準衡量的是“現實世界具有實際經濟價值的程式設計任務”——換句話說，不是做題，而是寫能用的程式碼、解決真實的工程問題。1656 Elo 的分數，超過了 Gemini 3.1 Pro，也超過了目前公開可查的大部分前沿模型成績。

在 Terminal-Bench 2.1（衡量 AI 在真實終端環境中完成複雜任務的能力）中，Gemini 3.5 Flash 得分 76.2%。作為參照，2025 年初 OpenAI Operator 發佈時，同類基準的成績普遍在 50%–60% 區間。半年多過去，76.2% 意味著智能體在執行真實任務時的可靠性，正在從“勉強可用”向“可以依賴”跨越。

在智能體工具呼叫基準 MCP Atlas 中，成績是 83.6%；多模態推理基準 CharXiv Reasoning 錄得 84.2%。在 Artificial Analysis 綜合智能指數中，Gemini 3.5 Flash 穩居第一象限的右上方——即同時具備前沿級智能水平與極高推理速度的最優區間，而且是目前唯一穩居這個區間的公開模型。

但真正讓這次發佈最具衝擊力的，不是基準測試，而是性價比。

Gemini 3.5 Flash 的輸出 Token 速率達到其他前沿模型的 4 倍。在 Antigravity 平台內建的最佳化版本中，響應速度更達到競品的 12 倍。

成本方面，處理智能體任務的費用通常不到其他前沿模型的一半。據Google測算，頭部科技企業若將 80% 的日常負載從其他前沿模型遷移至 Gemini 3.5 Flash，每年可節省超過 10 億美元。

皮查伊在演講中直言：“Flash 的驚人之處在於，它以不到同類前沿模型一半的價格，提供了前沿等級的能力。”

這句話值得停下來想一想。當一家巨頭願意用“砍半定價”來推廣自己的最前沿模型時，它傳達的訊號不是“我在讓利”，而是“我要把競爭對手擠出市場”。低價是手段，搶佔生態才是目的。

這些資料並非紙上談兵。

Google 內部 AI 程式設計工具形成了強巨量資料反饋閉環：從 2025 年 3 月每天處理 5000 億 Token，到 I/O 2026 時已增長至每天處理超過 3 兆 Token。規模翻倍僅用數周，而這種大規模真實負載的持續打磨，正是 Gemini 3.5 性能躍升的重要基石。

這裡有一個值得注意的細節：Google沒有披露 Gemini 3.5 的參數量。在行業裡，這通常意味著兩種可能——要麼參數規模並沒有大幅提升，靠的是工程最佳化和推理架構改進；要麼Google有意隱瞞，避免給競爭對手提供對標參考。無論那種情況，對外部開發者和企業來說，“參數黑盒”都是一個需要留心的訊號。

Gemini 3.5 之所以被稱為“智能體時代的基礎模型”，核心在於它是 Google 首款將前沿智能與行動力深度融合的模型系列。

所謂“智能體”（Agent），簡單說就是能自主規劃、呼叫工具、執行多步驟任務的人工智慧——不再只是回答問題，而是替你完成任務。Gemini 3.5 的智能體原生架構支援同時部署多個互聯協作的子智能體（subagents），大規模平行處理複雜業務場景，將原本需要數天乃至數周的長周期工作壓縮至極短時間完成。

它能夠穩定執行跨步驟、跨工具的複雜任務流程，並在整個過程中保持上下文連貫性，支援運行數周的自主工作流——如稅務申報、客戶盡調等場景——無需人工持續介入。這意味著，智能體 AI 正在從“演示階段”走向“生產階段”，而 Gemini 3.5 是目前門檻最低、最易上手的選擇。

程式設計能力的跨越式飛躍是另一大核心亮點。

Gemini 3.5 Flash 在 GDPVal 評分中表現突出，具體能力涵蓋從零建構全新應用、維護與迭代大型程式碼庫、遺留程式碼遷移（如遷移至 Next.js 等現代框架），以及快速規劃與迭代開發。

這裡有一個值得對照的背景：2026 年以來，AI 程式設計助手的市場競爭已經進入白熱化階段。GitHub Copilot、Cursor、Windsurf 等工具背後，分別繫結了 OpenAI、Anthropic 和 Google 的模型能力。Gemini 3.5 Flash 如果真的如基準測試所示在程式設計任務上大幅領先，那麼Google不僅在模型層面對競爭對手形成壓力，在開發者工具生態層面也將獲得更大的話語權。

多模態能力同樣進一步升級。

基於 Gemini 3 的原生多模態基礎建構，Gemini 3.5 能夠生成更豐富、更具互動性的 Web UI 和圖形介面（生成式 UI），對超過 100 頁的複雜檔案進行深度推理與資訊檢索。

它通過多模態 OCR 結合歷史資料模式推理與複雜帳單圖像理解——這個能力聽起來技術化，但實際場景非常具體：比如企業財務部門處理上千張供應商發票，過去需要人工逐一核對，現在可以由 AI 自主完成，且精準率在企業級場景中已經通過驗證。

安全方面的升級，Google著墨不少，但外界的疑問也最多。

Gemini 3.5 基於 Google 前沿安全框架（Frontier Safety Framework） 開發，強化了網路安全與 CBRN（化學、生物、放射、核）防護措施，並引入可解釋性工具——在 AI 給出最終回答前對其內部推理邏輯進行安全檢查，在顯著降低有害內容生成機率的同時，減少對合法查詢的誤拒率。

這裡存在一個值得追問的矛盾：Google強調“可解釋性”和“安全第一”，但與此同時，Gemini 3.5 正在大幅降低 AI 能力的獲取門檻（速度更快、價格更低、全面開放 API）。門檻越低，被濫用的風險越高。Google的安全框架是否真能覆蓋一個 Token 處理量達到 3.2 千兆/月的開放生態？這個問題，皮查伊在台上沒有回答。

02. 皮查伊的全端敘事：從模型到生態

皮查伊在 I/O 2026 主題演講中的發言，是理解這次發佈的關鍵。

他首先回顧了過去一年的進展：“自去年 I/O 以來，這是一段非凡的歷程——持續的產品發佈、技術突破和超高速進展。我們現在處於 AI 周期的一個階段：人們希望在他們每天使用的產品中看到真正的價值。”

這句話的潛台詞是：過去兩年 AI 行業都在跑分、發論文、做演示，現在到了交成績單的時候了。而Google的成績單，就是搜尋、Gemini App、Android 這幾十億使用者產品的 AI 化改造。

關於搜尋業務的演進，皮查伊說了一句份量很重的話：“如果我們從 27 年的搜尋研發中學到了什麼，那就是：延遲至關重要。”

這句話解釋了為何 Gemini 3.5 在速度上的突破被Google置於如此核心的位置。在搜尋這個億級使用者產品裡，延遲直接決定使用者體驗與留存。這也是為什麼“4 倍速度”不是一個技術指標，而是一個產品戰略：只有足夠快，AI 搜尋才有可能替代傳統搜尋，成為使用者的主流選擇。

皮查伊透露，搭載 AI 功能的搜尋功能正在改變使用者行為——搜尋已不再只是單次查詢，而更像是一次持續的對話，而當人們在搜尋中使用 AI 驅動的功能時，他們使用搜尋的頻率更高了。這對Google來說是一個極其重要的訊號：AI 功能不是蠶食搜尋的現有流量，而是在創造新的使用場景和更高的使用頻次。

對於智能體時代的戰略判斷，皮查伊的表態更加明確：“我們正超級專注於將智能體的力量，安全、可靠地帶給消費者，讓它為每個人服務。”

這句話的野心比聽起來大得多。

“為每個人服務”意味著Google不僅要佔領企業市場，還要佔領消費級市場。而要實現這一點，光有模型不夠，必須有全端能力：晶片（TPU 8）、模型（Gemini 3.5）、平台（Antigravity 2.0）、終端產品（Spark、搜尋、Android）。皮查伊在演講中勾勒的正是這條完整的技術堆疊路徑。

這條全端路徑的核心邏輯是：以極致性價比與極速推理，驅動智能體在消費端和企業端的規模化落地。而這，恰恰是 OpenAI 沒有晶片、Anthropic 沒有終端產品、Meta 沒有企業級全端的競爭對手們短期內難以複製的壁壘。

基於上述戰略框架，皮查伊公佈了多項即將落地的關鍵產品。

Gemini Spark——基於 Gemini 3.5 Flash 與 Antigravity 平台驅動的個人 AI 智能體——將在下周向美國 Google AI Ultra 訂閱使用者開放 Beta。它能夠 24/7 運行，處理長周期複雜任務，並通過 MCP 協議接入第三方工具。這意味著，Spark 不是一個封閉在Google生態裡的助手，而是一個可以連接外部服務的開放智能體——這個設計選擇，明顯是在對標 OpenAI 的外掛生態。

搜尋資訊智能體將於 2026 年夏季推出，在後台 24/7 運行，主動發現資訊並代為執行操作。Daily Brief Agent 將整合使用者的郵件、日曆與任務，生成個性化晨間摘要。Android Halo 將於 2026 年晚些時候推出，為使用者提供即時智能體任務追蹤介面。搭載 AI 功能的音訊眼鏡硬體產品則定於 2026 年秋季發佈。

而更強大的 Gemini 3.5 Pro，皮查伊透露“已在 Google 內部使用，展現出極大的性能提升”，預計下月正式推出。Pro 版的發佈，將直接與 OpenAI 的 GPT 系列和 Anthropic 的 Claude Opus 系列展開正面競爭。

這些產品構想是否靠譜，一個重要的驗證維度是：企業客戶有沒有真的在用、真的在付錢？

Google在發佈會上列舉了多家企業客戶的使用案例。但需要指出的是，這些案例均為Google主動披露，第三方獨立驗證資料尚待觀察。不過從已披露的資訊來看，應用場景確實覆蓋了企業 AI 化的核心痛點。

Shopify 利用平行多子智能體分析長周期複雜資料，體現多智能體協作能力；麥格理銀行借助 Gemini 3.5 加速客戶開戶流程，能夠對 100 頁以上的複雜檔案進行推理並給出合規建議——這個場景如果真的跑通，對金融行業的 AI 落地將是一個重要訊號；Salesforce（Agentforce） 依託其跨步驟工具呼叫能力自動化企業任務；Ramp 應用其多模態 OCR 能力處理複雜帳單；Xero 讓其自主管理數周的 workflows（如 1099 稅務表格處理）；Databricks 則利用其海量資料集推理能力進行即時監測。

把這些案例放在一起，一個共同的規律浮現出來：Gemini 3.5 的企業價值，不在於“更聰明”，而在於“更持久、更快速、更便宜地執行長周期任務”。這正是智能體 AI 從演示走向生產的關鍵門檻。

從生態整合的角度看，Gemini 3.5 Flash 即日起已在多個層面全面開放。

消費端作為 Gemini App 和 Google 搜尋 AI 模式的全球默認模型；開發者端通過 Google AI Studio、Gemini API 和 Android Studio 提供服務；企業端則通過 Gemini Enterprise Agent Platform 支援部署。

這種全端覆蓋的開放策略，與皮查伊所強調的“讓智能體的力量為每個人服務”形成了戰略呼應。但與此同時，一個值得警惕的問題是：當Google同時控制了模型、平台、開發工具和終端產品時，開發者和其他企業是否正在被逐步鎖定在Google的生態系統裡？“開放 API”和“開放生態”之間，並不總是等號。

03. 規模即壁壘：1800 億美元背後的邏輯

支撐這一切的，是 Google AI 全端持續釋放的規模勢能。

皮查伊在演講中披露的最新資料顯示：月度 Token 處理量已達到 3.2 千兆（quadrillion），同比增長 7 倍。這個數字意味著，Google的 AI 基礎設施正在以遠超行業平均的速度擴張。

Gemini App 月活躍使用者從 4 億增長至 9 億，一年內實現翻倍；搜尋 AI 模式月活躍使用者突破 10 億；AI Overviews 月活躍使用者達到 25 億；基於 Google 模型進行開發的開發者達到 850 萬/月。

而最震撼的數字或許是這一個：2026 年預計資本支出高達 1800 至 1900 億美元，較 2022 年的約 310 億美元大幅增長。

這 1800 多億美元的資本支出，本質上是在做一件事：用基礎設施的規模化優勢，把競爭對手擠出市場。當你的 TPU 叢集規模、Token 處理量和使用者基數都達到競爭對手無法匹敵的量級時，“速度 4 倍、價格砍半”就不再是一個促銷手段，而是一個結構性壁壘。

回到最根本的問題：Gemini 3.5 的發佈，究竟是一次真正的技術飛躍，還是一次精心包裝的戰略行銷？

答案可能是：兩者都是。

從技術角度看，Gemini 3.5 Flash 在基準測試中的表現、推理速度的提升、以及多智能體平行架構的落地，都是真實的進步。但與此同時，這次發佈真正值得關注的，不是模型本身，而是Google圍繞模型建構的全端壁壘：TPU 8 提供算力、Gemini 3.5 提供智能、Antigravity 2.0 提供平台、Spark 和搜尋提供觸達——這條鏈條上的每一個環節，Google都握有主動權。

對開發者和企業來說，這意味著選擇 Gemini 3.5 不僅是選擇一個模型，更是選擇一個生態。而對 OpenAI、Anthropic 和 Meta 來說，Gemini 3.5 的發佈傳遞的資訊很明確：單靠模型能力已經不夠了，誰能把模型、平台和產品連成一體，誰才能贏得智能體時代。

正如皮查伊在演講結尾所言：“當我們放眼整個創新技術堆疊，可以清晰地看到——我們正堅定地步入智能體化的 Gemini 時代。”

這句話是宣言，也是向競爭對手發出的挑戰。（鈦媒體AGI）

科技