Gemini 3.5 發佈:Google用“價格砍半、速度4倍”逼競爭對手出局

皮查伊:延遲至關重要。Gemini 3.5背後的產品邏輯。

在今日舉行的 Google I/O 2026 開發者大會上,Google CEO 桑達爾·皮查伊(Sundar Pichai)走上台,發佈了新一代大模型系列 Gemini 3.5

表面上,這是一次例行的大版本迭代。但把所有資訊拼在一起——性能基準、定價策略、產品路線圖、資本支出——你會發現,Google正在精心佈局一場深層較量:用“前沿智能+極速推理+超低成本”三者合力,把智能體 AI 的門檻提高到競爭對手短期內難以跟進的高度。

01. 性能與性價比:一次有備而來的反擊

這場較量的序幕,在過去半年裡已經拉開。

2025 年 1 月,OpenAI 推出 Operator,基於 CUA(Computer-Using Agent)模型,能夠自主操控瀏覽器介面執行多步驟任務,率先向“行動式 AI”邁出實質性一步。2026 年 2 月,Anthropic 發佈 Claude Opus 4.6,在智能體程式設計、電腦操控、工具呼叫等維度全面拉高行業基準;3 月,Anthropic 又密集推送 Claude Code 超過 10 個版本,加入 Computer Use、雲端定時任務和遠端控制,直接對標開發者的日常工作流。

也就是說,在 Gemini 3.5 發佈之前,智能體 AI 的敘事主導權並不在Google手裡。皮查伊今天的發佈,是一次系統性的反擊——而且是有備而來。

Gemini 3.5 系列首發推出 Gemini 3.5 Flash,定位為“迄今最強大的智能體與程式設計模型”。更強大的 Gemini 3.5 Pro 已在 Google 內部投入使用,皮查伊在台上透露,它“展現出極大的性能提升”,預計下月正式推出。

先說基準測試資料。

在 GDPval-AA 基準中,Gemini 3.5 Flash 取得 1656 Elo 評分。這個基準衡量的是“現實世界具有實際經濟價值的程式設計任務”——換句話說,不是做題,而是寫能用的程式碼、解決真實的工程問題。1656 Elo 的分數,超過了 Gemini 3.1 Pro,也超過了目前公開可查的大部分前沿模型成績。

在 Terminal-Bench 2.1(衡量 AI 在真實終端環境中完成複雜任務的能力)中,Gemini 3.5 Flash 得分 76.2%。作為參照,2025 年初 OpenAI Operator 發佈時,同類基準的成績普遍在 50%–60% 區間。半年多過去,76.2% 意味著智能體在執行真實任務時的可靠性,正在從“勉強可用”向“可以依賴”跨越。

在智能體工具呼叫基準 MCP Atlas 中,成績是 83.6%;多模態推理基準 CharXiv Reasoning 錄得 84.2%。在 Artificial Analysis 綜合智能指數中,Gemini 3.5 Flash 穩居第一象限的右上方——即同時具備前沿級智能水平與極高推理速度的最優區間,而且是目前唯一穩居這個區間的公開模型。

但真正讓這次發佈最具衝擊力的,不是基準測試,而是性價比。

Gemini 3.5 Flash 的輸出 Token 速率達到其他前沿模型的 4 倍。在 Antigravity 平台內建的最佳化版本中,響應速度更達到競品的 12 倍

成本方面,處理智能體任務的費用通常不到其他前沿模型的 一半。據Google測算,頭部科技企業若將 80% 的日常負載從其他前沿模型遷移至 Gemini 3.5 Flash,每年可節省超過 10 億美元

皮查伊在演講中直言:“Flash 的驚人之處在於,它以不到同類前沿模型一半的價格,提供了前沿等級的能力。”

這句話值得停下來想一想。當一家巨頭願意用“砍半定價”來推廣自己的最前沿模型時,它傳達的訊號不是“我在讓利”,而是“我要把競爭對手擠出市場”。低價是手段,搶佔生態才是目的。

這些資料並非紙上談兵。

Google 內部 AI 程式設計工具形成了強巨量資料反饋閉環:從 2025 年 3 月每天處理 5000 億 Token,到 I/O 2026 時已增長至每天處理超過 3 兆 Token。規模翻倍僅用數周,而這種大規模真實負載的持續打磨,正是 Gemini 3.5 性能躍升的重要基石。

這裡有一個值得注意的細節:Google沒有披露 Gemini 3.5 的參數量。在行業裡,這通常意味著兩種可能——要麼參數規模並沒有大幅提升,靠的是工程最佳化和推理架構改進;要麼Google有意隱瞞,避免給競爭對手提供對標參考。無論那種情況,對外部開發者和企業來說,“參數黑盒”都是一個需要留心的訊號。

Gemini 3.5 之所以被稱為“智能體時代的基礎模型”,核心在於它是 Google 首款將前沿智能與行動力深度融合的模型系列。

所謂“智能體”(Agent),簡單說就是能自主規劃、呼叫工具、執行多步驟任務的人工智慧——不再只是回答問題,而是替你完成任務。Gemini 3.5 的智能體原生架構支援同時部署多個互聯協作的子智能體(subagents),大規模平行處理複雜業務場景,將原本需要數天乃至數周的長周期工作壓縮至極短時間完成。

它能夠穩定執行跨步驟、跨工具的複雜任務流程,並在整個過程中保持上下文連貫性,支援運行數周的自主工作流——如稅務申報、客戶盡調等場景——無需人工持續介入。這意味著,智能體 AI 正在從“演示階段”走向“生產階段”,而 Gemini 3.5 是目前門檻最低、最易上手的選擇。

程式設計能力的跨越式飛躍是另一大核心亮點。

Gemini 3.5 Flash 在 GDPVal 評分中表現突出,具體能力涵蓋從零建構全新應用、維護與迭代大型程式碼庫、遺留程式碼遷移(如遷移至 Next.js 等現代框架),以及快速規劃與迭代開發。

這裡有一個值得對照的背景:2026 年以來,AI 程式設計助手的市場競爭已經進入白熱化階段。GitHub Copilot、Cursor、Windsurf 等工具背後,分別繫結了 OpenAI、Anthropic 和 Google 的模型能力。Gemini 3.5 Flash 如果真的如基準測試所示在程式設計任務上大幅領先,那麼Google不僅在模型層面對競爭對手形成壓力,在開發者工具生態層面也將獲得更大的話語權。

多模態能力同樣進一步升級。

基於 Gemini 3 的原生多模態基礎建構,Gemini 3.5 能夠生成更豐富、更具互動性的 Web UI 和圖形介面(生成式 UI),對超過 100 頁的複雜檔案進行深度推理與資訊檢索。

它通過多模態 OCR 結合歷史資料模式推理與複雜帳單圖像理解——這個能力聽起來技術化,但實際場景非常具體:比如企業財務部門處理上千張供應商發票,過去需要人工逐一核對,現在可以由 AI 自主完成,且精準率在企業級場景中已經通過驗證。

安全方面的升級,Google著墨不少,但外界的疑問也最多。

Gemini 3.5 基於 Google 前沿安全框架(Frontier Safety Framework) 開發,強化了網路安全與 CBRN(化學、生物、放射、核)防護措施,並引入可解釋性工具——在 AI 給出最終回答前對其內部推理邏輯進行安全檢查,在顯著降低有害內容生成機率的同時,減少對合法查詢的誤拒率。

這裡存在一個值得追問的矛盾:Google強調“可解釋性”和“安全第一”,但與此同時,Gemini 3.5 正在大幅降低 AI 能力的獲取門檻(速度更快、價格更低、全面開放 API)。門檻越低,被濫用的風險越高。Google的安全框架是否真能覆蓋一個 Token 處理量達到 3.2 千兆/月的開放生態?這個問題,皮查伊在台上沒有回答。

02. 皮查伊的全端敘事:從模型到生態

皮查伊在 I/O 2026 主題演講中的發言,是理解這次發佈的關鍵。

他首先回顧了過去一年的進展:“自去年 I/O 以來,這是一段非凡的歷程——持續的產品發佈、技術突破和超高速進展。我們現在處於 AI 周期的一個階段:人們希望在他們每天使用的產品中看到真正的價值。”

這句話的潛台詞是:過去兩年 AI 行業都在跑分、發論文、做演示,現在到了交成績單的時候了。而Google的成績單,就是搜尋、Gemini App、Android 這幾十億使用者產品的 AI 化改造。

關於搜尋業務的演進,皮查伊說了一句份量很重的話:“如果我們從 27 年的搜尋研發中學到了什麼,那就是:延遲至關重要。”

這句話解釋了為何 Gemini 3.5 在速度上的突破被Google置於如此核心的位置。在搜尋這個億級使用者產品裡,延遲直接決定使用者體驗與留存。這也是為什麼“4 倍速度”不是一個技術指標,而是一個產品戰略:只有足夠快,AI 搜尋才有可能替代傳統搜尋,成為使用者的主流選擇。

皮查伊透露,搭載 AI 功能的搜尋功能正在改變使用者行為——搜尋已不再只是單次查詢,而更像是一次持續的對話,而當人們在搜尋中使用 AI 驅動的功能時,他們使用搜尋的頻率更高了。這對Google來說是一個極其重要的訊號:AI 功能不是蠶食搜尋的現有流量,而是在創造新的使用場景和更高的使用頻次。

對於智能體時代的戰略判斷,皮查伊的表態更加明確:“我們正超級專注於將智能體的力量,安全、可靠地帶給消費者,讓它為每個人服務。”

這句話的野心比聽起來大得多。

“為每個人服務”意味著Google不僅要佔領企業市場,還要佔領消費級市場。而要實現這一點,光有模型不夠,必須有全端能力:晶片(TPU 8)、模型(Gemini 3.5)、平台(Antigravity 2.0)、終端產品(Spark、搜尋、Android)。皮查伊在演講中勾勒的正是這條完整的技術堆疊路徑。

這條全端路徑的核心邏輯是:以極致性價比與極速推理,驅動智能體在消費端和企業端的規模化落地。而這,恰恰是 OpenAI 沒有晶片、Anthropic 沒有終端產品、Meta 沒有企業級全端的競爭對手們短期內難以複製的壁壘。

基於上述戰略框架,皮查伊公佈了多項即將落地的關鍵產品。

Gemini Spark——基於 Gemini 3.5 Flash 與 Antigravity 平台驅動的個人 AI 智能體——將在下周向美國 Google AI Ultra 訂閱使用者開放 Beta。它能夠 24/7 運行,處理長周期複雜任務,並通過 MCP 協議接入第三方工具。這意味著,Spark 不是一個封閉在Google生態裡的助手,而是一個可以連接外部服務的開放智能體——這個設計選擇,明顯是在對標 OpenAI 的外掛生態。

搜尋資訊智能體將於 2026 年夏季推出,在後台 24/7 運行,主動發現資訊並代為執行操作。Daily Brief Agent 將整合使用者的郵件、日曆與任務,生成個性化晨間摘要。Android Halo 將於 2026 年晚些時候推出,為使用者提供即時智能體任務追蹤介面。搭載 AI 功能的音訊眼鏡硬體產品則定於 2026 年秋季發佈。

而更強大的 Gemini 3.5 Pro,皮查伊透露“已在 Google 內部使用,展現出極大的性能提升”,預計下月正式推出。Pro 版的發佈,將直接與 OpenAI 的 GPT 系列和 Anthropic 的 Claude Opus 系列展開正面競爭。

這些產品構想是否靠譜,一個重要的驗證維度是:企業客戶有沒有真的在用、真的在付錢?

Google在發佈會上列舉了多家企業客戶的使用案例。但需要指出的是,這些案例均為Google主動披露,第三方獨立驗證資料尚待觀察。不過從已披露的資訊來看,應用場景確實覆蓋了企業 AI 化的核心痛點。

Shopify 利用平行多子智能體分析長周期複雜資料,體現多智能體協作能力;麥格理銀行借助 Gemini 3.5 加速客戶開戶流程,能夠對 100 頁以上的複雜檔案進行推理並給出合規建議——這個場景如果真的跑通,對金融行業的 AI 落地將是一個重要訊號;Salesforce(Agentforce) 依託其跨步驟工具呼叫能力自動化企業任務;Ramp 應用其多模態 OCR 能力處理複雜帳單;Xero 讓其自主管理數周的 workflows(如 1099 稅務表格處理);Databricks 則利用其海量資料集推理能力進行即時監測。

把這些案例放在一起,一個共同的規律浮現出來:Gemini 3.5 的企業價值,不在於“更聰明”,而在於“更持久、更快速、更便宜地執行長周期任務”。這正是智能體 AI 從演示走向生產的關鍵門檻。

從生態整合的角度看,Gemini 3.5 Flash 即日起已在多個層面全面開放。

消費端作為 Gemini App 和 Google 搜尋 AI 模式的全球默認模型;開發者端通過 Google AI Studio、Gemini API 和 Android Studio 提供服務;企業端則通過 Gemini Enterprise Agent Platform 支援部署。

這種全端覆蓋的開放策略,與皮查伊所強調的“讓智能體的力量為每個人服務”形成了戰略呼應。但與此同時,一個值得警惕的問題是:當Google同時控制了模型、平台、開發工具和終端產品時,開發者和其他企業是否正在被逐步鎖定在Google的生態系統裡?“開放 API”和“開放生態”之間,並不總是等號。

03. 規模即壁壘:1800 億美元背後的邏輯

支撐這一切的,是 Google AI 全端持續釋放的規模勢能。

皮查伊在演講中披露的最新資料顯示:月度 Token 處理量已達到 3.2 千兆(quadrillion),同比增長 7 倍。這個數字意味著,Google的 AI 基礎設施正在以遠超行業平均的速度擴張。

Gemini App 月活躍使用者從 4 億增長至 9 億,一年內實現翻倍;搜尋 AI 模式月活躍使用者突破 10 億;AI Overviews 月活躍使用者達到 25 億;基於 Google 模型進行開發的開發者達到 850 萬/月

而最震撼的數字或許是這一個:2026 年預計資本支出高達 1800 至 1900 億美元,較 2022 年的約 310 億美元大幅增長。

這 1800 多億美元的資本支出,本質上是在做一件事:用基礎設施的規模化優勢,把競爭對手擠出市場。當你的 TPU 叢集規模、Token 處理量和使用者基數都達到競爭對手無法匹敵的量級時,“速度 4 倍、價格砍半”就不再是一個促銷手段,而是一個結構性壁壘。

回到最根本的問題:Gemini 3.5 的發佈,究竟是一次真正的技術飛躍,還是一次精心包裝的戰略行銷?

答案可能是:兩者都是。

從技術角度看,Gemini 3.5 Flash 在基準測試中的表現、推理速度的提升、以及多智能體平行架構的落地,都是真實的進步。但與此同時,這次發佈真正值得關注的,不是模型本身,而是Google圍繞模型建構的全端壁壘:TPU 8 提供算力、Gemini 3.5 提供智能、Antigravity 2.0 提供平台、Spark 和搜尋提供觸達——這條鏈條上的每一個環節,Google都握有主動權。

對開發者和企業來說,這意味著選擇 Gemini 3.5 不僅是選擇一個模型,更是選擇一個生態。而對 OpenAI、Anthropic 和 Meta 來說,Gemini 3.5 的發佈傳遞的資訊很明確:單靠模型能力已經不夠了,誰能把模型、平台和產品連成一體,誰才能贏得智能體時代。

正如皮查伊在演講結尾所言:“當我們放眼整個創新技術堆疊,可以清晰地看到——我們正堅定地步入智能體化的 Gemini 時代。”

這句話是宣言,也是向競爭對手發出的挑戰。 (鈦媒體AGI)