Google I/O 2026：全面進入智能體時代，AI不再只是聊天，而是替你幹活

2026/05/21

•

台北時間 5 月 20 日凌晨，Google I/O 2026 在加州山景城開幕。這不是一場常規更新——Google宣佈全面進入"智能體 Gemini 時代"。核心發佈：Gemini 3.5 Flash（速度 4 倍於同類）、全模態世界模型 Gemini Omni、7×24 背景執行的個人 AI 助手 Gemini Spark、搜尋框 25 年來最大改造、智能體程式設計平台 Antigravity 2.0、Android XR 智能眼鏡。Gemini 月活 9 億、搜尋 AI 概覽月活 25 億、每月處理 3200 兆 token（同比 7 倍增長）。今年 AI 基礎設施支出預計 1800-1900 億美元。Google正把 AI 智能體"塞進"搜尋、瀏覽器、手機和眼鏡的每一個入口。

如果用一句話概括今年的 Google I/O，那就是：

AI 不再只是回答問題，而是替你幹活。

兩小時的演講裡，Google管理層輪番出場，一次性發佈了數十個產品更新。但所有發佈都指向一個核心主題——Agentic Gemini 時代：AI 從對話助手進化為持續運行、跨應用執行任務的智能體。

從搜尋框到 Chrome 瀏覽器，從 Android 手機到智能眼鏡——Gemini 正在被"塞進"Google生態的每一個入口。這不是功能疊加，而是一次系統性轉向。

一、Gemini 生態爆發：月活 9 億，Token 處理量 7 倍增長

CEO 皮查伊在開場演講中先亮了一組資料：

Google AI 生態核心資料

Gemini App 月活：9 億（一年前 4 億，翻倍）
搜尋 AI 概覽（AI Overviews）月活：25 億
AI Mode 月活：超10 億
每月 Token 處理量：3200 兆個（同比增長 7 倍）
13 款產品各擁有超 10 億使用者，5 款超 30 億
2026 年 AI 基礎設施支出：1800-1900 億美元

兩年前Google每月處理 9.7 兆 token，去年 480 兆，今年 3200 兆——這條增長曲線的陡峭程度，足以解釋為什麼Google今年要投入近 2000 億美元建基礎設施。

二、兩大核心模型：Gemini 3.5 Flash + Gemini Omni

本次大會最核心的模型發佈有兩個：

1. Gemini 3.5 Flash——為 Agent 而生

Token 輸出速度：同類前沿模型的4 倍
價格：不到同類模型的一半
定位：專為智能體任務、更長工作流和程式設計設計
基準表現：在程式設計和 GDPVal 等真實經濟任務評測中全面超越 Gemini 3.1 Pro
今日起面向全球數十億使用者開放
更強的 Gemini 3.5 Pro 將於 6 月上線

2. Gemini Omni——全模態世界模型

由 DeepMind CEO Demis Hassabis 親自發佈
支援文字、圖像、音訊、視訊等所有模態的輸入和輸出
支援對話式視訊編輯（自然語言修改角色、背景、場景）
可上傳自拍轉換為其他風格或內容
首款模型 Gemini Omni Flash 今夏推出
所有生成內容嵌入 SynthID 數字水印

值得注意的是，Gemini 3.5 Flash 雖然更快更便宜，但其運行成本相比上一代上升了約 5 倍——因為 Agent 任務本身就需要更多計算量。有機構評論稱"性價比可能沒那麼美好"，這也是Google當日股價下跌 2.34% 的原因之一。

三、Gemini Spark：關上電腦它也在工作的 AI 助手

這可能是本次大會最具顛覆性的產品——Gemini Spark，一個 7×24 全天候運行的個人 AI 智能體。

Gemini Spark 核心特性

運行在 Google Cloud 專屬虛擬機器上（不依賴本地裝置）
即便合上筆記型電腦，Spark 也在繼續工作
可跨 Gmail、Google Drive、Sheets、Slides 等服務執行任務
支援手機端運行
未來將與第三方工具整合
本周面向受信任測試人員推出
下周面向美國 Google AI Ultra 訂閱使用者開放
今夏將在 Chrome 瀏覽器中運行

定位：直接對標 Anthropic 的 Claude Code / OpenAI 的 Codex
定價：AI Ultra 套餐 200 美元/月（從 250 降價），AI Pro 維持 20 美元/月

現場演示中，Spark 幫使用者策劃了一場街區派對：自動彙總所有郵件回覆、追蹤每位參與者攜帶的物品、向未回覆的鄰居傳送跟進郵件、在 Google Sheets 中建立即時追蹤器，還生成了一份包含充氣城堡和社區規則的 Google Slides 宣傳冊——所有資訊從 Drive 和 Gmail 中自動抓取。

這就是 Agent 與傳統 AI 助手的本質區別：它不是等你提問才回答，而是持續在後台監控、規劃和執行。

四、搜尋 25 年最大改造 + 智能體進入搜尋

Google對搜尋做了誕生 25 年以來的最大改造：

搜尋的三大變革

1. 新搜尋框

AI 生成的搜尋建議（不僅是自動補全）
支援多模態搜尋（上傳照片和視訊）

2. 資訊智能體進入搜尋

全天候背景執行，追蹤極其複雜的問題
持續監控網路，資訊變化時自動更新結果
使用者無需反覆手動搜尋
今年夏季推出

3. AI Mode 生成"迷你應用"

搜尋可直接在介面中生成可互動畫面
例：搜尋"周末活動"可從零生成一個活動計畫表
接入 Antigravity 編碼能力

Google還發佈了Universal Cart（通用購物車）——一個 AI 智能體驅動的跨平台購物系統，可在搜尋、Gemini、YouTube、Gmail 中統一使用，能追蹤優惠、監控價格變動、識別相容性問題（比如組裝電腦時提示部件不相容）。這意味著Google正在用 Agent 重構整個電商體驗。

五、開發者平台 + 硬體：Antigravity 2.0 與智能眼鏡

Antigravity 2.0——Google對標 Claude Code 和 OpenAI Codex 的智能體程式設計平台：

"毫不掩飾地以智能體為先"
用不到 1000 美元 Token 成本從零建構了一個作業系統
全新 CLI 工具，支援子代理編排複雜工作流
內建沙箱隔離、憑證掩碼、Git 策略保護
Google AI Studio 支援一鍵部署到 Cloud Run

Android XR 智能眼鏡——Google攜手三星、Gentle Monster、Warby Parker：

兩種形態：語音眼鏡 + 顯示眼鏡
內建 Gemini 智能助手
今年秋季上市，可與 iOS 和 Android 配對
現場演示：戴著眼鏡點咖啡——Gemini 導航到咖啡館、打開 DoorDash、準備好常點的訂單，手機全程放口袋

此外，Google還發佈了最新一代TPU 8（分為訓練版和推理版），以及Android Halo——手機上 AI 智能體運行狀態的可視化入口。

結語：三個判斷

判斷一：AI 競爭已進入"Agent 落地"階段

OpenAI 有 Codex，Anthropic 有 Claude Code，現在Google有 Gemini Spark 和 Antigravity 2.0。三巨頭同步衝刺的方向一致——讓 AI 從"聊天"走向"幹活"。能否真正融入使用者的日常工作流，決定了誰能拿走下一個十億使用者。Google的優勢在於它有搜尋、Gmail、Drive、YouTube 這些全球最大的資訊入口——Agent 在這裡天然有活幹。

判斷二：2000 億美元 AI 基建投入，賭的是 Agent 經濟

1800-1900 億美元的年度資本支出——這個數字比很多國家的 GDP 還大。Google在賭什麼？賭的是 Agent 時代每個使用者消耗的算力將是聊天時代的幾十倍乃至上百倍。當 Spark 在後台 7×24 小時為你監控資訊、執行任務，每一次工具呼叫都在消耗 token。9 億月活如果全部變成 Agent 使用者，算力需求將是天文數字。

判斷三：Google的最大優勢是"全家桶"生態

OpenAI 和 Anthropic 的 Agent 需要一個個去對接第三方工具；但Google的 Agent 天生就活在全球最大的資訊生態裡——搜尋（月活 25 億）、Gmail（18 億使用者）、YouTube（20 億+）、Android（30 億裝置）。Spark 從 Drive 調檔案、從 Gmail 讀郵件、在 Sheets 裡建表格、通過搜尋獲取即時資訊——它不需要任何第三方接入，因為Google自己就是那個"全家桶"。這可能是 Agent 競賽中Google最不可複製的護城河。 (臥臥智研)