Google I/O 2026:全面進入智能體時代,AI不再只是聊天,而是替你幹活

台北時間 5 月 20 日凌晨,Google I/O 2026 在加州山景城開幕。這不是一場常規更新——Google宣佈全面進入"智能體 Gemini 時代"。核心發佈:Gemini 3.5 Flash(速度 4 倍於同類)、全模態世界模型 Gemini Omni、7×24 背景執行的個人 AI 助手 Gemini Spark、搜尋框 25 年來最大改造、智能體程式設計平台 Antigravity 2.0、Android XR 智能眼鏡。Gemini 月活 9 億、搜尋 AI 概覽月活 25 億、每月處理 3200 兆 token(同比 7 倍增長)。今年 AI 基礎設施支出預計 1800-1900 億美元。Google正把 AI 智能體"塞進"搜尋、瀏覽器、手機和眼鏡的每一個入口。

如果用一句話概括今年的 Google I/O,那就是:

AI 不再只是回答問題,而是替你幹活。

兩小時的演講裡,Google管理層輪番出場,一次性發佈了數十個產品更新。但所有發佈都指向一個核心主題——Agentic Gemini 時代:AI 從對話助手進化為持續運行、跨應用執行任務的智能體。

從搜尋框到 Chrome 瀏覽器,從 Android 手機到智能眼鏡——Gemini 正在被"塞進"Google生態的每一個入口。這不是功能疊加,而是一次系統性轉向

一、Gemini 生態爆發:月活 9 億,Token 處理量 7 倍增長

CEO 皮查伊在開場演講中先亮了一組資料:

Google AI 生態核心資料

  • Gemini App 月活:9 億(一年前 4 億,翻倍)
  • 搜尋 AI 概覽(AI Overviews)月活:25 億
  • AI Mode 月活:超10 億
  • 每月 Token 處理量:3200 兆個(同比增長 7 倍)
  • 13 款產品各擁有超 10 億使用者,5 款超 30 億
  • 2026 年 AI 基礎設施支出:1800-1900 億美元

兩年前Google每月處理 9.7 兆 token,去年 480 兆,今年 3200 兆——這條增長曲線的陡峭程度,足以解釋為什麼Google今年要投入近 2000 億美元建基礎設施。

二、兩大核心模型:Gemini 3.5 Flash + Gemini Omni

本次大會最核心的模型發佈有兩個:

1. Gemini 3.5 Flash——為 Agent 而生

  • Token 輸出速度:同類前沿模型的4 倍
  • 價格:不到同類模型的一半
  • 定位:專為智能體任務、更長工作流和程式設計設計
  • 基準表現:在程式設計和 GDPVal 等真實經濟任務評測中全面超越 Gemini 3.1 Pro
  • 今日起面向全球數十億使用者開放
  • 更強的 Gemini 3.5 Pro 將於 6 月上線

2. Gemini Omni——全模態世界模型

  • 由 DeepMind CEO Demis Hassabis 親自發佈
  • 支援文字、圖像、音訊、視訊等所有模態的輸入和輸出
  • 支援對話式視訊編輯(自然語言修改角色、背景、場景)
  • 可上傳自拍轉換為其他風格或內容
  • 首款模型 Gemini Omni Flash 今夏推出
  • 所有生成內容嵌入 SynthID 數字水印

值得注意的是,Gemini 3.5 Flash 雖然更快更便宜,但其運行成本相比上一代上升了約 5 倍——因為 Agent 任務本身就需要更多計算量。有機構評論稱"性價比可能沒那麼美好",這也是Google當日股價下跌 2.34% 的原因之一。

三、Gemini Spark:關上電腦它也在工作的 AI 助手

這可能是本次大會最具顛覆性的產品——Gemini Spark,一個 7×24 全天候運行的個人 AI 智能體。

Gemini Spark 核心特性

  • 運行在 Google Cloud 專屬虛擬機器上(不依賴本地裝置)
  • 即便合上筆記型電腦,Spark 也在繼續工作
  • 可跨 Gmail、Google Drive、Sheets、Slides 等服務執行任務
  • 支援手機端運行
  • 未來將與第三方工具整合
  • 本周面向受信任測試人員推出
  • 下周面向美國 Google AI Ultra 訂閱使用者開放
  • 今夏將在 Chrome 瀏覽器中運行

定位:直接對標 Anthropic 的 Claude Code / OpenAI 的 Codex
定價:AI Ultra 套餐 200 美元/月(從 250 降價),AI Pro 維持 20 美元/月

現場演示中,Spark 幫使用者策劃了一場街區派對:自動彙總所有郵件回覆、追蹤每位參與者攜帶的物品、向未回覆的鄰居傳送跟進郵件、在 Google Sheets 中建立即時追蹤器,還生成了一份包含充氣城堡和社區規則的 Google Slides 宣傳冊——所有資訊從 Drive 和 Gmail 中自動抓取。

這就是 Agent 與傳統 AI 助手的本質區別:它不是等你提問才回答,而是持續在後台監控、規劃和執行

四、搜尋 25 年最大改造 + 智能體進入搜尋

Google對搜尋做了誕生 25 年以來的最大改造

搜尋的三大變革

1. 新搜尋框

  • AI 生成的搜尋建議(不僅是自動補全)
  • 支援多模態搜尋(上傳照片和視訊)

2. 資訊智能體進入搜尋

  • 全天候背景執行,追蹤極其複雜的問題
  • 持續監控網路,資訊變化時自動更新結果
  • 使用者無需反覆手動搜尋
  • 今年夏季推出

3. AI Mode 生成"迷你應用"

  • 搜尋可直接在介面中生成可互動畫面
  • 例:搜尋"周末活動"可從零生成一個活動計畫表
  • 接入 Antigravity 編碼能力

Google還發佈了Universal Cart(通用購物車)——一個 AI 智能體驅動的跨平台購物系統,可在搜尋、Gemini、YouTube、Gmail 中統一使用,能追蹤優惠、監控價格變動、識別相容性問題(比如組裝電腦時提示部件不相容)。這意味著Google正在用 Agent 重構整個電商體驗。

五、開發者平台 + 硬體:Antigravity 2.0 與智能眼鏡

Antigravity 2.0——Google對標 Claude Code 和 OpenAI Codex 的智能體程式設計平台:

  • "毫不掩飾地以智能體為先"
  • 用不到 1000 美元 Token 成本從零建構了一個作業系統
  • 全新 CLI 工具,支援子代理編排複雜工作流
  • 內建沙箱隔離、憑證掩碼、Git 策略保護
  • Google AI Studio 支援一鍵部署到 Cloud Run

Android XR 智能眼鏡——Google攜手三星、Gentle Monster、Warby Parker:

  • 兩種形態:語音眼鏡 + 顯示眼鏡
  • 內建 Gemini 智能助手
  • 今年秋季上市,可與 iOS 和 Android 配對
  • 現場演示:戴著眼鏡點咖啡——Gemini 導航到咖啡館、打開 DoorDash、準備好常點的訂單,手機全程放口袋

此外,Google還發佈了最新一代TPU 8(分為訓練版和推理版),以及Android Halo——手機上 AI 智能體運行狀態的可視化入口。

結語:三個判斷

判斷一:AI 競爭已進入"Agent 落地"階段

OpenAI 有 Codex,Anthropic 有 Claude Code,現在Google有 Gemini Spark 和 Antigravity 2.0。三巨頭同步衝刺的方向一致——讓 AI 從"聊天"走向"幹活"。能否真正融入使用者的日常工作流,決定了誰能拿走下一個十億使用者。Google的優勢在於它有搜尋、Gmail、Drive、YouTube 這些全球最大的資訊入口——Agent 在這裡天然有活幹。

判斷二:2000 億美元 AI 基建投入,賭的是 Agent 經濟

1800-1900 億美元的年度資本支出——這個數字比很多國家的 GDP 還大。Google在賭什麼?賭的是 Agent 時代每個使用者消耗的算力將是聊天時代的幾十倍乃至上百倍。當 Spark 在後台 7×24 小時為你監控資訊、執行任務,每一次工具呼叫都在消耗 token。9 億月活如果全部變成 Agent 使用者,算力需求將是天文數字。

判斷三:Google的最大優勢是"全家桶"生態

OpenAI 和 Anthropic 的 Agent 需要一個個去對接第三方工具;但Google的 Agent 天生就活在全球最大的資訊生態裡——搜尋(月活 25 億)、Gmail(18 億使用者)、YouTube(20 億+)、Android(30 億裝置)。Spark 從 Drive 調檔案、從 Gmail 讀郵件、在 Sheets 裡建表格、通過搜尋獲取即時資訊——它不需要任何第三方接入,因為Google自己就是那個"全家桶"。這可能是 Agent 競賽中Google最不可複製的護城河。 (臥臥智研)