Google I/O 2026：單日3兆Token！Gemini Flash 3.5重塑開發平台Antigravity，智能體優先！世界模型Omni登場！Spark對標OpenClaw！

2026/05/20

•

“Welcome to the agentic Gemini era ！”

凌晨，期待已久的GoogleI/O大會終於開始了！

這次可以說是量大管飽，有Gemini 3.5 Flash，Gemini Omni，Agent 還有各種有趣的小功能！

前段時間，GPT5.5，Claude Opus 4.7等各家模型相繼公佈，ChatGPT的image2 也直接擠掉 Nano Banana，掀起了一波 AI 繪畫浪潮。

在這一波節奏中，Google卻非常安靜。

在X上有訂閱Google產品的網友直接表示：“最好堅持按月付款。”

還有網友評論“我覺得Google在憋大招”；“偷偷努力，然後驚豔所有人”。

顯然，這次大會量大是肯定的，但到底是“真材實料”，還是“看著很香”？

我們一起拆一下。

Gemini Omni：對話就能改視訊，自拍秒變特效大片

昨天，Google CEO Sundar Pichai就在X上發佈了一個含他和Demis Hassabis可能用Gemini Omni進行風格編輯的圖像轉視訊，引起了大家猜想。

今天，Demis在Google I/O 2026上現身揭曉，去年他曾概述了擴展Gemini多模態能力使其成為世界模型的願景，現在他們正式推出Gemini Omni！

Demis說Gemini的世界知識和推理能力可以在 Omni 中真正大放異彩。

Omni 能將複雜的想法轉化為高度精準的視訊，如輸入Prompt“製作一個關於蛋白質折疊的定格動畫解釋視訊”，就會得到這樣的效果：

它可以用對話式語言來編輯視訊，而且有意思的是，可以提供自己拍的視訊，如Demis的自拍，可以調節細節、風格和加入元素，一句話定製視訊特效。

Demis 講到未來“Omni 將能夠從任何輸入中生成任何輸出”。今天 Omni 家族的第一款模型 Gemini Omni Flash 正式推出，很快 Omni Pro 也會出來。

Gemini 3.5 Flash：快是真的，貴也是真的

從3.1直接躍升到3.5，這次的 Gemini 3.5 Flash 到底有什麼實力？

基準測試就像模型身份證一樣，根據官方部落格描述：Gemini 3.5 Flash 是我們迄今為止最強大的 Agent 與程式碼模型，在 Terminal-Bench 2.1 (76.2%)、GDPval-AA (1656 Elo) 以及 MCP Atlas (83.6%) 等極具挑戰性的程式碼和 Agent 基準測試中，其表現甚至超越了 Gemini 3.1 Pro；

此外，它在多模態理解方面也處於領先地位（在 CharXiv 推理測試中達到 84.2%）。而在輸出每秒 Token 數這一指標上，它的速度是其他前沿模型的 4 倍。

既然是 Flash 版本，輸出速度也一定很快：

單看基準測試那確實是夯爆了，實際表現怎麼樣？

在油管上，已經有大神率先測試了：

“3.5 Flash 確實不錯，而且還只是 Flash 版本，非常期待 3.5 pro ”

“3.5 Flash 的輸出效果和3.1 pro 有很多相似之處，但是顯然更加依賴 token”

3.5 Flash 的輸出效果和3.1 pro有很多相似之處，但是顯然更加依賴 token”

官方也放出來一些測試表現，

用3.5Flash 製作城市景觀：

為論文製作動畫效果：

總的來說，實際測試可以給到一個頂尖！

但是，Gemini 也開始搞起限額了：

Antigravity：不到1000美元，12小時手搓作業系統！

他們將Gemni 3.5 Flash全新重塑了“智能體優先”開發平台：Antigravity。

這一平台每天處理的 Token 數量已經超過 3 兆個，已有數百萬人正在使用。

這次，他們推出了完整的 CLI（命令列介面）體驗：一個 Antigravity SDK，整合 Gemini 音訊模型的原生語音支援，還有與眾多介面和平台的整合，如 Android、Firebase 和 Google AI Studio，今天就可以體驗。

而其核心是Antigravity 2.0 ，一款全新的獨立桌面應用程式，真正體現了“智能體優先”，專注於核心智能體對話、智能體生成的產物（Artifacts）以及多智能體編排（Multi-agent orchestration）。

Gemini 3.5 Flash 已經與 Antigravity Harness 進行了協同最佳化，Google 內部團隊一直在使用它。

利用全新的 Antigravity 和 Gemini 3.5 Flash，他們讓智能體從零開始建構了一個可運行的作業系統。

Antigravity 在 12 個小時內，用 93 個平行工作的子智能體進行了超過 15000 次模型請求，並處理了 26 億個 Token，成功完成了這一任務。

而建構一整個功能完善的作業系統，消耗的 API 額度還不到 1000 美元。

真的強的有點誇張啊。

現在Antigravity 2.0 已向全球所有人開放。

Google 搜尋，要搶走電商的飯碗？

Sundar 提到的，去年在同一個舞台上推出的Google搜尋 AI Mode 的月活躍使用者數已經突破了 10 億大關。

在這一塊，一開始介紹的Google徹底成為一款AI搜尋啦；可以跨模態提問，支援文字、圖像、檔案和視訊；在搜尋中引入了一批Agent，其中資訊智能體可以在後台全天候 24 小時工作；都沒什麼驚喜，AI公司都已經做到了。

不過，他們提出的購物方式變革——“智能體商業”（Agentic Commerce），這倒是非常特別。

人們每天在 Google 上的購物次數竟然超過 10 億次，他們的Shopping Graph（購物圖譜）擁有超過 600 億個商品列表，而且在不斷更新。

對於Agentic Commerce，他們專注於交付三個基石：通用商業協議（Universal Commerce Protocol，UCP）、智能體支付協議（agent payments protocol，AP2）和通用購物車（Universal Cart）。

UCP 之於智能體商業，就像 HTTP 之於網際網路一樣。它是一個開源標準，從商品研究到結帳、再到物流追蹤的一切環節，允許所有核心參與者在整個購物流程中協同工作。

最近亞馬遜（Amazon）、Meta、微軟（Microsoft）、Salesforce 和 Stripe 都加入了這個協議。

他們正在將 UCP 引入更多的垂直領域，比如酒店、本地外賣提供商，以及 YouTube 和更多的產品中，還正在將由 UCP 驅動的體驗擴展到更多地區，比如加拿大、澳大利亞和英國。

在涉及到智能體支付時，他們聽到最多的第一大問題就是：“我怎麼知道它不會自己跑去買一些我根本不想要的東西？” 所以建立了AP2。

他們把這個協議歸結為兩部分：設定界限和確保問責制。AP2會為使用者提供永久的數字憑證追蹤，在使用者、商家和支付處理方之間建立起一條透明且可驗證的連結。

最後的通用購物車，這個真有點搶各大電商的飯碗，它能跨商家、跨服務工作，這意味著能夠在瀏覽搜尋、與 Gemini 聊天、觀看 YouTube 甚至閱讀 Gmail 的同時，將商品加入到同一個購物車中。

而且在加入的瞬間，購物車會自動幫你比價，尋找優惠和降價，並提醒你想買的東西補貨了。它還可以幫你想購物的替代方案，比如你選的電腦的處理器需要一個具有不同插槽類型的主機板，它幫你糾錯和推薦替換品。還可以根據不同情況使用你帶有不同權益的銀行卡，發掘隱藏優惠。

哇，這真的蠻實用的。

而這個通用購物車的推出是在今年夏天，Google搜尋和Gemini應用中會推出，YouTube 和 Gmail 隨後也將支援。

前台動嘴，後台監工：

Docs Live 與 Android Halo 的“神仙聯動”

這次I/O 大會，真的是量大管飽：還有兩個小編非常感興趣的功能—— Docs live、Android Halo

Docs live

針對 Google Docs 推出的全新 Gemini AI 驅動功能，語音驅動的即時文件建立與編輯，讓你可以“邊說邊生成”完整文件，幾乎無需打字。

Google 直接進行了對話：

“我剛剛突然想起來，明天我要回高中參加職業日活動，做一個校友分享演講。我需要準備一些內容，向學生們解釋我作為一名軟體工程師平時到底是做什麼的，但我現在完全不知道該從那裡開始。

哦，對了，你能直接從 Google Drive 裡把我的簡歷調出來嗎？不過……那可能會有點無聊。也許你可以幫我想一些有趣的類比，讓整個分享對學生來說更生動、更有意思一點？還有，我記得學校之前給我發過一封郵件，主題好像叫什麼‘職業日活動安排’之類的。你能不能直接把裡面的重要資訊提取出來，放到文件最上面？這樣我就知道明天幾點到、去那裡。然後根據這些要求，直接幫我生成一份演講草稿吧。

這個效果挺酷的，不過內容稍微有點太密了。能不能把那些類比整理成表格？這樣我瀏覽起來會更方便。

另外，再幫我加一條備註：‘講一下哥哥是如何激勵我成為軟體工程師的故事。’把它放在文件頂部，而且加粗顯示，這樣我就不會忘記講了。”

最後的效果呈現相當不錯：

Android Halo

怎麼知道Agent在後台做什麼？

Google 推出了Android Halo，與 Gemini Spark 深度繫結，可以在螢幕頂部即時顯示 AI Agent 的活動。

不過官方並沒有給出太多細節，預計將於今年晚些時候上線。

Gemini Spark：24小時不掛機的“數字打工人”

既然提到了Android Halo，Gemini Spark 也必須跟上！

Gemini Spark 是一個全天運行的 AI Agent ，不再侷限於“你問它答”的助手，而是可以在後台持續工作的執行型 Agent。

在大會上，還直接進行了展示：“工程師描述出他想要完成的幾個任務，然後 Gemini Spark 就會在後台自動運行。”

從演示裡，我們也能看到的 Gemini Spark 幾個優勢：

24小時持續常駐：與需要本地硬體支援的開源 Agent 項目（如近期熱門的 OpenClaw）不同，Spark 完全運行在Google雲端。這意味你合上筆記本後，它依然在後台幫你跑任務。

Google生態打通：它原生嵌入了 Gmail、Google Docs、Drive 和 Sheets。它可以幫你即時監控郵件裡的項目動態、把散落在各處的會議聊天記錄自動整理成一份 Google 文件，並自動寫好回覆草稿。

主動觸發與自動化：你可以給它設定長期策略。比如讓它每個月自動去帳單裡篩選信用卡消費，主動幫你揪出那些“隱形”的自動續費和異常扣款。

第三方生態擴展： Google首發就推出了基於 MCP（Model Context Protocol）的連接器，直接打通了 Canva、OpenTable 和 Instacart。企業使用者還可以將其接入 Microsoft SharePoint、OneDrive 和 ServiceNow。

當然面對安全問題，Gemini Spark會進行高風險操作的二次確認。

並且下周將正式向美國地區的 Google AI Ultra 訂閱使用者推送公開測試版。

寫在最後

可以看出，Agentic Gemini 時代正式開啟，2026 年 Google 也重點轉向了“Agents 幫我們行動”（agents that help us act）。他們推出的 Gemini Omni、 Gemini 3.5和各類工具，都是讓 AI 成為人們的全方位助手，主動、自主完成複雜工作流，跨越搜尋、購物、生產力、創作和日常生活的邊界。 (51CTO技術堆疊)

科技