Google I/O 2026:單日3兆Token!Gemini Flash 3.5重塑開發平台Antigravity,智能體優先!世界模型Omni登場!Spark對標OpenClaw!

“Welcome to the agentic Gemini era !”

凌晨,期待已久的GoogleI/O大會終於開始了!

這次可以說是量大管飽,有Gemini 3.5 Flash,Gemini Omni,Agent 還有各種有趣的小功能!

前段時間,GPT5.5,Claude Opus 4.7等各家模型相繼公佈,ChatGPT的image2 也直接擠掉 Nano Banana,掀起了一波 AI 繪畫浪潮。

在這一波節奏中,Google卻非常安靜。

在X上有訂閱Google產品的網友直接表示:“最好堅持按月付款。”

還有網友評論“我覺得Google在憋大招”;“偷偷努力,然後驚豔所有人”。

顯然,這次大會量大是肯定的,但到底是“真材實料”,還是“看著很香”?

我們一起拆一下。

Gemini Omni:對話就能改視訊,自拍秒變特效大片

昨天,Google CEO Sundar Pichai就在X上發佈了一個含他和Demis Hassabis可能用Gemini Omni進行風格編輯的圖像轉視訊,引起了大家猜想。


今天,Demis在Google I/O 2026上現身揭曉,去年他曾概述了擴展Gemini多模態能力使其成為世界模型的願景,現在他們正式推出Gemini Omni!

Demis說Gemini的世界知識和推理能力可以在 Omni 中真正大放異彩。

Omni 能將複雜的想法轉化為高度精準的視訊,如輸入Prompt“製作一個關於蛋白質折疊的定格動畫解釋視訊”,就會得到這樣的效果:


它可以用對話式語言來編輯視訊,而且有意思的是,可以提供自己拍的視訊,如Demis的自拍,可以調節細節、風格和加入元素,一句話定製視訊特效。


Demis 講到未來“Omni 將能夠從任何輸入中生成任何輸出”。今天 Omni 家族的第一款模型 Gemini Omni Flash 正式推出,很快 Omni Pro 也會出來。

Gemini 3.5 Flash:快是真的,貴也是真的

從3.1直接躍升到3.5,這次的 Gemini 3.5 Flash 到底有什麼實力?

基準測試就像模型身份證一樣,根據官方部落格描述:Gemini 3.5 Flash 是我們迄今為止最強大的 Agent 與程式碼模型,在 Terminal-Bench 2.1 (76.2%)、GDPval-AA (1656 Elo) 以及 MCP Atlas (83.6%) 等極具挑戰性的程式碼和 Agent 基準測試中,其表現甚至超越了 Gemini 3.1 Pro;

此外,它在多模態理解方面也處於領先地位(在 CharXiv 推理測試中達到 84.2%)。而在輸出每秒 Token 數這一指標上,它的速度是其他前沿模型的 4 倍。

既然是 Flash 版本,輸出速度也一定很快:

單看基準測試那確實是夯爆了,實際表現怎麼樣?

在油管上,已經有大神率先測試了:

“3.5 Flash 確實不錯,而且還只是 Flash 版本,非常期待 3.5 pro ”

“3.5 Flash 的輸出效果和3.1 pro 有很多相似之處,但是顯然更加依賴 token”

3.5 Flash 的輸出效果和3.1 pro有很多相似之處,但是顯然更加依賴 token”

官方也放出來一些測試表現,

用3.5Flash 製作城市景觀:


為論文製作動畫效果:

總的來說,實際測試可以給到一個頂尖!

但是,Gemini 也開始搞起限額了:

Antigravity:不到1000美元,12小時手搓作業系統!

他們將Gemni 3.5 Flash全新重塑了“智能體優先”開發平台:Antigravity。

這一平台每天處理的 Token 數量已經超過 3 兆個,已有數百萬人正在使用。

這次,他們推出了完整的 CLI(命令列介面)體驗:一個 Antigravity SDK,整合 Gemini 音訊模型的原生語音支援,還有與眾多介面和平台的整合,如 Android、Firebase 和 Google AI Studio,今天就可以體驗。

而其核心是Antigravity 2.0 ,一款全新的獨立桌面應用程式,真正體現了“智能體優先”,專注於核心智能體對話、智能體生成的產物(Artifacts)以及多智能體編排(Multi-agent orchestration)。

Gemini 3.5 Flash 已經與 Antigravity Harness 進行了協同最佳化,Google 內部團隊一直在使用它。

利用全新的 Antigravity 和 Gemini 3.5 Flash,他們讓智能體從零開始建構了一個可運行的作業系統。

Antigravity 在 12 個小時內,用 93 個平行工作的子智能體進行了超過 15000 次模型請求,並處理了 26 億個 Token,成功完成了這一任務。

而建構一整個功能完善的作業系統,消耗的 API 額度還不到 1000 美元。

真的強的有點誇張啊。

現在Antigravity 2.0 已向全球所有人開放。

Google 搜尋,要搶走電商的飯碗?

Sundar 提到的,去年在同一個舞台上推出的Google搜尋 AI Mode 的月活躍使用者數已經突破了 10 億大關。

在這一塊,一開始介紹的Google徹底成為一款AI搜尋啦;可以跨模態提問,支援文字、圖像、檔案和視訊;在搜尋中引入了一批Agent,其中資訊智能體可以在後台全天候 24 小時工作;都沒什麼驚喜,AI公司都已經做到了。

不過,他們提出的購物方式變革——“智能體商業”(Agentic Commerce),這倒是非常特別。

人們每天在 Google 上的購物次數竟然超過 10 億次,他們的Shopping Graph(購物圖譜)擁有超過 600 億個商品列表,而且在不斷更新。

對於Agentic Commerce,他們專注於交付三個基石:通用商業協議(Universal Commerce Protocol,UCP)、智能體支付協議(agent payments protocol,AP2)和通用購物車(Universal Cart)。

UCP 之於智能體商業,就像 HTTP 之於網際網路一樣。它是一個開源標準,從商品研究到結帳、再到物流追蹤的一切環節,允許所有核心參與者在整個購物流程中協同工作。

最近亞馬遜(Amazon)、Meta、微軟(Microsoft)、Salesforce 和 Stripe 都加入了這個協議。

他們正在將 UCP 引入更多的垂直領域,比如酒店、本地外賣提供商,以及 YouTube 和更多的產品中,還正在將由 UCP 驅動的體驗擴展到更多地區,比如加拿大、澳大利亞和英國。

在涉及到智能體支付時,他們聽到最多的第一大問題就是:“我怎麼知道它不會自己跑去買一些我根本不想要的東西?” 所以建立了AP2。

他們把這個協議歸結為兩部分:設定界限和確保問責制。AP2會為使用者提供永久的數字憑證追蹤,在使用者、商家和支付處理方之間建立起一條透明且可驗證的連結。

最後的通用購物車,這個真有點搶各大電商的飯碗,它能跨商家、跨服務工作,這意味著能夠在瀏覽搜尋、與 Gemini 聊天、觀看 YouTube 甚至閱讀 Gmail 的同時,將商品加入到同一個購物車中。

而且在加入的瞬間,購物車會自動幫你比價,尋找優惠和降價,並提醒你想買的東西補貨了。它還可以幫你想購物的替代方案,比如你選的電腦的處理器需要一個具有不同插槽類型的主機板,它幫你糾錯和推薦替換品。還可以根據不同情況使用你帶有不同權益的銀行卡,發掘隱藏優惠。

哇,這真的蠻實用的。

而這個通用購物車的推出是在今年夏天,Google搜尋和Gemini應用中會推出,YouTube 和 Gmail 隨後也將支援。

前台動嘴,後台監工:

Docs Live 與 Android Halo 的“神仙聯動”

這次I/O 大會,真的是量大管飽:還有兩個小編非常感興趣的功能—— Docs live、Android Halo

Docs live

針對 Google Docs 推出的全新 Gemini AI 驅動功能,語音驅動的即時文件建立與編輯,讓你可以“邊說邊生成”完整文件,幾乎無需打字。

Google 直接進行了對話:

“我剛剛突然想起來,明天我要回高中參加職業日活動,做一個校友分享演講。我需要準備一些內容,向學生們解釋我作為一名軟體工程師平時到底是做什麼的,但我現在完全不知道該從那裡開始。

哦,對了,你能直接從 Google Drive 裡把我的簡歷調出來嗎?不過……那可能會有點無聊。也許你可以幫我想一些有趣的類比,讓整個分享對學生來說更生動、更有意思一點?還有,我記得學校之前給我發過一封郵件,主題好像叫什麼‘職業日活動安排’之類的。你能不能直接把裡面的重要資訊提取出來,放到文件最上面?這樣我就知道明天幾點到、去那裡。然後根據這些要求,直接幫我生成一份演講草稿吧。

這個效果挺酷的,不過內容稍微有點太密了。能不能把那些類比整理成表格?這樣我瀏覽起來會更方便。

另外,再幫我加一條備註:‘講一下哥哥是如何激勵我成為軟體工程師的故事。’把它放在文件頂部,而且加粗顯示,這樣我就不會忘記講了。”

最後的效果呈現相當不錯:

Android Halo

怎麼知道Agent在後台做什麼?

Google 推出了Android Halo,與 Gemini Spark 深度繫結,可以在螢幕頂部即時顯示 AI Agent 的活動。

不過官方並沒有給出太多細節,預計將於今年晚些時候上線。

Gemini Spark:24小時不掛機的“數字打工人”

既然提到了Android Halo,Gemini Spark 也必須跟上!

Gemini Spark 是一個全天運行的 AI Agent ,不再侷限於“你問它答”的助手,而是可以在後台持續工作的執行型 Agent。

在大會上,還直接進行了展示:“工程師描述出他想要完成的幾個任務,然後 Gemini Spark 就會在後台自動運行。”

從演示裡,我們也能看到的 Gemini Spark 幾個優勢:

24小時持續常駐:與需要本地硬體支援的開源 Agent 項目(如近期熱門的 OpenClaw)不同,Spark 完全運行在Google雲端。這意味你合上筆記本後,它依然在後台幫你跑任務。

Google生態打通:它原生嵌入了 Gmail、Google Docs、Drive 和 Sheets。它可以幫你即時監控郵件裡的項目動態、把散落在各處的會議聊天記錄自動整理成一份 Google 文件,並自動寫好回覆草稿。

主動觸發與自動化: 你可以給它設定長期策略。比如讓它每個月自動去帳單裡篩選信用卡消費,主動幫你揪出那些“隱形”的自動續費和異常扣款。

第三方生態擴展: Google首發就推出了基於 MCP(Model Context Protocol)的連接器,直接打通了 Canva、OpenTable 和 Instacart。企業使用者還可以將其接入 Microsoft SharePoint、OneDrive 和 ServiceNow。

當然面對安全問題,Gemini Spark會進行高風險操作的二次確認。

並且下周將正式向美國地區的 Google AI Ultra 訂閱使用者推送公開測試版。

寫在最後

可以看出,Agentic Gemini 時代正式開啟,2026 年 Google 也重點轉向了“Agents 幫我們行動”(agents that help us act)。他們推出的 Gemini Omni、 Gemini 3.5和各類工具,都是讓 AI 成為人們的全方位助手,主動、自主完成複雜工作流,跨越搜尋、購物、生產力、創作和日常生活的邊界。 (51CTO技術堆疊)