GoogleI/O大會前瞻：Gemini 4.0未必封神，真正大招是生態

2026/05/17

•

這次，Google必須證明自己還在牌桌上。

台北時間5月20日凌晨，一年一度的GoogleI/O大會即將開幕。過去，大家看I/O，是等Android新功能、Pixel新硬體，順便看幾個炫技Demo。今年不一樣。外界真正想看的只有一件事：去年Gemini 3剛讓Google扳回一局，這幾個月OpenAI、Anthropic又連續加速，Google還能不能守住第一梯隊。

幾天前的Android Show已經放出訊號：Android17、Gemini Intelligence、AI筆記本，都只是預熱。真正的主菜，藏在I/O主題演講裡。

Gemini 4.0會不會亮相？傳聞中的Omni能不能把視訊、語音、對話和創作打通？Aluminium OS會不會讓Google重新殺回PC？Android XR眼鏡能不能成為下一個入口？

這些問題背後，真正要看的不是單個產品有多強，而是Google能不能把這些散牌，打成一套完整的反擊。

核心大腦：

Gemini 4.0與"Omni"，

對標GPT-5.5的全能形態

今年I/O大會的第一大懸念，是Gemini能否真正抹平與OpenAI的代差。

目前洩露的資訊涉及多個版本號，但真正值得關注的只有兩個：Gemini 4.0和Gemini Omni。前者是Google2026年的旗艦底座，目標是在邏輯推理能力上實現跨越式提升，全方位對標GPT-5.5；後者是基於4.0架構的原生多模態版本，核心在於"Omni(全能)"，意味著它不再需要外掛視訊或音訊工具，自己就能直接生成和處理多維資訊。

網紅科技博主Chubby也援引公開報導稱，Google正準備在I/O大會上發佈一款新的Gemini模型，將其定位為接近OpenAI最近的GPT-5.5，而不是更加難以企及的Anthropic Mythos。

而社交媒體上近期熱議的"Gemini Omni"模型，據傳將是本次大會的"One More Thing"。

根據Chrome Unboxed和9to5Google的聯合爆料，部分內測使用者已經提前看到了名為"Omni"的模型選項。與之前的Veo不同，Omni不僅涵蓋了Veo的視訊生成能力，還增加了"視訊重混"和"原生對話剪輯"等新功能。

有使用者在社交媒體上"哀嚎"，稱使用Omni模型生成一段短影片就消耗了其AI Pro計畫86%的每日額度。這種超高的算力消耗，側面反映了視訊生成任務的計算密集度，也暗示該模型的能力可能遠超此前的版本。

系統革命：

Aluminium OS，

不只是Android，

是PC的重生

如果說AI是大腦，那麼各路媒體和社區相傳的Aluminium OS就是Google為這顆大腦打造的全新"身體"。

在Reddit上，一段長達16分鐘的Aluminium OS上手視訊被瘋狂轉發。視訊顯示，這套系統徹底打破了ChromeOS的侷限：

· 互動邏輯： 底部擁有類似macOS或Windows的App Dock欄。

· 核心功能： 完整的桌面版Chrome瀏覽器體驗，原生運行AndroidApp，加上強大的虛擬桌面切換。

· 殺手鐧： 一個名為"Link to iOS"的內建應用。

這暴露了Google的野心。它不僅想統一自己的生態，還想通過AI電腦這個切入口，去撬蘋果iPhone使用者的牆角。

正如GoogleAndroid生態系統總裁薩米爾·薩馬特(Sameer Samat)此前確認的，Aluminium OS將搭載在名為"Googlebook"的新一代筆記本上。這不同於以往的Chromebook，而是由宏碁、華碩、聯想、戴爾、惠普等巨頭代工的高端AI PC，目標是正面對壘蘋果MacBook和微軟Surface Pro。

硬體"金珠"：

Android XR眼鏡的

量產前夜

去年的I/O大會上，AR眼鏡還只是PPT上的概念。今年，它已經有了清晰的量產路徑。

Mashable的最新深度報導梳理了GoogleXR硬體的真實面貌：

· AI智能眼鏡： 根據Android Headlines的爆料，目前代號"Jinju(金珠)"，定價區間預計在379美元至499美元之間，類似Meta與Ray-Ban的聯名款。無螢幕，主打Gemini Live語音互動。當你走在街上問"我面前這棟樓的歷史"，它會通過內建攝影機即時作答。

· AR增強現實眼鏡： 相比AI智能眼鏡還帶有顯示鏡片，但發佈時間未定。

379美元至499美元這個價格區間極具競爭力，意味著Google希望通過低門檻讓AR裝置成為普通人的日常配件。

在合作廠商方面，除了三星之外，Google這次還拉攏了XREAL等AR眼鏡領域的領先廠商。多位開發者在X上爆料，Google已經準備好了完整的Android XR SDK(開發者工具包)。I/O大會將是這些開發者正式獲准"上場"的時間點。

從"對話"到"代勞"：

智能體與生態版圖的

最後拼圖

如果說Gemini 4.0是大腦，Aluminium OS是骨架，那麼本次I/O上有望亮相的其餘武器，決定的是Google能不能真正切進使用者的日常。

· 搜尋的"核武選項"：默認AI Mode的豪賭

最可能引發行業震動的，是搜尋入口的徹底重構。Google準備正式將"AI Mode"設為默認搜尋選項。

搜尋不再是提供網頁跳轉，而是直接交付結果。當你搜尋"策劃低碳婚禮"時，Gemini 4.0會直接生成完整的方案預算，而不是讓你點選不同的婚慶網站。

為解決"幻覺"痛點，新搜尋將引入即時校驗技術。AI在生成答案的同時，後台會同步啟動數個微型搜尋任務進行交叉驗證，並即時標註信源權重與"信心指數"。

備受好評的NotebookLM也有望與Gemini深度整合。使用者可以將私有文件、科研報告作為"事實來源"喂給AI，確保生成的每一句話都"有據可查"，從而解決企業級使用者對AI精準性的焦慮。

· 智能體(Agentic AI)：從"聊天"轉向"執行"

在本次大會的預期清單中，"Agentic AI"是最吸睛的關鍵詞。與以往只會"紙上談兵"的對話機器人不同，Google正計畫讓Gemini具備自主執行能力。

5月14日，社交媒體X上得爆料帳號 @testingcatalog披露了更為詳盡的細節：這款名為 "Gemini Spark" 的全新智能體即將亮相。它被定位為一個24/7全天候線上的私人助理，其核心邏輯在於“理解”與“接管”。爆料顯示，Gemini Spark不僅能學習使用者的行為習慣，還會深度呼叫已連接的應用（Apps）、歷史對話、地理位置以及使用者已登錄的網站資訊，從而建構起極具個人化的“數字大腦”。

為了實現最高效的任務處理，Gemini Spark甚至會保存遠端瀏覽器資料（如登錄憑據和遠端程式碼執行資料），這意味著它可以在極少人工干預下，自主控制電腦或手機完成複雜任務。比如，它能直接從網頁提取資料、填充表格並自動傳送郵件，而無需使用者反覆授權登錄。

結合名為 "Magic Pointer" 的螢幕感知技術，AI 不再只是搜尋框裡的字元，它能“看到”你螢幕上的內容（比如社交媒體上的旅行目的地），並直接利用Gemini Spark 獲取的個人情報與登錄狀態，在後台靜默完成機票比價、酒店預訂並同步至日曆。

當然，針對如此深度的隱私介入，爆料也提到Google在設定中預留了開關，使用者可以隨時清理遠端瀏覽器資料或關閉個人智能功能，以在便利與安全之間尋找平衡。

· Android 17：低調測試背後的"多工"野心

雖然"Android Show"已經預熱過，但I/O主會場才是Android 17真正亮殺招的舞台。測試版看似波瀾不驚，但核心互動邏輯正在發生質變。

據稱，借鑑了折疊屏經驗的"氣泡"窗口(App Bubbles)互動模式將全面下放，允許任何應用以懸浮窗形式存在。這不僅是針對大屏裝置的最佳化，更是為了在Aluminium OS時代實現手機與PC體驗的無縫融合。

此外，在經歷了兩年的激進擴張後，Android 17將回歸底層，重點修復AI整合後的功耗與隱私漏洞，為即將到來的Pixel系列提供最穩固的底座。

· 創作工具與"未來投影"：Veo、Lyria與Project Beam

視訊生成工具Veo和音樂創作工具Lyria預計將推出更具商業落地價值的Pro版本，對標行業最頂尖的生成式標準。充滿科幻感的3D視訊通話技術Project Beam也有望展示最新進展，利用多攝像頭陣列讓遠端通話對象像真實的3D模型一樣出現在你面前，配合Android XR眼鏡使用，直接打破了螢幕的物理邊界。

社交媒體反應：

是"全能代理"的黎明，

還是"追趕者"的最後掙扎？

在社交媒體和開發者社區，圍繞這屆I/O的討論已經極度兩極分化。

看好的一方，賭的是生態整合。

科技媒體Mashable援引創作者Renato在X上的推文指出，Omni模型的出現意味著我們終於要打破"對話方塊"的束縛。如果Gemini 3.5/4.0能夠原生輸出視訊並嵌入工作流，創作者將不再需要在不同的AI工具間反覆切換，這種"多模態畫布"的體驗將直接改變內容生產的邏輯。

知名科技評論員邁克爾·斯坦(Michael Stan)則認為，相比模型跑分，"Teamfood"(內部測試代號)長效記憶功能才是真正的殺手鐧。目前AI工具最讓人沮喪的就是每次開啟新對話都要重新解釋背景，如果Google能實現跨Session的持久記憶，Gemini才會真正從"聊天機器人"變成"數字助理"。

看衰的一方，質疑的是執行力。

開發者Jasper的評論獲得了大量點贊，他直言Google正全面落後：視訊輸給Seedance，圖像輸給GPT image v2，聊天和程式設計輸給了所有人，語音輸給GPT realtime 2，音樂輸給Suno。這屆I/O必須拿出有統治力的產品。

針對"Gemini 4.0性能約等於GPT-5.5"的爆料，評論員Kushagra Tiwari諷刺道："Google將目標對準GPT-5.5而不是Mythos，這說明了現在的真實基準線到底在那裡。他們甚至都不再假裝去追趕Anthropic了，只是在努力讓自己在低一檔的梯隊中保持存在感。"

Reddit上也有資深使用者反映，近期Gemini和Google Flow的穩定性極差，甚至到了"幾乎無法使用"的地步。雖然他樂觀地認為這是在為大版本更新鋪路，但更多使用者在跟帖中表達了因3.1版本Bug頻發而感到心灰意冷，甚至已經開始考慮重回GPT或Anthropic。

還有一些聲音在討論更底層的問題。

有開發者在X上提出：即便Gemini 4.0追平了GPT-5.5，但在成本和效率上，它能否抵擋住中國開源大模型的衝擊？如果閉源模型的溢價無法轉化成絕對的生產力優勢，Google的商業閉環將面臨嚴峻挑戰。

也有評論調侃Google一直在"廚房裡備菜"，但如果5月19日端出來的菜還是"半成品"，那麼正如Stephen Day所言："Google可能需要把整個廚房的員工都換了。"

這種輿論氛圍，本質上是一種"恨鐵不成鋼"的期待。大家依然相信Google擁有全球最強的算力和最深的技術積澱，但耐心正在被一次次"Demo驚豔、實測平平"所磨滅。今年的I/O，不只是展示技術的秀場，更是Google奪回社區信任的關鍵一仗。

總結：

這不只是一場科技盛會，

更是Google的保衛戰

站在2026年的時間節點上，Google面臨的對手前所未有地強大：OpenAI虎視眈眈，Meta在XR硬體端先聲奪人，蘋果正在深度重構全線產品的AI體驗。

經過前面五章的梳理，有幾個判斷可以先給出來。

在這手牌裡，最有勝算的可能是搜尋。AI Mode設為默認這步棋，本質上是Google在用自己最大的護城河(搜尋入口和流量)去喂AI。別家需要費力獲客，Google只需要把現有使用者的搜尋體驗換一層皮。如果即時校驗技術和NotebookLM整合能做到位，這張牌打出來的效果可能比Gemini模型本身更重要。

最大的不確定性在Aluminium OS。一個全新的作業系統要說服使用者放棄macOS或Windows，光靠"能跑AndroidApp"遠遠不夠。ChromeOS的教訓還在眼前。Google需要在I/O上拿出至少一個讓人無法在其他平台複製的使用場景，否則Googlebook大機率會重蹈Chromebook高開低走的老路。

而XR眼鏡和Omni模型，更像是Google在押注下一個周期。379美元的定價說明Google想走量，但沒有螢幕的AI眼鏡能不能撐起日常使用，取決於Gemini Live的語音互動到底有多可靠。如果只是一個戴在臉上的語音助手，消費者不會買單。

歸根結底，Google這次要證明的不是某個單品有多強，而是這些散在各處的能力，從模型到系統到硬體到搜尋，能不能拼成一套連貫的體驗。如果I/O結束後，外界的反應還是"每個Demo都很炫，但實際用起來還是老樣子"，那這場保衛戰就算輸了。

5月20日凌晨，答案馬上揭曉。 (網易科技)