GoogleI/O大會前瞻:Gemini 4.0未必封神,真正大招是生態

這次,Google必須證明自己還在牌桌上。

台北時間5月20日凌晨,一年一度的GoogleI/O大會即將開幕。過去,大家看I/O,是等Android新功能、Pixel新硬體,順便看幾個炫技Demo。今年不一樣。外界真正想看的只有一件事:去年Gemini 3剛讓Google扳回一局,這幾個月OpenAI、Anthropic又連續加速,Google還能不能守住第一梯隊。

幾天前的Android Show已經放出訊號:Android17、Gemini Intelligence、AI筆記本,都只是預熱。真正的主菜,藏在I/O主題演講裡。

Gemini 4.0會不會亮相?傳聞中的Omni能不能把視訊、語音、對話和創作打通?Aluminium OS會不會讓Google重新殺回PC?Android XR眼鏡能不能成為下一個入口?

這些問題背後,真正要看的不是單個產品有多強,而是Google能不能把這些散牌,打成一套完整的反擊。

核心大腦:

Gemini 4.0與"Omni",

對標GPT-5.5的全能形態

今年I/O大會的第一大懸念,是Gemini能否真正抹平與OpenAI的代差。

目前洩露的資訊涉及多個版本號,但真正值得關注的只有兩個:Gemini 4.0和Gemini Omni。前者是Google2026年的旗艦底座,目標是在邏輯推理能力上實現跨越式提升,全方位對標GPT-5.5;後者是基於4.0架構的原生多模態版本,核心在於"Omni(全能)",意味著它不再需要外掛視訊或音訊工具,自己就能直接生成和處理多維資訊。

網紅科技博主Chubby也援引公開報導稱,Google正準備在I/O大會上發佈一款新的Gemini模型,將其定位為接近OpenAI最近的GPT-5.5,而不是更加難以企及的Anthropic Mythos。

而社交媒體上近期熱議的"Gemini Omni"模型,據傳將是本次大會的"One More Thing"。

根據Chrome Unboxed和9to5Google的聯合爆料,部分內測使用者已經提前看到了名為"Omni"的模型選項。與之前的Veo不同,Omni不僅涵蓋了Veo的視訊生成能力,還增加了"視訊重混"和"原生對話剪輯"等新功能。

有使用者在社交媒體上"哀嚎",稱使用Omni模型生成一段短影片就消耗了其AI Pro計畫86%的每日額度。這種超高的算力消耗,側面反映了視訊生成任務的計算密集度,也暗示該模型的能力可能遠超此前的版本。

系統革命:

Aluminium OS,

不只是Android,

是PC的重生

如果說AI是大腦,那麼各路媒體和社區相傳的Aluminium OS就是Google為這顆大腦打造的全新"身體"。

在Reddit上,一段長達16分鐘的Aluminium OS上手視訊被瘋狂轉發。視訊顯示,這套系統徹底打破了ChromeOS的侷限:

· 互動邏輯: 底部擁有類似macOS或Windows的App Dock欄。

· 核心功能: 完整的桌面版Chrome瀏覽器體驗,原生運行AndroidApp,加上強大的虛擬桌面切換。

· 殺手鐧: 一個名為"Link to iOS"的內建應用。

這暴露了Google的野心。它不僅想統一自己的生態,還想通過AI電腦這個切入口,去撬蘋果iPhone使用者的牆角。

正如GoogleAndroid生態系統總裁薩米爾·薩馬特(Sameer Samat)此前確認的,Aluminium OS將搭載在名為"Googlebook"的新一代筆記本上。這不同於以往的Chromebook,而是由宏碁、華碩、聯想、戴爾、惠普等巨頭代工的高端AI PC,目標是正面對壘蘋果MacBook和微軟Surface Pro。

硬體"金珠":

Android XR眼鏡的

量產前夜

去年的I/O大會上,AR眼鏡還只是PPT上的概念。今年,它已經有了清晰的量產路徑。

Mashable的最新深度報導梳理了GoogleXR硬體的真實面貌:

· AI智能眼鏡: 根據Android Headlines的爆料,目前代號"Jinju(金珠)",定價區間預計在379美元至499美元之間,類似Meta與Ray-Ban的聯名款。無螢幕,主打Gemini Live語音互動。當你走在街上問"我面前這棟樓的歷史",它會通過內建攝影機即時作答。

· AR增強現實眼鏡: 相比AI智能眼鏡還帶有顯示鏡片,但發佈時間未定。

379美元至499美元這個價格區間極具競爭力,意味著Google希望通過低門檻讓AR裝置成為普通人的日常配件。

在合作廠商方面,除了三星之外,Google這次還拉攏了XREAL等AR眼鏡領域的領先廠商。多位開發者在X上爆料,Google已經準備好了完整的Android XR SDK(開發者工具包)。I/O大會將是這些開發者正式獲准"上場"的時間點。

從"對話"到"代勞":

智能體與生態版圖的

最後拼圖

如果說Gemini 4.0是大腦,Aluminium OS是骨架,那麼本次I/O上有望亮相的其餘武器,決定的是Google能不能真正切進使用者的日常。

· 搜尋的"核武選項":默認AI Mode的豪賭

最可能引發行業震動的,是搜尋入口的徹底重構。Google準備正式將"AI Mode"設為默認搜尋選項。

搜尋不再是提供網頁跳轉,而是直接交付結果。當你搜尋"策劃低碳婚禮"時,Gemini 4.0會直接生成完整的方案預算,而不是讓你點選不同的婚慶網站。

為解決"幻覺"痛點,新搜尋將引入即時校驗技術。AI在生成答案的同時,後台會同步啟動數個微型搜尋任務進行交叉驗證,並即時標註信源權重與"信心指數"。

備受好評的NotebookLM也有望與Gemini深度整合。使用者可以將私有文件、科研報告作為"事實來源"喂給AI,確保生成的每一句話都"有據可查",從而解決企業級使用者對AI精準性的焦慮。

· 智能體(Agentic AI):從"聊天"轉向"執行"

在本次大會的預期清單中,"Agentic AI"是最吸睛的關鍵詞。與以往只會"紙上談兵"的對話機器人不同,Google正計畫讓Gemini具備自主執行能力。

5月14日,社交媒體X上得爆料帳號 @testingcatalog披露了更為詳盡的細節:這款名為 "Gemini Spark" 的全新智能體即將亮相。它被定位為一個24/7全天候線上的私人助理,其核心邏輯在於“理解”與“接管”。爆料顯示,Gemini Spark不僅能學習使用者的行為習慣,還會深度呼叫已連接的應用(Apps)、歷史對話、地理位置以及使用者已登錄的網站資訊,從而建構起極具個人化的“數字大腦”。

為了實現最高效的任務處理,Gemini Spark甚至會保存遠端瀏覽器資料(如登錄憑據和遠端程式碼執行資料),這意味著它可以在極少人工干預下,自主控制電腦或手機完成複雜任務。比如,它能直接從網頁提取資料、填充表格並自動傳送郵件,而無需使用者反覆授權登錄。

結合名為 "Magic Pointer" 的螢幕感知技術,AI 不再只是搜尋框裡的字元,它能“看到”你螢幕上的內容(比如社交媒體上的旅行目的地),並直接利用Gemini Spark 獲取的個人情報與登錄狀態,在後台靜默完成機票比價、酒店預訂並同步至日曆。

當然,針對如此深度的隱私介入,爆料也提到Google在設定中預留了開關,使用者可以隨時清理遠端瀏覽器資料或關閉個人智能功能,以在便利與安全之間尋找平衡。

· Android 17:低調測試背後的"多工"野心

雖然"Android Show"已經預熱過,但I/O主會場才是Android 17真正亮殺招的舞台。測試版看似波瀾不驚,但核心互動邏輯正在發生質變。

據稱,借鑑了折疊屏經驗的"氣泡"窗口(App Bubbles)互動模式將全面下放,允許任何應用以懸浮窗形式存在。這不僅是針對大屏裝置的最佳化,更是為了在Aluminium OS時代實現手機與PC體驗的無縫融合。

此外,在經歷了兩年的激進擴張後,Android 17將回歸底層,重點修復AI整合後的功耗與隱私漏洞,為即將到來的Pixel系列提供最穩固的底座。

· 創作工具與"未來投影":Veo、Lyria與Project Beam

視訊生成工具Veo和音樂創作工具Lyria預計將推出更具商業落地價值的Pro版本,對標行業最頂尖的生成式標準。充滿科幻感的3D視訊通話技術Project Beam也有望展示最新進展,利用多攝像頭陣列讓遠端通話對象像真實的3D模型一樣出現在你面前,配合Android XR眼鏡使用,直接打破了螢幕的物理邊界。

社交媒體反應:

是"全能代理"的黎明,

還是"追趕者"的最後掙扎?

在社交媒體和開發者社區,圍繞這屆I/O的討論已經極度兩極分化。

看好的一方,賭的是生態整合。

科技媒體Mashable援引創作者Renato在X上的推文指出,Omni模型的出現意味著我們終於要打破"對話方塊"的束縛。如果Gemini 3.5/4.0能夠原生輸出視訊並嵌入工作流,創作者將不再需要在不同的AI工具間反覆切換,這種"多模態畫布"的體驗將直接改變內容生產的邏輯。

知名科技評論員邁克爾·斯坦(Michael Stan)則認為,相比模型跑分,"Teamfood"(內部測試代號)長效記憶功能才是真正的殺手鐧。目前AI工具最讓人沮喪的就是每次開啟新對話都要重新解釋背景,如果Google能實現跨Session的持久記憶,Gemini才會真正從"聊天機器人"變成"數字助理"。

看衰的一方,質疑的是執行力。

開發者Jasper的評論獲得了大量點贊,他直言Google正全面落後:視訊輸給Seedance,圖像輸給GPT image v2,聊天和程式設計輸給了所有人,語音輸給GPT realtime 2,音樂輸給Suno。這屆I/O必須拿出有統治力的產品。

針對"Gemini 4.0性能約等於GPT-5.5"的爆料,評論員Kushagra Tiwari諷刺道:"Google將目標對準GPT-5.5而不是Mythos,這說明了現在的真實基準線到底在那裡。他們甚至都不再假裝去追趕Anthropic了,只是在努力讓自己在低一檔的梯隊中保持存在感。"

Reddit上也有資深使用者反映,近期Gemini和Google Flow的穩定性極差,甚至到了"幾乎無法使用"的地步。雖然他樂觀地認為這是在為大版本更新鋪路,但更多使用者在跟帖中表達了因3.1版本Bug頻發而感到心灰意冷,甚至已經開始考慮重回GPT或Anthropic。

還有一些聲音在討論更底層的問題。

有開發者在X上提出:即便Gemini 4.0追平了GPT-5.5,但在成本和效率上,它能否抵擋住中國開源大模型的衝擊?如果閉源模型的溢價無法轉化成絕對的生產力優勢,Google的商業閉環將面臨嚴峻挑戰。

也有評論調侃Google一直在"廚房裡備菜",但如果5月19日端出來的菜還是"半成品",那麼正如Stephen Day所言:"Google可能需要把整個廚房的員工都換了。"

這種輿論氛圍,本質上是一種"恨鐵不成鋼"的期待。大家依然相信Google擁有全球最強的算力和最深的技術積澱,但耐心正在被一次次"Demo驚豔、實測平平"所磨滅。今年的I/O,不只是展示技術的秀場,更是Google奪回社區信任的關鍵一仗。

總結:

這不只是一場科技盛會,

更是Google的保衛戰

站在2026年的時間節點上,Google面臨的對手前所未有地強大:OpenAI虎視眈眈,Meta在XR硬體端先聲奪人,蘋果正在深度重構全線產品的AI體驗。

經過前面五章的梳理,有幾個判斷可以先給出來。

在這手牌裡,最有勝算的可能是搜尋。AI Mode設為默認這步棋,本質上是Google在用自己最大的護城河(搜尋入口和流量)去喂AI。別家需要費力獲客,Google只需要把現有使用者的搜尋體驗換一層皮。如果即時校驗技術和NotebookLM整合能做到位,這張牌打出來的效果可能比Gemini模型本身更重要。

最大的不確定性在Aluminium OS。一個全新的作業系統要說服使用者放棄macOS或Windows,光靠"能跑AndroidApp"遠遠不夠。ChromeOS的教訓還在眼前。Google需要在I/O上拿出至少一個讓人無法在其他平台複製的使用場景,否則Googlebook大機率會重蹈Chromebook高開低走的老路。

而XR眼鏡和Omni模型,更像是Google在押注下一個周期。379美元的定價說明Google想走量,但沒有螢幕的AI眼鏡能不能撐起日常使用,取決於Gemini Live的語音互動到底有多可靠。如果只是一個戴在臉上的語音助手,消費者不會買單。

歸根結底,Google這次要證明的不是某個單品有多強,而是這些散在各處的能力,從模型到系統到硬體到搜尋,能不能拼成一套連貫的體驗。如果I/O結束後,外界的反應還是"每個Demo都很炫,但實際用起來還是老樣子",那這場保衛戰就算輸了。

5月20日凌晨,答案馬上揭曉。 (網易科技)