#Gemini
GoogleChrome覺醒!Gemini 3全面接管,38億使用者一夜進入Agent時代
【新智元導讀】GoogleChrome擁抱Gemini 3,用38億使用者的絕對底牌向OpenAI宣戰:瀏覽器不僅是入口,更是終結一切App的超級智能體!Google終於不再沉睡!就在剛剛,Google正式官宣或將改寫網際網路歷史的重磅更新——所有桌面端Chrome瀏覽器,正式接入Gemini 3。這意味著,全球38億使用者手中的瀏覽器,一夜之間從一個單純的網頁查看工具,進化為了一個全能的AGI入口。此次更新最大的亮點,在於徹底改變了人與資訊的互動方式。Gemini 3不再是一個需要單獨訪問的網頁,而是直接「住」進了 Chrome裡。得益於Gemini 3強大的多模態理解能力,Chrome現在可以像人類一樣「看懂」網頁,並執行複雜的操作。想辦個千禧風派對?只要一句話,「自動瀏覽」功能就能掃遍全網找同款,自動比價、自動領券、甚至直接加購,全程不用你操心預算。更絕的,是處理那些讓人頭大的繁瑣流程。比如複雜的旅行規劃,它能瞬間調動Gmail、地圖、日曆這套「Google全家桶」,把訂酒店、查機票、同步日程安排得明明白白。以前需要在幾十個標籤頁裡反覆橫跳的崩潰感,徹底成為了歷史。如果你是搞設計的,或者只是想修個圖,Chrome現在內建的Nano Banana模型更是讓人直呼「魔法」。不用下載圖片,也不用打開PS,直接在網頁側邊欄輸入一句提示詞,圖片立刻按你的想法大變樣。這簡直是把生產力工具直接焊死在了瀏覽器裡。雖然市場上Perplexity Comet和OpenAI Atlas最近風頭正勁,但Google這波「回馬槍」實在太狠。畢竟,Chrome擁有全球最龐大的38億使用者底座。當最好的AI體驗變成了瀏覽器的「出廠設定」,使用者還需要去下載別的應用嗎?難怪網友們紛紛感慨:「沉睡的巨人,已完全甦醒」。目前,MacOS、Windows和Chromebook Plus上的Chrome,已全部上線新功能。不過,自動瀏覽功能僅限Google AI Pro和Ultra訂閱美國使用者使用。瀏覽器?不,這是你的AI管家在全球瀏覽器市場中,Google以超38億使用者量,穩坐世界頭把交椅。但不得不承認,AI這波浪潮實屬給Google統治地位,帶來很大的衝擊。「AI原生」瀏覽器的崛起,讓其存量市場正被快速蠶食。尤其是,過去一年,Perplexity Comet異軍突起,憑藉顛覆性AI搜尋體驗,吸引大量使用者。緊接著,OpenAI也入局,正式發佈了內嵌ChatGPT的瀏覽器Atlas。這一次,Gemini 3深入植入GoogleChrome後,或將重塑未來的流量入口。Gemini 3的實力眾所周知,通過全新的側邊欄體驗,人們可以在網頁多工處理時,更加得心應手。不僅如此,Google還將旗下爆款「全家桶」與AI深度整合,全新「自動瀏覽」功能便可幫你處理複雜的多步工作流。未來,個人智能(Personal Intelligence)即將上線,更懂你,更智能。如今,GoogleChrome完成了「回爐重塑」,進化為一個真正的全能助手。人類與瀏覽器的互動範式,正經歷一場徹頭徹尾的重構。全新側邊欄,隨時待命全新升級後的側邊欄,無論你切換到那個標籤頁,Gemini都能隨時待命。這能幫你省去來回切換的麻煩,實現無縫的多工處理。你可以一邊在主窗口忙工作,一邊在側邊欄處理其他事務——· 有人用它在「標籤頁叢林」裡對比不同選項;· 有人用它彙總各站點的產品評價;· 還有人在亂成一團的日曆裡快速找空檔。自動瀏覽,人類雙手解放這次最重磅的升級,當屬自動瀏覽能力了。無論是對比不同日期的酒店和機票價格幫你精準「撿漏」,還是預約掛號、填寫那些長得要命的線上表格、收集報稅檔案、找裝修報價、查帳單、報銷費用,甚至幫駕照續期等等,它都不在話下。只要你授權,它甚至能呼叫Google密碼管理器幫你搞定需要登錄的任務。理解創意願景:幫你搜尋極其冷門的派對裝飾並直接入倉。新一代智能體能力:自動瀏覽可以從PDF裡提取資訊幫你填表。最佳周末推薦:根據你的酒店和航班標準,幫你挑出最合適的出遊周末。找房小能手:根據你的要求篩選並推薦最合適的公寓。此外,Chrome還支援Google與行業大咖們共同制定的開放標準通用商務協議(UCP),確保AI智能體在Chrome裡的購物流程變得如絲般順滑。Nano Banana入駐,隨地大小修圖Nano Banana的創意能力,也直接內嵌到了Chrome裡。對於創作者而言,這意味著「下載圖片-打開PS-修改-保存-上傳」的舊工作流徹底作古。現在,你只需要在網頁上選中圖片,在側邊欄輸入一段提示詞,Gemini就能呼叫Nano Banana即時對圖片進行重構或修改。不用離開當前標籤頁,不用安裝任何外掛,網頁本身就變成了一個強大的圖像工作站。「全家桶」互聯,搞定一切Perplexity和OpenAI最大的短板,正是Google最深的護城河——生態。Chrome版Gemini 3打通了Connected Apps(連接應用)。它可以無縫呼叫Gmail、Google Maps、YouTube、Google Flights等自家服務。這種深度整合讓辦事效率突飛猛進。比如,你要去參加會議,Gemini能幫你翻出那封陳年活動郵件,結合Google航班的資訊給出出行建議,最後再幫你草擬一封告知同事到達時間的郵件。個人智能:更懂你、更主動Gemini App裡備受歡迎的「個人智能」,也會在未來幾個月登陸Chrome。當然,掌控權始終在你手裡:你可以自行選擇是否加入,並隨時連接或斷開應用。Chrome會記住以往的對話背景,針對你的全網搜尋提供「量身定製」的答案;你也可以預設特定指令。有了「個人智能」,Chrome不再只是一個工具,而是一個懂你、能主動提供幫助的貼心搭檔。安全與隱私為了安全起見,Google不僅加入了全新的防禦機制來抵禦新型網路威脅,而且自動瀏覽在執行「買單」或「發動態」等敏感操作前,一定會暫停並明確請求你的確認。如今,當Gemini 3的頂級模型能力,遇上Chrome 38億的龐大使用者基數,再加上Google無孔不入的生態服務,這場瀏覽器之戰似乎在開始前就已經結束了。對於普通使用者來說,從今天起,你的瀏覽器不再只是一個瀏覽器,它是你的秘書、你的買手、你的設計師。可以說,一個由AI驅動的全新瀏覽時代,已經開啟。 (新智元)
台灣要使用現在要全程VPN才行
蘋果,低頭了
2026 年 1 月,蘋果與Google確認達成合作,Gemini 將成為 Apple Intelligence 體系的重要技術支撐之一,並用於包括新版個性化 Siri 在內的多項系統級 AI 功能。這並不是一次簡單的 API 接入,而是涉及模型能力、雲端計算以及系統層級整合的深度合作。對外界來說,這個消息的衝擊力,甚至超過了很多具體功能本身:過去三年裡,蘋果在 AI 領域畫過的餅太多,但真正落地的成果太少。WWDC 上展示過的「更懂上下文的 Siri」「能跨應用執行複雜操作的 Siri」更是一次次延期,直到 2026 年,這些能力依然沒有完整交付。圖片來源:Apple而這一次,蘋果沒有繼續強調「完全自研」,而是選擇直接引入 Gemini 作為核心能力來源。更有消息稱,這個全新的 Siri 不久後就會在 iOS 27 的測試版中亮相。考慮到 Siri 和 Apple Intelligence 的畫餅歷史,雷科技對更智能的 Siri 始終持懷疑態度。而這次蘋果與Google的合作,至少說明了一件事——蘋果已經不再堅持「凡事都要自己來」了。Siri 也曾是先進技術的代表不過話又說回來,儘管國內使用者對 Siri 評價非常一般,但作為手機智能助手裡的「老資歷」,Siri 的誕生其實一點都不保守:2011 年,Siri 隨 iPhone 4S 正式發佈,是業內第一批被大規模推向消費級市場的語音助手。要知道在當時,語音互動還停留在指令式輸入的階段,Siri 已經開始嘗試提供語言理解、上下文關聯和服務整合。至少在那個階段,Siri 的出現是具備明顯前瞻性的。但問題在於,作為蘋果的技術產品,Siri 的發展路徑從一開始就被框在了一個保守的技術邊界內。蘋果很早就為 Siri 定下了幾個不容妥協的前提:優先保護隱私、儘可能在端側完成計算、系統行為高度可控。在傳統功能型語音助手時代,這套邏輯是成立的。因為當時的 Siri,本質上只是一個「語音入口」,負責把使用者指令轉譯成系統操作;但當 AI 進入大模型時代,更複雜的 AI 指令帶來了更大的算力缺口,Siri 也開始變得力不從心起來。與 AI 時代脫節不是「一日之寒」在雷科技看來,這種頂層路線的不合時宜,才是 Siri 在 AI 時代體驗「遙遙落後」的根本原因。首先,Siri 的模型規模與能力註定了它不可能好用。在大模型時代,聰明本身就是一種資源密集型能力。更強的理解力、更自然的對話、更複雜的任務拆解,本質上都依賴大規模模型和持續的雲端算力支援。圖片來源:Apple而蘋果在這件事上,一直保持克制:一方面,蘋果希望把 AI 能力儘量壓到端側,減少資料外流;另一方面,蘋果在自建雲端算力上的節奏,也明顯慢於Google、微軟這樣的雲服務原生廠商。這導致 Siri 背後的模型規模長期受限,能力提升緩慢,而使用者對 AI 的期待,卻在 ChatGPT、Gemini 等產品的推動下迅速被拉高。其次,是組織和人才的問題。過去幾年裡,蘋果 AI 團隊的人員流動並不小。從公開資訊來看,不少原本參與核心模型研發的工程師和管理層,陸續被 OpenAI、Google、Meta 等公司吸納。這種流失並不罕見,但在一個高度依賴長期積累的領域,會直接影響研發節奏。更不用說蘋果內部的保密文化對 AI 人才的限制了。在 AI 時代,任何一個技術突破都能在短時間內形成論文、成為研究人員的光鮮履歷和跳槽時的底氣。但在蘋果的保密文化下,除了極少數頭部負責人有在公眾面前露面的機會,大多數研究員都無法將技術與自己掛鉤。在這樣的文化背景下,蘋果 AI 團隊成員接連出走已成必然。而蘋果與 Google、Meta、OpenAI 等巨頭之間的能力差距,也逐漸消耗了外界對 Apple Intelligence 的耐心。能滿足蘋果條件的 AI 模型並不多當然了,蘋果也嘗試過自救,比如講 Apple Intelligence 接入 ChatGPT。但在雷科技看來,對蘋果來說,與Google合作確實是一個更合適當前局面的選擇。首先,OpenAI 的模型能力很大程度上依賴微軟 Azure 的算力。如果蘋果選擇深度繫結 OpenAI,實際上等於在核心 AI 能力上間接受制於微軟,這顯然不符合蘋果一貫強調的獨立性。而Google不僅擁有 Gemini 這樣的自研模型體系,同時也具備成熟的全球雲基礎設施,以及長期服務 Android 與 Pixel 裝置的經驗。在「如何把大模型穩定地嵌入移動系統」這件事上,Google是少數有實戰經驗的公司之一。圖片來源:Google其次,是多模態能力的契合度。Siri 的下一步顯然不是「更會聊天」,而是要理解螢幕、理解應用狀態、理解使用者正在做什麼。這種高度依賴多模態理解的能力,恰好是 Gemini 的強項之一。從這個角度看,Gemini 並不是來「替代 Siri」,而是成為 Siri 背後的理解層和推理層。當然了,既然是雙方合作,那Google的合作態度也非常重要。根據已披露的資訊,Siri 背後的 Gemini 並非直接運行在Google公有雲上,而是被部署在蘋果自建的私有雲端運算體系中。這意味著蘋果依然可以控制資料路徑,維持其隱私敘事。而像 Gemini 這樣同時滿足「模型能力」「雲算力」「隱私控制」這三點的合作方,確實不多。Gemini 能讓蘋果回到 AI 一線嗎?從能力上看,Gemini 的引入,確實有機會補上 Siri 在理解力和執行力上的短板。更複雜的指令拆解、更自然的上下文延續、更穩定的跨應用操作,都是現階段 Siri 明顯欠缺的能力。但這能否把 Siri 重新帶回 AI 助手的第一梯隊,雷科技認為 Gemini 的「藥效」還沒有這麼強。我們知道,AI 能力並不只取決於模型本身,「感知權限」同樣重要。如果蘋果想讓 Siri 重回一線,必然需要在系統層級,真正放權給 Siri。過去 Siri 的很多問題,並不是「不聰明」,而是「不能做」:權限受限、介面不開放、應用不配合,都會直接限制 AI 助手的實際價值。而對國內使用者來說,蘋果與Google的合作也讓 Apple Intelligence 國內落地的情況變得更複雜:Gemini 的引入,必然能為 Siri 帶來質變的提升;但海外模型國內落地的合規性依舊是一道無法繞過的門檻。在這個時間點切換模型,很可能會讓 Apple Intelligence 的入華工作清零。幸運的是,這種不確定性也為國內 AI 廠商創造了機會。圖片來源:豆包如果蘋果證明了一件事——系統級 AI 助手,必須依託頂級模型能力,那麼Android陣營的硬體廠商,也勢必會加快與頭部模型廠商的深度合作。無論是字節、阿里,還是其他大模型團隊,都會迎來新的談判空間。說到底,Siri 和 Gemini 的合作,其實也是蘋果在 AI 時代的一次路線修正。蘋果用直白的技術代差,證明了「有些事情自己真不一定能做」。說到底,iOS 27 能否真正補上那塊畫了三年的 AI 大餅,這個問題沒人說得準。但至少在 2026 年,蘋果終於站到了正確的道路上了。 (雷科技)
自帶 Nano 改圖,一鍵總結 N 個網頁!Chrome 這次更新,讓所有 AI 外掛都下崗了
講真,作為每天和瀏覽器打交道超過 10 小時的“重度衝浪選手”,Chrome 幾乎就是我的第二個辦公桌。自打 AI 爆火之後,為了提效,我這瀏覽器右上角就沒清淨過。我裝了五花八門的外掛:有的專門用來總結長文章,有的用來跟網頁對話……但懂得都懂,沒有一個真的特別好使。直到昨天,Google 親手扔下了一個“核彈級更新”,我瞬間覺得:那些折騰了半天的 AI 外掛,終於可以通通刪掉了!(具體的開啟教學我放在文末了)。圖:Chrome 中整合的 Gemini這次 Chrome 的進化,絕不僅僅是多了一個總結網頁的小工具那麼簡單。它是直接把最強的 Gemini 3 “焊”進了核心裡,讓瀏覽器從一個單純的“閱讀器”,變成了一個真正能替你幹髒活、累活的“數字分身”……01 側邊欄進化:第三方外掛通通可以“下崗”了說實話,AI 側邊欄這東西,大家早就司空見慣了。不管是國外的外掛,還是中國的 Kimi、智譜,早就能讓你一邊看網頁一邊總結、對話。但這次 Chrome 原生的 Gemini 側邊欄,真的讓我想把那些第三方外掛都卸了。因為除了常規操作,它至少有 3 個讓我大喊“臥槽”的狠招:總結網頁只是基本功: 別人能做的它都能做,而且反應速度極快,畢竟是親兒子。圖:Chrome 側邊欄總結網頁你可能不服,這不都能做嗎?Gemini 真正厲害的地方在於,它能同時總結 N 個打開的網頁。以前我想看幾篇文章的摘要,得每個頁面點一次外掛,手都點酸了。現在,它能一次性把所有打開的網頁全讀完,直接甩給我一份彙總好的摘要。(最臥槽的是,你可以讓它用這 N個網頁為素材直接寫篇文章,自媒體人要起飛了!))圖:Chrome 的側邊欄同時總結 N 個網頁再比如我想買個降噪耳機,在京東上開了十幾個產品頁,看得眼花繚亂。現在簡單了,直接讓它幫我全網比價、挑毛病,最後告訴我那款最值得下單。圖:Chrome 側邊欄在 JD 頁面做比價這才是真正的“省心神器”,再也不用在幾十個標籤頁裡反覆橫跳了。視訊“快進鍵”的終結者: 這點最牛。你在看 YouTube 視訊時,它不僅能幫你出總結,最離譜的是它能自動切片。它會把視訊分成好幾個關鍵段落,你看到感興趣的點,點一下文字,進度條直接跳到那個位置。圖:Chrome 側邊欄直接總結視訊並做切片以前看個長視訊得手動拖進度條,現在感覺是 AI 牽著你的手,直接把精華送到你嘴邊。不過有一說一,這功能目前還是有點“偏心”,對 YouTube 的支援簡直是親兒子等級。我也試了下 B 站,雖然也能總結出大概意思,但少了那個最靈魂的“自動切片”,就像吃泡麵沒調料包,效果大打折扣。這些結果可以直接通過 Gmail 發郵件出去,而且這次還把日曆、YouTube、地圖等全部整合進來了。不得不說,Google把自家“全家桶”整合起來的殺傷力真的無敵,這種“自家產品互相開掛”的操作,才是這次更新最頂的地方。02 Nano Banana:這那是瀏覽器,這是隨身帶了個 PS以前在網上看到一張圖想改一改,你得先下載,再開修圖軟體,折騰半天再重新匯出。現在 Chrome 側邊欄直接把 Nano Banana 整合進來了,簡單來說,它就像在瀏覽器裡裝了個“一鍵整容”按鈕。我試了幾個場景,簡直是懶人福音。比如你看到一張色彩鮮豔的素材圖,想看看一張照片變成復古黑白風是什麼效果,不用找濾鏡,在側邊欄說句話就行。圖:Chrome 側邊欄直接修改圖片更神的是,如果你對著一張空蕩蕩的房間照片,想腦補一下裝修後的樣子,直接讓它往裡“塞”滿家具。上一秒還是冷冰冰的毛坯房,下一秒就能變出北歐風的溫馨感。圖:Chrome 側邊欄直接修改圖片甚至當你面對一整個網頁密密麻麻的資料頭大時,直接喊它把網頁內容生成一張精美的資訊圖,這對於每天做 PPT 的人來說,簡直是救了命了。圖:Chrome 側邊欄生成資訊圖這種“即看即改”的操作,以前得折騰好幾個 App,現在動動嘴皮子就在瀏覽器裡順手辦了。03 終極殺招:它不是在聊天,是在替你“上班”如果說前面的功能只是讓你“看得爽”,那接下來的 Auto browse(自動瀏覽) 簡直是讓 Chrome 長出了手腳。我試了幾個官方案例,確實有點科幻。比如最枯燥的自動填表,你只需把資料甩給它,它能自動識別並把另一個表單填得整整齊齊。更神的是,比如你想辦個主題派對,看到一張氛圍感拉滿的佈置圖,不用你肉眼去搜同款。它能直接識別圖裡的復古電視、氣球、裝飾品,去電商網站搜出同款並一鍵塞進購物車,連券都領好了,你只管付錢。甚至連訂酒店、查航班這種瑣事,它都能根據你的要求直接出一套最優方案。不過,我也得說句大實話: 這一招目前對國外網站確實很猛,但我實測發現,它還沒學會怎麼逛京東、淘寶或攜程,基本處於“罷工”狀態。(所以這裡用了官方的案例)雖然這種“數字替身”的未來很爽,但中國使用者不知道啥時候能享受到。04 隱藏教學:怎麼強先開啟這個“黑科技”?看到這兒,估計大家手裡的外掛已經按捺不住要刪了。不過目前這些功能還在灰度測試中,如果你想現在就體驗,可以試試這套“極客開啟方案”:第一步:開啟隱藏開關(Flags)先升級 Chrome 到最新版,然後在網址列輸入 chrome://flags/  進入實驗室。在搜尋框輸入 “glic”,把搜出來的這五項全部從 Default 改成 Enabled:GlicGlic Z Order ChangesGlic actorGlic Pre-WarmingGlic FRE Pre-Warming圖:開啟 Chrome 的相關選項點選右下角的 “Relaunch”(重新啟動)即可。第二步:如果還沒出來,試試這幾條“黑指令”如果你重啟了還沒看到 Gemini 出現,那說明被地域限制鎖死了。這時候需要先徹底退出 Chrome,然後打開終端(Terminal)執行下面這幾行命令,直接給它來個“強制開啟”:💡 小提示: 執行前建議先備份。命令中的 ~/Library/Application Support/Google/Chrome/ 路徑適用於 Mac 使用者。另外,你的 Chrome 需要設定為英文,而且 IP 地址必須設定為美國。這一頓操作之後再次打開 Chrome,你就能看到那個能替你“上班”的數字分身了。寫在最後不得不感嘆,2026 年開年這一個月,AI 圈的節奏快得讓人窒息。特別是這兩天全網刷屏、幾乎把智能體推向神壇的 ClawdBot(Moltbolt),大家應該都看出來了:“智能體(Agent)”化已經是大勢所趨。以往是我們“用”瀏覽器去找資訊,現在是 AI 正在“接管”瀏覽器去辦實事。而這次 Gemini 與 Chrome 的深度融合,意義完全不同。畢竟 Chrome 是全球幾十億人的裝機必備,它這次的“超進化”,意味著 AI 這種處理資訊的方式,正在從極客的小眾玩具,徹底變成普通人觸手可及的日常工具。雖然現在對中國 App 的適配還沒那麼絲滑,但這種“有人幫我幹活”的未來,確實已經近在咫尺了。最後互動一下:如果 AI 真的能替你處理掉所有無聊的填表、訂票、比價工作,你最想用省下來的時間幹點啥? (AI范兒)
GoogleChrome史詩級更新!Gemini 3原生植入,瀏覽器終於能“自己動”了?
Chrome 瀏覽器剛剛迎來了一波史詩級加強!Google官方剛剛宣佈,將最強的 Gemini 3 模型直接塞進了 Chrome 裡。注意,這次不是在側邊欄加個簡單的對話方塊,而是引入了真正的 Agentic AI 能力。簡單來說:以前你的瀏覽器是用來“看”網頁的,現在的瀏覽器,真的能自己“上網”幹活了。01 真正的“自動駕駛”:Auto Browse這是本次更新的重頭戲——Auto Browse(自動瀏覽)。基於 Gemini 3 的多模態能力,Chrome 現在可以處理複雜的多步驟工作流(Multi-step workflows)。它不再只是給你吐出文字建議,而是像一個真實的私人助理一樣,幫你點選連結、尋找資訊、填寫表單,甚至處理那些極其繁瑣的“髒活累活”。舉個簡單的例子:假設你要舉辦一場 Y2K 復古主題派對,但不知道買什麼裝飾品。以前你需要:去小紅書/Pinterest找靈感 → 截圖 → 去淘寶/亞馬遜搜同款 → 比價 → 加購物車。現在,你只需要給 Auto Browse 一張參考圖:“Gemini,幫我看看這張圖裡都有什麼,然後幫我搜同款,要便宜的,直接加進購物車。”Gemini in Chrome能夠理解你的創意構想,幫你尋找非常具體的派對裝飾品並將其加入到購物中Gemini 3 會利用其視覺能力識別圖片中的物品,自動在電商網站搜尋相似款,利用優惠碼確保不超預算,甚至最後一步直接幫你把東西放進購物車。如果不只是買東西呢?根據Google的內測,測試者們已經開始用它來幹這些事了:全網比價:自動查詢不同日期的酒店和機票價格,不僅是看,而是幫你規劃。可以幫你找到合適的公寓,並根據你的條件篩選結果可以根據對酒店和航班的要求,為你推薦最佳的周末住宿方案。填表狂魔:自動填寫繁瑣的線上表格,甚至幫忙報稅。可以根據PDF檔案中的資訊自動填寫表單生活瑣事:給水管工查報價、管理訂閱服務、甚至更新駕照。一句話總結:那些你不想幹的重複性勞動,現在瀏覽器全包了。當然,我知道大家擔心什麼——安全。Google也強調了“Security by design”。對於敏感操作(比如付款、在社交媒體發帖),Auto Browse 會自動暫停,必須經過你的明確確認才會執行。它能幫你省心,但不會自作主張亂花你的錢。自動瀏覽功能能讓你隨時瞭解最新情況,並要求你確認敏感操作02 側邊欄進化:不切屏,才是真效率為了配合強大的 AI 能力,Chrome 這次還推出了全新的側邊欄體驗(Side Panel Experience)。不知道大家有沒有這種痛苦:寫論文/寫程式碼的時候,為了查一個資料,切出去開了個新標籤頁,然後不知不覺就開始刷別的東西,半小時回不來。現在的 Gemini 側邊欄,主打一個“伴隨式服務”:你可以在主窗口保留你的核心工作(比如正在寫的文件),然後在側邊欄喚起 Gemini 處理雜事。比如:多方比價:不用開10個電商頁面來回切,直接在側邊欄讓它把不同網站的產品優缺點列出來。總結評論:打開亞馬遜商品頁,側邊欄直接告訴你“這東西大家覺得那裡不好”。日程管理:在混亂的日曆裡幫你找空閒時間,而你不需要離開當前的網頁。瀏覽器中的 Gemini 會在側邊欄打開,方便進行多工處理一句話總結:它就像坐在你旁邊的實習生,你只管主線任務,支線任務丟給它,不用切屏,不用打斷心流。03 Nano Banana:網頁圖片,原地“整容”他們很久之前發佈了一個名字很怪、但功能很暴力的模型:Nano Banana。這是一個直接整合在 Chrome 裡的圖像生成/修改能力。它的核心賣點是 “On the fly”(即時修改)。以前我們在網頁上看到一張圖,想改一下,得先“右鍵另存為”→“打開PS/美圖秀秀”→“修改”→“上傳”。現在?根本不需要下載。你只需要在側邊欄輸入一句 Prompt(提示詞),告訴它你想怎麼改,網頁上的那張圖就會原地變形。無需複製貼上或重新上傳;使用 Nano Banana 在當前瀏覽器窗口中轉換圖像比如這張客廳的照片,你可以直接讓 Gemini 給它換個“現代風”裝修,或者把一份枯燥的資料圖表直接轉化成一張精美的資訊圖。這就很適合做設計、做PPT的朋友,找素材的時候,沒有合適的?直接讓瀏覽器給你“捏”一張出來。04 打通全家桶 & 什麼時候能用?最後,作為Google親兒子,Chrome 這次徹底打通了 Connected Apps(關聯應用)。Gemini 可以直接呼叫你的 Gmail、日曆、地圖、YouTube 甚至 Google Flights 的資料。舉個場景:你要去開會,但是忘記航班資訊了。 Gemini 可以幫你從幾個月前的舊郵件裡把航班資訊挖出來,結合地圖給你推薦行程,最後幫你草擬一封郵件告訴同事你幾點到。可以與其他 Google 應用(例如 Gmail)配合使用📍 如何體驗?根據官方消息,這些更新正在向 MacOS, Windows 和 Chromebook Plus,AI Pro/Ultra 使用者陸續推送。如果你手裡的 Chrome 還沒收到更新,不妨去檢查一下版本,或者再耐心等等。 (奇點前哨)
Google 王炸更新 Gemini 和 Chrome 合體 絞殺一切競爭對手...
很多人一直吐槽 Google,Gemini 那麼強了,人家都推出了AI瀏覽器,為什麼Chrome 卻一直還是原地踏步?Google 到底在幹嘛?現在它終於來了Gemini 和 Chrome 合體了...Google 剛剛發佈了基於最新 Gemini 3 模型的 Chrome 重大更新,這不僅僅是一個外掛或側邊欄的升級,而是對瀏覽器核心邏輯的重構。Chrome 正在從一個被動的“網頁瀏覽工具”,進化為一個能夠主動思考、替你幹活的“智能代理(Agentic AI)”。說實話,以前咱們用 AI 得經歷多少步驟?先開網頁、登帳號、想 Prompt,萬一網速不給力還得轉半天圈圈。要是想讓 AI 總結個網頁,還得在那兒苦哈哈地複製貼上,簡直麻煩得要死。這次升級後,Chrome 基本上變成了 Gemini 的“完全體容器”。Google 這次是打算把 AI 直接縫進你的瀏覽肌肉裡,甚至要開啟“無人駕駛”模式。這就帶大家看看,Google 這次到底在構思什麼“大殺器”。👇先文字長的,看視訊介紹:Side Panel:從“彈窗”變成“常駐協作者”Google 給 Chrome 加了一個新的 側邊欄(Side Panel)。Side Panel不只是一個簡單的聊天框,它變成了一個全能的指揮中心。以前用 AI,你得切出去,複製貼上,再切回來。現在?它就住在你手邊無論你打開那個標籤頁,Gemini 都隨時可用而且最重要的是:它能看懂你在看什麼多工處理神器:你可以一邊在首頁面寫方案、看資料,一邊讓側邊欄裡的 Gemini 去對比多個網站的產品資訊、彙總評價、提煉結論。比如你正在瀏覽幾個不同的數位產品頁面,你可以讓側邊欄裡的 Gemini 直接生成一個“橫向對比表”,把這幾個網頁的參數全部抓取並整理出你可以在首頁面繼續當前工作同時在側邊欄讓 Gemini 處理另一項任務不打斷、不切換、不複製貼上內建Nano Banana:螢幕上的圖片,直接改這是 Google 在端側 AI 上的新突破。你可以在瀏覽器裡直接對網頁上的圖片進行處理。以前你想看看一件家具放在房間裡是什麼效果,得先下載圖片、上傳到編輯器、祈禱效果還行……現在不用了。你可以直接指著螢幕上的圖片,讓 Gemini 修改...比如你看到一個房間的照片,想看看它更換裝修風格的樣子,你可以說:"幫我把這個房間換成淺色現代風家具。"它就直接生成了。不需要下載,不需要上傳,所見即所改。Google Workspace 深度打通Gemini 和 Google 全家桶的聯動也更深了。演示裡有個場景:你在看一份課程大綱(比如某個讀書會的書單),需要給學習小組發一封郵件,介紹一下要讀的書。以前怎麼做?1.看大綱,記住書名2.切到 Gmail,新建郵件3.切回大綱,複製書名4.切到 Gmail,貼上5.想寫介紹?再去搜一下這本書講什麼6.來回切換到頭暈……現在呢?你讓 Gemini 讀當前頁面的大綱,然後說:"從裡面挑三本書,寫個簡短介紹,用真人秀的風格寫,幫我起草一封郵件。"Gemini 直接從當前頁面提取資訊,在側邊欄裡把郵件寫好,連書的簡介都給你編好了(而且還是真人秀風格的,帶點戲劇性)。你全程不需要離開正在看的頁面。 大綱在主窗口,郵件在側邊欄,一心二用,效率翻倍。寫完之後,它還可以呼叫 Gmail,直接一鍵傳送。搞定。這種"讀當前頁面 + 執行另一個任務"的能力,才是 AI 真正融入工作流的樣子。Connected Apps:Google 全家桶深度打通接下來這個功能,打工人狂喜。Gemini 不只是跟 Chrome 聯動,而是跟整個 Google 生態打通了。官方叫它 Connected Apps(關聯應用)。目前支援的應用包括:Gmail(郵件)Google Calendar(日曆)YouTubeGoogle Maps(地圖)Google Shopping(購物)Google Flights(航班)這些應用可以在 Gemini 設定裡一鍵開啟。這意味著啥?舉個例子:你要出差參加一個會議,需要訂機票。以前怎麼做?翻郵件找會議時間 → 打開機票網站搜航班 → 比價 → 訂票 → 再寫郵件告訴同事你的到達時間……現在呢?你跟 Gemini 說一句:"幫我查一下下周那個會議的時間,推薦幾個航班,然後寫封郵件告訴同事我的到達時間。"Gemini 自己去翻你的郵件找會議詳情,自己去 Google Flights 查航班,自己幫你起草郵件。一句話,三件事,全搞定。個人智能 Personal Intelligence:越用越懂你這個功能目前還在預告階段,但聽起來非常值得期待:Personal Intelligence(個人智能)。允許 Chrome 記住你的偏好記住過去的對話上下文支援自訂指令提供更“像你助理”的回答簡單說,就是 Gemini 會記住你之前的對話上下文,然後基於這些記憶,給你更個性化的回答。比如你之前跟它聊過你喜歡什麼風格的酒店、你的預算範圍、你對航班時間的偏好……下次你再問它"幫我訂個酒店",它就不會從零開始問你一堆問題,而是直接根據你的偏好給推薦。從一個通用工具,變成一個懂你的私人助理。當然,Google 強調這個功能是使用者主動開啟的,你可以選擇連接那些應用,也可以隨時斷開。隱私控制權在你手裡。真正的核武:Auto Browse(自動瀏覽)上線!好,前面都是開胃菜。接下來這個功能,才是這次更新的真正炸裂之處↓Gemini 開始"接管方向盤"這是我最想吹爆的功能,沒有之一!以前 AI 只能“動嘴”,現在它能“動手”了。這就是所謂的 AI 正式接管“方向盤”。這是什麼概念?Gemini 不再只是"回答問題",而是真的能像人一樣打開網頁、點選按鈕、填寫表單、替你完成任務。場景一:訂酒店演示裡,使用者說:"我想去芝加哥,住某某酒店,幫我查一下這幾個周末的價格,還有一些其他要求。"Gemini 直接打開 Expedia,自己開新標籤頁,自己點日期選擇器,自己篩選條件,最後把搜尋結果整理好呈現給你。不是給你一個連結讓你自己去看,是它替你完成了整個搜尋流程。場景二:篩選公寓在 Redfin(美國找房網站)上,使用者說:"幫我看看我的最愛裡的公寓,把不允許養寵物的刪掉,然後把 Gabriel 加為協作者。"Gemini 打開收藏列表,點進每個房源,看細則,檢查寵物政策,不符合的自動移除,最後還幫你邀請了室友。一個小時的繁瑣操作,變成一句話。場景三:填表格使用者有一份 PDF 格式的球隊名單,要給一個線上報名系統填表。以前這是複製貼上的地獄。現在?"用名單裡的資訊,幫我報名,填上他們的名字和位置。"Gemini 從 PDF 裡提取資料,自動填進表單欄位。手工活,自動化了。想像一下這個場景:你想去大理旅遊,但你懶得翻攜程、看去那兒、查攻略。你只需要對側邊欄的 Gemini 說:“幫我查下 3 月中旬上海去大理最便宜的機票,順便搜下雙廊附近 500 元以內、評分 4.5 以上、帶露台的民宿。”接下來神奇的一幕發生了:瀏覽器會自動開啟一個新的“發游標籤頁”,你能看到它自己在搜尋框打字、自己在點滑鼠、劃螢幕、翻頁面。它不是在呼叫 API,而是在像人一樣替你上網。查完之後,它會在側邊欄給你列出一張清晰的對比表,甚至連預訂表單都能幫你填好大半,你只需要點個“支付”。這那是瀏覽器啊,這簡直是請了個全能小秘書。😂視覺購物:看圖下單,預算可控最後一個演示,是我覺得最"未來感"的一個。場景是這樣的:使用者看到一張 Y2K 風格派對佈置的照片(就是那種千禧年復古風),想復刻這個佈置。以前怎麼做?自己盯著圖,分析裡面有什麼東西——氣球、綵帶、背景布、裝飾道具……然後一個一個去電商網站搜,比價,加購物車,算總價,超預算了再刪幾個……現在呢?你跟 Gemini 說:"去 Etsy,幫我找到能復刻這個佈置的東西,加到購物車,預算不超過 75 美元。"Gemini 先用 Gemini 3 的多模態能力分析圖片內容(氣球是什麼顏色、背景簾是什麼款式、有那些道具),然後去 Etsy 搜尋對應商品,自己比價,自己控制預算,最後把商品加進購物車。更絕的是,官方還提到:Gemini 會自動幫你找優惠碼並應用上去。你打開購物車的時候,發現東西都選好了,總價正好卡在預算線上,優惠碼也用上了。從"我想要這個效果"到"購物車已就緒",一句話的事兒。這不是"幫你搜東西",這是"幫你買東西"。 購物體驗直接跳過了中間所有的繁瑣步驟。小互的思考:這背後的狠招是什麼?我覺得,這次升級其實暴露了Google 的一個陽謀:它想把瀏覽器變成 AI 時代的新型作業系統,從而截殺所有想分流的對手。為什麼這麼說?以前我們要用 AI,可能會去搜 ChatGPT,或者去用 Arc 這種號稱“AI 瀏覽器”的新玩意。Google 這一波操作,意思很明確:既然全球 60% 以上的人都在用 Chrome,那我為什麼不直接把 AI 變成空氣呢?它要讓你形成一種“肌肉記憶”——凡事不決問網址列,凡事想寫點啥點右鍵。這其實是在利用生態位進行防守反擊。還有一點是:Gemini 3 開始佈局 “Personal Intelligence(個人智能)”。只要你授權,它能讀你的 Gmail 郵件、看你的 Google 日曆、翻你的雲端硬碟。這意味著它比你更懂你自己。未來你將離不開它,遷移成本更加高!它不再是在提供搜尋結果,它是在直接提供決策結果。以前我們要搜“我的行程”,現在直接問它“我明天幾點出發去機場最合適”,它能自動結合你的機票確認郵件、即時的交通路況、甚至明天的天氣,直接給你一個最終答案。這其實是一個非常恐怖的閉環。Google正在把你所有的數字生活都圈在 Chrome 這個金魚缸裡。這曾經是 OpenAI 的主要競爭力,現在看來蕩然無存了!但這也有個潛在的代價,那就是你的瀏覽行為、你的歷史記憶、你的搜尋偏好,甚至你在網頁上輸入的每一個字,都在Google  AI 的“喂養”之下。雖然效率起飛了,但這種隱私的“裸奔感”,換個角度看,其實挺讓人唏噓的。我們是用一部分隱私和自主思考,換取了這種極致的便利。其他你可能關心的一些問題需要登錄的網站?也能搞定你可能會問:有些網站需要登錄才能操作,Gemini 怎麼辦?答案是:可以用 Google Password Manager。如果你授權了,Gemini 可以用你保存在 Google 密碼管理器裡的帳號,自動登錄網站,然後繼續執行任務。當然,這個功能需要你主動授權,不是默認開啟的。安全機制:敏感操作會暫停確認看到這裡,你可能會有點擔心:這麼強的自動化能力,萬一 AI 做錯了怎麼辦?Google 顯然也想到了這個問題。官方說,他們為 Auto Browse 設計了全新的安全防護機制,針對新型網路威脅做了專門的防禦。更重要的是,敏感操作會暫停並要求你確認。比如:下單付款前,會暫停,讓你確認在社交媒體發帖前,會暫停,讓你確認其他涉及隱私或金錢的操作,都會暫停你始終掌握最終決定權。 Gemini 是幫你幹活的,不是替你做決定的。UCP 協議:讓 AI 購物成為行業標準這個資訊可能比較技術,但值得一提。Google 還宣佈 Chrome 將支援一個叫 UCP(Universal Commerce Protocol,通用商務協議) 的開放標準。這個協議是 Google 和 Shopify、Etsy、Wayfair、Target 等行業巨頭一起制定的,目的是讓 AI 代理能夠在各種電商平台上無縫地代表使用者執行操作。什麼意思?就是說,未來不只是 Google 自己的服務,第三方電商平台也會支援這種"AI 代你下單"的模式。這是一個行業等級的變化。AI 購物不再是某一家公司的專屬功能,而是要變成整個電商生態的標準能力。什麼時候能用?在那能用?說了這麼多,什麼時候能用上?根據官方資訊:平台:MacOS、Windows、Chromebook Plus地區:目前僅限美國使用者:Auto Browse 功能需要 Google AI Pro 或 Ultra 訂閱Nano Banana:所有 Gemini in Chrome 使用者都能用對於國內使用者來說,可能需要自己想想辦法。但不管怎樣,方向已經很清楚了:AI 瀏覽器的時代,真的來了。 (小互AI)
蘋果把Siri推向對話式AI:iPhone與Mac將內建聊天介面,背後是與Gemini的深度繫結
一、蘋果這次想改的,不只是Siri的“腦子”過去幾年,Siri的問題從來不止“回答不夠聰明”。更根本的是,它的互動方式已經落後於人們對AI的最新想像:你對它說一句,它回一句;你換個問法,它往往又像“忘了上文”。在ChatGPT把“可以追問、可以糾錯、可以把對話串起來”變成常識之後,傳統語音助手那套“一問一答”的節奏,顯得越來越像上一個時代的產品。Bloomberg 的描述很明確:蘋果要把Siri做成公司的第一款“AI聊天機器人”,並且會嵌入iPhone與Mac等系統裡,成為更像“入口”的能力。Reuters 的轉述也提到,新形態會支援語音與文字兩種模式,並替換現有介面。換句話說,蘋果這次要動的不是某個功能點,而是Siri的“呈現方式”——它不再只是你偶爾叫一聲的語音開關,而更像一個隨時能對話的系統層服務。這種變化的價值,並不在“能不能寫一段更像樣的文字”,而在於它能否讓使用者形成新的習慣:當你要查資訊、寫東西、整理日程、甚至只是想把一句話改得順一點時,你第一反應不是打開一個應用,而是直接跟系統聊。這才是所謂“入口級改造”的真實含義。二、代號“Campos”,要“內建”而不是單單獨的App多家轉述都提到,這個新Siri在蘋果內部的代號是“Campos”,並且它會“嵌得很深”:覆蓋iPhone、iPad與Mac的系統層,而不是以獨立App的形式出現。這點很“蘋果”。在AI時代,最容易做的是再造一個聊天應用——下載、註冊、開聊;但最難的,是把它變成系統能力:隨時可呼出、跨應用協作、能在合適的時機出現、又不把使用者體驗弄得支離破碎。蘋果歷來擅長做後者:它不一定總是第一個做出新東西的人,但往往能把某種能力“系統化”,讓它變成每台裝置都默認擁有的基礎設施。如果Campos真的取代現有Siri介面,這意味著蘋果準備把對話式AI放到一個更醒目的位置——它不再只是“語音助手升級版”,而是“系統互動的一種新形態”。這也解釋了為什麼報導會強調它將成為iOS 27、iPadOS 27和macOS 27的關鍵賣點:當聊天入口成為系統能力,更新系統就不只是“修修補補”,而是一次新的互動敘事。三、或在今年WWDC露面,是“一次性全給”還是“分批交付”?關於節奏,市場最關心的其實不是“會不會做”,而是“什麼時候能用、首發能做到什麼程度”。目前的說法大體一致:蘋果可能在6月的WWDC把這件事擺上檯面,隨後進入測試,最終在秋季隨新系統推送到使用者手裡。但時間線之外,還有一個更敏感的問題:這次會不會再出現“發佈很驚豔,落地很分批”的情況。過去一年,蘋果在“Apple Intelligence”的推進上,就出現過功能分階段上線、體驗逐步補齊的節奏爭議——使用者當然能理解大工程需要迭代,但當AI競爭的窗口期被拉得越來越短,“先講願景、後慢慢交付”就會讓口碑非常被動。Reuters 的描述提到,蘋果在2024年推出Apple Intelligence後,市場反應並不算熱烈,這也讓這次Siri重做承擔了更強的“翻身”期待。所以,iOS 27 的Campos若真要成為“主角”,它必須在兩個維度上過關:一是穩定性與速度——不能像某些第三方聊天應用那樣“偶爾聰明、偶爾胡來”;二是可用性——首發就要讓使用者感到“這東西真的能常用”,而不是只適合演示。否則,Siri的重做就會變成一次昂貴的試錯。四、為什麼是現在:Apple Intelligence的冷場與外部壓力蘋果顯然意識到,Siri已經不能再靠“小修小補”拖下去。對外界而言,Siri的象徵意義太強:它曾經是智能助手浪潮的代表,但在生成式AI時代卻變成“落後”的代名詞。只要Siri還停留在舊範式,外界就會不斷把蘋果與OpenAI、Google做對比——這種對比,那怕不完全公平,也會真實影響使用者預期。更現實的壓力在於:AI正在把“系統入口”重新洗牌。過去,使用者習慣用搜尋、用App、用語音助手;現在,越來越多人習慣先問一個聊天機器人。對蘋果來說,這種習慣遷移一旦固化,意味著它在iPhone與Mac上的“系統入口優勢”會被稀釋——你依然買蘋果硬體,但你的資訊入口、生產力入口可能越來越不在蘋果的體系裡。從這個角度看,Campos不是“追熱點”,而是“止損”。它要做的事,是把使用者從第三方對話入口拉回系統層,讓Siri重新具備存在感。只不過,蘋果這次面對的不是一個簡單的功能差距,而是一種新的互動標準:對話要更連貫、更能理解上下文、更能處理複雜指令。想追上這套標準,靠傳統Siri那種規則+檢索的體系很難完成,必須借助更強的模型能力。五、借Gemini追速度,蘋果要守住的是邊界這就把問題引向報導中最“關鍵的一句”:新Siri背後將深度使用Google的Gemini。Reuters 與 The Verge 的轉述都提到,蘋果與Google的合作將為這次升級提供支撐,並強調這是一種“定製版”的Gemini能力嵌入系統。從工程角度講,這是一條更務實的路:自己從零訓練一個與ChatGPT、Gemini同等級的大模型,既耗時又燒錢,還要在短期內做出穩定可控的產品體驗,難度極高。與其在“模型能力”上硬拚,蘋果更可能選擇在自己最擅長的地方贏回來:把模型能力變成系統體驗,把對話式AI嵌入到裝置、應用與工作流裡。但“借外腦”也帶來一個繞不過去的邊界問題:蘋果如何繼續維持它長期建立的隱私敘事與控制感。使用者關心的從來不只是“它能不能答對”,還包括“我的資料會不會被拿去訓練、請求會不會被外部看到、那些內容在本地處理、那些必須上雲”。這些問題並不會因為蘋果與Google合作就自動消失,反而會更尖銳。因此,Campos真正的挑戰,可能不在“接入Gemini”本身,而在於“怎麼把外部模型能力裝進蘋果的盒子裡”:體驗要統一、呼叫要克制、邊界要清晰。它既要像聊天機器人那樣好用,又要像系統能力那樣穩定,還要保留蘋果一貫的“可控感”。這三件事缺一件,都會讓這次升級失色。 (視界的剖析)
Fortune雜誌─蘋果Google聯手:一場奇襲
上周,蘋果與Google意外宣佈達成一項人工智慧合作協議,迅速在科技行業掀起軒然大波,並推動Google市值一度突破4兆美元大關。根據協議,蘋果將把Google的AI技術整合到自家的移動作業系統中,包括用於升級Siri語音助手。Google首席執行長桑達爾·皮查伊與蘋果首席執行長蒂姆·庫克。近日,兩家公司宣佈達成一項重大合作協議,蘋果智能相關功能包括新版Siri語言助手將採用Google的Gemini大模型及相關AI技術。圖片來源:Anna Moneymaker—Getty ImagesGoogle重獲AI領先地位自2022年11月OpenAI推出ChatGPT後的近兩年間,Google在AI領域的表現曾備受質疑。在追趕OpenAI的ChatGPT和Anthropic的Claude過程中,這家搜尋巨頭似乎步履維艱。Google的聊天機器人Bard及後續Gemini模型曾在公開場合出現事實錯誤,比如推薦在比薩上塗膠水、生成“黑人納粹”這種有歷史錯誤的圖像。然而,Google最新的Gemini 3大模型已成為市面上最先進的模型之一,獲得了使用者和企業的廣泛認可。Google雲服務也吸引了大批客戶,這與它自研的TPU晶片有一定關係。在運行AI模型時,TPU相比輝達的GPU具備成本與速度上的雙重優勢。蘋果在聲明中稱,經過“審慎考量”,認定Google的AI技術為其基礎模型“提供了最強大的支援”。這對Gemini而言無疑是重要背書,而此前蘋果一直首選OpenAI作為“蘋果智能”的技術供應商。美銀分析師認為,此次合作鞏固了“Gemini作為移動裝置端領先大語言模型的地位”,並有助於增強投資者對Google搜尋業務穩定性及長期盈利能力的信心。AI智能體初創公司創始人、劍橋大學賈奇商學院戰略與政策講師哈姆扎·穆達西爾指出,蘋果的選擇可能不僅基於技術能力的考量。由於蘋果禁止合作夥伴使用其使用者資料訓練模型,穆達西推測,蘋果可能認為,Google所能夠提供資料隱私和智慧財產權方面的保障是OpenAI和Anthropic難以企及的。合作也將為Google帶來直接的營收增長。儘管相關財務細節尚未披露,但據彭博社早前報導,蘋果可能每年會向Google支付約10億美元的技術使用費。不過對Google來說,這項合作更大的意義在於擠進了蘋果的管道。蘋果在全球擁有大約 15億iPhone使用者。通過為新版Siri提供支援,蘋果使用者未來通過Siri進行網購或消費,Google都有望從中獲得一定的分成。長遠看,Gemini聊天應用未來甚至可能預裝到新款iPhone中。對蘋果而言,此次合作有利有弊蘋果首席執行長蒂姆·庫克。圖片來源:David Paul Morris/Bloomberg via Getty Images有利的一面是,蘋果能夠向使用者提供功能更強大的Siri語音助手等功能,成本較低,而且保障了使用者的隱私。韋德布什證券公司分析師丹·艾夫斯表示,該合作為蘋果“加速推進2026年及以後的AI戰略奠定了堅實的基礎”。然而,蘋果仍需依賴外部合作夥伴提供核心AI功能暴露出其短板。擅長垂直整合的蘋果,在自研大語言模型方面卻仍面臨重重困難。生成式AI時代開啟以來,這個難題始終困擾著蘋果。2025年,多項“蘋果智能”功能推遲上線,新版Siri發佈也一再延期。這些延誤不僅損害了蘋果作為科技領軍者的聲譽,也引發了使用者的不滿。甚至有使用者因為iPhone 16廣告中宣傳的AI功能未能如期上線,而對蘋果提起了集體訴訟。蘋果CEO蒂姆·庫克曾承諾2026年推出升級版Siri,外界普遍預期會搭載蘋果自研大模型。但顯然蘋果自有模型尚未準備就緒,最終轉向了Google的技術。未來科技集團的分析師丹尼爾·紐曼指出,長期以來,憑藉龐大的使用者基數和銷售網路,蘋果在追逐AI等新趨勢時可以更從容,但2026年對蘋果來說是“成敗攸關的一年”。日前,庫克已經對公司的管理層進行了人事調整,任命一位曾參與GoogleGemini項目的高管負責AI業務。如果蘋果智能的延期發佈確實與隱私與安全有關,那麼使用者的等待或許是值得的。理想情況下,蘋果希望打造一個既能媲美頂尖模型,又能完全在iPhone上本地運行,而不需要將使用者資料上傳到雲端。穆達西爾認為,蘋果可能正攻克模型功耗與散熱等技術難題。與Google合作,既可以為蘋果爭取時間,在模型壓縮與架構設計方面實現突破,又能夠在一定程度上緩解來自華爾街的壓力。部分支援蘋果的人指出,蘋果從來不是新技術的先行者,例如世界上第一款MP3播放器、智慧型手機、無線耳機、智能手錶,都不是蘋果發明的,這家科技巨頭卻總能憑藉設計創新和行銷策略而後來居上。蘋果也有從合作夥伴學習關鍵技術而後自研的傳統,如晶片。而在搜尋領域,蘋果Safari瀏覽器長期整合Google搜尋,並未自研,也沒有影響其發展。未來蘋果在AI領域是否會複製這樣的模式,尚待觀察。對OpenAI無疑構成利空OpenAI首席執行長山姆·奧爾特曼。圖片來源:Florian Gaertner/Photothek via Getty Images蘋果與Google的合作並非排他性協議,意味著蘋果可能仍然會在部分“蘋果智能”功能中採用OpenAI的模型,但蘋果選擇與Google合作,對OpenAI來說無疑是一記重擊。這強化了一種觀點:Google不僅追上了OpenAI,更在模型能力上實現反超。一旦失去蘋果生態,OpenAI將難以實現使用者群的進一步增長。目前,OpenAI聲稱它的周活躍使用者超過8億人,但近期資料顯示增長可能放緩。OpenAI首席執行長山姆·奧爾特曼曾稱,許多人已經將ChatGPT視為AI的代名詞。但是在蘋果使用者通過Siri體驗過Gemini模型的出色性能之後,這種認知可能會發生改變。奧爾特曼上月對媒體表示,他認為蘋果是OpenAI的長期主要競爭對手。OpenAI正聯合蘋果前首席設計師喬尼·艾夫研發新型AI裝置,旨在挑戰智慧型手機作為AI助手主要載體的地位,這款裝置有望在今年亮相。以前,只要蘋果還依賴ChatGPT為Siri提供技術支援,OpenAI就能清晰瞭解競爭對手的能力。但今後,OpenAI恐怕很難再深入瞭解蘋果AI的進展,從而難以將其新產品定位為“iPhone殺手”。OpenAI希望通過這款新裝置,將使用者牢牢鎖定在自己的系統中,這種做法有些類似於蘋果硬體+iOS的閉環生態,能夠有效防止使用者流向功能相近的競品。另外,OpenAI還要繼續推進技術突破,從而具備超越Google的決定性優勢,並長期保持。唯有如此,OpenAI才有可能促使蘋果未來重新加大對它的技術依賴。又或者,彎道超車的OpenAI,或許真的有可能憑藉一款跨時代的AI硬體,終結對蘋果裝置和管道的依賴。(財富中文網)編者語曾被質疑落後的Google,憑藉TPU晶片、Gemini模型和雲生態的綜合優勢,贏得了最挑剔的客戶蘋果的認可,標誌著AI競賽已從模型能力的單點比拚,升級為“晶片—模型—雲—生態”的全鏈條對抗。選擇GoogleGemini驅動Siri,而非堅守“全端自研”,證明在AI時代,頂尖的技術實力與擁有龐大使用者的硬體生態結合,才能形成更強的競爭力。對於建構生態圍牆的中國手機廠商與AI公司,開放合作也是一個打開市場空間的可選項。 (財富FORTUNE)