#Chrome
自帶 Nano 改圖,一鍵總結 N 個網頁!Chrome 這次更新,讓所有 AI 外掛都下崗了
講真,作為每天和瀏覽器打交道超過 10 小時的“重度衝浪選手”,Chrome 幾乎就是我的第二個辦公桌。自打 AI 爆火之後,為了提效,我這瀏覽器右上角就沒清淨過。我裝了五花八門的外掛:有的專門用來總結長文章,有的用來跟網頁對話……但懂得都懂,沒有一個真的特別好使。直到昨天,Google 親手扔下了一個“核彈級更新”,我瞬間覺得:那些折騰了半天的 AI 外掛,終於可以通通刪掉了!(具體的開啟教學我放在文末了)。圖:Chrome 中整合的 Gemini這次 Chrome 的進化,絕不僅僅是多了一個總結網頁的小工具那麼簡單。它是直接把最強的 Gemini 3 “焊”進了核心裡,讓瀏覽器從一個單純的“閱讀器”,變成了一個真正能替你幹髒活、累活的“數字分身”……01 側邊欄進化:第三方外掛通通可以“下崗”了說實話,AI 側邊欄這東西,大家早就司空見慣了。不管是國外的外掛,還是中國的 Kimi、智譜,早就能讓你一邊看網頁一邊總結、對話。但這次 Chrome 原生的 Gemini 側邊欄,真的讓我想把那些第三方外掛都卸了。因為除了常規操作,它至少有 3 個讓我大喊“臥槽”的狠招:總結網頁只是基本功: 別人能做的它都能做,而且反應速度極快,畢竟是親兒子。圖:Chrome 側邊欄總結網頁你可能不服,這不都能做嗎?Gemini 真正厲害的地方在於,它能同時總結 N 個打開的網頁。以前我想看幾篇文章的摘要,得每個頁面點一次外掛,手都點酸了。現在,它能一次性把所有打開的網頁全讀完,直接甩給我一份彙總好的摘要。(最臥槽的是,你可以讓它用這 N個網頁為素材直接寫篇文章,自媒體人要起飛了!))圖:Chrome 的側邊欄同時總結 N 個網頁再比如我想買個降噪耳機,在京東上開了十幾個產品頁,看得眼花繚亂。現在簡單了,直接讓它幫我全網比價、挑毛病,最後告訴我那款最值得下單。圖:Chrome 側邊欄在 JD 頁面做比價這才是真正的“省心神器”,再也不用在幾十個標籤頁裡反覆橫跳了。視訊“快進鍵”的終結者: 這點最牛。你在看 YouTube 視訊時,它不僅能幫你出總結,最離譜的是它能自動切片。它會把視訊分成好幾個關鍵段落,你看到感興趣的點,點一下文字,進度條直接跳到那個位置。圖:Chrome 側邊欄直接總結視訊並做切片以前看個長視訊得手動拖進度條,現在感覺是 AI 牽著你的手,直接把精華送到你嘴邊。不過有一說一,這功能目前還是有點“偏心”,對 YouTube 的支援簡直是親兒子等級。我也試了下 B 站,雖然也能總結出大概意思,但少了那個最靈魂的“自動切片”,就像吃泡麵沒調料包,效果大打折扣。這些結果可以直接通過 Gmail 發郵件出去,而且這次還把日曆、YouTube、地圖等全部整合進來了。不得不說,Google把自家“全家桶”整合起來的殺傷力真的無敵,這種“自家產品互相開掛”的操作,才是這次更新最頂的地方。02 Nano Banana:這那是瀏覽器,這是隨身帶了個 PS以前在網上看到一張圖想改一改,你得先下載,再開修圖軟體,折騰半天再重新匯出。現在 Chrome 側邊欄直接把 Nano Banana 整合進來了,簡單來說,它就像在瀏覽器裡裝了個“一鍵整容”按鈕。我試了幾個場景,簡直是懶人福音。比如你看到一張色彩鮮豔的素材圖,想看看一張照片變成復古黑白風是什麼效果,不用找濾鏡,在側邊欄說句話就行。圖:Chrome 側邊欄直接修改圖片更神的是,如果你對著一張空蕩蕩的房間照片,想腦補一下裝修後的樣子,直接讓它往裡“塞”滿家具。上一秒還是冷冰冰的毛坯房,下一秒就能變出北歐風的溫馨感。圖:Chrome 側邊欄直接修改圖片甚至當你面對一整個網頁密密麻麻的資料頭大時,直接喊它把網頁內容生成一張精美的資訊圖,這對於每天做 PPT 的人來說,簡直是救了命了。圖:Chrome 側邊欄生成資訊圖這種“即看即改”的操作,以前得折騰好幾個 App,現在動動嘴皮子就在瀏覽器裡順手辦了。03 終極殺招:它不是在聊天,是在替你“上班”如果說前面的功能只是讓你“看得爽”,那接下來的 Auto browse(自動瀏覽) 簡直是讓 Chrome 長出了手腳。我試了幾個官方案例,確實有點科幻。比如最枯燥的自動填表,你只需把資料甩給它,它能自動識別並把另一個表單填得整整齊齊。更神的是,比如你想辦個主題派對,看到一張氛圍感拉滿的佈置圖,不用你肉眼去搜同款。它能直接識別圖裡的復古電視、氣球、裝飾品,去電商網站搜出同款並一鍵塞進購物車,連券都領好了,你只管付錢。甚至連訂酒店、查航班這種瑣事,它都能根據你的要求直接出一套最優方案。不過,我也得說句大實話: 這一招目前對國外網站確實很猛,但我實測發現,它還沒學會怎麼逛京東、淘寶或攜程,基本處於“罷工”狀態。(所以這裡用了官方的案例)雖然這種“數字替身”的未來很爽,但中國使用者不知道啥時候能享受到。04 隱藏教學:怎麼強先開啟這個“黑科技”?看到這兒,估計大家手裡的外掛已經按捺不住要刪了。不過目前這些功能還在灰度測試中,如果你想現在就體驗,可以試試這套“極客開啟方案”:第一步:開啟隱藏開關(Flags)先升級 Chrome 到最新版,然後在網址列輸入 chrome://flags/  進入實驗室。在搜尋框輸入 “glic”,把搜出來的這五項全部從 Default 改成 Enabled:GlicGlic Z Order ChangesGlic actorGlic Pre-WarmingGlic FRE Pre-Warming圖:開啟 Chrome 的相關選項點選右下角的 “Relaunch”(重新啟動)即可。第二步:如果還沒出來,試試這幾條“黑指令”如果你重啟了還沒看到 Gemini 出現,那說明被地域限制鎖死了。這時候需要先徹底退出 Chrome,然後打開終端(Terminal)執行下面這幾行命令,直接給它來個“強制開啟”:💡 小提示: 執行前建議先備份。命令中的 ~/Library/Application Support/Google/Chrome/ 路徑適用於 Mac 使用者。另外,你的 Chrome 需要設定為英文,而且 IP 地址必須設定為美國。這一頓操作之後再次打開 Chrome,你就能看到那個能替你“上班”的數字分身了。寫在最後不得不感嘆,2026 年開年這一個月,AI 圈的節奏快得讓人窒息。特別是這兩天全網刷屏、幾乎把智能體推向神壇的 ClawdBot(Moltbolt),大家應該都看出來了:“智能體(Agent)”化已經是大勢所趨。以往是我們“用”瀏覽器去找資訊,現在是 AI 正在“接管”瀏覽器去辦實事。而這次 Gemini 與 Chrome 的深度融合,意義完全不同。畢竟 Chrome 是全球幾十億人的裝機必備,它這次的“超進化”,意味著 AI 這種處理資訊的方式,正在從極客的小眾玩具,徹底變成普通人觸手可及的日常工具。雖然現在對中國 App 的適配還沒那麼絲滑,但這種“有人幫我幹活”的未來,確實已經近在咫尺了。最後互動一下:如果 AI 真的能替你處理掉所有無聊的填表、訂票、比價工作,你最想用省下來的時間幹點啥? (AI范兒)
GoogleChrome史詩級更新!Gemini 3原生植入,瀏覽器終於能“自己動”了?
Chrome 瀏覽器剛剛迎來了一波史詩級加強!Google官方剛剛宣佈,將最強的 Gemini 3 模型直接塞進了 Chrome 裡。注意,這次不是在側邊欄加個簡單的對話方塊,而是引入了真正的 Agentic AI 能力。簡單來說:以前你的瀏覽器是用來“看”網頁的,現在的瀏覽器,真的能自己“上網”幹活了。01 真正的“自動駕駛”:Auto Browse這是本次更新的重頭戲——Auto Browse(自動瀏覽)。基於 Gemini 3 的多模態能力,Chrome 現在可以處理複雜的多步驟工作流(Multi-step workflows)。它不再只是給你吐出文字建議,而是像一個真實的私人助理一樣,幫你點選連結、尋找資訊、填寫表單,甚至處理那些極其繁瑣的“髒活累活”。舉個簡單的例子:假設你要舉辦一場 Y2K 復古主題派對,但不知道買什麼裝飾品。以前你需要:去小紅書/Pinterest找靈感 → 截圖 → 去淘寶/亞馬遜搜同款 → 比價 → 加購物車。現在,你只需要給 Auto Browse 一張參考圖:“Gemini,幫我看看這張圖裡都有什麼,然後幫我搜同款,要便宜的,直接加進購物車。”Gemini in Chrome能夠理解你的創意構想,幫你尋找非常具體的派對裝飾品並將其加入到購物中Gemini 3 會利用其視覺能力識別圖片中的物品,自動在電商網站搜尋相似款,利用優惠碼確保不超預算,甚至最後一步直接幫你把東西放進購物車。如果不只是買東西呢?根據Google的內測,測試者們已經開始用它來幹這些事了:全網比價:自動查詢不同日期的酒店和機票價格,不僅是看,而是幫你規劃。可以幫你找到合適的公寓,並根據你的條件篩選結果可以根據對酒店和航班的要求,為你推薦最佳的周末住宿方案。填表狂魔:自動填寫繁瑣的線上表格,甚至幫忙報稅。可以根據PDF檔案中的資訊自動填寫表單生活瑣事:給水管工查報價、管理訂閱服務、甚至更新駕照。一句話總結:那些你不想幹的重複性勞動,現在瀏覽器全包了。當然,我知道大家擔心什麼——安全。Google也強調了“Security by design”。對於敏感操作(比如付款、在社交媒體發帖),Auto Browse 會自動暫停,必須經過你的明確確認才會執行。它能幫你省心,但不會自作主張亂花你的錢。自動瀏覽功能能讓你隨時瞭解最新情況,並要求你確認敏感操作02 側邊欄進化:不切屏,才是真效率為了配合強大的 AI 能力,Chrome 這次還推出了全新的側邊欄體驗(Side Panel Experience)。不知道大家有沒有這種痛苦:寫論文/寫程式碼的時候,為了查一個資料,切出去開了個新標籤頁,然後不知不覺就開始刷別的東西,半小時回不來。現在的 Gemini 側邊欄,主打一個“伴隨式服務”:你可以在主窗口保留你的核心工作(比如正在寫的文件),然後在側邊欄喚起 Gemini 處理雜事。比如:多方比價:不用開10個電商頁面來回切,直接在側邊欄讓它把不同網站的產品優缺點列出來。總結評論:打開亞馬遜商品頁,側邊欄直接告訴你“這東西大家覺得那裡不好”。日程管理:在混亂的日曆裡幫你找空閒時間,而你不需要離開當前的網頁。瀏覽器中的 Gemini 會在側邊欄打開,方便進行多工處理一句話總結:它就像坐在你旁邊的實習生,你只管主線任務,支線任務丟給它,不用切屏,不用打斷心流。03 Nano Banana:網頁圖片,原地“整容”他們很久之前發佈了一個名字很怪、但功能很暴力的模型:Nano Banana。這是一個直接整合在 Chrome 裡的圖像生成/修改能力。它的核心賣點是 “On the fly”(即時修改)。以前我們在網頁上看到一張圖,想改一下,得先“右鍵另存為”→“打開PS/美圖秀秀”→“修改”→“上傳”。現在?根本不需要下載。你只需要在側邊欄輸入一句 Prompt(提示詞),告訴它你想怎麼改,網頁上的那張圖就會原地變形。無需複製貼上或重新上傳;使用 Nano Banana 在當前瀏覽器窗口中轉換圖像比如這張客廳的照片,你可以直接讓 Gemini 給它換個“現代風”裝修,或者把一份枯燥的資料圖表直接轉化成一張精美的資訊圖。這就很適合做設計、做PPT的朋友,找素材的時候,沒有合適的?直接讓瀏覽器給你“捏”一張出來。04 打通全家桶 & 什麼時候能用?最後,作為Google親兒子,Chrome 這次徹底打通了 Connected Apps(關聯應用)。Gemini 可以直接呼叫你的 Gmail、日曆、地圖、YouTube 甚至 Google Flights 的資料。舉個場景:你要去開會,但是忘記航班資訊了。 Gemini 可以幫你從幾個月前的舊郵件裡把航班資訊挖出來,結合地圖給你推薦行程,最後幫你草擬一封郵件告訴同事你幾點到。可以與其他 Google 應用(例如 Gmail)配合使用📍 如何體驗?根據官方消息,這些更新正在向 MacOS, Windows 和 Chromebook Plus,AI Pro/Ultra 使用者陸續推送。如果你手裡的 Chrome 還沒收到更新,不妨去檢查一下版本,或者再耐心等等。 (奇點前哨)
Google深夜放大招!把Chrome做成AI作業系統,以後上網真不需要手了
今天凌晨2點,Google宣佈對macOS、Windows系統及Chrome book Plus裝置的Chrome瀏覽器進行重大更新,整合最新大模型Gemini 3。簡單來說,現在的Chrome不再只是個用來上網的工具,更像是一個能替你自動幹活的私人AI作業系統。很多很多重複、繁瑣的工作都能自動化了,甚至不用你開口就辦妥了。Chrome這次真的搞了個大動作,咱們來好好聊聊它帶來哪些新創新。這次最實用的更新之一就是這個側邊欄,不管你打開多少個標籤頁,Gemini都能常駐在側邊欄跟著你。以前處理事情總愛開一堆標籤頁,對比資訊、看評價的時候來回切,越切越亂還容易忘事。現在就不一樣了,主標籤頁專心做核心工作,側邊欄同步處理其他事就行。有的用來對比不同平台的商品選項,有的彙總全網的產品評價省得一個個點開看。還可以用它梳理亂糟糟的日程表,把零散的活動時間都歸置清楚。這種不打斷思路的多工體驗,用過之後真的回不去了。另外一個驚喜是Nano Banana的創意功能也整合進來了,以前想改張網頁上的圖,得先下載下來,再打開修圖軟體折騰,改完還得重新上傳,步驟繁瑣到想放棄。現在不用這麼麻煩了,直接在Chrome側邊欄輸入你想改的效果就行,不用切換任何頁面,即時就能看到修改結果。比如我想給客廳翻新找靈感,就把網上看到的戶型圖在側邊欄改一改風格;整理工作資料的時候,也能快速把表格轉成直觀的資訊圖表。小白也能輕鬆上手,不用懂任何修圖技巧。Gemini還能和Gmail、日曆、YouTube這些Google常用應用深度配合,相當於把這些工具的能力都整合到一起了。舉個例子,我之前要去外地參加會議訂機票,以前得先翻信箱找會議時間地點,再打開Google航班查票價選時間,最後還得發郵件跟同事說行程。現在只要跟側邊欄的Gemini說一聲,它會自己調出郵件裡的會議詳情,結合航班資訊給我推薦合適的班次,訂完票還能自動幫我擬好郵件草稿。Gemini應用裡最新的“個人智能”功能之前就圈了不少粉,再過幾個月這個功能也會登陸Chrome。最讓人放心的是,這個功能全程都由自己掌控,想聯動哪些應用、不想讓它訪問哪些內容都能自己定,不想用了隨時能關掉。會記住你之前的對話內容,後續再查相關問題的時候,給出的答案會更貼合你的需求。你也可以提前跟它說清楚自己的偏好,比如喜歡簡潔的回答或者詳細的教學,它都會照著來。相當於瀏覽器從一個冷冰冰的工具,變成了懂你習慣的AI夥伴,不用每次都重複說明需求。Chrome的自動填充功能大家應該都用過,填地址、信用卡資訊確實方便。這次的自動瀏覽功能直接升級了,不再侷限於簡單的資訊填寫,能幫你處理複雜的多步驟任務。能幫你做的事特別多,規劃假期的時候,會對比不同日期的酒店和機票價格,幫你找到性價比最高的出行時間。更厲害的是處理複雜需求,比如想辦一場千禧年主題派對,看到一張喜歡的主題圖,它能識別圖裡的元素,幫你搜同款裝飾用品加入購物車,還會幫你控制預算自動用優惠碼。只要你授權,就算需要登錄帳號,它也能通過Google密碼管理器完成操作,全程不用自己動手。值得一提的是,Chrome後續會支援Google的通用商務協議,這個協議是Google和Shopify、Etsy這些大平台一起研發的開放標準。就是有了這個標準,AI能更順暢地幫你處理購物、預訂這類事務,不會因為不同平台的規則不一樣出現卡頓或者操作失敗的情況,後續用AI代辦商務相關的事會更靠譜、方便。說實話,看完這些更新,我最大的感受就是Chrome瀏覽器已經徹徹底底變成了一個作業系統,相信以後Google會陸續把更多的超強實用功能搬上來。網友表示,這比一般的更新要大得多。內建於Chrome的Gemini 3實際上改變了您的瀏覽方式。感覺瀏覽器一直以來都沒什麼變化,而這次終於有所不同了。這將把Chrome瀏覽器提升到一個全新高度。雖然我已經有一段時間沒用Chrome 了,但我可能會重新用它看看。Google簡直把所有人都吞噬了,功能上的絕對統治力,我太喜歡了!!(經管之家)
Google 王炸更新 Gemini 和 Chrome 合體 絞殺一切競爭對手...
很多人一直吐槽 Google,Gemini 那麼強了,人家都推出了AI瀏覽器,為什麼Chrome 卻一直還是原地踏步?Google 到底在幹嘛?現在它終於來了Gemini 和 Chrome 合體了...Google 剛剛發佈了基於最新 Gemini 3 模型的 Chrome 重大更新,這不僅僅是一個外掛或側邊欄的升級,而是對瀏覽器核心邏輯的重構。Chrome 正在從一個被動的“網頁瀏覽工具”,進化為一個能夠主動思考、替你幹活的“智能代理(Agentic AI)”。說實話,以前咱們用 AI 得經歷多少步驟?先開網頁、登帳號、想 Prompt,萬一網速不給力還得轉半天圈圈。要是想讓 AI 總結個網頁,還得在那兒苦哈哈地複製貼上,簡直麻煩得要死。這次升級後,Chrome 基本上變成了 Gemini 的“完全體容器”。Google 這次是打算把 AI 直接縫進你的瀏覽肌肉裡,甚至要開啟“無人駕駛”模式。這就帶大家看看,Google 這次到底在構思什麼“大殺器”。👇先文字長的,看視訊介紹:Side Panel:從“彈窗”變成“常駐協作者”Google 給 Chrome 加了一個新的 側邊欄(Side Panel)。Side Panel不只是一個簡單的聊天框,它變成了一個全能的指揮中心。以前用 AI,你得切出去,複製貼上,再切回來。現在?它就住在你手邊無論你打開那個標籤頁,Gemini 都隨時可用而且最重要的是:它能看懂你在看什麼多工處理神器:你可以一邊在首頁面寫方案、看資料,一邊讓側邊欄裡的 Gemini 去對比多個網站的產品資訊、彙總評價、提煉結論。比如你正在瀏覽幾個不同的數位產品頁面,你可以讓側邊欄裡的 Gemini 直接生成一個“橫向對比表”,把這幾個網頁的參數全部抓取並整理出你可以在首頁面繼續當前工作同時在側邊欄讓 Gemini 處理另一項任務不打斷、不切換、不複製貼上內建Nano Banana:螢幕上的圖片,直接改這是 Google 在端側 AI 上的新突破。你可以在瀏覽器裡直接對網頁上的圖片進行處理。以前你想看看一件家具放在房間裡是什麼效果,得先下載圖片、上傳到編輯器、祈禱效果還行……現在不用了。你可以直接指著螢幕上的圖片,讓 Gemini 修改...比如你看到一個房間的照片,想看看它更換裝修風格的樣子,你可以說:"幫我把這個房間換成淺色現代風家具。"它就直接生成了。不需要下載,不需要上傳,所見即所改。Google Workspace 深度打通Gemini 和 Google 全家桶的聯動也更深了。演示裡有個場景:你在看一份課程大綱(比如某個讀書會的書單),需要給學習小組發一封郵件,介紹一下要讀的書。以前怎麼做?1.看大綱,記住書名2.切到 Gmail,新建郵件3.切回大綱,複製書名4.切到 Gmail,貼上5.想寫介紹?再去搜一下這本書講什麼6.來回切換到頭暈……現在呢?你讓 Gemini 讀當前頁面的大綱,然後說:"從裡面挑三本書,寫個簡短介紹,用真人秀的風格寫,幫我起草一封郵件。"Gemini 直接從當前頁面提取資訊,在側邊欄裡把郵件寫好,連書的簡介都給你編好了(而且還是真人秀風格的,帶點戲劇性)。你全程不需要離開正在看的頁面。 大綱在主窗口,郵件在側邊欄,一心二用,效率翻倍。寫完之後,它還可以呼叫 Gmail,直接一鍵傳送。搞定。這種"讀當前頁面 + 執行另一個任務"的能力,才是 AI 真正融入工作流的樣子。Connected Apps:Google 全家桶深度打通接下來這個功能,打工人狂喜。Gemini 不只是跟 Chrome 聯動,而是跟整個 Google 生態打通了。官方叫它 Connected Apps(關聯應用)。目前支援的應用包括:Gmail(郵件)Google Calendar(日曆)YouTubeGoogle Maps(地圖)Google Shopping(購物)Google Flights(航班)這些應用可以在 Gemini 設定裡一鍵開啟。這意味著啥?舉個例子:你要出差參加一個會議,需要訂機票。以前怎麼做?翻郵件找會議時間 → 打開機票網站搜航班 → 比價 → 訂票 → 再寫郵件告訴同事你的到達時間……現在呢?你跟 Gemini 說一句:"幫我查一下下周那個會議的時間,推薦幾個航班,然後寫封郵件告訴同事我的到達時間。"Gemini 自己去翻你的郵件找會議詳情,自己去 Google Flights 查航班,自己幫你起草郵件。一句話,三件事,全搞定。個人智能 Personal Intelligence:越用越懂你這個功能目前還在預告階段,但聽起來非常值得期待:Personal Intelligence(個人智能)。允許 Chrome 記住你的偏好記住過去的對話上下文支援自訂指令提供更“像你助理”的回答簡單說,就是 Gemini 會記住你之前的對話上下文,然後基於這些記憶,給你更個性化的回答。比如你之前跟它聊過你喜歡什麼風格的酒店、你的預算範圍、你對航班時間的偏好……下次你再問它"幫我訂個酒店",它就不會從零開始問你一堆問題,而是直接根據你的偏好給推薦。從一個通用工具,變成一個懂你的私人助理。當然,Google 強調這個功能是使用者主動開啟的,你可以選擇連接那些應用,也可以隨時斷開。隱私控制權在你手裡。真正的核武:Auto Browse(自動瀏覽)上線!好,前面都是開胃菜。接下來這個功能,才是這次更新的真正炸裂之處↓Gemini 開始"接管方向盤"這是我最想吹爆的功能,沒有之一!以前 AI 只能“動嘴”,現在它能“動手”了。這就是所謂的 AI 正式接管“方向盤”。這是什麼概念?Gemini 不再只是"回答問題",而是真的能像人一樣打開網頁、點選按鈕、填寫表單、替你完成任務。場景一:訂酒店演示裡,使用者說:"我想去芝加哥,住某某酒店,幫我查一下這幾個周末的價格,還有一些其他要求。"Gemini 直接打開 Expedia,自己開新標籤頁,自己點日期選擇器,自己篩選條件,最後把搜尋結果整理好呈現給你。不是給你一個連結讓你自己去看,是它替你完成了整個搜尋流程。場景二:篩選公寓在 Redfin(美國找房網站)上,使用者說:"幫我看看我的最愛裡的公寓,把不允許養寵物的刪掉,然後把 Gabriel 加為協作者。"Gemini 打開收藏列表,點進每個房源,看細則,檢查寵物政策,不符合的自動移除,最後還幫你邀請了室友。一個小時的繁瑣操作,變成一句話。場景三:填表格使用者有一份 PDF 格式的球隊名單,要給一個線上報名系統填表。以前這是複製貼上的地獄。現在?"用名單裡的資訊,幫我報名,填上他們的名字和位置。"Gemini 從 PDF 裡提取資料,自動填進表單欄位。手工活,自動化了。想像一下這個場景:你想去大理旅遊,但你懶得翻攜程、看去那兒、查攻略。你只需要對側邊欄的 Gemini 說:“幫我查下 3 月中旬上海去大理最便宜的機票,順便搜下雙廊附近 500 元以內、評分 4.5 以上、帶露台的民宿。”接下來神奇的一幕發生了:瀏覽器會自動開啟一個新的“發游標籤頁”,你能看到它自己在搜尋框打字、自己在點滑鼠、劃螢幕、翻頁面。它不是在呼叫 API,而是在像人一樣替你上網。查完之後,它會在側邊欄給你列出一張清晰的對比表,甚至連預訂表單都能幫你填好大半,你只需要點個“支付”。這那是瀏覽器啊,這簡直是請了個全能小秘書。😂視覺購物:看圖下單,預算可控最後一個演示,是我覺得最"未來感"的一個。場景是這樣的:使用者看到一張 Y2K 風格派對佈置的照片(就是那種千禧年復古風),想復刻這個佈置。以前怎麼做?自己盯著圖,分析裡面有什麼東西——氣球、綵帶、背景布、裝飾道具……然後一個一個去電商網站搜,比價,加購物車,算總價,超預算了再刪幾個……現在呢?你跟 Gemini 說:"去 Etsy,幫我找到能復刻這個佈置的東西,加到購物車,預算不超過 75 美元。"Gemini 先用 Gemini 3 的多模態能力分析圖片內容(氣球是什麼顏色、背景簾是什麼款式、有那些道具),然後去 Etsy 搜尋對應商品,自己比價,自己控制預算,最後把商品加進購物車。更絕的是,官方還提到:Gemini 會自動幫你找優惠碼並應用上去。你打開購物車的時候,發現東西都選好了,總價正好卡在預算線上,優惠碼也用上了。從"我想要這個效果"到"購物車已就緒",一句話的事兒。這不是"幫你搜東西",這是"幫你買東西"。 購物體驗直接跳過了中間所有的繁瑣步驟。小互的思考:這背後的狠招是什麼?我覺得,這次升級其實暴露了Google 的一個陽謀:它想把瀏覽器變成 AI 時代的新型作業系統,從而截殺所有想分流的對手。為什麼這麼說?以前我們要用 AI,可能會去搜 ChatGPT,或者去用 Arc 這種號稱“AI 瀏覽器”的新玩意。Google 這一波操作,意思很明確:既然全球 60% 以上的人都在用 Chrome,那我為什麼不直接把 AI 變成空氣呢?它要讓你形成一種“肌肉記憶”——凡事不決問網址列,凡事想寫點啥點右鍵。這其實是在利用生態位進行防守反擊。還有一點是:Gemini 3 開始佈局 “Personal Intelligence(個人智能)”。只要你授權,它能讀你的 Gmail 郵件、看你的 Google 日曆、翻你的雲端硬碟。這意味著它比你更懂你自己。未來你將離不開它,遷移成本更加高!它不再是在提供搜尋結果,它是在直接提供決策結果。以前我們要搜“我的行程”,現在直接問它“我明天幾點出發去機場最合適”,它能自動結合你的機票確認郵件、即時的交通路況、甚至明天的天氣,直接給你一個最終答案。這其實是一個非常恐怖的閉環。Google正在把你所有的數字生活都圈在 Chrome 這個金魚缸裡。這曾經是 OpenAI 的主要競爭力,現在看來蕩然無存了!但這也有個潛在的代價,那就是你的瀏覽行為、你的歷史記憶、你的搜尋偏好,甚至你在網頁上輸入的每一個字,都在Google  AI 的“喂養”之下。雖然效率起飛了,但這種隱私的“裸奔感”,換個角度看,其實挺讓人唏噓的。我們是用一部分隱私和自主思考,換取了這種極致的便利。其他你可能關心的一些問題需要登錄的網站?也能搞定你可能會問:有些網站需要登錄才能操作,Gemini 怎麼辦?答案是:可以用 Google Password Manager。如果你授權了,Gemini 可以用你保存在 Google 密碼管理器裡的帳號,自動登錄網站,然後繼續執行任務。當然,這個功能需要你主動授權,不是默認開啟的。安全機制:敏感操作會暫停確認看到這裡,你可能會有點擔心:這麼強的自動化能力,萬一 AI 做錯了怎麼辦?Google 顯然也想到了這個問題。官方說,他們為 Auto Browse 設計了全新的安全防護機制,針對新型網路威脅做了專門的防禦。更重要的是,敏感操作會暫停並要求你確認。比如:下單付款前,會暫停,讓你確認在社交媒體發帖前,會暫停,讓你確認其他涉及隱私或金錢的操作,都會暫停你始終掌握最終決定權。 Gemini 是幫你幹活的,不是替你做決定的。UCP 協議:讓 AI 購物成為行業標準這個資訊可能比較技術,但值得一提。Google 還宣佈 Chrome 將支援一個叫 UCP(Universal Commerce Protocol,通用商務協議) 的開放標準。這個協議是 Google 和 Shopify、Etsy、Wayfair、Target 等行業巨頭一起制定的,目的是讓 AI 代理能夠在各種電商平台上無縫地代表使用者執行操作。什麼意思?就是說,未來不只是 Google 自己的服務,第三方電商平台也會支援這種"AI 代你下單"的模式。這是一個行業等級的變化。AI 購物不再是某一家公司的專屬功能,而是要變成整個電商生態的標準能力。什麼時候能用?在那能用?說了這麼多,什麼時候能用上?根據官方資訊:平台:MacOS、Windows、Chromebook Plus地區:目前僅限美國使用者:Auto Browse 功能需要 Google AI Pro 或 Ultra 訂閱Nano Banana:所有 Gemini in Chrome 使用者都能用對於國內使用者來說,可能需要自己想想辦法。但不管怎樣,方向已經很清楚了:AI 瀏覽器的時代,真的來了。 (小互AI)
救命!AI瀏覽器都捲成這樣了,怎麼大家還是用Chrome啊?
【新智元導讀】瀏覽器之爭已不單是速度對決!新玩家Atlas與Comet能替你訂票購物,AI代理時代已至;然而老大哥Chrome憑71%份額穩坐釣魚台。未來,是擁抱全能助手的便捷,還是警惕安全漏洞的深淵?決勝局就在此刻!你上網的時候,通常用什麼瀏覽器?Edge,Chrome,還是其他?有一股AI新勢力,開始對這些老牌瀏覽器發起挑戰。就在我們習慣了網址列搜尋、標籤頁切換時,一股AI新勢力正悄然潛入。它們不滿足於只做一個展示網頁的容器,而是想成為你的私人秘書,甚至是替你在網路世界的「替身」。爭奇鬥豔:AI新玩家亮出絕活這場大戰的開端,源於兩款激進的新產品。你的私人AI秘書:ChatGPT Atlas2025年秋天,OpenAI推出了名為ChatGPT Atlas的瀏覽器。它基於Chromium核心,把ChatGPT直接建在瀏覽器裡。在瀏覽網頁時,可以隨時拉出側邊欄問問題,它會記住你的瀏覽歷史,幫你完成多步任務,比如研究東西、自動購物或整理資訊。「瀏覽器記憶」功能,可手動選擇是否開啟。開啟這個功能後,瀏覽器能記住你之前看的房子、求職資訊、旅行計畫,下次直接接著聊。最亮眼的還是代理模式。對它說「幫我計畫周末去上海」,它能自己開標籤搜機票、比酒店、填表單。當然,重要決策還是由你決定。Perplexity Comet:超級研究與購物助手緊隨其後的Perplexity Comet則是另一副面孔。它更像是一個不知疲倦的研究員,主打「一邊瀏覽,一邊調研」。上網時,Comet的助手會陪你一起瀏覽,即時回答問題、自動化任務、總結頁面、生成帶來源的報告。如果問它「這個手機值不值得買」,它能立刻在側邊欄甩出一份對比表格,帶上優惠券資訊和全網評價。當Comet Assistant 識別出某項任務很重要,例如登錄特定網站或完成購物車中的購買——它會暫停操作,並在繼續執行前徵得您的許可。Microsoft  Copilot:穩紮穩打的跟隨者傳統的領路人Microsoft Edge也沒閒著,它依靠Copilot穩紮穩打,在Windows生態的掩護下,成了不少辦公族最穩妥的AI助手。圍城內外:老大哥Chrome的護城河看了這些眼花繚亂的功能,你可能會想:Chrome這下要被擠下寶座了吧?其實遠沒有。到2026年初,Chrome依然佔據著全球約71%的市場份額,穩坐釣魚台。原因也很簡單:它在Android手機和Windows電腦上是默認選項。速度快、擴展多、帳號同步無縫,億萬使用者已經養成習慣,想換沒那麼容易。Google也沒坐以待斃。從2025到2026年,Gemini迎來好幾波重大更新,連安裝包都不用下,就能體驗到更聰明的Chrome。不需要下載任何新應用,只要在網址列提問,Gemini 就能跨標籤整理資訊,甚至幫你總結一段視訊。它還能跨標籤找資訊、自動處理一些簡單任務,比如總結視訊或找回以前瀏覽過的頁面。最近幾個月,Gemini in Chrome也開始開發代理功能,幫你處理重複瑣事,比如預約理髮或每周買菜——你說一句話,它就在網頁上操作。移動端也隨之更新。現在,美國使用者已經能免費用Gemini in Chrome,響應更快,能邊刷邊問。不知不覺間,Chrome就變了樣,發現時AI已經無處不在。很多人試過Atlas和Comet後直呼新鮮,但一到日常工作、刷劇、同步書籤,還是切回Chrome——畢竟習慣難改。新玩家想在短期內動搖這個基本盤,難度確實不小。繁華背後的暗礁然而,新技術的萌芽總是伴隨著爭議。在Reddit和X上,關於AI瀏覽器的吐槽從未停歇。最讓人頭疼的是性能。不少使用者發現,Atlas和Comet在執行複雜任務時,偶爾會「當機」,卡頓、崩潰,甚至讓筆記型電腦發燙嚴重。有人開玩笑說,用AI瀏覽器上網,就像是在給電腦「人工催熟」。更深層的危機藏在安全防護裡。網路安全機構LayerX的一項測試發現:在釣魚網站的攔截測試中,傳統的Chrome和Edge攔截率都在50%左右,而Atlas僅有5.8%。「提示注入攻擊」更是AI瀏覽器繞不開的噩夢。駭客在網頁中埋下一段指令,當你讓AI總結網頁時,它可能已經被洗腦,偷偷轉發了你的私人郵件。OpenAI坦言,這或許是一個永遠無法徹底根治的漏洞。甚至有諮詢機建構議企業暫時封殺這些AI瀏覽器,理由很簡單:它們優先考慮了體驗,卻犧牲了安全。未來,誰主沉浮2026年才剛開始,這場較量遠未到終局。短期內,Chrome的霸主地位依然堅如磐石。但在特定領域,縫隙已經產生:研究者偏愛Comet的敏銳,ChatGPT的重度使用者則離不開Atlas的深度。未來,我們可能不再需要自己點來點去,而是對著螢幕說一句話,AI就能幫我們搞定一切。但在這之前,誰能先解決那個名為「安全」的難題,誰才能真正贏得使用者的長久信任。你會繼續守著老朋友Chrome,還是已經準備好,搭上這艘稍顯顛簸卻充滿想像力的AI航船? (新智元)
抱歉了Chrome,這次我選中國這款AI瀏覽器
【新智元導讀】全面融合千問,夸克AI瀏覽器全面升級!不切應用、不換標籤,隨時喚起千問AI助手,實現作業系統級全域喚起的互動形態。學生黨、打工人的真正生產力神器來了。ChatGPT推出Atlas,Google股價應聲下挫超4%。AI瀏覽器正在成為國際巨頭新角力場。PC作為人們工作+學習主力的場景,正成為 AI 搶佔的下一個超級入口。一方面,移動端螢幕太小,輸入慢,生產力場景碎片化;另一方面,真正的深度思考、複雜創作、協同辦公,始終是PC大屏的主場。11月26日,夸克全面升級為更強大的AI瀏覽器——這次直接把千問AI助手焊進了瀏覽器,並行布六大千問AI套件;無需切換標籤或應用,支援任意場景喚起千問;成為國內首個實現「作業系統級」的全域AI體驗。此番煥新亮相,再次宣告了阿里全力進軍AI to C的市場野心,代表著阿里AI戰略(C計畫)持續升級落地。2025年AI瀏覽器的終極戰場,阿里正在下一盤更大的棋。新一代AI瀏覽器登場如今,打開電腦點開夸克,它已經搖身一變,全新升級為「夸克AI瀏覽器」。其實,這一步並不突然。前段時間,背靠阿里Qwen大模型推出「千問App」,並以「最強模型做最好個人助手」的姿態重新殺回C端市場。這一次,夸克升級,直接對標Chrome,打造全球領先的AI瀏覽器。夸克的底氣來自那裡?1、阿里AI戰略持續升級,基於阿里生態優勢,全力入局AI to C,搶佔PC超級入口。2、基於阿里最強大模型Qwen,夸克全面融合了千問,讓瀏覽器長出「第二外腦」。3、全球領先的AI產品形態,實現系統級「全域AI」能力,隨時桌面可喚起千問。自2023年上線後,Qwen「全家桶」不斷升級迭代,在業界廣受好評。如今,Qwen 3成為阿里大模型家族最強AI。就連Hugging Face CEO多次公開力薦Qwen模型。毋庸置疑,Qwen 3就是阿里最大王牌,支援文字、圖像、語音等多模態輸入,是實力全能型選手。它的即時推理引擎,可以毫秒級響應,即便面對複雜任務也能從容應對。基於Qwen搭建的夸克,針對瀏覽器場景做了深度定製,整合了強大的自然語言理解、網頁結構解析,以及使用者意圖與上下文關聯能力。同時,搭配的千問AI助手,推理、理解、執行能力強大。它不僅適合日常問答、創作,也適合科研、推理研究;文采出眾、專業領域也能提供高品質的回答。作為新一代AI瀏覽器,夸克回答更聰明、處理任務更高效,體驗也更加絲滑。一手實測,妥妥的生產力神器夸克全面融合了千問,無需頻繁切換標籤和應用,隨時召喚AI。邊瀏覽網頁邊對話、邊閱讀文章邊總結,即問即答,彷彿有個AI副手隨時待命。接下來,我們展開了一波最全面的實測。桌面級智能助理,隨時待命這次升級,最大的亮點便是——AI不再被關在某個網頁或某個小外掛裡。和很多「裝了AI外掛的瀏覽器」相比,差別就在這裡——別家是「你找AI」,夸克想做到「AI伴隨左右」。全域桌面喚起千問的入口是多元的:千問讀屏、快捷框、懸浮球、側邊欄、劃詞、螢幕擷圖。以上方式皆可實現,可做到隨時隨地,即問即答。舉個栗子,《瘋狂動物城2》即將在國內上映了,想要瞭解下觀影體驗,直接對話方塊問千問就可以了。千問給出的總結,非常全面。它並非直接羅列分析,而是先提供高度凝練的結論,再系統地從四個維度進行闡釋。甚至最後,它還附上了影片精準的上映時間。無需查詢多個網頁,即可掌握要點,節省大把時間。一句話,隨時喚起千問幫你幹活。點選千問懸浮球,或是Alt+空格/Option+空格即可一鍵喚起千問快捷框。不論是搜尋、創作、總結、翻譯,還是做表格、做PPT,甚至是格式轉換,一句話就夠了。i人大學生怎麼練習口語?千問隨即給出了一套行之有效的實操指南。當你還在為課程論文頭疼時,千問可以直出一份邏輯清晰、結構完整的寫作框架。不管是學生還是打工人,做表、做PPT都是必修的功課。如今,一句話千問就能搞定了。它還可以一句話轉格式,課堂上、會議上白板的文字,能一鍵提取並幫你轉成PDF。在工作、學習,不論遇到了何種問題,都可以隨時喚醒千問。更強大的是,無需打開夸克瀏覽器,千問AI也能做到有問必答。千問讀屏「讀屏」的本質,是共享螢幕讓AI能夠在即時讀懂螢幕上的內容,理解、分析並給出回答。要做到這一點,必須具備超強的多模態與即時互動能力,遠超普通文字問答的難度。舉個例子,把Karpathy考驗Nano Banana題目共享給千問,讓它給出解答。在解題之前,千問第一步需「看」——識別出螢幕中的文字。不僅要看懂,還要理解和推理。接下來,它會分析當前任務的意圖,然後逐步推理,給出精準的答案。亦或是在工作中,閱讀一些文件不得要領時,打開千問讀屏,一鍵總結。我們又接著文件後續內容進行提問——「Google這次打了勝仗了嗎?那些話可以體現」。沒想到,千問可以根據已有的內容,做出判斷分析,然後給出總結。通過多輪提問,輕輕鬆鬆就能把工作搞定。更驚喜的是,千問讀屏還可以共享應用——WPS文件,支援Word和PDF形式。想要緊追AI前沿論文,千問幫你把論文的全貌總結得清清楚楚。可以看到,不論在做什麼,千問都可以即時洞察螢幕內容,理解人們的當下所需。這一過程非常簡單,無需複製、截圖、解釋,就能得到精準回應,讓打工人、學生黨更加專注做事。千問側邊欄你是不是也曾有過這樣的煩惱,在看一篇難啃的英文文章時,整篇通讀下來不得要領。這時,「千問側邊欄」隨時出動,用不了多久就能總結一篇詳細的摘要,讓效率大幅提升。再比如,看一份技術報告,卻不懂一些專業術語的含義,千問可以解決。千問劃詞閱讀時,遇到一個不懂的詞,或是想要瞭解更多資訊,不用關鍵詞搜尋,「千問劃詞」就可以。千問劃詞的能力,貫穿整個PC系統。不論是在夸克,還是是本地檔案、WPS等第三方應用,皆可實現全域桌面喚起千問。千問螢幕擷圖更厲害的是,千問螢幕擷圖也可以即問即答。擷取一張肥皂膜奇點的圖片,千問一下子就能解釋明白。不僅如此,想要提取圖片中的文字,螢幕擷圖後點選「提取文字」,複製貼上順手搞定。經過多輪實測後不難發現,夸克此次煥新升級,真正實現了全域桌面喚起千問。作為比較,OpenAI Atlas也原生整合了ChatGPT對話能力,進入首頁即可喚醒ChatGPT。在打開任意網頁時,點選「Ask ChatGPT」或側邊欄直接呼叫,論文解讀、總結、改寫都能實現。不僅如此,Atlas還可以開啟「Agent模式」,讓ChatGPT代為操作,在瀏覽器中填表、訂機票....不過這種能力,僅侷限在Atlas中使用,跳脫了這個瀏覽器,便不能喚醒ChatGPT了。全面融合千問的夸克AI瀏覽器可以做到——隨叫隨到,即問即答。不論在夸克瀏覽器裡面,還是在桌面、任何第三方應用,皆可喚醒千問AI助手,做到了真正的系統級全域喚起AI的能力。智能瀏覽:絲滑的工作流幾十年來,網際網路深刻地改變了資訊傳播的方式。對現代人來說,能不能上網很重要;而上網,離不開瀏覽器——這關乎我們如何認知資訊。但資訊不是結果,大家期待讓工作更輕鬆的工具出現。而AI時代的到來,讓阿里看到了這種可能:將AI能力深度嵌入電腦作業系統,把夸克AI瀏覽器打造為更專業的生產力工具。這次升級了下列功能:智能標籤管理線上文件直接編輯超級播放器PDF對照翻譯跨端流暢傳輸雲端儲存,智能尋找首先,幫你智能管理標籤,運行更流暢,介面更清爽。點選夸克AI瀏覽器左上角,可以快速搜尋——多標籤不再混亂,幫你快速找到所需頁面。右鍵一點就可以給網頁建立標籤組,重新命名、選顏色,輕鬆將相關的網頁,比如說項目的文件或者學習資料歸納到同一個分組裡。標籤可以自由收起或者展開,再也不用擔心頁面雜亂無章:而且它可以智能管理高記憶體頁面,確保全程流暢,在不同任務和工作流之間絲滑切換。這避免了瀏覽器崩潰打斷工作流,從而提升使用者資訊處理效率。但對生產力工具而言,穩定運行也是基本要求。在此之上,夸克圍繞辦公、學習等場景下的高頻需求,還有獨有的「殺手鐧」。比如,辦公或學習中最常用到的PDF檔案,在過去處理起來比較繁瑣。過去,你可能要採取下列步驟:夸克AI瀏覽器的「PDF編輯」就簡單多了:線上PDF檔案,無需下載,線上查看、批註這次,夸克不止可以查看PDF,還提供了下列實用功能:高效處理:隨時劃詞批註和修改、一鍵標記。隨心編輯:可直接選中、複製、搜尋。最關鍵的是,PDF編輯的能力更強大,可以直接打開或直接拖入瀏覽器,圖片上的文字也能直接編輯——對於學生黨等需要查看外文的使用者來說,夸克的對照翻譯尤其實用——上傳或打開PDF,AI自動生成雙欄對照排版,外文即時對照翻譯:專業文獻、論文、報告再也不用來回對照。夸克太懂學習需求了——阿里最強AI模型支援,中文翻譯質量有保障。閱讀、學習、整理PDF,一切都更輕鬆。對於辦公黨而言,夸克這次跨端傳輸解決了多端同步的痛點:文件、網頁、大檔案都能跨端傳輸,100G大檔案也能輕鬆傳;讓電腦的工作也能在手機上隨時處理,實現工作無縫銜接。傳送網址,PC端只需右擊網頁標籤,點選「傳送到手機」,即可在手機端接收到相關連結。比如,在夸克AI瀏覽器中修改好的PDF檔案,在起始頁,只需點選瀏覽器右上↗️工具列中的「紙飛機」快傳功能,即可傳送檔案。這些能力過去在各類AI、App裡也能實現,但需要頻繁切換標籤、應用、甚至需要各種手動螢幕擷圖、複製連結、上傳檔案,費時費力。夸克要解決的是「摩擦成本」——打開夸克,所有完整工作流都在一個AI瀏覽器完成。夸克背靠阿里生態,使用Qwen領先模型+深度融合千問,讓人人都能免費享受行業首創的全域AI能力。再加上夸克一貫的「無廣告干擾、啟動載入極速、資料更安全」的基本盤,整體體驗是:把複雜工作流做簡,把必要摩擦力做到最低。這是夸克敢於對標Chrome的底氣——Chrome通過Gemini模型重構搜尋欄,實現自然語言對話與生成式回答;夸克則通過C計畫全面升級為AI的PC超級入口,主打提高生產力:一句話辦成事,工作更絲滑。在這場AI重塑資訊入口的變革中,夸克以全新AI互動形態,通過垂直場景深耕與生態整合建構差異化競爭力。搶攻AI新入口,全球巨頭血戰AI這波浪潮,重新點燃了瀏覽器的戰火。傳統瀏覽器只做兩件事:一是顯示HTML/JS渲染出的頁面;二是根據關鍵詞發起搜尋。比如,想要寫一篇報告,開一堆標籤頁,需要自己搜、自己讀、自己總結,尤其是在資訊極度過剩的今天,更加讓人頭大,且時間成本高。最關鍵的是,它根本不理解人類進行中的任務,也不會歸類tab,針對頁面做總結。還有一個非常重要的因素是,傳統搜尋的商業模式高度依賴廣告,而國內瀏覽器最為典型。對於每個人來說,原本只想找個答案,結果滿屏廣告、雜訊,體驗感大幅降低。大模型的出現,不僅從底層重塑了瀏覽器,還帶來了一場生產力的效率革命。它的核心,就是讓AI去看、去總結,做資訊壓縮和結構化處理,而且讓「智能體」去承接學習、辦公等任務。放眼全球,全球科技巨頭和AI初創公司的重磅玩家們,各有各的打法。以Google、微軟為代表的巨頭,選擇了在傳統瀏覽器上「加AI層」。微軟Edge瀏覽器,將Copilot深度整合到側邊欄中;GoogleChrome接入Gemini,總結網頁、下單等任務皆可實現。而AI瀏覽器「新貴」最典型代表,莫過於Perplexity的Comet,OpenAI的Atlas、原創Arc公司的Dia......Comet直接把Perplexity對話式搜尋嵌入了瀏覽器,以其出色的搜尋、總結、規劃等能力,贏得了行業口碑。Atlas主菜是「智能體」,其「Agent Mode」可自主代勞,完成調研、比價、訂機票等複雜任務。回到國內戰場,一些網際網路巨頭紛紛將AI植入瀏覽器中,而更多在基本上面的能力實現,比如對話、總結這類。AI的滲透,僅停留在表層,並未觸達PC超級入口的核心。可以看到,幾乎每個有實力的玩家,都想要在AI瀏覽器中分一杯羹。夸克的這次升級,直接把戰場天花板拉高了一個量級,加入了全球AI瀏覽器佇列。當系統級全域 AI 變成標配,當「一句話幹活」成為新的互動範式,當瀏覽器從資訊入口升級為智能中樞——2025年這場AI瀏覽器的終極戰,拼的就不再是誰的AI功能多,而是誰能真正改寫人們工作的方式。對阿里而言,此次夸克AI瀏覽器的全面升級,實現超1.1億電腦使用者喚起千問,都是在搶奪當下和未來的流量入口。 (新智元)
OpenAI 推出瀏覽器:“讓位吧,Chrome”
台北時間10月22日凌晨,沒等來傳聞中的Gemini 3,等來了OpenAI正式發佈首款AI瀏覽器ChatGPT Atlas。簡單來說,這是一個把ChatGPT"塞進"瀏覽器的產品,你在任何網頁上都能隨時喚出ChatGPT側邊欄,讓AI幫你總結內容、編輯文字、甚至代替你完成購物和預訂任務。聽起來有點像Chrome裝了個ChatGPT外掛?確實如此,但OpenAI的野心遠不止於此。關於OpenAI開發瀏覽器的傳聞早在2024年11月就已流傳,做瀏覽器的目標很明確,爭奪網際網路資訊入口的控制權,獲取更多使用者資料。如今靴子落地,Google股價一度下跌了不少。有趣的是,OpenAI正是用一個長得最像Chrome的瀏覽器,來挑戰Chrome,用你最熟悉的方式打敗你。ChatGPT Atlas沒有選擇激進的介面革新,也沒有太多功能創新,而是保留了多標籤、網址列這些使用者習以為常的元素,只是把AI放到了瀏覽的中心位置。那麼,ChatGPT Atlas究竟有那些功能?它和市面上已有的AI瀏覽器相比,又有什麼不同?讓ChatGPT無處不在的瀏覽體驗側邊欄:ChatGPT隨時待命ChatGPT Atlas最核心的設計是將ChatGPT深度嵌入瀏覽器。在任何網頁上,使用者都可以點選Ask ChatGPT按鈕,喚出一個側邊欄。這個側邊欄自動獲取當前頁面的上下文,使用者可以直接要求ChatGPT總結程式碼差異、比較產品參數、分析文章觀點,無需再複製貼上內容。首席設計師Ryan在發佈會上演示了這一功能,強調這是“範式轉變”,瀏覽器從"僅僅展示資訊"變成"理解資訊甚至編輯資訊"的工具。但坦白說,Perplexity的Comet、The Browser Company的Dia這些AI瀏覽器早就有了。側邊欄+頁面上下文,已經是AI瀏覽器的標配。類似的是Cursor Chat功能,在網頁的任何文字框中,使用者用游標選中文字後可以直接呼叫ChatGPT進行內聯編輯。比如在Gmail寫郵件時,選中一段話,讓ChatGPT"整理我的語言"或"改成更正式的語氣",修改後的文字直接替換原文。這確實省去了在多個標籤頁之間來回切換的麻煩。瀏覽器記憶:幫你記住更多ChatGPT Atlas引入了“瀏覽器記憶”功能,這是它與傳統瀏覽器的重要區別。它不只記錄你訪問過那些網站,還會記住你在頁面上的操作行為,看了什麼內容、對比了那些產品、完成了什麼任務。這意味著你可以用自然語言搜尋歷史,比如問"找出我上周看過的所有職位招聘,並總結行業趨勢",ChatGPT會呼叫這些記憶給出個性化的分析。CEO Fidji Simo在部落格中舉了個例子,她經常瀏覽無麩質食譜,現在可以直接讓ChatGPT“根據我最近看的食譜制定本周菜單”,並通過Agent模式在Instacart上自動下單。又是菜譜?看來OpenAI對"根據食譜買菜"這個場景情有獨鍾。當然,這個功能完全可選。使用者可以在設定中查看、歸檔或刪除所有記憶,也可以在網址列控制某個網站是否允許ChatGPT讀取。清除瀏覽歷史會同步刪除相關記憶。記憶功能本來就是ChatGPT率先推出的特性,遷移到瀏覽器是自然的延伸。但問題在於,這需要使用者對OpenAI有足夠的信任,畢竟,讓AI記住你的所有瀏覽操作和行為,聽起來就像在網上“裸奔”。Agent模式:本地版Operator對於Plus、Pro和Business訂閱使用者,ChatGPT 提供了Agent模式。這是一個可以代表使用者執行任務的AI代理,它能打開標籤頁、點選按鈕、填寫表單、完成購物流程。可以簡單理解為本地版的Operator。它在Atlas的標籤頁裡行動,而不是像Operator那樣用一台雲端的獨立瀏覽器。發佈會上的演示場景包括根據食譜計算八人份配料並在Instacart下單、在Google Doc中加入評論並轉換為Linear任務。又是訂票、買菜、訂餐廳。這些演示場景從Operator發佈時就在用,已經不新鮮了。經過我們的測試,目前的網頁AI代理在簡單任務上表現尚可,但處理複雜問題時仍不夠可靠。OpenAI自己也承認,Agent可能會犯錯,甚至可能受到網頁中隱藏的惡意指令影響。OpenAI強調Agent是"協作式"的,使用者可以隨時監控進度或接管控制權。在我們的測試中ChatGPT Atlas未能完成電商比價任務安全方面,Agent僅在使用者的標籤頁內運行,不能在電腦上執行程式碼或訪問檔案系統。在金融網站等敏感場景,它會暫停並等待使用者確認。使用者也可以選擇"登出模式",限制Agent訪問已登錄的帳戶資料。它和其他AI瀏覽器最大不同,就是它是OpenAI發佈的AI瀏覽器賽道已經相當擁擠。Perplexity的Comet主打AI側邊欄和多步驟任務自動化,還有能主動給出洞見的背景助手,同樣免費開放,Microsoft Edge的Copilot模式整合了聊天和搜尋功能,支援多標籤對比和語音控制,與微軟生態深度繫結;The Browser Company的Dia則更注重介面美學和工作流最佳化,強調與標籤對話的能力,可以作為寫作夥伴和個人助理。所以單從目前功能層面,ChatGPT Atlas並沒有從樣貌上徹底重新設計瀏覽器。側邊欄、頁面總結、自動化任務,這些都是很多AI瀏覽器的標準配置。它也沒有推翻瀏覽器的形態本身,只是把AI放到了瀏覽的中心位置,讓使用者在熟悉的介面中獲得智能化的體驗。此外,首發就面向所有使用者開放(Agent模式除外),也體現了OpenAI快速佔領市場的決心。在體驗上,接下來它還需要證明自己不只是Chrome加了個ChatGPT外掛。畢竟Edge早就引入了Copilot,而Chrome也可以輕易加入Gemini側邊欄,Gemini游標、Agent模式,還有著龐大的使用者基數和生態優勢。但在此之外,OpenAI的Atlas絕對不只是“又一個瀏覽器”這麼簡單。在OpenAI的思路里,你也能看到,他們強調的Atlas的亮點之一,就在於與ChatGPT帳戶的深度整合,瀏覽器可以呼叫使用者在ChatGPT中的歷史對話和偏好設定,實現跨裝置、跨平台的一致體驗,跨會話、跨網站的記憶系統也不只是單次對話的上下文,對於重度ChatGPT使用者來說,有了它至少可以少開一個應用,也不用跨窗口複製貼上了。OpenAI CEO Fidji Simo在部落格中闡述了發佈ChatGPT Atlas的意圖,“我們希望ChatGPT從一個孤立的、被動的文字聊天介面,演變為一個直覺化的超級助手,連接你需要的所有服務。”她提出了ChatGPT將成為你生活的作業系統。而瀏覽器是這一戰略的關鍵節點,因為它是大多數人獲取資訊、完成任務的入口。也就是說,OpenAI的Atlas最大的“不同”,就是它是由OpenAI發佈的。ChatGPT Atlas帶來的是ChatGPT整個生態的能力與使用者關係。這使得它是第一個可以不只在Chrome設定的規則內進行功能修補,而試圖從根本上改變人們對瀏覽器的使用邏輯的產品——它要在已經被ChatGPT塑造了使用習慣的數億使用者的基礎上,把瀏覽體驗的核心從Google的搜尋引擎,轉移到OpenAI的AI模型上。這本質上還是OpenAI要把ChatGPT打造成未來全知全能的作業系統的路線裡,必要的一步。用一個最像Chrome的樣子,對使用者來說熟悉的介面幾乎沒有學習成本;而對競爭對手,尤其是Google而言,這算是一個真正的警告了。接下來可以預期的是,它會迫使Google、微軟等巨頭更快速地將AI深度整合進自己的瀏覽器產品。所有人都會捲入OpenAI的AI時代作業系統之爭中去。 (矽星人Pro)
Google Chrome 終於出手了,我又可以摸魚了
大家好,我是艾倫。最近一直在當全端開發工程師,但開發前端遇到報錯的時候,總是要f12 看介面看各種報錯,然後再截圖給ClaudeCode。流程倒是不長,但就是很繁瑣。前段時間我還在想,Chrome 啥時候能出個能看網頁運行情況的MCP 啊。結果,就在前幾天,答案來了。Chrome 直接推出了一個叫做ChromeDevTools 的MCP。能夠直接在Chrome 瀏覽器中調試網頁,享受DevTools 的調試功能和效能分析能力。讓AI 終於能夠"開眼"寫程式碼了!知道這個MCP 的第一時間我就火速的打開ClaudeCode 進行安裝了。第一步,讓AI 學會登錄,像個真人一樣,能不能完成最基礎的操作。使用的方法很簡單,輸入前端的URL,然後輸入關鍵字"Chrome MCP"就可以將瀏覽器喚醒。然後再輸入我的要求,就可以看到瀏覽器在模擬我們的操作行為。點擊"登錄"按鈕,輸入使用者名稱和密碼,最後再點擊"登錄"。這不僅僅是自動化,這是「可視化」的自動化。它能重現Bug、測試複雜的使用者流程,這對於定位那些偶發性的、難以復現的Bug,價值無可估量。第二步,讓AI擁有“眼睛”,自己檢查工作。如果只是模擬操作,我覺得還不夠驚豔。真正的自動化,我覺得得讓它能自己檢查DevTools,自己檢查工作結果。http://localhost:3000/ 使用Chrome MCP 打開這個頁面,並輸入使用者名稱和密碼super_admin/123456,進入到我的頁面,在帳號設定中將手機號綁定/更換以及設定密碼這兩個填空欄全部刪除。最後核實這次修改是否按照預期進行。當我在最後加上了最後核實這次修改是否按照預期進行。 這句話時,Chrome MCP 會對介面進行一次截圖去檢視和記錄修改的結果。相當於他用自己的"眼睛"幫我們檢查了一遍,真正做到了我前面所說的"開眼"寫代碼。它不再是盲目執行指令的工具,而是一個能驗證結果、有閉環思維的夥伴。第三步,從前端開發到效能分析優化。Chrome MCP 在前端開發上的能力還遠不如此。我們還能讓它自動進行效能追蹤分析,診斷具體的效能瓶頸,例如過高的LCP(最大內容繪製)指標等。這個前端的終極難題,我現在把它拋給Chrome MCP。前端的頁面載入有點慢,Chrome MCP 去分析原因,讓它變快一些,再給我一個效能瓶頸的報告。Chrome MCP 發揮了它的優勢,我也直接一大個解放。再也不需要打開Chrome DevTools 效能介面去看渲染、指令碼執行、網路請求等耗時點了。現在Chrome MCP 自動幫我分析,找到了問題並直接上手改代碼。最後,一份詳盡的效能優化報告自動產生。我需要做的,僅僅是檢查一遍它的修改,然後提交。模擬器- 有"眼睛"的測試員- 性能優化專家。Chrome MCP 的出現,可以說徹底的改變了前端開發的方式,也可能徹底改變了前端開發者的命運。從繁瑣、重複的實現細節中解放出來,將更多精力投入更高維度的思考:系統架構的設計、業務邏輯的梳理、產品體驗的創新等。我們不再是那個需要時刻盯著儀表板的司機,而更像一個設定好目的地,並信任副駕駛能處理好路上一切狀況的領航員。讓機器做機器擅長的事,讓人回歸人擅長的創造。我想,這便是這場技術革命,帶給我們開發者最激動人心的未來。(阿倫AI工具庫)