#chrome
WebMCP:Google在 Chrome 146 中埋下的一顆炸彈
AI Agent 不用再「裝人類」瀏覽網頁了。Google 在 Chrome 146 中悄悄上線了 WebMCP 的早期預覽版,通過 flag 即可開啟。而這個東西,可能會徹底改寫 AI Agent 與網頁互動的方式。Chrome 146 包含了 WebMCP 的早期預覽,通過 flag 開啟,允許 AI Agent 直接查詢和執行服務,而無需像使用者一樣瀏覽網頁。服務可以通過命令式的 navigator.modelContext API 或聲明式的表單來聲明。而這,用開發者 Alex Volkov 的話說,就像是 UI 裡的 API。這真的很有意思。WebMCP 是一個新標準,允許 Web 開發者為 AI Agent / 智能瀏覽器暴露一套直接的工具集,這樣它們就不用再點按鈕了,而是直接存取網站上的函數!現在的 Agent目前 AI Agent 操作網頁的方式,本質上就是在模擬一個人類使用者:螢幕擷圖、識別按鈕在那、點選、填表、等頁面載入……這就好比你請了一個天才助手,結果讓他蒙著眼睛去操作電腦,只能靠不停螢幕擷圖來「看」螢幕上有什麼。結果就是:又慢,又貴,又脆弱……網站一改版,Agent 就懵了。一個簡單的搜尋操作,可能要消耗上千個 token 來處理螢幕擷圖圖片和 DOM 解析。而 WebMCP 的思路則完全不同:讓網站主動告訴 Agent「我能做什麼」。兩種暴露方式WebMCP 給開發者提供了兩條路。命令式 API通過 JavaScript 的 navigator.modelContext.registerTool() 註冊工具函數。比如一個電商網站可以註冊一個 search_products 工具,AI Agent 發現後直接傳入關鍵詞呼叫,拿到結構化的商品資料——不需要螢幕擷圖,不需要解析 DOM,不需要模擬點選搜尋框。聲明式表單通過標註 HTML 表單元素,讓 Agent 自動理解頁面上的互動能力。這種方式更簡單,適合輕量級場景。兩種方式可以混用。老練的開發者用命令式做精細控制,簡單的網站用聲明式快速接入,靈活度拉滿。極其節省 token據實測資料,WebMCP 的結構化工具呼叫相比螢幕擷圖式的 Agent 互動,token 消耗最多可節省 89%。這意味著,原來要花 2000 個 token 處理一張截圖才能「看懂」頁面,現在一個 JSON 響應 20-100 個 token 就搞定了。而且不需要驗證截圖,工具的返回值直接就是確認結果。微軟和 Google 聯手並且,WebMCP 並不只是 Google 一家在玩。微軟的 Edge 團隊獨立提出了「WebModel Context」方案,Chrome 團隊也有一個類似的「Script Tools」提案。結果,雙方一碰頭發現撞車了,於是決定在 W3C Web Machine Learning 社區組下合併為統一的 WebMCP 提案。微軟 Edge 平台的產品經理 Kyle Pflug 稱:WebMCP 讓網頁暴露 MCP 工具給 Agent,類似於傳統 MCP 伺服器暴露的工具,但不需要單獨的伺服器元件。這對「人在回路」的場景是天然適配的,因為它運行在瀏覽器的 browsing context 中,可以簡化狀態和認證——而這在傳統的瀏覽 Agent 方案中非常棘手。簡單說就是:網頁本身變成了 MCP 伺服器,但不需要真的跑一個伺服器。如何認證你可能想問:認證怎麼搞?會不會復用使用者已有的登錄會話?答案是:對,就是這樣。WebMCP 運行在瀏覽器的 browsing context 中,天然繼承使用者當前的認證會話和瀏覽器的同源安全模型。Agent 呼叫的工具和使用者手動操作在權限上完全一致,不需要額外的 OAuth 流程或 API Key。這比傳統的伺服器端 MCP 方案簡單太多了。Kyle Pflug 也確認,他們預計「一些網站會同時使用 WebMCP 和傳統 MCP 伺服器」,因為兩者服務的場景不同:WebMCP 適合有使用者在場的瀏覽器場景,傳統 MCP 適合無頭的伺服器端場景。人與 AIWebMCP 的設計哲學有一條很明確的紅線:Agent 是輔助,不是替代。官方文件列了幾條原則:網頁的人類介面仍然是主體,WebMCP 不會替代你的 UIAI Agent 是增強而不是取代人類互動使用者對 Agent 的所有操作保持可見和可控人和 AI 協作,而不是 AI 單干所以 WebMCP 不支援無頭瀏覽、完全自主的 Agent、也不支援後端服務整合。它就是為「使用者坐在瀏覽器前,Agent 在旁邊幫忙」這個場景設計的。兩層 Web 的未來當主流瀏覽器開始原生支援 AI Agent 與網頁的結構化互動,一個有趣的變化正在發生:網站可能要分出兩層。面向人類的層:視覺化、品牌化、敘事驅動。面向 Agent 的層:結構化、Schema 驅動、快速響應。或許,是時候討論「Agent SEO」了:你的網站對 AI Agent 友不友好,可能成為新的競爭維度;那些不暴露 WebMCP 工具的網站,可能會逐漸變得對 Agent「不可見」。雖然目前的 WebMCP 還處於非常早期的階段,API 設計仍在迭代,Chrome 146 中的實現需要手動開啟 flag,但方向或許已經不言而喻:瀏覽器不再只是人類的工具,它正在同時成為 AI Agent 的作業系統。 (AGI Hunt)
Google Chrome深夜爆更,Agent不用「裝」人了!前端最後防線崩了?
【新智元導讀】終於,AI不用裝得像個人了。GoogleChrome重磅上線WebMCP。從此,Agent不用瘋狂螢幕擷圖,直連核心完成任務,AI與網頁互動的底層邏輯正在重構。今天,GoogleChrome團隊投下了一枚深水炸彈:WebMCP(Web模型上下文協議)正式登場。它可以讓AI智能體跳過「人類使用者介面」,直接與現有的網站和Web應用深度互動。在Chrome 146的早期預覽版中,開啟特定flag即可體驗WebMCP這相當於給Agent加上了「超能力」,從此不用再「裝得像個人一樣」,去看網頁、找按鈕,或是點連結。僅通過一個API:navigator.modelContext,AI便可繞過圖形介面,直接與Web應用服務的核心對話。假設想要訂一張機票,Agent不用在螢幕上點選,而會直接通過底層協議,向航空公司網站傳送命令,直接獲取結果。用開發者Alex Volkov的話來說,「WebMCP就相當於UI裡的API」。可以說,WebMCP的誕生,釋放了一個極其明確的訊號——AI Agent與網頁互動的底層邏輯,正迎來一場徹底的重塑。它實現了從「視覺模擬」到「邏輯直連」的躍遷,正讓傳統的Web互動範式徹底走向終結。WebMCP震撼登場掀起Agent互動革命或許很多人,還沒有意識到WebMCP的重要性。它的核心在於,改變了Agent獲取服務的方式,讓其直接拿到了網頁的「通天鑰匙」。過去幾周,全世界都在為爆火的OpenClaw瘋狂,若是未來互動更進一步,說不定又將催生一次大變革。要知道,如今Agent操作網頁的方式,既笨拙又原始,而現在的整合方式實在是「太拉胯」了。它們本質上,就是在模擬人類的行為——螢幕擷圖、識別按鈕的位置、模擬點選,DOM抓取......這種方式,存在著明顯的痛點:成本高昂:一次簡單的搜尋,可能需消耗數千token來處理截圖、解析頁面;穩定性低:網站一旦改版,Agent會因找不到按鈕陷入「癱瘓」;反饋低效:Agent必須反覆「看」螢幕,來確認操作是否成功。不再裝個人,降維打擊如今,有了WebMCP,網站可以直接向AI開放其服務介面。Agent不用經過「前端視覺介面」,直接可以查詢並執行服務。WebMCP將取代傳統的「螢幕抓取」(screen-scraping),從而實現更穩定、更高效的頁面互動和資訊檢索。誠如網友所言,AI Agent正成為網路的「一等公民」。在GoogleChrome 146的官博中,為開發者提供了兩套靈活的API接入方式:聲明性API:執行可直接在HTML表單中定義的標準操作;命令式API:執行需要JavaScript執行的複雜、更動態的互動。這兩種方式,允許開發者為AI提供一套直接的工具集,讓Agent跳過視覺識別,直接存取網站背後的結構化函數。此前,Google軟體工程師Khushal Sagar在演講中表示,WebMCP目標是成為AI應用領域的USB-C介面。它不僅是讓智能體替代使用者,更是建立一種協作模式:使用者、網頁、智能體三者共享介面,共同協作。智能體專用路徑:開發者在為人類設計UI的同時,為智能體提供結構化的API路徑。兩大巨頭聯手要徹底「幹掉」前端?值得一提的是,WebMCP並不是Google的獨角戲。早在25年8月13日,Google、微軟開發者聯手,在GitHub上提交了WebMCP這一項目。開放原始碼專案:https://github.com/webmachinelearning/webmcp目前,AI智能體通常通過MCP等協議進行後端整合。但對於Web開發者來說,為了開放網站功能,他們往往得用Python或NodeJS寫一套後端伺服器,而不是用他們更熟悉的瀏覽器端JS。在項目介紹中,WebMCP讓網頁能在UI中提供「智能體專用通道」。與後端整合不同,WebMCP工具在客戶端執行,只有在智能體載入頁面後才可用。智能體依然可以像人一樣觀察頁面和模擬操作,但有了工具,它能更直接、高效地達成目標。據官方的介紹,以下是WebMCP的三大主要優勢:程式碼復用:直接利用現有的前端程式碼;統一介面:使用者和智能體共用一個介面,簡化了互動時的身份驗證和狀態同步;無障礙利器:讓輔助技術能執行更高層級的頁面操作,而不僅僅是簡單的點選。更進一步說,WebMCP讓使用者和智能體可以在同一個網頁介面裡並肩工作,既能利用現有的應用邏輯,又能保持上下文共享和使用者的掌控感。繞過所有UI,統治網路那麼,在WebMCP加持下,Agent未來會演變成什麼樣?開發者們提前設想了三大場景,電子商務、旅遊出行,以及客戶支援。首先,未來,我們的購物體驗,或將迎來質變。一句指令,Agent不再在頁面上反覆「翻找」優惠券入口,僅通過WebMCP函數呼叫,實現秒級下單。它可以輕鬆找到產品、配置特定的購物選項,完成結帳全流程。在旅遊出行方面,Agent還可以成為更精準的預訂專家,使用結構化資料進行搜尋、過濾結果和處理預訂。由於避開了混亂的UI干擾,它能確保每次搜尋結果的精準性,並直接在後台完成複雜的行程組合。此外,WebMCP還可以成為自動化服務的橋樑,讓智能體自動填寫必要的技術細節,以建立詳細的客戶支援服務工單。上手試過的開發者驚嘆,立即發現了WebMCP兩大好處。分層Web時代來臨一半給AI用開發者大佬Nikoloz Turazashvili最新一文,深度解釋了WebMCP的出現對於開發意味著什麼。如果你看過AI Agent像無頭蒼蠅一樣使用網站——瞎猜那個按鈕是結帳,或者糾結乘客姓名該填在那個框裡……實際上,你已經抓住核心痛點了:現在的Web UI是給人看的,但智能體需要的是「結構」。這恰恰是WebMCP想要解決的問題。如前所述,它是一個擬議中的Web標準,允許網站直接向瀏覽器內的Agent暴露結構化的工具。這樣一來,智能體就能呼叫真正的函數(帶有Schema),而不是去暴力爬取頁面,然後祈禱DOM結構沒有改變。因此,可以把它想像成「內建在瀏覽器標籤頁裡的MCP」。WebMCP的核心思路,便是發佈工具,別光給像素。與其讓Agent去瞎猜一個按鈕是幹嘛的,不如在搭建的網站明確發佈一份契約:Discovery(發現):這個頁面上有那些工具(checkout, filter_results等)JSON Schemas:輸入/輸出具體長什麼樣(以此減少幻覺)State(狀態):對頁面上當前可用內容的共識這就把「到處亂點直到碰巧蒙對」變成了:直接呼叫book_flight({ origin, destination, outboundDate… })。WebMCP基本上是在說——如果智能體要在瀏覽器肚子裡運行,瀏覽器就得提供這種握手機制。而且從產品角度看,這也是控制權的轉移:網站自己定義了允許那些操作,以及資料該怎麼傳。如果WebMCP真的成為標準落地,主流瀏覽器開始原生支援這種結構化互動,未來的網際網路或許分化為兩層:給人類用的UI:視覺美感、品牌敘事給Agent用的工具介面:結構化資料、極速響應而最終贏家不會是那些介面最花哨的——而是那些擁有最清晰工具契約的App。這一切,預示著「Agentic UI」時代的到來。未來的網頁將不再僅僅是給「人」看的展示窗,還是能與AI無縫銜接的自動化服務節點。WebMCP的出現,無疑加速了從「手動搜尋」到「智能體自動執行」的網際網路範式轉移。 (新智元)
自帶 Nano 改圖,一鍵總結 N 個網頁!Chrome 這次更新,讓所有 AI 外掛都下崗了
講真,作為每天和瀏覽器打交道超過 10 小時的“重度衝浪選手”,Chrome 幾乎就是我的第二個辦公桌。自打 AI 爆火之後,為了提效,我這瀏覽器右上角就沒清淨過。我裝了五花八門的外掛:有的專門用來總結長文章,有的用來跟網頁對話……但懂得都懂,沒有一個真的特別好使。直到昨天,Google 親手扔下了一個“核彈級更新”,我瞬間覺得:那些折騰了半天的 AI 外掛,終於可以通通刪掉了!(具體的開啟教學我放在文末了)。圖:Chrome 中整合的 Gemini這次 Chrome 的進化,絕不僅僅是多了一個總結網頁的小工具那麼簡單。它是直接把最強的 Gemini 3 “焊”進了核心裡,讓瀏覽器從一個單純的“閱讀器”,變成了一個真正能替你幹髒活、累活的“數字分身”……01 側邊欄進化:第三方外掛通通可以“下崗”了說實話,AI 側邊欄這東西,大家早就司空見慣了。不管是國外的外掛,還是中國的 Kimi、智譜,早就能讓你一邊看網頁一邊總結、對話。但這次 Chrome 原生的 Gemini 側邊欄,真的讓我想把那些第三方外掛都卸了。因為除了常規操作,它至少有 3 個讓我大喊“臥槽”的狠招:總結網頁只是基本功: 別人能做的它都能做,而且反應速度極快,畢竟是親兒子。圖:Chrome 側邊欄總結網頁你可能不服,這不都能做嗎?Gemini 真正厲害的地方在於,它能同時總結 N 個打開的網頁。以前我想看幾篇文章的摘要,得每個頁面點一次外掛,手都點酸了。現在,它能一次性把所有打開的網頁全讀完,直接甩給我一份彙總好的摘要。(最臥槽的是,你可以讓它用這 N個網頁為素材直接寫篇文章,自媒體人要起飛了!))圖:Chrome 的側邊欄同時總結 N 個網頁再比如我想買個降噪耳機,在京東上開了十幾個產品頁,看得眼花繚亂。現在簡單了,直接讓它幫我全網比價、挑毛病,最後告訴我那款最值得下單。圖:Chrome 側邊欄在 JD 頁面做比價這才是真正的“省心神器”,再也不用在幾十個標籤頁裡反覆橫跳了。視訊“快進鍵”的終結者: 這點最牛。你在看 YouTube 視訊時,它不僅能幫你出總結,最離譜的是它能自動切片。它會把視訊分成好幾個關鍵段落,你看到感興趣的點,點一下文字,進度條直接跳到那個位置。圖:Chrome 側邊欄直接總結視訊並做切片以前看個長視訊得手動拖進度條,現在感覺是 AI 牽著你的手,直接把精華送到你嘴邊。不過有一說一,這功能目前還是有點“偏心”,對 YouTube 的支援簡直是親兒子等級。我也試了下 B 站,雖然也能總結出大概意思,但少了那個最靈魂的“自動切片”,就像吃泡麵沒調料包,效果大打折扣。這些結果可以直接通過 Gmail 發郵件出去,而且這次還把日曆、YouTube、地圖等全部整合進來了。不得不說,Google把自家“全家桶”整合起來的殺傷力真的無敵,這種“自家產品互相開掛”的操作,才是這次更新最頂的地方。02 Nano Banana:這那是瀏覽器,這是隨身帶了個 PS以前在網上看到一張圖想改一改,你得先下載,再開修圖軟體,折騰半天再重新匯出。現在 Chrome 側邊欄直接把 Nano Banana 整合進來了,簡單來說,它就像在瀏覽器裡裝了個“一鍵整容”按鈕。我試了幾個場景,簡直是懶人福音。比如你看到一張色彩鮮豔的素材圖,想看看一張照片變成復古黑白風是什麼效果,不用找濾鏡,在側邊欄說句話就行。圖:Chrome 側邊欄直接修改圖片更神的是,如果你對著一張空蕩蕩的房間照片,想腦補一下裝修後的樣子,直接讓它往裡“塞”滿家具。上一秒還是冷冰冰的毛坯房,下一秒就能變出北歐風的溫馨感。圖:Chrome 側邊欄直接修改圖片甚至當你面對一整個網頁密密麻麻的資料頭大時,直接喊它把網頁內容生成一張精美的資訊圖,這對於每天做 PPT 的人來說,簡直是救了命了。圖:Chrome 側邊欄生成資訊圖這種“即看即改”的操作,以前得折騰好幾個 App,現在動動嘴皮子就在瀏覽器裡順手辦了。03 終極殺招:它不是在聊天,是在替你“上班”如果說前面的功能只是讓你“看得爽”,那接下來的 Auto browse(自動瀏覽) 簡直是讓 Chrome 長出了手腳。我試了幾個官方案例,確實有點科幻。比如最枯燥的自動填表,你只需把資料甩給它,它能自動識別並把另一個表單填得整整齊齊。更神的是,比如你想辦個主題派對,看到一張氛圍感拉滿的佈置圖,不用你肉眼去搜同款。它能直接識別圖裡的復古電視、氣球、裝飾品,去電商網站搜出同款並一鍵塞進購物車,連券都領好了,你只管付錢。甚至連訂酒店、查航班這種瑣事,它都能根據你的要求直接出一套最優方案。不過,我也得說句大實話: 這一招目前對國外網站確實很猛,但我實測發現,它還沒學會怎麼逛京東、淘寶或攜程,基本處於“罷工”狀態。(所以這裡用了官方的案例)雖然這種“數字替身”的未來很爽,但中國使用者不知道啥時候能享受到。04 隱藏教學:怎麼強先開啟這個“黑科技”?看到這兒,估計大家手裡的外掛已經按捺不住要刪了。不過目前這些功能還在灰度測試中,如果你想現在就體驗,可以試試這套“極客開啟方案”:第一步:開啟隱藏開關(Flags)先升級 Chrome 到最新版,然後在網址列輸入 chrome://flags/  進入實驗室。在搜尋框輸入 “glic”,把搜出來的這五項全部從 Default 改成 Enabled:GlicGlic Z Order ChangesGlic actorGlic Pre-WarmingGlic FRE Pre-Warming圖:開啟 Chrome 的相關選項點選右下角的 “Relaunch”(重新啟動)即可。第二步:如果還沒出來,試試這幾條“黑指令”如果你重啟了還沒看到 Gemini 出現,那說明被地域限制鎖死了。這時候需要先徹底退出 Chrome,然後打開終端(Terminal)執行下面這幾行命令,直接給它來個“強制開啟”:💡 小提示: 執行前建議先備份。命令中的 ~/Library/Application Support/Google/Chrome/ 路徑適用於 Mac 使用者。另外,你的 Chrome 需要設定為英文,而且 IP 地址必須設定為美國。這一頓操作之後再次打開 Chrome,你就能看到那個能替你“上班”的數字分身了。寫在最後不得不感嘆,2026 年開年這一個月,AI 圈的節奏快得讓人窒息。特別是這兩天全網刷屏、幾乎把智能體推向神壇的 ClawdBot(Moltbolt),大家應該都看出來了:“智能體(Agent)”化已經是大勢所趨。以往是我們“用”瀏覽器去找資訊,現在是 AI 正在“接管”瀏覽器去辦實事。而這次 Gemini 與 Chrome 的深度融合,意義完全不同。畢竟 Chrome 是全球幾十億人的裝機必備,它這次的“超進化”,意味著 AI 這種處理資訊的方式,正在從極客的小眾玩具,徹底變成普通人觸手可及的日常工具。雖然現在對中國 App 的適配還沒那麼絲滑,但這種“有人幫我幹活”的未來,確實已經近在咫尺了。最後互動一下:如果 AI 真的能替你處理掉所有無聊的填表、訂票、比價工作,你最想用省下來的時間幹點啥? (AI范兒)
GoogleChrome史詩級更新!Gemini 3原生植入,瀏覽器終於能“自己動”了?
Chrome 瀏覽器剛剛迎來了一波史詩級加強!Google官方剛剛宣佈,將最強的 Gemini 3 模型直接塞進了 Chrome 裡。注意,這次不是在側邊欄加個簡單的對話方塊,而是引入了真正的 Agentic AI 能力。簡單來說:以前你的瀏覽器是用來“看”網頁的,現在的瀏覽器,真的能自己“上網”幹活了。01 真正的“自動駕駛”:Auto Browse這是本次更新的重頭戲——Auto Browse(自動瀏覽)。基於 Gemini 3 的多模態能力,Chrome 現在可以處理複雜的多步驟工作流(Multi-step workflows)。它不再只是給你吐出文字建議,而是像一個真實的私人助理一樣,幫你點選連結、尋找資訊、填寫表單,甚至處理那些極其繁瑣的“髒活累活”。舉個簡單的例子:假設你要舉辦一場 Y2K 復古主題派對,但不知道買什麼裝飾品。以前你需要:去小紅書/Pinterest找靈感 → 截圖 → 去淘寶/亞馬遜搜同款 → 比價 → 加購物車。現在,你只需要給 Auto Browse 一張參考圖:“Gemini,幫我看看這張圖裡都有什麼,然後幫我搜同款,要便宜的,直接加進購物車。”Gemini in Chrome能夠理解你的創意構想,幫你尋找非常具體的派對裝飾品並將其加入到購物中Gemini 3 會利用其視覺能力識別圖片中的物品,自動在電商網站搜尋相似款,利用優惠碼確保不超預算,甚至最後一步直接幫你把東西放進購物車。如果不只是買東西呢?根據Google的內測,測試者們已經開始用它來幹這些事了:全網比價:自動查詢不同日期的酒店和機票價格,不僅是看,而是幫你規劃。可以幫你找到合適的公寓,並根據你的條件篩選結果可以根據對酒店和航班的要求,為你推薦最佳的周末住宿方案。填表狂魔:自動填寫繁瑣的線上表格,甚至幫忙報稅。可以根據PDF檔案中的資訊自動填寫表單生活瑣事:給水管工查報價、管理訂閱服務、甚至更新駕照。一句話總結:那些你不想幹的重複性勞動,現在瀏覽器全包了。當然,我知道大家擔心什麼——安全。Google也強調了“Security by design”。對於敏感操作(比如付款、在社交媒體發帖),Auto Browse 會自動暫停,必須經過你的明確確認才會執行。它能幫你省心,但不會自作主張亂花你的錢。自動瀏覽功能能讓你隨時瞭解最新情況,並要求你確認敏感操作02 側邊欄進化:不切屏,才是真效率為了配合強大的 AI 能力,Chrome 這次還推出了全新的側邊欄體驗(Side Panel Experience)。不知道大家有沒有這種痛苦:寫論文/寫程式碼的時候,為了查一個資料,切出去開了個新標籤頁,然後不知不覺就開始刷別的東西,半小時回不來。現在的 Gemini 側邊欄,主打一個“伴隨式服務”:你可以在主窗口保留你的核心工作(比如正在寫的文件),然後在側邊欄喚起 Gemini 處理雜事。比如:多方比價:不用開10個電商頁面來回切,直接在側邊欄讓它把不同網站的產品優缺點列出來。總結評論:打開亞馬遜商品頁,側邊欄直接告訴你“這東西大家覺得那裡不好”。日程管理:在混亂的日曆裡幫你找空閒時間,而你不需要離開當前的網頁。瀏覽器中的 Gemini 會在側邊欄打開,方便進行多工處理一句話總結:它就像坐在你旁邊的實習生,你只管主線任務,支線任務丟給它,不用切屏,不用打斷心流。03 Nano Banana:網頁圖片,原地“整容”他們很久之前發佈了一個名字很怪、但功能很暴力的模型:Nano Banana。這是一個直接整合在 Chrome 裡的圖像生成/修改能力。它的核心賣點是 “On the fly”(即時修改)。以前我們在網頁上看到一張圖,想改一下,得先“右鍵另存為”→“打開PS/美圖秀秀”→“修改”→“上傳”。現在?根本不需要下載。你只需要在側邊欄輸入一句 Prompt(提示詞),告訴它你想怎麼改,網頁上的那張圖就會原地變形。無需複製貼上或重新上傳;使用 Nano Banana 在當前瀏覽器窗口中轉換圖像比如這張客廳的照片,你可以直接讓 Gemini 給它換個“現代風”裝修,或者把一份枯燥的資料圖表直接轉化成一張精美的資訊圖。這就很適合做設計、做PPT的朋友,找素材的時候,沒有合適的?直接讓瀏覽器給你“捏”一張出來。04 打通全家桶 & 什麼時候能用?最後,作為Google親兒子,Chrome 這次徹底打通了 Connected Apps(關聯應用)。Gemini 可以直接呼叫你的 Gmail、日曆、地圖、YouTube 甚至 Google Flights 的資料。舉個場景:你要去開會,但是忘記航班資訊了。 Gemini 可以幫你從幾個月前的舊郵件裡把航班資訊挖出來,結合地圖給你推薦行程,最後幫你草擬一封郵件告訴同事你幾點到。可以與其他 Google 應用(例如 Gmail)配合使用📍 如何體驗?根據官方消息,這些更新正在向 MacOS, Windows 和 Chromebook Plus,AI Pro/Ultra 使用者陸續推送。如果你手裡的 Chrome 還沒收到更新,不妨去檢查一下版本,或者再耐心等等。 (奇點前哨)
Google深夜放大招!把Chrome做成AI作業系統,以後上網真不需要手了
今天凌晨2點,Google宣佈對macOS、Windows系統及Chrome book Plus裝置的Chrome瀏覽器進行重大更新,整合最新大模型Gemini 3。簡單來說,現在的Chrome不再只是個用來上網的工具,更像是一個能替你自動幹活的私人AI作業系統。很多很多重複、繁瑣的工作都能自動化了,甚至不用你開口就辦妥了。Chrome這次真的搞了個大動作,咱們來好好聊聊它帶來哪些新創新。這次最實用的更新之一就是這個側邊欄,不管你打開多少個標籤頁,Gemini都能常駐在側邊欄跟著你。以前處理事情總愛開一堆標籤頁,對比資訊、看評價的時候來回切,越切越亂還容易忘事。現在就不一樣了,主標籤頁專心做核心工作,側邊欄同步處理其他事就行。有的用來對比不同平台的商品選項,有的彙總全網的產品評價省得一個個點開看。還可以用它梳理亂糟糟的日程表,把零散的活動時間都歸置清楚。這種不打斷思路的多工體驗,用過之後真的回不去了。另外一個驚喜是Nano Banana的創意功能也整合進來了,以前想改張網頁上的圖,得先下載下來,再打開修圖軟體折騰,改完還得重新上傳,步驟繁瑣到想放棄。現在不用這麼麻煩了,直接在Chrome側邊欄輸入你想改的效果就行,不用切換任何頁面,即時就能看到修改結果。比如我想給客廳翻新找靈感,就把網上看到的戶型圖在側邊欄改一改風格;整理工作資料的時候,也能快速把表格轉成直觀的資訊圖表。小白也能輕鬆上手,不用懂任何修圖技巧。Gemini還能和Gmail、日曆、YouTube這些Google常用應用深度配合,相當於把這些工具的能力都整合到一起了。舉個例子,我之前要去外地參加會議訂機票,以前得先翻信箱找會議時間地點,再打開Google航班查票價選時間,最後還得發郵件跟同事說行程。現在只要跟側邊欄的Gemini說一聲,它會自己調出郵件裡的會議詳情,結合航班資訊給我推薦合適的班次,訂完票還能自動幫我擬好郵件草稿。Gemini應用裡最新的“個人智能”功能之前就圈了不少粉,再過幾個月這個功能也會登陸Chrome。最讓人放心的是,這個功能全程都由自己掌控,想聯動哪些應用、不想讓它訪問哪些內容都能自己定,不想用了隨時能關掉。會記住你之前的對話內容,後續再查相關問題的時候,給出的答案會更貼合你的需求。你也可以提前跟它說清楚自己的偏好,比如喜歡簡潔的回答或者詳細的教學,它都會照著來。相當於瀏覽器從一個冷冰冰的工具,變成了懂你習慣的AI夥伴,不用每次都重複說明需求。Chrome的自動填充功能大家應該都用過,填地址、信用卡資訊確實方便。這次的自動瀏覽功能直接升級了,不再侷限於簡單的資訊填寫,能幫你處理複雜的多步驟任務。能幫你做的事特別多,規劃假期的時候,會對比不同日期的酒店和機票價格,幫你找到性價比最高的出行時間。更厲害的是處理複雜需求,比如想辦一場千禧年主題派對,看到一張喜歡的主題圖,它能識別圖裡的元素,幫你搜同款裝飾用品加入購物車,還會幫你控制預算自動用優惠碼。只要你授權,就算需要登錄帳號,它也能通過Google密碼管理器完成操作,全程不用自己動手。值得一提的是,Chrome後續會支援Google的通用商務協議,這個協議是Google和Shopify、Etsy這些大平台一起研發的開放標準。就是有了這個標準,AI能更順暢地幫你處理購物、預訂這類事務,不會因為不同平台的規則不一樣出現卡頓或者操作失敗的情況,後續用AI代辦商務相關的事會更靠譜、方便。說實話,看完這些更新,我最大的感受就是Chrome瀏覽器已經徹徹底底變成了一個作業系統,相信以後Google會陸續把更多的超強實用功能搬上來。網友表示,這比一般的更新要大得多。內建於Chrome的Gemini 3實際上改變了您的瀏覽方式。感覺瀏覽器一直以來都沒什麼變化,而這次終於有所不同了。這將把Chrome瀏覽器提升到一個全新高度。雖然我已經有一段時間沒用Chrome 了,但我可能會重新用它看看。Google簡直把所有人都吞噬了,功能上的絕對統治力,我太喜歡了!!(經管之家)
Google 王炸更新 Gemini 和 Chrome 合體 絞殺一切競爭對手...
很多人一直吐槽 Google,Gemini 那麼強了,人家都推出了AI瀏覽器,為什麼Chrome 卻一直還是原地踏步?Google 到底在幹嘛?現在它終於來了Gemini 和 Chrome 合體了...Google 剛剛發佈了基於最新 Gemini 3 模型的 Chrome 重大更新,這不僅僅是一個外掛或側邊欄的升級,而是對瀏覽器核心邏輯的重構。Chrome 正在從一個被動的“網頁瀏覽工具”,進化為一個能夠主動思考、替你幹活的“智能代理(Agentic AI)”。說實話,以前咱們用 AI 得經歷多少步驟?先開網頁、登帳號、想 Prompt,萬一網速不給力還得轉半天圈圈。要是想讓 AI 總結個網頁,還得在那兒苦哈哈地複製貼上,簡直麻煩得要死。這次升級後,Chrome 基本上變成了 Gemini 的“完全體容器”。Google 這次是打算把 AI 直接縫進你的瀏覽肌肉裡,甚至要開啟“無人駕駛”模式。這就帶大家看看,Google 這次到底在構思什麼“大殺器”。👇先文字長的,看視訊介紹:Side Panel:從“彈窗”變成“常駐協作者”Google 給 Chrome 加了一個新的 側邊欄(Side Panel)。Side Panel不只是一個簡單的聊天框,它變成了一個全能的指揮中心。以前用 AI,你得切出去,複製貼上,再切回來。現在?它就住在你手邊無論你打開那個標籤頁,Gemini 都隨時可用而且最重要的是:它能看懂你在看什麼多工處理神器:你可以一邊在首頁面寫方案、看資料,一邊讓側邊欄裡的 Gemini 去對比多個網站的產品資訊、彙總評價、提煉結論。比如你正在瀏覽幾個不同的數位產品頁面,你可以讓側邊欄裡的 Gemini 直接生成一個“橫向對比表”,把這幾個網頁的參數全部抓取並整理出你可以在首頁面繼續當前工作同時在側邊欄讓 Gemini 處理另一項任務不打斷、不切換、不複製貼上內建Nano Banana:螢幕上的圖片,直接改這是 Google 在端側 AI 上的新突破。你可以在瀏覽器裡直接對網頁上的圖片進行處理。以前你想看看一件家具放在房間裡是什麼效果,得先下載圖片、上傳到編輯器、祈禱效果還行……現在不用了。你可以直接指著螢幕上的圖片,讓 Gemini 修改...比如你看到一個房間的照片,想看看它更換裝修風格的樣子,你可以說:"幫我把這個房間換成淺色現代風家具。"它就直接生成了。不需要下載,不需要上傳,所見即所改。Google Workspace 深度打通Gemini 和 Google 全家桶的聯動也更深了。演示裡有個場景:你在看一份課程大綱(比如某個讀書會的書單),需要給學習小組發一封郵件,介紹一下要讀的書。以前怎麼做?1.看大綱,記住書名2.切到 Gmail,新建郵件3.切回大綱,複製書名4.切到 Gmail,貼上5.想寫介紹?再去搜一下這本書講什麼6.來回切換到頭暈……現在呢?你讓 Gemini 讀當前頁面的大綱,然後說:"從裡面挑三本書,寫個簡短介紹,用真人秀的風格寫,幫我起草一封郵件。"Gemini 直接從當前頁面提取資訊,在側邊欄裡把郵件寫好,連書的簡介都給你編好了(而且還是真人秀風格的,帶點戲劇性)。你全程不需要離開正在看的頁面。 大綱在主窗口,郵件在側邊欄,一心二用,效率翻倍。寫完之後,它還可以呼叫 Gmail,直接一鍵傳送。搞定。這種"讀當前頁面 + 執行另一個任務"的能力,才是 AI 真正融入工作流的樣子。Connected Apps:Google 全家桶深度打通接下來這個功能,打工人狂喜。Gemini 不只是跟 Chrome 聯動,而是跟整個 Google 生態打通了。官方叫它 Connected Apps(關聯應用)。目前支援的應用包括:Gmail(郵件)Google Calendar(日曆)YouTubeGoogle Maps(地圖)Google Shopping(購物)Google Flights(航班)這些應用可以在 Gemini 設定裡一鍵開啟。這意味著啥?舉個例子:你要出差參加一個會議,需要訂機票。以前怎麼做?翻郵件找會議時間 → 打開機票網站搜航班 → 比價 → 訂票 → 再寫郵件告訴同事你的到達時間……現在呢?你跟 Gemini 說一句:"幫我查一下下周那個會議的時間,推薦幾個航班,然後寫封郵件告訴同事我的到達時間。"Gemini 自己去翻你的郵件找會議詳情,自己去 Google Flights 查航班,自己幫你起草郵件。一句話,三件事,全搞定。個人智能 Personal Intelligence:越用越懂你這個功能目前還在預告階段,但聽起來非常值得期待:Personal Intelligence(個人智能)。允許 Chrome 記住你的偏好記住過去的對話上下文支援自訂指令提供更“像你助理”的回答簡單說,就是 Gemini 會記住你之前的對話上下文,然後基於這些記憶,給你更個性化的回答。比如你之前跟它聊過你喜歡什麼風格的酒店、你的預算範圍、你對航班時間的偏好……下次你再問它"幫我訂個酒店",它就不會從零開始問你一堆問題,而是直接根據你的偏好給推薦。從一個通用工具,變成一個懂你的私人助理。當然,Google 強調這個功能是使用者主動開啟的,你可以選擇連接那些應用,也可以隨時斷開。隱私控制權在你手裡。真正的核武:Auto Browse(自動瀏覽)上線!好,前面都是開胃菜。接下來這個功能,才是這次更新的真正炸裂之處↓Gemini 開始"接管方向盤"這是我最想吹爆的功能,沒有之一!以前 AI 只能“動嘴”,現在它能“動手”了。這就是所謂的 AI 正式接管“方向盤”。這是什麼概念?Gemini 不再只是"回答問題",而是真的能像人一樣打開網頁、點選按鈕、填寫表單、替你完成任務。場景一:訂酒店演示裡,使用者說:"我想去芝加哥,住某某酒店,幫我查一下這幾個周末的價格,還有一些其他要求。"Gemini 直接打開 Expedia,自己開新標籤頁,自己點日期選擇器,自己篩選條件,最後把搜尋結果整理好呈現給你。不是給你一個連結讓你自己去看,是它替你完成了整個搜尋流程。場景二:篩選公寓在 Redfin(美國找房網站)上,使用者說:"幫我看看我的最愛裡的公寓,把不允許養寵物的刪掉,然後把 Gabriel 加為協作者。"Gemini 打開收藏列表,點進每個房源,看細則,檢查寵物政策,不符合的自動移除,最後還幫你邀請了室友。一個小時的繁瑣操作,變成一句話。場景三:填表格使用者有一份 PDF 格式的球隊名單,要給一個線上報名系統填表。以前這是複製貼上的地獄。現在?"用名單裡的資訊,幫我報名,填上他們的名字和位置。"Gemini 從 PDF 裡提取資料,自動填進表單欄位。手工活,自動化了。想像一下這個場景:你想去大理旅遊,但你懶得翻攜程、看去那兒、查攻略。你只需要對側邊欄的 Gemini 說:“幫我查下 3 月中旬上海去大理最便宜的機票,順便搜下雙廊附近 500 元以內、評分 4.5 以上、帶露台的民宿。”接下來神奇的一幕發生了:瀏覽器會自動開啟一個新的“發游標籤頁”,你能看到它自己在搜尋框打字、自己在點滑鼠、劃螢幕、翻頁面。它不是在呼叫 API,而是在像人一樣替你上網。查完之後,它會在側邊欄給你列出一張清晰的對比表,甚至連預訂表單都能幫你填好大半,你只需要點個“支付”。這那是瀏覽器啊,這簡直是請了個全能小秘書。😂視覺購物:看圖下單,預算可控最後一個演示,是我覺得最"未來感"的一個。場景是這樣的:使用者看到一張 Y2K 風格派對佈置的照片(就是那種千禧年復古風),想復刻這個佈置。以前怎麼做?自己盯著圖,分析裡面有什麼東西——氣球、綵帶、背景布、裝飾道具……然後一個一個去電商網站搜,比價,加購物車,算總價,超預算了再刪幾個……現在呢?你跟 Gemini 說:"去 Etsy,幫我找到能復刻這個佈置的東西,加到購物車,預算不超過 75 美元。"Gemini 先用 Gemini 3 的多模態能力分析圖片內容(氣球是什麼顏色、背景簾是什麼款式、有那些道具),然後去 Etsy 搜尋對應商品,自己比價,自己控制預算,最後把商品加進購物車。更絕的是,官方還提到:Gemini 會自動幫你找優惠碼並應用上去。你打開購物車的時候,發現東西都選好了,總價正好卡在預算線上,優惠碼也用上了。從"我想要這個效果"到"購物車已就緒",一句話的事兒。這不是"幫你搜東西",這是"幫你買東西"。 購物體驗直接跳過了中間所有的繁瑣步驟。小互的思考:這背後的狠招是什麼?我覺得,這次升級其實暴露了Google 的一個陽謀:它想把瀏覽器變成 AI 時代的新型作業系統,從而截殺所有想分流的對手。為什麼這麼說?以前我們要用 AI,可能會去搜 ChatGPT,或者去用 Arc 這種號稱“AI 瀏覽器”的新玩意。Google 這一波操作,意思很明確:既然全球 60% 以上的人都在用 Chrome,那我為什麼不直接把 AI 變成空氣呢?它要讓你形成一種“肌肉記憶”——凡事不決問網址列,凡事想寫點啥點右鍵。這其實是在利用生態位進行防守反擊。還有一點是:Gemini 3 開始佈局 “Personal Intelligence(個人智能)”。只要你授權,它能讀你的 Gmail 郵件、看你的 Google 日曆、翻你的雲端硬碟。這意味著它比你更懂你自己。未來你將離不開它,遷移成本更加高!它不再是在提供搜尋結果,它是在直接提供決策結果。以前我們要搜“我的行程”,現在直接問它“我明天幾點出發去機場最合適”,它能自動結合你的機票確認郵件、即時的交通路況、甚至明天的天氣,直接給你一個最終答案。這其實是一個非常恐怖的閉環。Google正在把你所有的數字生活都圈在 Chrome 這個金魚缸裡。這曾經是 OpenAI 的主要競爭力,現在看來蕩然無存了!但這也有個潛在的代價,那就是你的瀏覽行為、你的歷史記憶、你的搜尋偏好,甚至你在網頁上輸入的每一個字,都在Google  AI 的“喂養”之下。雖然效率起飛了,但這種隱私的“裸奔感”,換個角度看,其實挺讓人唏噓的。我們是用一部分隱私和自主思考,換取了這種極致的便利。其他你可能關心的一些問題需要登錄的網站?也能搞定你可能會問:有些網站需要登錄才能操作,Gemini 怎麼辦?答案是:可以用 Google Password Manager。如果你授權了,Gemini 可以用你保存在 Google 密碼管理器裡的帳號,自動登錄網站,然後繼續執行任務。當然,這個功能需要你主動授權,不是默認開啟的。安全機制:敏感操作會暫停確認看到這裡,你可能會有點擔心:這麼強的自動化能力,萬一 AI 做錯了怎麼辦?Google 顯然也想到了這個問題。官方說,他們為 Auto Browse 設計了全新的安全防護機制,針對新型網路威脅做了專門的防禦。更重要的是,敏感操作會暫停並要求你確認。比如:下單付款前,會暫停,讓你確認在社交媒體發帖前,會暫停,讓你確認其他涉及隱私或金錢的操作,都會暫停你始終掌握最終決定權。 Gemini 是幫你幹活的,不是替你做決定的。UCP 協議:讓 AI 購物成為行業標準這個資訊可能比較技術,但值得一提。Google 還宣佈 Chrome 將支援一個叫 UCP(Universal Commerce Protocol,通用商務協議) 的開放標準。這個協議是 Google 和 Shopify、Etsy、Wayfair、Target 等行業巨頭一起制定的,目的是讓 AI 代理能夠在各種電商平台上無縫地代表使用者執行操作。什麼意思?就是說,未來不只是 Google 自己的服務,第三方電商平台也會支援這種"AI 代你下單"的模式。這是一個行業等級的變化。AI 購物不再是某一家公司的專屬功能,而是要變成整個電商生態的標準能力。什麼時候能用?在那能用?說了這麼多,什麼時候能用上?根據官方資訊:平台:MacOS、Windows、Chromebook Plus地區:目前僅限美國使用者:Auto Browse 功能需要 Google AI Pro 或 Ultra 訂閱Nano Banana:所有 Gemini in Chrome 使用者都能用對於國內使用者來說,可能需要自己想想辦法。但不管怎樣,方向已經很清楚了:AI 瀏覽器的時代,真的來了。 (小互AI)
救命!AI瀏覽器都捲成這樣了,怎麼大家還是用Chrome啊?
【新智元導讀】瀏覽器之爭已不單是速度對決!新玩家Atlas與Comet能替你訂票購物,AI代理時代已至;然而老大哥Chrome憑71%份額穩坐釣魚台。未來,是擁抱全能助手的便捷,還是警惕安全漏洞的深淵?決勝局就在此刻!你上網的時候,通常用什麼瀏覽器?Edge,Chrome,還是其他?有一股AI新勢力,開始對這些老牌瀏覽器發起挑戰。就在我們習慣了網址列搜尋、標籤頁切換時,一股AI新勢力正悄然潛入。它們不滿足於只做一個展示網頁的容器,而是想成為你的私人秘書,甚至是替你在網路世界的「替身」。爭奇鬥豔:AI新玩家亮出絕活這場大戰的開端,源於兩款激進的新產品。你的私人AI秘書:ChatGPT Atlas2025年秋天,OpenAI推出了名為ChatGPT Atlas的瀏覽器。它基於Chromium核心,把ChatGPT直接建在瀏覽器裡。在瀏覽網頁時,可以隨時拉出側邊欄問問題,它會記住你的瀏覽歷史,幫你完成多步任務,比如研究東西、自動購物或整理資訊。「瀏覽器記憶」功能,可手動選擇是否開啟。開啟這個功能後,瀏覽器能記住你之前看的房子、求職資訊、旅行計畫,下次直接接著聊。最亮眼的還是代理模式。對它說「幫我計畫周末去上海」,它能自己開標籤搜機票、比酒店、填表單。當然,重要決策還是由你決定。Perplexity Comet:超級研究與購物助手緊隨其後的Perplexity Comet則是另一副面孔。它更像是一個不知疲倦的研究員,主打「一邊瀏覽,一邊調研」。上網時,Comet的助手會陪你一起瀏覽,即時回答問題、自動化任務、總結頁面、生成帶來源的報告。如果問它「這個手機值不值得買」,它能立刻在側邊欄甩出一份對比表格,帶上優惠券資訊和全網評價。當Comet Assistant 識別出某項任務很重要,例如登錄特定網站或完成購物車中的購買——它會暫停操作,並在繼續執行前徵得您的許可。Microsoft  Copilot:穩紮穩打的跟隨者傳統的領路人Microsoft Edge也沒閒著,它依靠Copilot穩紮穩打,在Windows生態的掩護下,成了不少辦公族最穩妥的AI助手。圍城內外:老大哥Chrome的護城河看了這些眼花繚亂的功能,你可能會想:Chrome這下要被擠下寶座了吧?其實遠沒有。到2026年初,Chrome依然佔據著全球約71%的市場份額,穩坐釣魚台。原因也很簡單:它在Android手機和Windows電腦上是默認選項。速度快、擴展多、帳號同步無縫,億萬使用者已經養成習慣,想換沒那麼容易。Google也沒坐以待斃。從2025到2026年,Gemini迎來好幾波重大更新,連安裝包都不用下,就能體驗到更聰明的Chrome。不需要下載任何新應用,只要在網址列提問,Gemini 就能跨標籤整理資訊,甚至幫你總結一段視訊。它還能跨標籤找資訊、自動處理一些簡單任務,比如總結視訊或找回以前瀏覽過的頁面。最近幾個月,Gemini in Chrome也開始開發代理功能,幫你處理重複瑣事,比如預約理髮或每周買菜——你說一句話,它就在網頁上操作。移動端也隨之更新。現在,美國使用者已經能免費用Gemini in Chrome,響應更快,能邊刷邊問。不知不覺間,Chrome就變了樣,發現時AI已經無處不在。很多人試過Atlas和Comet後直呼新鮮,但一到日常工作、刷劇、同步書籤,還是切回Chrome——畢竟習慣難改。新玩家想在短期內動搖這個基本盤,難度確實不小。繁華背後的暗礁然而,新技術的萌芽總是伴隨著爭議。在Reddit和X上,關於AI瀏覽器的吐槽從未停歇。最讓人頭疼的是性能。不少使用者發現,Atlas和Comet在執行複雜任務時,偶爾會「當機」,卡頓、崩潰,甚至讓筆記型電腦發燙嚴重。有人開玩笑說,用AI瀏覽器上網,就像是在給電腦「人工催熟」。更深層的危機藏在安全防護裡。網路安全機構LayerX的一項測試發現:在釣魚網站的攔截測試中,傳統的Chrome和Edge攔截率都在50%左右,而Atlas僅有5.8%。「提示注入攻擊」更是AI瀏覽器繞不開的噩夢。駭客在網頁中埋下一段指令,當你讓AI總結網頁時,它可能已經被洗腦,偷偷轉發了你的私人郵件。OpenAI坦言,這或許是一個永遠無法徹底根治的漏洞。甚至有諮詢機建構議企業暫時封殺這些AI瀏覽器,理由很簡單:它們優先考慮了體驗,卻犧牲了安全。未來,誰主沉浮2026年才剛開始,這場較量遠未到終局。短期內,Chrome的霸主地位依然堅如磐石。但在特定領域,縫隙已經產生:研究者偏愛Comet的敏銳,ChatGPT的重度使用者則離不開Atlas的深度。未來,我們可能不再需要自己點來點去,而是對著螢幕說一句話,AI就能幫我們搞定一切。但在這之前,誰能先解決那個名為「安全」的難題,誰才能真正贏得使用者的長久信任。你會繼續守著老朋友Chrome,還是已經準備好,搭上這艘稍顯顛簸卻充滿想像力的AI航船? (新智元)
抱歉了Chrome,這次我選中國這款AI瀏覽器
【新智元導讀】全面融合千問,夸克AI瀏覽器全面升級!不切應用、不換標籤,隨時喚起千問AI助手,實現作業系統級全域喚起的互動形態。學生黨、打工人的真正生產力神器來了。ChatGPT推出Atlas,Google股價應聲下挫超4%。AI瀏覽器正在成為國際巨頭新角力場。PC作為人們工作+學習主力的場景,正成為 AI 搶佔的下一個超級入口。一方面,移動端螢幕太小,輸入慢,生產力場景碎片化;另一方面,真正的深度思考、複雜創作、協同辦公,始終是PC大屏的主場。11月26日,夸克全面升級為更強大的AI瀏覽器——這次直接把千問AI助手焊進了瀏覽器,並行布六大千問AI套件;無需切換標籤或應用,支援任意場景喚起千問;成為國內首個實現「作業系統級」的全域AI體驗。此番煥新亮相,再次宣告了阿里全力進軍AI to C的市場野心,代表著阿里AI戰略(C計畫)持續升級落地。2025年AI瀏覽器的終極戰場,阿里正在下一盤更大的棋。新一代AI瀏覽器登場如今,打開電腦點開夸克,它已經搖身一變,全新升級為「夸克AI瀏覽器」。其實,這一步並不突然。前段時間,背靠阿里Qwen大模型推出「千問App」,並以「最強模型做最好個人助手」的姿態重新殺回C端市場。這一次,夸克升級,直接對標Chrome,打造全球領先的AI瀏覽器。夸克的底氣來自那裡?1、阿里AI戰略持續升級,基於阿里生態優勢,全力入局AI to C,搶佔PC超級入口。2、基於阿里最強大模型Qwen,夸克全面融合了千問,讓瀏覽器長出「第二外腦」。3、全球領先的AI產品形態,實現系統級「全域AI」能力,隨時桌面可喚起千問。自2023年上線後,Qwen「全家桶」不斷升級迭代,在業界廣受好評。如今,Qwen 3成為阿里大模型家族最強AI。就連Hugging Face CEO多次公開力薦Qwen模型。毋庸置疑,Qwen 3就是阿里最大王牌,支援文字、圖像、語音等多模態輸入,是實力全能型選手。它的即時推理引擎,可以毫秒級響應,即便面對複雜任務也能從容應對。基於Qwen搭建的夸克,針對瀏覽器場景做了深度定製,整合了強大的自然語言理解、網頁結構解析,以及使用者意圖與上下文關聯能力。同時,搭配的千問AI助手,推理、理解、執行能力強大。它不僅適合日常問答、創作,也適合科研、推理研究;文采出眾、專業領域也能提供高品質的回答。作為新一代AI瀏覽器,夸克回答更聰明、處理任務更高效,體驗也更加絲滑。一手實測,妥妥的生產力神器夸克全面融合了千問,無需頻繁切換標籤和應用,隨時召喚AI。邊瀏覽網頁邊對話、邊閱讀文章邊總結,即問即答,彷彿有個AI副手隨時待命。接下來,我們展開了一波最全面的實測。桌面級智能助理,隨時待命這次升級,最大的亮點便是——AI不再被關在某個網頁或某個小外掛裡。和很多「裝了AI外掛的瀏覽器」相比,差別就在這裡——別家是「你找AI」,夸克想做到「AI伴隨左右」。全域桌面喚起千問的入口是多元的:千問讀屏、快捷框、懸浮球、側邊欄、劃詞、螢幕擷圖。以上方式皆可實現,可做到隨時隨地,即問即答。舉個栗子,《瘋狂動物城2》即將在國內上映了,想要瞭解下觀影體驗,直接對話方塊問千問就可以了。千問給出的總結,非常全面。它並非直接羅列分析,而是先提供高度凝練的結論,再系統地從四個維度進行闡釋。甚至最後,它還附上了影片精準的上映時間。無需查詢多個網頁,即可掌握要點,節省大把時間。一句話,隨時喚起千問幫你幹活。點選千問懸浮球,或是Alt+空格/Option+空格即可一鍵喚起千問快捷框。不論是搜尋、創作、總結、翻譯,還是做表格、做PPT,甚至是格式轉換,一句話就夠了。i人大學生怎麼練習口語?千問隨即給出了一套行之有效的實操指南。當你還在為課程論文頭疼時,千問可以直出一份邏輯清晰、結構完整的寫作框架。不管是學生還是打工人,做表、做PPT都是必修的功課。如今,一句話千問就能搞定了。它還可以一句話轉格式,課堂上、會議上白板的文字,能一鍵提取並幫你轉成PDF。在工作、學習,不論遇到了何種問題,都可以隨時喚醒千問。更強大的是,無需打開夸克瀏覽器,千問AI也能做到有問必答。千問讀屏「讀屏」的本質,是共享螢幕讓AI能夠在即時讀懂螢幕上的內容,理解、分析並給出回答。要做到這一點,必須具備超強的多模態與即時互動能力,遠超普通文字問答的難度。舉個例子,把Karpathy考驗Nano Banana題目共享給千問,讓它給出解答。在解題之前,千問第一步需「看」——識別出螢幕中的文字。不僅要看懂,還要理解和推理。接下來,它會分析當前任務的意圖,然後逐步推理,給出精準的答案。亦或是在工作中,閱讀一些文件不得要領時,打開千問讀屏,一鍵總結。我們又接著文件後續內容進行提問——「Google這次打了勝仗了嗎?那些話可以體現」。沒想到,千問可以根據已有的內容,做出判斷分析,然後給出總結。通過多輪提問,輕輕鬆鬆就能把工作搞定。更驚喜的是,千問讀屏還可以共享應用——WPS文件,支援Word和PDF形式。想要緊追AI前沿論文,千問幫你把論文的全貌總結得清清楚楚。可以看到,不論在做什麼,千問都可以即時洞察螢幕內容,理解人們的當下所需。這一過程非常簡單,無需複製、截圖、解釋,就能得到精準回應,讓打工人、學生黨更加專注做事。千問側邊欄你是不是也曾有過這樣的煩惱,在看一篇難啃的英文文章時,整篇通讀下來不得要領。這時,「千問側邊欄」隨時出動,用不了多久就能總結一篇詳細的摘要,讓效率大幅提升。再比如,看一份技術報告,卻不懂一些專業術語的含義,千問可以解決。千問劃詞閱讀時,遇到一個不懂的詞,或是想要瞭解更多資訊,不用關鍵詞搜尋,「千問劃詞」就可以。千問劃詞的能力,貫穿整個PC系統。不論是在夸克,還是是本地檔案、WPS等第三方應用,皆可實現全域桌面喚起千問。千問螢幕擷圖更厲害的是,千問螢幕擷圖也可以即問即答。擷取一張肥皂膜奇點的圖片,千問一下子就能解釋明白。不僅如此,想要提取圖片中的文字,螢幕擷圖後點選「提取文字」,複製貼上順手搞定。經過多輪實測後不難發現,夸克此次煥新升級,真正實現了全域桌面喚起千問。作為比較,OpenAI Atlas也原生整合了ChatGPT對話能力,進入首頁即可喚醒ChatGPT。在打開任意網頁時,點選「Ask ChatGPT」或側邊欄直接呼叫,論文解讀、總結、改寫都能實現。不僅如此,Atlas還可以開啟「Agent模式」,讓ChatGPT代為操作,在瀏覽器中填表、訂機票....不過這種能力,僅侷限在Atlas中使用,跳脫了這個瀏覽器,便不能喚醒ChatGPT了。全面融合千問的夸克AI瀏覽器可以做到——隨叫隨到,即問即答。不論在夸克瀏覽器裡面,還是在桌面、任何第三方應用,皆可喚醒千問AI助手,做到了真正的系統級全域喚起AI的能力。智能瀏覽:絲滑的工作流幾十年來,網際網路深刻地改變了資訊傳播的方式。對現代人來說,能不能上網很重要;而上網,離不開瀏覽器——這關乎我們如何認知資訊。但資訊不是結果,大家期待讓工作更輕鬆的工具出現。而AI時代的到來,讓阿里看到了這種可能:將AI能力深度嵌入電腦作業系統,把夸克AI瀏覽器打造為更專業的生產力工具。這次升級了下列功能:智能標籤管理線上文件直接編輯超級播放器PDF對照翻譯跨端流暢傳輸雲端儲存,智能尋找首先,幫你智能管理標籤,運行更流暢,介面更清爽。點選夸克AI瀏覽器左上角,可以快速搜尋——多標籤不再混亂,幫你快速找到所需頁面。右鍵一點就可以給網頁建立標籤組,重新命名、選顏色,輕鬆將相關的網頁,比如說項目的文件或者學習資料歸納到同一個分組裡。標籤可以自由收起或者展開,再也不用擔心頁面雜亂無章:而且它可以智能管理高記憶體頁面,確保全程流暢,在不同任務和工作流之間絲滑切換。這避免了瀏覽器崩潰打斷工作流,從而提升使用者資訊處理效率。但對生產力工具而言,穩定運行也是基本要求。在此之上,夸克圍繞辦公、學習等場景下的高頻需求,還有獨有的「殺手鐧」。比如,辦公或學習中最常用到的PDF檔案,在過去處理起來比較繁瑣。過去,你可能要採取下列步驟:夸克AI瀏覽器的「PDF編輯」就簡單多了:線上PDF檔案,無需下載,線上查看、批註這次,夸克不止可以查看PDF,還提供了下列實用功能:高效處理:隨時劃詞批註和修改、一鍵標記。隨心編輯:可直接選中、複製、搜尋。最關鍵的是,PDF編輯的能力更強大,可以直接打開或直接拖入瀏覽器,圖片上的文字也能直接編輯——對於學生黨等需要查看外文的使用者來說,夸克的對照翻譯尤其實用——上傳或打開PDF,AI自動生成雙欄對照排版,外文即時對照翻譯:專業文獻、論文、報告再也不用來回對照。夸克太懂學習需求了——阿里最強AI模型支援,中文翻譯質量有保障。閱讀、學習、整理PDF,一切都更輕鬆。對於辦公黨而言,夸克這次跨端傳輸解決了多端同步的痛點:文件、網頁、大檔案都能跨端傳輸,100G大檔案也能輕鬆傳;讓電腦的工作也能在手機上隨時處理,實現工作無縫銜接。傳送網址,PC端只需右擊網頁標籤,點選「傳送到手機」,即可在手機端接收到相關連結。比如,在夸克AI瀏覽器中修改好的PDF檔案,在起始頁,只需點選瀏覽器右上↗️工具列中的「紙飛機」快傳功能,即可傳送檔案。這些能力過去在各類AI、App裡也能實現,但需要頻繁切換標籤、應用、甚至需要各種手動螢幕擷圖、複製連結、上傳檔案,費時費力。夸克要解決的是「摩擦成本」——打開夸克,所有完整工作流都在一個AI瀏覽器完成。夸克背靠阿里生態,使用Qwen領先模型+深度融合千問,讓人人都能免費享受行業首創的全域AI能力。再加上夸克一貫的「無廣告干擾、啟動載入極速、資料更安全」的基本盤,整體體驗是:把複雜工作流做簡,把必要摩擦力做到最低。這是夸克敢於對標Chrome的底氣——Chrome通過Gemini模型重構搜尋欄,實現自然語言對話與生成式回答;夸克則通過C計畫全面升級為AI的PC超級入口,主打提高生產力:一句話辦成事,工作更絲滑。在這場AI重塑資訊入口的變革中,夸克以全新AI互動形態,通過垂直場景深耕與生態整合建構差異化競爭力。搶攻AI新入口,全球巨頭血戰AI這波浪潮,重新點燃了瀏覽器的戰火。傳統瀏覽器只做兩件事:一是顯示HTML/JS渲染出的頁面;二是根據關鍵詞發起搜尋。比如,想要寫一篇報告,開一堆標籤頁,需要自己搜、自己讀、自己總結,尤其是在資訊極度過剩的今天,更加讓人頭大,且時間成本高。最關鍵的是,它根本不理解人類進行中的任務,也不會歸類tab,針對頁面做總結。還有一個非常重要的因素是,傳統搜尋的商業模式高度依賴廣告,而國內瀏覽器最為典型。對於每個人來說,原本只想找個答案,結果滿屏廣告、雜訊,體驗感大幅降低。大模型的出現,不僅從底層重塑了瀏覽器,還帶來了一場生產力的效率革命。它的核心,就是讓AI去看、去總結,做資訊壓縮和結構化處理,而且讓「智能體」去承接學習、辦公等任務。放眼全球,全球科技巨頭和AI初創公司的重磅玩家們,各有各的打法。以Google、微軟為代表的巨頭,選擇了在傳統瀏覽器上「加AI層」。微軟Edge瀏覽器,將Copilot深度整合到側邊欄中;GoogleChrome接入Gemini,總結網頁、下單等任務皆可實現。而AI瀏覽器「新貴」最典型代表,莫過於Perplexity的Comet,OpenAI的Atlas、原創Arc公司的Dia......Comet直接把Perplexity對話式搜尋嵌入了瀏覽器,以其出色的搜尋、總結、規劃等能力,贏得了行業口碑。Atlas主菜是「智能體」,其「Agent Mode」可自主代勞,完成調研、比價、訂機票等複雜任務。回到國內戰場,一些網際網路巨頭紛紛將AI植入瀏覽器中,而更多在基本上面的能力實現,比如對話、總結這類。AI的滲透,僅停留在表層,並未觸達PC超級入口的核心。可以看到,幾乎每個有實力的玩家,都想要在AI瀏覽器中分一杯羹。夸克的這次升級,直接把戰場天花板拉高了一個量級,加入了全球AI瀏覽器佇列。當系統級全域 AI 變成標配,當「一句話幹活」成為新的互動範式,當瀏覽器從資訊入口升級為智能中樞——2025年這場AI瀏覽器的終極戰,拼的就不再是誰的AI功能多,而是誰能真正改寫人們工作的方式。對阿里而言,此次夸克AI瀏覽器的全面升級,實現超1.1億電腦使用者喚起千問,都是在搶奪當下和未來的流量入口。 (新智元)