OpenAI 推出瀏覽器:“讓位吧,Chrome”

台北時間10月22日凌晨,沒等來傳聞中的Gemini 3,等來了OpenAI正式發佈首款AI瀏覽器ChatGPT Atlas。

簡單來說,這是一個把ChatGPT"塞進"瀏覽器的產品,你在任何網頁上都能隨時喚出ChatGPT側邊欄,讓AI幫你總結內容、編輯文字、甚至代替你完成購物和預訂任務。

聽起來有點像Chrome裝了個ChatGPT外掛?確實如此,但OpenAI的野心遠不止於此。

關於OpenAI開發瀏覽器的傳聞早在2024年11月就已流傳,做瀏覽器的目標很明確,爭奪網際網路資訊入口的控制權,獲取更多使用者資料。如今靴子落地,Google股價一度下跌了不少。

有趣的是,OpenAI正是用一個長得最像Chrome的瀏覽器,來挑戰Chrome,用你最熟悉的方式打敗你。ChatGPT Atlas沒有選擇激進的介面革新,也沒有太多功能創新,而是保留了多標籤、網址列這些使用者習以為常的元素,只是把AI放到了瀏覽的中心位置。

那麼,ChatGPT Atlas究竟有那些功能?它和市面上已有的AI瀏覽器相比,又有什麼不同?

讓ChatGPT無處不在的瀏覽體驗

側邊欄:ChatGPT隨時待命

ChatGPT Atlas最核心的設計是將ChatGPT深度嵌入瀏覽器。在任何網頁上,使用者都可以點選Ask ChatGPT按鈕,喚出一個側邊欄。這個側邊欄自動獲取當前頁面的上下文,使用者可以直接要求ChatGPT總結程式碼差異、比較產品參數、分析文章觀點,無需再複製貼上內容。

首席設計師Ryan在發佈會上演示了這一功能,強調這是“範式轉變”,瀏覽器從"僅僅展示資訊"變成"理解資訊甚至編輯資訊"的工具。但坦白說,Perplexity的Comet、The Browser Company的Dia這些AI瀏覽器早就有了。側邊欄+頁面上下文,已經是AI瀏覽器的標配。

類似的是Cursor Chat功能,在網頁的任何文字框中,使用者用游標選中文字後可以直接呼叫ChatGPT進行內聯編輯。比如在Gmail寫郵件時,選中一段話,讓ChatGPT"整理我的語言"或"改成更正式的語氣",修改後的文字直接替換原文。這確實省去了在多個標籤頁之間來回切換的麻煩。

瀏覽器記憶:幫你記住更多

ChatGPT Atlas引入了“瀏覽器記憶”功能,這是它與傳統瀏覽器的重要區別。它不只記錄你訪問過那些網站,還會記住你在頁面上的操作行為,看了什麼內容、對比了那些產品、完成了什麼任務。

這意味著你可以用自然語言搜尋歷史,比如問"找出我上周看過的所有職位招聘,並總結行業趨勢",ChatGPT會呼叫這些記憶給出個性化的分析。CEO Fidji Simo在部落格中舉了個例子,她經常瀏覽無麩質食譜,現在可以直接讓ChatGPT“根據我最近看的食譜制定本周菜單”,並通過Agent模式在Instacart上自動下單。又是菜譜?看來OpenAI對"根據食譜買菜"這個場景情有獨鍾。

當然,這個功能完全可選。使用者可以在設定中查看、歸檔或刪除所有記憶,也可以在網址列控制某個網站是否允許ChatGPT讀取。清除瀏覽歷史會同步刪除相關記憶。

記憶功能本來就是ChatGPT率先推出的特性,遷移到瀏覽器是自然的延伸。但問題在於,這需要使用者對OpenAI有足夠的信任,畢竟,讓AI記住你的所有瀏覽操作和行為,聽起來就像在網上“裸奔”。

Agent模式:本地版Operator

對於Plus、Pro和Business訂閱使用者,ChatGPT 提供了Agent模式。這是一個可以代表使用者執行任務的AI代理,它能打開標籤頁、點選按鈕、填寫表單、完成購物流程。可以簡單理解為本地版的Operator。它在Atlas的標籤頁裡行動,而不是像Operator那樣用一台雲端的獨立瀏覽器。

發佈會上的演示場景包括根據食譜計算八人份配料並在Instacart下單、在Google Doc中加入評論並轉換為Linear任務。又是訂票、買菜、訂餐廳。這些演示場景從Operator發佈時就在用,已經不新鮮了。

經過我們的測試,目前的網頁AI代理在簡單任務上表現尚可,但處理複雜問題時仍不夠可靠。OpenAI自己也承認,Agent可能會犯錯,甚至可能受到網頁中隱藏的惡意指令影響。OpenAI強調Agent是"協作式"的,使用者可以隨時監控進度或接管控制權。

在我們的測試中ChatGPT Atlas未能完成電商比價任務

安全方面,Agent僅在使用者的標籤頁內運行,不能在電腦上執行程式碼或訪問檔案系統。在金融網站等敏感場景,它會暫停並等待使用者確認。使用者也可以選擇"登出模式",限制Agent訪問已登錄的帳戶資料。

它和其他AI瀏覽器最大不同,就是它是OpenAI發佈的

AI瀏覽器賽道已經相當擁擠。Perplexity的Comet主打AI側邊欄和多步驟任務自動化,還有能主動給出洞見的背景助手,同樣免費開放,Microsoft Edge的Copilot模式整合了聊天和搜尋功能,支援多標籤對比和語音控制,與微軟生態深度繫結;The Browser Company的Dia則更注重介面美學和工作流最佳化,強調與標籤對話的能力,可以作為寫作夥伴和個人助理。

所以單從目前功能層面,ChatGPT Atlas並沒有從樣貌上徹底重新設計瀏覽器。側邊欄、頁面總結、自動化任務,這些都是很多AI瀏覽器的標準配置。它也沒有推翻瀏覽器的形態本身,只是把AI放到了瀏覽的中心位置,讓使用者在熟悉的介面中獲得智能化的體驗。此外,首發就面向所有使用者開放(Agent模式除外),也體現了OpenAI快速佔領市場的決心。

在體驗上,接下來它還需要證明自己不只是Chrome加了個ChatGPT外掛。畢竟Edge早就引入了Copilot,而Chrome也可以輕易加入Gemini側邊欄,Gemini游標、Agent模式,還有著龐大的使用者基數和生態優勢。

但在此之外,OpenAI的Atlas絕對不只是“又一個瀏覽器”這麼簡單。

在OpenAI的思路里,你也能看到,他們強調的Atlas的亮點之一,就在於與ChatGPT帳戶的深度整合,瀏覽器可以呼叫使用者在ChatGPT中的歷史對話和偏好設定,實現跨裝置、跨平台的一致體驗,跨會話、跨網站的記憶系統也不只是單次對話的上下文,對於重度ChatGPT使用者來說,有了它至少可以少開一個應用,也不用跨窗口複製貼上了。

OpenAI CEO Fidji Simo在部落格中闡述了發佈ChatGPT Atlas的意圖,“我們希望ChatGPT從一個孤立的、被動的文字聊天介面,演變為一個直覺化的超級助手,連接你需要的所有服務。”她提出了ChatGPT將成為你生活的作業系統。而瀏覽器是這一戰略的關鍵節點,因為它是大多數人獲取資訊、完成任務的入口。

也就是說,OpenAI的Atlas最大的“不同”,就是它是由OpenAI發佈的。

ChatGPT Atlas帶來的是ChatGPT整個生態的能力與使用者關係。這使得它是第一個可以不只在Chrome設定的規則內進行功能修補,而試圖從根本上改變人們對瀏覽器的使用邏輯的產品——它要在已經被ChatGPT塑造了使用習慣的數億使用者的基礎上,把瀏覽體驗的核心從Google的搜尋引擎,轉移到OpenAI的AI模型上。

這本質上還是OpenAI要把ChatGPT打造成未來全知全能的作業系統的路線裡,必要的一步。

用一個最像Chrome的樣子,對使用者來說熟悉的介面幾乎沒有學習成本;而對競爭對手,尤其是Google而言,這算是一個真正的警告了。接下來可以預期的是,它會迫使Google、微軟等巨頭更快速地將AI深度整合進自己的瀏覽器產品。所有人都會捲入OpenAI的AI時代作業系統之爭中去。 (矽星人Pro)