這是一場瀏覽器之爭。
OpenAI似乎真的想用人工智慧顛覆一切。
上個月,這家新創公司發佈了Sora,這是一款由AI驅動的社群媒體影片應用程式,目前依然位居蘋果App Store下載榜首。現在,該公司又將目標瞄準了網頁瀏覽器市場——Google憑藉Chrome已經主導這一領域十多年。
周二,OpenAI發佈了首款AI驅動的瀏覽器,名為ChatGPT Atlas。這款新應用程式為網路的未來描繪了令人期待的藍圖,儘管實現這一目標可能還需要一些時間。
OpenAI在一篇部落格文章中表示:“一款基於ChatGPT打造的瀏覽器,讓我們距離真正理解你的世界、幫助你實現目標的超級助手更近了一步。”
ChatGPT Atlas已在Mac平台上線,Windows、iOS和Android版本也即將推出。
OpenAI表示,他們的瀏覽器將使ChatGPT的功能始終可用,無需切換到其他標籤頁或進行複製貼上。該應用程式能夠瞭解目前網站視窗的資訊背景,並結合以往的對話內容以及使用者的瀏覽歷史進行回應。
這款瀏覽器的設計風格和使用者介面與Chrome相似。我可以想像,把ChatGPT放在主螢幕或側邊欄,作為網頁瀏覽體驗的核心,並結合以往互動實現更好的個人化,這對於從幫助撰寫更好的郵件到解答各種問題都會非常有用。
但這次發佈中最吸引人的部分,是瀏覽器具備的名為Agent模式的自主代理能力。使用者可以讓瀏覽器完成多步驟任務,例如訂機票、線上購物或進行資料分析。此時,瀏覽器會真正接管螢幕,為使用者完成相關操作。
例如,在一次直播示範中,一位OpenAI高層讓瀏覽器根據目前網站視窗顯示的食譜,為八個人產生一份食材清單,並隨後在Instacart上下單購買這些雜貨。
我自己在家也嘗試了Agent模式。我下載了Atlas,讓它在Uber Eats上從我最喜歡的當地泰國餐廳點一份泰式炒河粉。瀏覽器最終完成了任務,但在處理各種菜餚選項、在頁面上來回點選以及篩選彈窗廣告時顯得有些吃力。整個過程花了好幾分鐘才完成。
以目前的狀態來看,它的速度太慢了。我寧願自己動手。但它的潛力是顯而易見的。主要的障礙在於,瀏覽器會透過擷取頁面截圖來分析每個頁面,並試圖判斷在每個網站的介面上該點選那裡。
從我的觀察來看,我相信具備自主能力的瀏覽器和AI瀏覽器將是未來的發展方向,但目前的版本讓我想起了當年第一次用撥接數據機上美國線上(America Online)體驗網際網路的感覺。我相信它會變得更好,可能還需要一年的時間才能真正實用。 AI模型和演算法會不斷進步,支撐自主運算的GPU也會變得更強大。
當然,這個領域的巨頭也不會袖手旁觀。根據Statcounter的資料,GoogleChrome在瀏覽器市場的佔有率高達72%。幾乎可以肯定,Chrome很快就會大力整合AI代理功能。
我很期待未來幾年Google和OpenAI之間的激烈競爭,這將為使用者帶來更多功能和創新。 (鈦媒體AGI)