在矽谷的Perplexity辦公室裡,阿爾溫德·斯里尼瓦斯正在勾勒一幅全新的網際網路藍圖——AI不再只是回答你的問題,而是進化為貼身的智能代理,幫你過濾海量資訊、管理日程,甚至主動為你網購、篩選好友、安排行程。
這位27歲的印度裔CEO,從IIT馬德拉斯到加州大學伯克利分校,從OpenAI實習生到挑戰Google搜尋霸權的創業者,他的公司Perplexity在兩年內從零成長為估值90億美元的AI搜尋引擎,月活使用者超過1000萬。
Perplexity被稱為"AI版Google"。與傳統搜尋引擎截然不同,使用者可以用自然語言提問,它會即時搜尋網路,整合多個權威來源的資訊,並生成帶有引用連結的精準答案。從學術研究到投資分析,從日常購物到旅行規劃,Perplexity正在重新定義人們獲取資訊的方式。目前,Perplexity每個月處理超過7.8億次查詢,增長率超過20%。
不過,這位年輕的CEO並不滿足於做一個"AI版Google”。他們剛剛發佈的Comet瀏覽器,正在重新定義人類與網際網路的關係。在這個AI原生瀏覽器中,智能代理不僅能理解你在做什麼,還能主動幫你完成各種任務——這意味著,AI不僅成為你的工具,更開始介入和重塑你的線上生活方式。
“很多人想靠給聊天機器人加功能來超越ChatGPT,但他們完全搞錯了方向。”斯里尼瓦斯說,“聊天層的競爭已經結束,真正的機會是在聊天之上,建構端到端的智能代理工作流。”
當AI瀏覽器大戰一觸即發,Google緊鑼密鼓地整合AI功能,OpenAI據傳也即將入局,Perplexity則已經率先行動。當AI真正“代替”我們上網、決策、互動時,網際網路本身或許也將被徹底改寫。
核心要點:
1.Chrome多次"誤殺"Perplexity擴展,迫使其開發獨立瀏覽器
2.AI代理可忽略廣告直接購買,將摧毀Google廣告商業模式
3. Google受制於成本、安全和內部協調,給創業公司留下機會窗口
4. Comet混合架構讓登錄資訊留在本地,比OpenAI方案更安全
5. 內部基準PPLxBench用真實使用者資料,比學術基準更可靠
6. AI競爭核心在上下文工程和工具協調,而非模型本身
7.瀏覽器開發需長期投入,高門檻將成競爭護城河
8.技術進步超越人類適應速度,需更多企業家創造新就業
嘉賓介紹
阿爾溫德·斯里尼瓦斯(Aravind Srinivas)
Perplexity AI聯合創始人兼CEO(圖左)
馬修·伯曼(Matthew Berman)
主持人,知名AI領域YouTuber和技術評論家(圖右)
主持人馬修·伯曼:阿爾溫德,感謝你的到來。首先我想談談,是什麼促使你們開發自己的網頁瀏覽器?
阿爾溫德·斯里尼瓦斯:這個想法的起源是我們注意到的一個現象:世界上大約150億次搜尋查詢中,70-80%都是通過瀏覽器的搜尋框進行的,也就是Chrome或Safari的網址列。這個被稱為為"Omnibox"(全能搜尋框)的統一搜尋框,實際上是Google流量的最大入口。
但真正讓我們下定決心的,是一系列"不愉快"的經歷。我們曾經開發了一個Chrome擴展,可以將Perplexity設為默認搜尋引擎。結果呢?Chrome更新後,這個擴展就神秘消失了。我自己都遇到過這種情況——去Chrome應用程式商店一看,發現擴展被"自動解除安裝",理由是"可能在收集你的搜尋資料"。
我們還做過一個側邊欄擴展,讓使用者可以隨時向我們提問頁面相關的問題,但經常無法正常工作。
這讓我想起了Google當年的經歷——微軟曾經推送IE瀏覽器更新,專門移除Google工具列,這直接促使Google決定開發自己的瀏覽器。歷史總是驚人地相似。
因此,我們意識到必須掌控自己的命運。雖然開發瀏覽器對我們這樣專注核心產品的公司來說是巨大的分心,但我們不能只做防守。
關鍵的轉折點是:我們看到了只有在瀏覽器環境下才能實現的功能——AI代理。
想像一下,一個AI助手可以跨越你的不同標籤頁提取上下文,深度研究你的Slack(企業即時通訊和協作平台)、Notion(生產力工具)或Google Docs(Google文件),回覆郵件,整理日程安排會議。這些都是傳統個人助理會做的事情。
對小企業主來說,它可以比較商品價格,分析Reddit(美國知名社交新聞聚合網站)上使用者評論來調整行銷策略——而這些工作原本需要花費數小時或僱傭專門團隊。
主持人馬修·伯曼:開發一個全新的瀏覽器從零到發佈只花了8個月的時間,這確實很瘋狂。
阿爾溫德·斯里尼瓦斯:是的,雖然我們基於Chromium(Google開放原始碼的瀏覽器項目)開發,但就像所有軟體都基於Linux一樣,我們都站在巨人的肩膀上。
更重要的是,我們不只是做了一個瀏覽器,而是我們讓 AI 代理功能達到了足以讓使用者驚豔的水平。能夠在短短八個月內發佈第一個版本,我感到非常自豪。
當然,這遠遠沒有結束。接下來,我們要確保產品能夠穩定地服務於上百萬使用者,並在這個基礎上持續擴展和最佳化。
之所以選擇自己做瀏覽器,一方面是出於防守——避免被第三方平台所限制,真正掌握自己的命運;另一方面也是主動出擊——有些創新和體驗,只有在我們完全掌控客戶端的情況下才能實現。
主持人馬修·伯曼:Google會繼續在瀏覽器中加入AI功能,OpenAI據說也要推出瀏覽器。你們如何保持競爭力?
阿爾溫德·斯里尼瓦斯:對於Google的挑戰,本質上和我們在搜尋領域面臨的問題是一樣的——經濟模式的根本衝突。
想像一下這個場景:如果AI代理替你點選連結、閱讀內容、做購買決策,甚至直接完成購買,那企業為什麼還要在Google AdWords(Google的廣告平台)上花費數十億美元?
使用者完全可以對AI說:"忽略所有廣告連結,只點選真實內容,閱讀所有評價,觀看相關YouTube視訊,然後為我買最好的那個,購買前確認一下就行。"
如果AI花15分鐘就能完成這種複雜的任務鏈條,並基於你的喜好給出建議,那其他商家在這個關鍵詞上的廣告投入就完全白費了。
這對Google AdWords業務是致命打擊。商家會被迫把錢更多投向品牌廣告而不是效果廣告。這也解釋了為什麼Google在去年的年度開發者大會上發佈的Project Mariner(AI代理項目)功能有限,而且藏在每月250美元的付費計畫後面。
對擁有1000億美元現金流的Google來說,把這種技術放在200美元/月的付費牆後面很奇怪,除非他們不想破壞現有業務。他們有太多需要保護的東西,不敢把這種技術開放給所有人。
其次是成本問題。推理成本極高,向30億使用者提供這種服務需要巨大投入。這對正在崛起的公司反而有利,因為你不可能一夜之間服務30億人,需要逐步擴展。
第三是安全風險。我們是創業公司,人們期待我們去挑戰,願意接受一個功能強大但還不完美的產品。但對Google來說,安全標準和企業級安全要求極高,在他們最重要的資產——搜尋業務的聖盃Omnibox上犯任何錯誤,代價都是巨大的。
就像當年Bard(Google的AI聊天機器人)演示出錯,Google股價就跌了7%。如果因為在瀏覽器中的AI錯誤導致使用者轉向Safari等其他瀏覽器,那損失會非常慘重。
最後是組織架構問題。Google內部有人負責AI,有人負責瀏覽器,有人負責廣告,讓所有部門就發佈計畫達成一致需要幾個月時間。
而我們認為這個時間窗口足夠我們發佈這些功能,獲得初始核心使用者,並打造更好的產品。
主持人馬修·伯曼:你之前提到不想爭第二名,只想爭第一名。
阿爾溫德·斯里尼瓦斯:很多人想通過在聊天機器人上增加更多功能來超越ChatGPT,但他們完全搞錯了重點。聊天層的遊戲已經結束了,OpenAI完全贏得了這場競爭,沒必要逃避這個事實。
Google顯然會繼續努力保持第二名,但相距甚遠。我對爭奪第二名沒興趣,我要爭第一名。而端到端的智能代理工作流程是在聊天之上的一層。
瀏覽器是我們使用頻率超過ChatGPT的產品,而且粘性極強——一旦習慣了某個瀏覽器,切換需要很大成本。
我覺得這是Google第一次真正處於劣勢。即使他們想破壞自己的商業模式,僅僅讓使用者點選連結,向數十億使用者提供這種耗費大量算力的AI代理服務,對他們來說也是巨大的開支。
甚至我們現在也做不到——Comet目前只對有限使用者和候補名單上的人開放。這是一個全新的產品類別,你不能只是快速迭代。一切都需要時間,所以你要承受真正的痛苦來開發這個產品。
我們希望這能成為很好的競爭門檻——不只是發佈客戶端的第一版,而是持續升級,不斷推出新功能,並承諾在這裡投入十年的工作。
主持人馬修·伯曼:當我開始使用Comet時,我看到了網路瀏覽的一些未來景象。人類和真實網際網路之間似乎出現了某種分離,中間會有一個代理。這是你們的願景嗎?
阿爾溫德·斯里尼瓦斯: 我希望網路不會變得那麼糟糕,以至於大部分內容都是AI生成的垃圾資訊。但坦率地說,現在已經有這種趨勢了。
每當我在X(原Twitter)上發推文,大量回覆都是機器人,我不斷把它們標記為垃圾資訊,但似乎很難處理。
這確實是Comet的一個絕佳應用場景:讓它自動篩讀文章或推文,過濾AI垃圾,只提煉有用資訊,並按需整理,直接在本地客戶端展示給我。
你可以建構自己想要的版本。比如你收到大量連接請求,沒時間逐一處理,就可以說:"過濾所有連接請求,只保留至少有一個共同聯絡人的。我不想接受來自完全不認識的人的請求。"
或者你舉辦活動,有200人想參加,你可以說:"按這個標準篩選,去LinkedIn上查看他們的背景,看看是否來自知名品牌,這些是我想要的品牌類型,先把這些人給我,接受他們的請求,然後發郵件通知他們已被錄取。"
這些都是枯燥乏味的任務,原本需要你或團隊成員花費多少小時?我們希望基於你提到的訊號雜訊比問題——如果由於AI的氾濫,網路資訊的訊號雜訊比會隨時間下降,那麼Comet就是對抗它的方式:
每個人都有自己的個人AI來過濾垃圾資訊,只給你有用的資訊。
主持人馬修·伯曼:與完全託管在雲端的代理環境相比,本地代理的體驗有什麼根本區別?
阿爾溫德·斯里尼瓦斯:關鍵區別在於安全性和使用者體驗。
為什麼有人會希望在別人的伺服器上保留第三方應用的登錄狀態?這風險極大。你必須確保他們刪除cookie連結或認證令牌,這些都是使用Comet時不需要擔心的問題,也是我們與OpenAI的Operator(網頁操作工具)的方法的重大區別。
他們試圖在伺服器端保留所有內容,以無頭模式(headless mode,後台自動化操作)運行,要求你進行身份驗證,然後儲存認證令牌或保持持久cookie。這不是讓使用者對安全性放心的好方法。
瀏覽器為我們提供了客戶端和伺服器端架構的混合方案。所有登錄資訊都保留在客戶端,所有第三方服務的登錄狀態都在客戶端,這些資料都儲存在你的客戶端上,我們不必獲取任何資訊。
當你讓Comet代理執行任務時,它只會從瀏覽器的打開標籤頁中提取該特定任務的相關資訊,解析螢幕並完成任務。任務所需的智能來自伺服器端——運行在雲端的強大模型。
主持人馬修·伯曼:如果我想刪除這些查詢記錄怎麼辦?
阿爾溫德·斯里尼瓦斯:你可以要求我們不儲存任何資料。如果你想刪除查詢記錄,可以到Perplexity刪除。如果你想在隱身模式下運行,我們甚至不儲存這些提示或中間的思考過程。一切都保持安全。
這樣,我們既能真正幫助你,確保所有資訊都屬於你,又能受益於伺服器上的前沿智能,但只在需要時將其應用於你的資料,永遠不需要讓你在我們的伺服器上保持登錄狀態。
另一個重點是Omnibox。如果有人爭論:"為什麼我需要瀏覽器?給我一個聊天窗口,我跟它對話,它就能為我做一切",我覺得人們並沒有意識到——AI還沒準備好100%可靠且自主地完成所有事情。
你仍然需要親自處理很多任務。比如我不會信任Comet精準地為Perplexity做財務會計。我們有大量現金,我不會信任它登錄投資銀行或商業銀行。這些系統的登錄本身就很複雜,而這些事情AI當前還做不到。
既然你還需要用瀏覽器來處理這些重要任務,為什麼不在一個統一的環境中完成所有工作呢?
這就是瀏覽器為你提供的價值。Omnibox本來就是你輸入大部分內容的地方。如果我能直接在那裡幫助你,或者在你瀏覽的任何網頁上與你協作,就像一個智能助手站在你身邊一起瀏覽,這會非常強大。
這就是為什麼我們認為瀏覽器方案完全合理,而不是把你鎖定在一個完全不同介面的桌面應用中,試圖建構那些流式介面。整合在瀏覽器中的體驗要好得多,因為這是使用者本來就熟悉的環境。
主持人馬修·伯曼:Perplexity支援很多不同的AI模型,最近還在X上發佈說Kimi模型在內部評估中表現不錯,很快會開始後訓練。你們如何選擇要整合的模型?後訓練又是什麼樣的?
阿爾溫德·斯里尼瓦斯: 我們有一個內部基準測試,叫做PPLxBench。這是一個不斷加入更多提示的基準。
每當有人在X上標記bug,或直接從產品、Discord、Reddit等管道報告問題時——我們有很多收集bug的管道。但我們不會像X AI(馬斯克的AI公司)那樣立即修復bug——他們只是修改提示來解決問題。
我們的做法是將這些問題加入到評估集中,嘗試一起修復一批bug,可能是提示更改,也可能是後訓練更改,然後在基準集上重新評估。
這樣基準集會不斷擴展,包含對我們產品和使用者真正重要的提示。這為我們在提示版本控制或後訓練方面的任何更改提供了真實訊號,幫助我們判斷是否進行了有效的後訓練。
每當有新模型發佈時,我們不必僅僅依靠學術界的最新基準。我們可以實際看到它在內部評估中的表現,這些評估涵蓋了許多不同的垂直領域和用例。一旦模型表現良好,任何模型提供商都很難過度擬合我們的基準,因為我們沒有公開版本。
雖然他們可能通過挖掘類似訓練集的更多提示來過度擬合學術基準(即使評估集是私有的),但他們無法為Perplexity挖掘這些資料,因為這些都是真實使用者資料。
我們的後訓練方法是:採樣一些我們目前表現不好的提示,加上一些模型作為通用模型必須擅長的提示,將所有這些組合成後訓練集。我們同時進行SFT(監督微調)和RHF(人類反饋強化學習),其中RHF使用的是DeepSeek設計的GRPO演算法。
主持人馬修·伯曼:目前所有後訓練都在DeepSeek模型上進行嗎?
阿爾溫德·斯里尼瓦斯: 是的,但我相信 Kimi 很快會趕上。我們還有阿里巴巴 Qwen(通義千問)的小型微調版,廣泛用於各種分類任務。
實際上,Perplexity 不只用一個核心聊天模型。比如,系統需要判斷你的請求是否涉及個人資料、是否要生成財務介面、圖表、結構化卡片或購物查詢等,每次搜尋時大約有 20 個不同模型協同運行。即使你只選了一個模型,後台也會調動其他模型共同處理,因為單一模型無法獨立完成所有任務。
OpenAI也在這樣做。每次你在ChatGPT上提問,他們決定是否搜尋網路,那只是一個分類器。這就是為什麼AI最終會被那些擅長上下文工程的人掌控——他們能夠整合所有相關上下文,協調所有相關工具,並將所有內容打包成出色的使用者工作流程。
主持人馬修·伯曼:你們是否需要與前沿模型提供商競爭?
阿爾溫德·斯里尼瓦斯: 不僅僅是那樣。很多人認為我們不懂如何訓練模型,這不對。我們當然有大語言模型的專業知識。但問題不在於一次性發佈一個模型——Mistral(法國AI公司)曾經做過,但今天沒人談論他們的模型了。為什麼?
因為你必須持續生產模型,這是永無止境的旅程。
除非有人真正實現了通用人工智慧或者超級智能,否則你就必須不斷在各種排行榜和基準測試上爭奪領先地位。如果你做不到,最優秀的研究人員就會選擇加入那些能夠做到的實驗室,或者被願意開出上億美元年薪的人挖走。
你必須全身心投入創立一家能夠提前兩年規劃、持續建設數十萬GPU叢集、採購大量能源並自建資料中心的公司。
主持人馬修·伯曼:所以關鍵是訓練對產品和使用者真正重要的模型。
阿爾溫德·斯里尼瓦斯: 我們現在關注兩件事:第一,打造具備高精準性、帶引用且無虛假資訊的優秀總結能力——這已通過 Sonar 模型實現,目前大多數搜尋都依賴於它。
第二,我們希望訓練出能高效控制瀏覽器的模型,比如快速點選和切換標籤。目前,我們雖然能用內部模型進行上下文打包和總結,但在具體決策和實際操作上,還沒有專用模型,因此這一能力尤為珍貴。
我相信,不久的將來就能實現本地高效運行。像我們訓練出強大總結和對話能力模型一樣,我也有信心將專業能力應用於“瀏覽器控制”領域。這個模型無需龐大,但要足夠通用和靈活,兼具推理和專門化,才能實現對瀏覽器的高速操作。
目前 Comet 執行複雜任務需四五分鐘,如果能將其縮短到一分鐘以內,那才是真正的“魔法”。唯一的辦法,就是訓練出既小巧又高效的自研模型,並開發專屬推理核心,全面提升速度。
主持人馬修·伯曼:這些模型會在使用者電腦上本地運行嗎?
阿爾溫德·斯里尼瓦斯: 如果能實現本地運行,將非常理想。雖然我不確定 MacBook 的性能是否足夠,但如果可行,這將是我們的首選方向。
現在,微軟部分筆記本已配備 NPU,MacBook 也有 M1 晶片。如果一年後我們能做到,不僅速度更快,隱私也能得到保障——所有資料都可以留在本地,無需再擔心伺服器端。這將是一次真正意義上的突破。
主持人馬修·伯曼:很多人擔心AI會取代他們的工作。你對此有何看法?
阿爾溫德·斯里尼瓦斯: AI肯定會對社會產生這種影響:那些真正站在使用AI前沿的人,會比不使用AI的人更容易找到工作。這是必然會發生的。
但大家忽視了真正的問題:這不是AI與人類的簡單對立,而是技術進步的速度達到了前所未有的程度。
即使你告訴人們'必須開始使用AI,學會如何使用AI,通過AI為團隊創造更多價值,提高效率',但人類從來都不擅長快速適應。
我們雖然有適應能力,但這次真的在挑戰我們的極限,特別是面對每三到六個月就更新換代的技術。
主持人馬修·伯曼:所以你相信那句行業老話:"擁有AI的人會取代你,而AI本身不會"?
阿爾溫德·斯里尼瓦斯: 是的,但我覺得這不是簡單地告訴人們"去使用AI"就能解決的問題。我認為要求人們跟上時代需要付出很大努力。因此,有些人會失業,因為也許跟上這些超出了他們的能力範圍。
社會需要湧現更多企業家來創造新工作。因為每家公司都需要更少的人。那些失業的人要麼最終自己創業,利用AI;要麼他們學會了使用AI,為需要招聘的新公司做貢獻。
在這之中會有一個臨時階段,所有的位移和轉變都在這個階段發生。在這個階段,你會看到一些人在掙扎,沒必要粉飾這一點。
主持人馬修·伯曼:Box公司的CEO亞倫·列維(Aaron Levie)幾周前對我說,隨著AI變得更好、人們使用更多,公司實際上不會需要更少的人。
他的論點是,如果他有一個使用AI極其高效的團隊,難道他們不應該是他首先投資、擴展的團隊嗎?
阿爾溫德·斯里尼瓦斯: 我認為這是一個很好的長期論點,但這個論點的缺陷在於它假設總是會有大量懂得如何使用AI的人才供應。
我想強調,人們的適應速度不會那麼快。
主要不是因為我們自身的侷限性,而是因為技術進步的速度。它進步得比我們通常的適應速度更快,所以需要我們付出更多努力來跟上時代。
你知道O4和O3之間的區別嗎?很多人甚至不知道,仍然停留在GPT-4.0這個默認模型上。現在瀏覽代理要來了,某個時候它會使用你的電腦,填寫表格。顯然某種形式的勞動將不再需要。我希望人們盡力而為,不要掉以輕心。
主持人馬修·伯曼:最後,你對那些擔心被AI取代的人有什麼建議?
阿爾溫德·斯里尼瓦斯: 這個轉變是真實存在的,速度也是前所未有的。但歷史告訴我們,每一次技術革命最終都創造了更多的機會。
關鍵是要主動適應,而不是被動等待。
你有沒有想過,為什麼要花錢請理財顧問、房產經紀人或中介?其實你為這些建議和服務付出了不少,只是很少意識到這一點,因為社會運作本就是如此。
AI工具也是如此。如果你認為通過使用AI獲得了與家人相處的時間,或者幫你每年多安排一次度假,在工作中表現出色,獲得晉陞,這些完全彌補了你在AI工具上的投資,人們就會開始把AI看得不像是在為Netflix或Spotify付費,而是:
"我是否願意為了更好的生活而投資,讓自己更容易獲得長期成功?"
那些能夠掌握AI工具的人,將在這個新時代中找到自己的位置;而那些選擇迴避的人,可能真的會被時代拋在後面。這不是危言聳聽,而是現實。但同樣現實的是,機會就在那裡,等著那些願意學習和適應的人去抓住。
我希望人們盡最大努力,不要輕視這個問題。少花時間在社交媒體上無意義地瀏覽,多花時間使用AI。不是因為我們想要你的使用量,而是因為這是你為新社會提供價值的方式。 (每日天使)