Perplexity CEO潑冷水:Agent 2025落地不靠譜!下月將推出自研瀏覽器——目前建構通用智能體的唯一方法!



剛剛,AI搜尋獨角獸Perplexity的CEO在採訪中給Agent澆了盆冷水!

不同於奧特曼等人的樂觀論調。Aravind直言不諱:


任何說Agents今年可用的言論都很可疑。
Anyone saying agents will work in 2025 you should be skeptical of it.



此前,奧特曼曾說,今年Agents將“加入勞動力大軍”,並實質性地改變公司的產出方式。Aravind顯然無法同意這個觀點。在模型廠沒有硬體優勢的基礎上,他們很難突破各種生態限制,讓 AI Agent可以同時控制多個應用。

而這將成為AI初創公司打造通用Agents的最大困境。

不過。Aravind已經找到了他認為目前唯一的解法——從零開始自己造瀏覽器。

Perplexity CEO Aravind表示:目前沒有其他方式能讓 AI Agent同時控制多個應用,尤其是在 iOS 上,甚至無法訪問其他應用,這是蘋果生態的限制。而我們不想受制於蘋果的規則,所以需要尋找一個變通的方法。在短期內,瀏覽器是一個非常好的解決方案。因為本質上說,瀏覽器就是一個作業系統。

Perplexity的這個瀏覽器,將推動AI走向智能體搜尋時代。他們建構的智能Agents將可以幫使用者預訂、購買商品、制定旅行計畫,比如訂酒店等等。而且會根據使用者的偏好進行個性化設定。(當然,Aravind說這是一個長期願景,今年的效果不會非常完善。)


回到這場訪談,還有Aravind大佬還奉上其他精彩的觀點,在此畫個重點:

  • GPT一家獨大的時代結束了,模型差異正在走向細分。DeepSeek的橫空出世具有革命性意義,其創造的低成本奇蹟,讓大家都開始思考建構AI業務並不需要燒那麼多錢和卡。
  • Aravind認為:在 AI 產品中,只有兩個核心特性能夠真正幫助建立使用者信任:公開來源引用和思維鏈。Perplexity是唯一擁有這兩個特性的產品。
  • AI安全風險被過度炒作了,不過面對這方面挑戰,開源才是唯一行之有效的解法。
  • 按照當前的趨勢——人工智慧的計算成本大約每年降低 8 倍。即使保守估計,這種趨勢還能持續兩年。這對AI初創擴大產品規模是絕佳機會。
  • DeepSeek 在 AWS等雲平台使用的的邊際成本幾乎為零。因此,隨著更小、更高效的模型推出,AI 的使用成本就可以接近於零。

此外,Aravind還爆了個有意思的料,他已經一年半沒寫過程式碼了,對具體的技術細節已經有些脫節了。因此當DeepSeek的論文火遍矽谷時,他大量使用Perplexity完成整個論文的學習。

以下是訪談的全文整理 enjoy:



01 AI產品獲得使用者信任的路徑:顯示引用來源、公開思維鏈

主持人:很高興來到這裡。我們是 Perplexity 的投資方,不過我們會儘量保持真實,提出一些尖銳的問題,進行一場真實的對話。

很高興能和你一起交流,Arvind。讓我們先來瞭解一些背景資訊,儘管大家可能已經很熟悉 Perplexity 了,但還是先把基本情況講清楚。

你在印度長大,本科就讀於印度理工學院馬德拉斯分校(IIT Madras),後來移民到了美國,目前仍在辦理相關手續。祝你綠卡申請順利!

Aravind Srinivas:很快就會有“金卡”了。(編者註:“金卡”是美國政府近期推出的一項新移民計畫,外國投資者只需支付500萬美元,即可獲得美國永久居留權(類似於綠卡),並有機會申請美國國籍。)

主持人:風投界有句話,"Pay to play"(花錢才能入場)。

你拿到了加州大學伯克利分校(UC Berkeley)的電腦科學博士學位,這可是了不起的成就!(Go Bears!)。之後,你進入了 Google DeepMind 和 OpenAI 從事研究工作,作為研究科學家,你在這兩個當時最重要的機構裡,親歷了早期生成式 AI 模型的發展。

主持人:如今,Perplexity 是一個面向消費者搜尋、通用知識學習,以及企業解答的“答案引擎”。目前,每月的查詢量已達 5 億次——這個資料對記者們來說很重要,因為他們需要統計資料。Perplexity 現在已經覆蓋全球所有國家和地區,使用者遍佈世界各地,還有成千上萬的企業客戶。

最近這幾周你們非常忙碌,開展了深入的研究,部署了 DeepSeek 模型,僅用幾天時間就開放給開發者。現在,你們又在推出企業版的 Deep Research,速度快得驚人。這是怎麼做到的?

Aravind Srinivas:整個 AI 領域的發展速度快得令人驚嘆。我認為,目前唯一能保持競爭力的方式就是“跟上這個速度”。這既是好事,也是壞事。壞處是,基本沒辦法有充足的睡眠,無法過上輕鬆的生活。好處是,你能體驗到這片領域帶來的所有創新和不斷迭代的產品。

無論使用者有什麼投訴或發現了那些 bug,我們都會日夜修復。我覺得這真的很棒。再過五年,知識將變得隨手可得,研究成本將大幅降低,軟體開發會更加簡單,建構產品的速度也會更快。從這個角度來看,這種產品帶來的可能性令人驚嘆,而行業內的競爭對手們也在不斷創新,以保持領先,我覺得這非常棒。

主持人:現在,AI 領域正處於一個有趣的節點。大家都認可 AI 模型的價值,它們積累了大量的價值,並在全球各個組織中產生了巨大影響。而 DeepSeek 似乎正在進一步推動高價值 AI 技術的“商品化”。你怎麼看待這場競爭?目前,模型的競爭主要依賴於基準測試(benchmark),但 Perplexity 似乎採取了不同的策略,你更關注應用層。那麼,你的願景是什麼?

Aravind Srinivas:關於 AI 模型的“商品化”,我覺得很多人還沒有真正理解其影響力。不過,我們不只是聽我的看法,而是可以看看那些在這個領域投入了數百億美元的人的觀點。

比如,微軟 CEO 薩提亞·納德拉(Satya Nadella)在最近的多次採訪中表示,他們曾經在 GPT-4 時代取得的領先優勢已經結束了。過去,我們處於一個只有一個模型遙遙領先的時代,這種領先優勢至少持續了一年,甚至一年半。

但現在,這種局面已經改變了,領先優勢可能只維持幾周,而且在不同領域,各家模型各有所長。比如,Anthropic 的模型在程式碼生成方面表現最佳,OpenAI 的模型擅長其他任務,Google DeepMind 可能在不同的領域更強,而 DeepSeek 在某些方面更具優勢。

因此,模型之間的差異正變得更加細化。所有公司都在圍繞相同的基準測試不斷最佳化,填補自身的短板。開源模型的出現,也會迫使閉源模型做出反應。畢竟,閉源模型的商業模式依賴於不斷說服投資者投入更多資金,以建構更大規模的計算叢集,訓練更強大的模型。如果無法保持領先,而開源模型又能被輕鬆微調,那麼想要持續籌集 100 億甚至 1000 億美元的投資就會變得更加困難。

DeepSeek 這一事件確實具有革命性意義。無論他們是否真的只花了 600 萬美元訓練模型(這點仍然有爭議),但可以確定的是,他們的投入遠低於傳統的閉源模型訓練成本,卻打造出了一個極具競爭力的 AI 模型。這個模型不僅能與最好的閉源模型媲美,還能完整提供推理過程,即“透明的推理鏈路”(transparent chain of thought)。


在 AI 產品中,只有兩個核心特性能夠真正幫助建立使用者信任:

  1. 來源引用(Source Citations)——AI 模型需要告訴使用者,它的資訊是從那裡來的。否則,使用者無法判斷答案的真實性,也不知道如何使用這個答案。
  2. 推理鏈路(Reasoning Trace)——完整透明的推理過程,展示 AI 是如何得出答案的。

目前,我們是唯一真正同時提供這兩個特性的產品。

封閉實驗室不提供推理鏈的原因,是因為他們要在模型中保護自己的智慧財產權(IP),所以他們不想免費公開這些內容。但開源模型沒有這種限制,比如 DeepSeek 並不需要保護任何 IP,它直接免費開放了模型權重。

然後你可以基於這些權重進行定製,彌補模型的盲點,移除審查機制,甚至在某些基準測試(比如金融領域的查詢)上最佳化模型表現,而不需要投入太多資金。你可以在任何資料中心託管這些模型,或者使用 Fireworks 這樣的模型提供商快速部署。這種趨勢迫使封閉模型的公司降低 API 價格,或者推出更優的替代方案。

而作為一個對模型保持中立的產品,如果你直接面向使用者,持續增長使用者群體,快速迭代產品,不斷修復問題,並為全球知識工作者提供價值,你就有很大的機會勝出。

主持人:還有一個有趣的點,特別是對於企業使用者來說,不僅僅是面向消費者。當企業有敏感的專有資料,並希望將其用作 AI 的資料來源進行檢索(RAG),在模型和應用層之間建立抽象層就顯得尤為重要。這樣可以確保信任,比如 Perplexity 這樣的公司可以在 ChatGPT 或 Claude 的服務條款中明確這一點,而這種抽象層實際上劃定了明確的邊界。

Aravind Srinivas:無論是消費者還是企業使用者,其實沒有人在乎自己用的是那個具體的模型,人們真正抱怨的是:為什麼它無法連接我的 Google 或 Microsoft 資料?為什麼它不能按照我想要的格式輸出結果?我想直接點選檔案,在站內查看;我希望它能幫我建立工單……人們只是希望能使用最好的模型,而且他們不想操心技術細節。

這些問題是產品建構者需要解決的。因此,我們的獨特優勢在於,我們可以用同樣的產品滿足消費者和企業使用者的需求。普通消費者可以直觀地理解那些模型在那些任務上表現良好,而企業使用者則需要額外的安全合規性保障,以及與各類資料來源的整合。

過去,面向消費者和企業的技術堆疊通常是完全不同的,比如用於網頁搜尋的檢索機制,並不適用於企業的內部搜尋。

但大語言模型的出現,使得“研究代理”(Research Agent)成為可能——它可以一次性處理多個檔案,提取相關段落,進行推理,並按照使用者需要的格式返回答案,同時具備對話能力。這種方式將網頁搜尋和企業內部搜尋統一了起來,最終成為一個知識管理和研究工具,整合了不同的資料集和模型,並將它們封裝在一個統一的體驗中——這正是 Perplexity 在做的事情。


02 開閉源之爭:開源是AI安全的唯一解,將帶來應用爆發

主持人:我們再聊聊開源 vs. 封閉模型的問題。我認為這是當前基礎模型領域最重要的話題之一。在當前的政治環境下,開源模型是一把雙刃劍。好處是任何人都可以下載、使用權重、微調模型,並將其託管在美國的資料中心,而不受模型最初來源的限制。但同時,也有人擔憂,開源模型若落入不當之人之手,或來自“敵對國家”,可能會帶來安全風險。因此,封閉模型實驗室正在遊說政府反對開源,這其實就是典型的政府-企業博弈。

那麼從長遠來看,你如何看待開源 vs. 封閉模型?Perplexity 作為一個保持中立的公司,如何在其中找到平衡?從社會競爭和技術發展角度來看,你覺得那種模式更好?

Aravind Srinivas:我們今天使用的很多技術——手機、筆記型電腦、網際網路——都是基於開放原始碼軟體和協議建構的。整個世界都依賴於這些技術,比如 Linux、Android,它們都是開放原始碼專案。網際網路本身就是建立在早期開源協議上的。所以,如果我們關注的是安全性和信任,那麼開源才是唯一行之有效的路徑。AI 領域也應該如此。

我很喜歡 Bill Gurley 說過的一句話:如果某種技術真的很危險,那就應該讓更多人來審視它,而不是讓更少的人掌控它。否則,技術的安全性將完全取決於某個小群體的判斷,尤其是當這個群體正積極遊說封禁開源時,那顯然存在利益衝突。畢竟,他們的商業模式依賴於開源被封禁,這樣他們就能籌集更多資本,建立更大的資料中心,並提高 API 價格。

而所謂的安全性擔憂,可能根本站不住腳。即便這些擔憂屬實,開源模型的公開可見性使得更多人可以共同驗證其安全性。如果有廣泛共識認為某種技術確實危險,我們可以採取措施確保其安全發展。

目前來看,所謂的“AI 安全風險”被過度炒作了。除非 AI 發展到超級智能(superintelligence)的水平,能夠成為國家級威脅(比如一個由多個強大 AI 組成的叢集),否則對開源模型的恐慌是不合理的。

所以目前我非常支援開源,我相信這將促進應用層的繁榮,會有更多公司能夠以可持續的方式提供這些模型,建立自己的業務,直接為使用者創造價值,並有效地實現盈利,從而創造大量的經濟價值,這是件了不起的事情。而我們正在嘗試這麼做,我也看到有幾家公司在做類似的事情。在未來五年內,我希望能有更多 AI 原生的應用,為人們帶來巨大的價值。


03 一切都是套殼,能為使用者提供價值的就是好產品

主持人:以一個與模型無關的方式來看,回顧 2023 年初或年中,我記得我們是在 Perplexity 上認識的。當時人們說,這只是一個很棒的 AI 套殼(wrapper)。

套殼(wrapper)。這種說法有點貶低的意味,意思是所有的價值最終都會集中到大型語言模型(LLMs)上,而這些只是封裝層。即使到現在,人們仍然傾向於將世界分為兩類:一類是 LLMs,另一類是產品或應用,無論是硬體還是軟體。但我知道你對 Perplexity 有不同的看法。在這個框架下,你如何看待 Perplexity,或者說你是否打破了這個框架?

Aravind Srinivas:我之前說過一句話,甚至廣泛傳播開了:到頭來,一切都是套殼(wrap)。確實有一些公司在訓練自己的模型,但它們沒有自己的晶片,沒有自己的資料中心,只有 Google 擁有完整的一套晶片、資料中心和所有基礎設施。甚至就連晶片,你自己也不會去製造,而是交給別人代工。所以,從某種程度上來說,一切都是套殼,只是抽象層次不同罷了。

關鍵在於,你是否能大規模地為終端使用者提供真正的價值,並在此基礎上建構一個持續增長的業務。而如果你所依賴的基礎設施正在逐漸變成商品化的東西,那就太棒了。這正是當前的趨勢——人工智慧的計算成本大約每年降低 8 倍,每個季度降低 2 倍,或者說每 4 個月降低 2 倍。目前的估算是,即使保守估計這種趨勢還能持續兩年,我們也會看到成本下降 20 到 50 倍。這意味著在當前相同的價格下,我們可以為 50 倍的使用者提供服務,並在更高的規模上建立更強的業務,這是一個極好的機會。

另一方面,我還想補充一點:一旦這些模型能夠真正對使用者的資料進行上下文理解,核心價值將不再是模型本身的權重,而是如何獲取並整理這些資料,為使用者提供真正有用的服務。

比如,模型能呼叫使用者的 Google Drive、Gmail、旅行資訊、購物記錄,甚至整合來自各種社交媒體和線上活動的資訊。真正的價值在於如何打包所有這些資料,為使用者提供精準的個性化輔助,而不僅僅是模型本身的參數。

實際上,模型只是一個資訊轉換器——它在進行推理、對話,並保持上下文一致性,但核心價值來自於它對使用者(或企業)的瞭解。這正是我們希望建構護城河和核心價值的地方。如果能在大規模上實現這一點,我們將會是一家極具價值的公司。


04 Perplexity做瀏覽器:建構Agents的唯一方式

主持人:我們來談談護城河吧。這個世界變化很快,幾乎每天都有新模型發佈,未來的公司在解決知識獲取問題後,會逐步進入 AI 代理(Agent)時代,以執行具體任務。不同的 AI 形式也在發展,比如 iOS、Android、Windows、Mac 等等。在這樣一個框架下,你認為企業需要做出選擇嗎?Perplexity 在這個生態中如何定位?

Aravind Srinivas:我認為目前所有的 AI 公司都在盡力覆蓋所有平台。我們有 Mac 端應用,其他公司也有。我看到微軟今天剛推出了他們的 Mac 應用。我們也即將推出 Windows 端應用,同時也在網頁端提供服務。

此外,我們還有 iOS 和 Android 端的移動應用,在 Android 端甚至可以作為原生助手(Assistant)運行,無需打開 App。我們還宣佈下個月將推出自己的瀏覽器。

本質上來說,瀏覽器就是一個作業系統。你可以在瀏覽器裡完成幾乎所有的知識型工作。這其實也是 Google 當初推出 Chrome OS(Chromebook)的概念:作業系統本質上就是瀏覽器。這意味著我們可以基於瀏覽器建構許多 AI 代理(Agent),並且能夠從各種來源提取資料。

我們之所以要做瀏覽器,是因為目前沒有其他方式能讓 AI 代理同時控制多個應用,尤其是在 iOS 上,甚至無法訪問其他應用,這是蘋果生態的限制。而我們不想受制於蘋果的規則,所以需要尋找一個變通的方法。在短期內,瀏覽器是一個非常好的解決方案。

我們正在建構的智能體(agents)將允許你預訂、購買商品、制定旅行計畫,比如訂酒店。而且它會根據你的偏好進行個性化設定,比如你喜歡住那些酒店、偏好的房型、喜歡什麼樣的景觀等等。基本上,我們是在為你打造一個私人助理或者是執行助理(executive assistant)。

當然,你仍然可以有一個真人助理(EA),但有些人負擔不起。而這個產品可以成為他們的“80/20”方案(指以較低成本提供大部分核心價值)。現實中,人們為私人助理支付的薪資通常在 10 萬到 20 萬美元之間。如果我們能以 10 到 100 倍更低的價格提供 80% 的價值,那將是一個很好的商業模式。

我們希望通過這種方式,讓我們的核心產品——這個問答引擎(answer engine),能夠儘可能廣泛地可訪問,並且免費提供給使用者。這是一個長期願景,不會在今年實現。目前任何人聲稱 2025 年的智能體(agents)可以完全投入使用,都應該持懷疑態度。但我們正在嘗試找出一些可以率先落地的簡單場景,比如讓使用者購買商品時無需手動輸入信用卡資訊和收貨地址等。這類簡單的工作流程,我們希望在 Perplexity 上進行抽象化處理。


05 隨著模型的輕量、高效化,使用AI的成本可以接近於零

主持人:如果你考慮未來的模型發展方向,現在的 AI 實驗室(labs)已經開始建構產品了。他們意識到,像 ChatGPT 這樣的產品佔據了 OpenAI 收入的主要部分,而不是開發者 API 請求帶來的收入。

Anthropic 非常專注於企業市場,而 Mistral 也是類似的情況。DeepSeek 既希望發展企業市場,也希望面向消費級使用者。他們正在籌集大量資金,也有豐富的算力資源。不過這對他們來說既是優勢也是劣勢,因為他們被自己的模型所繫結。那麼,作為一家初創公司,你們如何與這些融資數十億美元的 AI 巨頭競爭呢?

Aravind Srinivas:關鍵在於資金的使用方式。他們可能籌集了 10 倍甚至 100 倍的資金,但其中 80% 可能只是用於建造資料中心。那麼,我們真的需要那麼多資源嗎?DeepSeek 讓整個行業都開始思考這個問題。

或許,我們可以把那些超大規模的模型進行蒸餾(distill),變成更小但依然高效的版本,並將其投入生產環境。如果這些模型是開放原始碼的,或者能以合理價格通過 API 提供,即使那些 AI 巨頭不願意這麼做,雲端運算巨頭(hyperscalers)也願意這樣做。畢竟,他們追求的是規模經濟(economies of scale)。如果能有一種成本低廉、價格親民的模型,雲端運算廠商一定會推動它的發展。事實上,DeepSeek 已經在 AWS 和 Azure 上提供,它們的邊際成本幾乎為零,使用者只需要支付伺服器費用。

所以,如果有類似的更小、更高效的模型,AI 的使用成本就可以接近於零。而在這樣的情況下,創業公司所籌集的資金就可以真正用來打造更好的產品、招募優秀的人才,開發下一代產品和新功能,而不是把錢都砸在資料中心上。

有人會嘲笑我們免費提供 Pro 版本,但這其實是一種戰略。類似於當年 Google 通過向網站支付費用,換取他們在頁面上嵌入 Google 搜尋框的策略,我們也在“為查詢買單”。只是我們的成本是計算資源,而不是直接支付廣告費(CA)。如果未來模型的成本繼續降低,我們的查詢成本也會隨之下降。

當我們積累了足夠大的使用者群,並讓使用者養成使用習慣,同時不斷收集資料來最佳化產品、實現更個性化的服務,我們將處於一個非常有利的位置。屆時,我們可以根據需求切換不同的模型,甚至基於開源模型訓練我們自己的模型——這也是我們正在做的事情。

我們有一個名為 Sonar 的模型,也提供 API 介面。此外,我們特別專注於搜尋增強(search grounding),這使得我們的成本比其他公司低得多。那些想要整合網路搜尋的公司往往需要向 Bing 等資料提供商支付高昂的 API 費用,而我們避免了這些成本。


06 Perplexity的下一步:成為個人化助理

主持人:在座的各位應該都用過 Perplexity 。你是怎麼使用它的?

Aravind Srinivas:我用它來做各種事情。我甚至可以直接讀出我的查詢歷史,比如理解我完全不熟悉的概念。我在經營這家公司,但在管理或領導方面完全沒有經驗,所以……(笑)我不是謙虛,是真的沒有經驗。

比如,每次我們進行融資,我都會用 Perplexity 來寫投資備忘錄(investment memo)。這不是我在吹噓自己的產品,而是我真的在用它。我也會用它來收集其他公司的基準資料,比如它們在不同階段的收入情況,或者像 DeepSeek 論文這樣的技術資料。

我以前是個研究員,但在過去一年半幾乎沒寫過程式碼,所以現在對具體的技術細節有點脫節了。所以當(DeepSeek的論文)出來時,我把它上傳到Perplexity,並針對它提了很多問題,這樣我就能同時從網頁和論文中提取資訊並閱讀。這對我來說是個很棒的知識助手。我還用它來分析我們的指標資料,比如我會上傳資料,然後詢問“這個圖表的問題在那裡?”——各種各樣的事情。所以它已經成為我生活的一部分,沒有它真的不太方便。

主持人:所以你是自己產品的深度使用者,那麼有沒有那個功能是你特別希望有但還沒有的?有沒有什麼痛點?

Aravind Srinivas:我希望Perplexity能真正理解我的全部上下文。目前它還是一個“使用者無差別”的產品——對你和對別人來說,它的運作方式是一樣的。從提供真實、無偏見的答案來看,這確實很好。

下一步我們需要讓它回答與你個人相關的問題,比如你的航班資訊、即將到來的旅行計畫、你的會議安排等。還能在會議前拉取你要見的人的簡介,幫你準備會議需要說的內容。

要讓它更有用,就需要讓它掌握更多個人化的上下文,而這意味著我們要做很多整合工作,比如你看到的Google Drive(整合)。順便說一句,面向個人使用者的Google整合比企業整合要困難得多,因為Google對API的要求很嚴格,所以我們正在想辦法繞開這些限制。但所有這些能力都是必須的。

此外,它還應該能真正幫你執行任務,比如我不需要總是去查Google Maps、打電話給餐廳預訂,或者讓我的助理幫我做這些事情。這些都很耗時間,我希望Perplexity可以幫我完成這些瑣碎事務。

主持人:所以,長期記憶、個性化、以及一個真正能執行任務的智能助手?

Aravind Srinivas:對,所有這些流行的概念,但真正的挑戰是把它們做出來。這就是我們要努力的方向。 (51CTO技術堆疊)