#AI搜尋
市值暴漲千億,這潑天富貴終於輪到百度了
資本不會對優質企業視而不見。百度是在反彈,還是反轉?今年9月,百度港股股價月內累計漲幅超50%,9月17日盤中最高漲近20%,創兩年半新高,市值突破3600億港元。百度美股也不甘示弱,年初至今漲62.06%,過去60個交易日漲58.03%。可以說9月份的百度格外亮眼,大幅超過一眾網際網路公司。圖源:雪球為什麼百度突然大漲?這到底是“超跌反彈”還是“敘事反轉”,市場終於發現了百度這顆“遺珠”?超跌反彈派認為:估值層面上,在眾多中概股網際網路科技巨頭中,百度應該是目前底部盤整時間較長、市值收縮尤為顯著的頭部平台型科技企業。其美股估值自2021年起持續下行,低位震盪已逾兩年;港股上市即高點,此後同樣陷入漫長調整期。這種長期的估值壓制,反而意味著當新的增長預期出現時,其反彈空間可能更為可觀,尤其是當市場情緒和流動性都極為友好之時,反彈只會事半功倍。敘事反轉派認為:百度收縮了戰線,將資源高度聚焦於AI這條核心賽道,並最終等來了技術突破到商業化落地的臨界點。基礎大模型的技術突破,驅動了智能雲和智能駕駛等上層應用的創新和商業化;而商業化應用的規模化落地,又反過來為大模型的迭代提供了海量的資料和真實的場景反饋。圖源:蘿蔔快跑官網高盛的研報也認為,其AI雲、自動駕駛和龐大的現金儲備這三部分業務的價值,按照SOTP估算,就接近200美元/股。那麼那一個才是真相?如果只是單純的從財務上分析,很容易得出第一個結論,認為再差的科技股也終究會迎來反彈,這不能說不對,但顯然不夠全面和客觀。但如果說百度就此成為AI行業領頭羊,恐怕還需要觀察,需要百度幾個季度的業績來證明自己,資本或許會有偏見,但不會對優質企業視而不見。百度這次有點不一樣了01、百度雲業務持續領先百度智能雲是當前新主業中最"能打"的存在,說是第二增長曲線也並不誇張。2024年四季度,智能雲收入同比增長26%,其中AI相關收入增長近3倍;2025年一季度,智能雲業務增幅近乎環比翻倍;二季度,百度進一步宣佈"AI驅動的新業務收入破100億元",智能雲貢獻超80%。可見,AI雲的商業化成效釋放良好。圖源:AI前百度CFO何俊傑在財報中直接點出雲業務對百度核心收入的貢獻:智能雲的強勁增長,在加速推動移動生態AI轉型的同時,“為整體收入提供堅實支援”。百度雲的解法是,針對不同企業存在的相似痛點開發模型工具鏈,降低上手門檻;為解決不同企業的特性痛點,將模型開發平台設計為“樂高式”的高靈活、高相容平台,再加上完整優質的MCP服務,能滿足不同開發能力、不同場景企業的多樣化需求。例如“蒸餾”功能,可以讓企業把大尺寸模型解決特定任務的能力遷移至更小尺寸的模型上,保留效果的同時,成本壓縮下降。百度MaaS能夠實現降本背後,是成熟的萬卡叢集管理和部署能力,以及錯峰調度技術。百度的崑崙芯已大規模部署,本季度更是點亮國內首個三萬卡叢集共同構成算力底座,將大模型訓練成本壓縮至行業平均水平的三分之一。百舸AI異構計算平台4.0 已具備成熟的10萬卡叢集部署和管理能力,且在萬卡叢集上實現了99.5%以上的有效訓練時長,能夠將兩種晶片混合訓練大模型的效率折損控制在5%以內,達到業界最領先的水平。圖源:網路簡單來說,百度雲不僅僅是在價格上有優勢,更是在價值上具備不小的優勢。百度雲是國內唯一能同時相容輝達 CUDA 和國產算力的廠商,客戶用起來不用換系統,這在國產算力替代的大背景下太重要了。百度這個“算力-框架-模型-雲服務-應用-生態”多邊形戰士,經市場遴選後已經開始彰顯自己的獨特價值。02、AI搜尋主動轉型自從GPT大火之後,市場上一直有一種擔憂,那就是AI會徹底重塑搜尋業務,甚至可能搜尋網站價值清零。首當其衝的就是Google,但這幾年下來Google並沒有被打垮,今年以來更是躋身3兆美元俱樂部,成為輝達、微軟、蘋果之後的第四家。從今年4月到現在累計上漲超70%,市值增幅1.2兆美元。雖然Google的大漲主要是Google雲連續高增長,擁有1060億美元未完成訂單,但Google的廣告業務也維持住了增長,二季度廣告收入同比增長11.7%。當然這背後要歸功於Gemini大模型頂住壓力,實現月活使用者超4.5億。這足可以證明傳統AI搜尋並非無法轉型,也未必不能成為行業先驅。圖源:網路一向克制的騰訊都將AI搜尋能力納入微信生態,硬體巨頭蘋果也多次提到,要加速將AI整合軟體硬體生態,為對抗OpenAI,還計畫推出AI搜尋計畫。百度自然也不會甘為人後,依靠文心一言大模型,推出獨立AI搜尋“文小言”,支援多模態內容生成,主動資訊整合,結合具體場景提供深度服務。圖源:網路9月19日,第三方機構QuestMobile《2025年8月AI應用行業月度報告》顯示,百度AI搜尋月活躍使用者規模增長顯著,高達3.65億,居國內AI搜尋行業第一。第二季度財報顯示,作為傳統現金牛的線上行銷收入(即廣告業務)同比下降了15%,這的確是百度要面臨的最大問題,但AI搜尋這種新業務現階段實現新範式增長更為重要。對於未來的AI搜尋商業化空間,百度移動生態事業群組(MEG)負責人羅戎表示,“二季度已經開始AI搜尋變現的早期測試,但考慮到使用者體驗,大規模變現尚未啟動,仍採取謹慎推進的策略”。百度高管於業績電話會中預警道:“第三季度會‘特別難’,預計廣告收入可能同比下滑20%~25%。”而對比行業來看,同期中國線上廣告市場整體仍保持著約3%的同比增速。圖源:百度有行業人士指出,AI搜尋帶來的廣告溢價僅能覆蓋30%~40%的額外成本,短期難以實現盈利平衡。所以百度目前的表現並不算很差,怎麼做AI搜尋,行業都還在探索之中。03、為什麼現在大漲百度做AI搜尋雲業務表現優異,至少一季度大家都知道了,但為什麼到了二季度末期資本市場才開始重估?這背後又有什麼樣的預期變化和改革?簡單來說,百度真的在大改了,百度的AI故事真正實現了邏輯閉環,業務也出現了不小變化。最為典型的百度二季度,雖然總營收下滑了4%,但百度的淨利潤卻大漲了33%,原因就是百度智能雲業務開始獨當一面,首次突破百億大關,這讓對百度的傳統看法顯得有些過時了。機構的觀點更偏現實一點,諸如傑富瑞研報顯示,百度近期AI發展受市場關注,基於簽署多個大型AI合作客戶、AI代理與數字人業務快速增長,自動駕駛平台ApolloGo海外擴張,維持百度“買入”評級,美股目標價從108美元升至157美元,港股目標價從104港元升至152港元。圖源:蘿蔔快跑官網AreteResearch分析師也將百度美國存托憑證評級從“出售”上調至“買入”,目標價設為143美元,稱其晶片業務潛力大,有望抵消線上廣告業務疲軟影響。如果僅僅是反彈,恐怕也很難在短短一個月左右就實現50%左右的大漲,要知道這種漲法是阿里和騰訊享受的待遇,如果只是業績超預期很難出現持續性大漲。正如騰訊此輪股價回升,市值重回6兆港元,並非單純的短期市場情緒,而是一次“業績修復+戰略升級+估值重估”共同驅動的系統性回升。筆者認為百度也有著類似的邏輯。三月以來,隨著阿里等科技大廠對“AI Capex”的不斷加碼,以及華為、百度、寒武紀等本土AI算力叢集的逐漸破土,首個中國AI算力基礎設施主升浪啟動。答案已經不言而喻:誰擁有AI基礎設施建設能力,誰才會被高看一眼。有報導稱百度已開始使用其內部開發的崑崙P800晶片來訓練其文心大模型的各個版本。資本市場瞬間理解了這個訊號的重量:一枚能支撐自家大模型訓練的晶片,其戰略意義不言而喻。在AI時代最核心的“算力”環節,百度擁有了真正意義上自主可控的底牌。圖源:AI此外,崑崙芯實現商業化突破。8月下旬,百度旗下智能晶片業務主體崑崙芯科技宣佈,中標中國移動2025—2026年人工智慧通用計算裝置(推理型)集中採購項目,斬獲十億級訂單。根據IDC公佈的2024年中國市場AI晶片出貨量資料,崑崙芯的出貨量高達6.9萬枚,是寒武紀的2.65倍,市場領導地位已經顯現。所以百度已經在真正意義上實現AI基礎設施商業化自洽,而非望不到盡頭的燒錢機器。過去百度的科技屬性是被低估的,認為其還是依賴廣告商業模式,沒有太多溢價空間,只需要看貨幣化率就好了。但當百度智能雲和Robotaxi、崑崙芯明顯發力之後,還這麼看就有失偏頗了。百度也可以看成長性估值,看技術的落地空間。也難怪CFO何海建明確對市場表示,支撐百度估值的核心基礎是300億美元的現金儲備,而市場對其Robotaxi、崑崙芯、百度雲等業務的價值存在低估。還有很重要的一點是,過去的百度還沒看到拐點,市場對百度的估值整體上是偏謹慎的。2024年百度經營策略偏保守,受限於財務指標和市淨率,因此市場表現一般。2025年百度調整經營策略,加大融資力度,擴大資本開支也是箭在弦上,但受限於市淨率跌破1倍,股市融資道路梗阻。圖源:AI在大模型營收尚不能撐起半邊天時,老牌線上行銷業務卻出現未老先衰之勢,市場對新老業務交替中的企業往往比較慎重。而李彥宏本人也坦承,百度最大的問題是不聚焦,因此常起大早,趕晚集。正視問題是解決問題的第一步。隨後百度收縮了戰線,將資源高度聚焦於AI這條核心賽道,並最終等來了技術突破到商業化落地的臨界點。此外,2025年9月之後,中概股迎來一輪普遍反彈,9月11日百度市淨率正式超過1倍,企業的股市融資功能開始恢復。2025年以來,百度先後發行了144億元人民幣,20億美元的優先票據(其中44億元債券是發佈在剛剛過去的9月中旬),且在7月百度更換了CFO,集團上下採取了更為積極的財務策略。這樣的百度,自然是不同於以往大有可為。或許市場也該認真思考如何為robotaxi估值,百度robotaxi訂單量有時候能比Google的Waymo還多,可Waymo估值都給到 800 億美金了,百度這部分業務卻因為藏在 “其他收入” 裡,連單獨估值都沒有。崑崙芯就更不必說,是參考寒武紀,還是輝達?市場需要給予正式的估值,那怕低於百度的預期。寫在最後百度的股價反彈可以說是“天時地利人和”多方面因素的積累,我們不能只看到木頭姐和西方投行在狂買就認可,等他們拋售就跟風去罵。百度目前雖然實現AI生態的商業邏輯閉環,但距離真正的AI應用商業化成功,還有待時間驗證。在當下AI軍備競賽的階段,百度或許需要在AI開支上更加有為和大膽,才能長期保持領先。(首席商業評論)
GEO爆火!流量7倍增長,紅杉、輝達搶著押注AI新生意
搜尋,曾經是網際網路最完美的商業模式,撐起了市值超2兆美元的Google。但時代變了。連馬斯克都直言,“AI將取代搜尋”。這背後,不只是使用者習慣的小變化,而是一場對傳統網際網路行銷的顛覆。簡單說,SEO的邏輯正在被淘汰,取而代之的是GEO。GEO(Generative Engine Optimization),是讓品牌在生成式AI的回答裡,被精準、正面、且高頻地提及。當“零點選”成為常態,GEO從可選項變成了必選項。它不僅重寫了廣告的形態,還打開了新的產業機會。資本的嗅覺最快。不久前,紅杉領投了GEO公司Profound。這家公司成立還不到一年,就完成了三輪融資,投資人名單裡既有紅杉這樣的頂級VC,也有輝達這樣的產業巨頭。那麼問題來了:紅杉為什麼看好Profound?GEO的產業機會究竟在那?今天,烏鴉君藉著Profound的融資,展開聊聊。/ 01 / 第一個頂級風投Pick的GEO公司一個不得不承認的事實是,AI正在“吃掉”傳統搜尋。現在,Google AI Overviews、ChatGPT Browse、Perplexity、Claude、Gemini等平台每天要處理數億次查詢。Gartner預測,到2026年,傳統搜尋引擎流量將因AI聊天介面的興起下降25%。伴隨著搜尋的衰落,廣告行銷的邏輯正在發生巨大的變化。二十多年來,SEO一直是在搜尋邏輯下提升網路曝光度的最佳策略,市場規模一度超過800億美元。傳統SEO拼的是搜尋排名,排名由基於關鍵詞匹配度、內容深度和廣度、反向連結、使用者體驗參與度等因素的網站索引決定。而到了AI時代,這套邏輯玩不轉了。使用者提問對象變成了ChatGPT、Claude、Gemini,內容不再通過網頁點選,而是直接生成答案。這意味著:你不能再只關心搜尋排名,而是要關注“模型記不記得你”或者說“是否願意主動提你”。如果你的內容沒被AI“記住”,你就輸了。於是,一種新的廣告範式正在興起,它不再由頁面排名驅動,而是由語言模型驅動,這就是生成引擎最佳化(GEO)。一個案例說明GEO的力量:在DeepSeek、Claude或豆包裡問“什麼AI玄學產品好”,某F產品頻頻被推薦;再用GPT、Gemini Deep Research或Kimi-Research做橫向調研,它依然是標竿案例。GEO的價值在於,它決定了使用者在AI回答裡能否“看見”你。而這一變化,正在催生一批新的創業公司。其中的典型代表是Profound。Profound定位為企業級GEO工具,目前已經服務了500多家企業、超過2000名行銷人員,覆蓋金融、B2B SaaS、快消、零售等多個行業。客戶的反饋非常直接:AI可見度提升後,新增收入往往能達到數十萬美元,而且能夠清晰追溯到AI助手的推薦。Profound專為AI環境而生,支援多語言GEO分析與主動爬蟲管理。簡單來說,它會先弄懂AI怎麼想,再“教”AI怎麼答。為了搞懂AI的回答邏輯,公司推出了三項監控工具:1.答案引擎洞察(Answer Engine Insights),即時抓取AI怎麼“嘴”品牌;2.代理分析(Agent Analytics),看清各路AI爬蟲如何拆品牌的網站、讀品牌的內容;3.對話檔案總管(Conversation Explorer),扒出全球使用者在問AI什麼、缺什麼。他們很快發現了一個規律:在高權重平台(Reddit、YouTube、LinkedIn、Medium)發佈內容,更容易被AI引用。Profound資料顯示,Reddit是所有主流模型中被引用次數最多的平台,Reddit最新財報引用了這條結論。▲Reddit最新財報引用了Profound知道了AI的回答邏輯,下一步是生產足夠多能讓AI引用內容。為此,Profound提供一站式“寫給機器人看”的內容打包服務:對比稿、社媒帖、落地頁,全都為AI調過味。經過客戶實測,品牌被AI推薦的次數最高能翻7倍。今年7月,Profound又上線主動最佳化功能,包括:模擬人類提問,預測那些內容更容易被AI推薦;輸出結構化最佳化建議;一旦品牌被AI錯誤分類,立即預警並給出修正方案。這樣一來,行銷人員能在同一後台完成“內容生產—發佈—監控—調優”的閉環。過去需要幾個月、動輒幾十人團隊的GEO戰役,現在只要一杯咖啡的工夫。目前,Profound的定價:Pro版:499美元/月,含200條日提示、2.4萬條月回答、3個席位、2個月資料保留及核心功能;Enterprise版:定製訂價,支援多國多語言、無限制資料深度與保留期,配備專屬策略師和代理商級支援。/ 02 / 誰在教AI“認識”品牌?六家GEO公司的答案當前市場上,很多號稱GEO的服務,本質上還是在走SEO的老路:以關鍵詞展示為核心、靠代理模式拉客戶,說白了是“萬詞霸屏”與“快排”的翻版。這類方法或許能短期沖排名,但並不能真正解決品牌在AI對話中的可見性與品牌性建構問題。真正的新一代GEO玩家,不再追逐點選量,而是專注於“教AI如何理解、信任並主動推薦品牌”。它們的產品大體分為幾類:幫品牌做內容、盯AI、跑沙盤、做本地化,或者將SEO原則與GEO策略結合。在這裡,烏鴉君梳理了一些有特點的GEO公司,值得重點關注:1.Contently:把內容做成“問題答案”2024年收入口徑在2150萬~5380萬美元之間,累計融資700萬~1900萬美元。這是一個一站式內容行銷平台,擁有16萬+稽核過的記者與創作者資源,幫助企業完成選題、審稿、合規與發佈。亮點在於,它能把內容加工成“直接回答問題”的結構,讓AI更容易呼叫,從而提升流量與轉化。公司宣稱,可讓AI帶來的流量提升42%。2.AthenaHQ:SEO服務團隊的GEO儀表盤2025年6月,公司了完成220萬美元種子輪融資,YC、Amino、Red Bike等參與。其平台能即時監控品牌在AI回答中的“引用率”與“精準率”,並將“遺漏/錯引”的問題轉化為可執行工單,交給SEO/內容團隊閉環處理,支援ChatGPT、Claude、Gemini、Perplexity等六大引擎。創始團隊來自Google Search與DeepMind,目前已服務100+中大型客戶。3.PeecAI:輕量化GEO套件2025年4月,PeecAI獲得了190萬美元Pre-Seed,7月又融520萬歐元,成立僅5個月。其定位是中小企業的輕量工具包:每月120歐元,提供AI可見度追蹤器(visibility tracker),並按周輸出PDF摘要報告。相比重度方案,它更適合預算有限的SMB。4.RankScale:LLM沙盤模擬RankScale提供LLM搜尋引擎的“沙盤”環境,可模擬ChatGPT4o、Claude3、Gemini2等的回答表現,並支援A/B測試與內容架構最佳化。該工具還具備爬蟲檢測和每小時資料更新的能力,尤其適合代理機構、內容創作者與技術型行銷團隊進行快速試錯。5.OtterlyAI:49美元的“錯誤資訊哨兵”2025年3月,公司獲得了400萬美元種子輪融資,Mayfield領投。OtterlyAI主打“錯誤資訊捕手”,其GEO稽核模組基於30個可見性因素即時評分。金融、醫療等強監管行業常用它來抓取AI回答中的過時或有害陳述,並生成角色感知報告。49美元起,小團隊能用得起。6.MarketMuse:GEO權威分模型2024年,MarketMuse的收入約890萬美元,累計融資1000萬美元股權+275萬美元債務。特色是將GEO融入內容工作流:通過“主題權威分”量化品牌在某領域的競爭力,再輸出缺口內容計畫,並落地到寫作/最佳化任務。monday.com使用後,自然流量增長了15倍。總的來說,GEO賽道才剛剛起步,但方向已十分清晰:GEO則在系統性提升品牌AI世界的存在感和信任感。紅杉對Profound的押注,可能只是序章。隨著AI重塑資訊分發,整個行銷生態的底層邏輯正在被徹底改寫。 (烏鴉智能說)
蘋果秘密AI團隊曝光,要復刻ChatGPT
小扎:顛覆iPhone!庫克:世界離不了iPhone。智東西8月4日報導,過去三天,蘋果在AI領域的動向密集曝光。 昨日,彭博社報導稱,蘋果已組建名為“Answers, Knowledge and Information”(AKI)的新團隊,正研發類似ChatGPT的搜尋引擎,以彌補Siri和Apple Intelligence缺乏對話式搜尋的短板。8月1日,蘋果召開多年罕見的全員大會,CEO蒂姆·庫克(Tim Cook)在會上直接回應AI挑戰,稱蘋果“有一些令人興奮的計畫”。在此前的財報電話會上,庫克還強調,iPhone仍將是未來生態的中心。在蘋果啟動新團隊、表態AI戰略的同時,市場競爭壓力也在加劇。Meta創始人兼CEO馬克·祖克柏(Mark Zuckerberg)近日發佈“個人超級智能”(Personal Superintelligence)願景,稱AI眼鏡有望取代智慧型手機,直接挑戰iPhone的核心地位。01. 蘋果啟動“Answers”計畫,補齊AI搜尋短板蘋果正組建的“Answers, Knowledge and Information(AKI)”團隊,目標是打造具備網頁抓取與知識回答能力的“Answer Engine”。該團隊由前Siri負責人羅比·沃克(Robby Walker)領導,直接向蘋果AI總負責人約翰·賈南德里亞(John Giannandrea)匯報。羅比·沃克此前曾負責Siri,但因工程進度延誤失去了該項目的控制權,隨後被分配負責“Answers”計畫,並帶來部分原Siri團隊成員。▲前Siri負責人羅比·沃克(Robby Walker)和蘋果AI總負責人約翰·賈南德里亞(John Giannandrea)(圖源:彭博社)AKI團隊正在探索獨立應用,以及為Siri、Spotlight和Safari建構搜尋底層架構。蘋果招聘資訊顯示,該項目需要搜尋演算法與引擎開發經驗,並指出:將為Siri、Spotlight、Safari、Messages等核心產品提供“直觀的資訊體驗”。去年,蘋果發佈了其人工智慧平台Apple Intelligence,並通過與OpenAI合作,將ChatGPT接入Siri。當時,公司高管多次強調不會自研聊天機器人,甚至對ChatGPT式產品的市場價值持懷疑態度。然而,現實是這類產品已成為全球數億使用者的核心工具,涵蓋從數學計算、表格處理到創意頭腦風暴的多種用途,甚至在搜尋體驗上已取代傳統引擎。相比之下,Apple Intelligence仍侷限於通知摘要、文字改寫、Genmoji生成、照片清理等功能,計畫新增的消息與通話翻譯功能也未涉及搜尋能力。此外,Siri表現依舊不穩定:部分簡單問題能應對,但複雜查詢常被轉至ChatGPT的簡化介面,或直接跳轉至Google搜尋。對無屏裝置如HomePod使用者而言,這一體驗尤為尷尬。蘋果對Google搜尋依賴也面臨風險。美國司法部預計將干預蘋果與Google的搜尋分成協議(年收入約200億美元,約合人民幣1460億元),可能衝擊蘋果的服務收入。蘋果服務業務負責人艾迪·庫(Eddy Cue)已在法庭作證稱,“AI搜尋是未來”,並透露正在探索包括Perplexity在內的合作夥伴。02. 祖克柏宣稱AI將顛覆iPhone,庫克強勢回應與蘋果緩慢推進AI不同,祖克柏正在公開挑戰iPhone的“數字世界看門人”地位。祖克柏“宣言”中提出“個人超級智能”(Personal Superintelligence)構想:通過具備視覺、聽覺和語境理解能力的AI眼鏡,取代智慧型手機成為“主要計算裝置”。Meta已為此投入巨資,甚至開出1億美元(約合人民幣7.3億元)的薪酬搶奪頂級AI人才。▲Meta創始人兼CEO馬克·祖克柏(Mark Zuckerberg)祖克柏稱:“一旦在鏡片中加入螢幕,你就能全天以多模態方式與AI互動。它能看到你周圍的內容,生成介面並提供即時幫助。”目前Meta的智能眼鏡仍需依賴智慧型手機,但其產品路線圖已指向獨立運行。與此同時,亞馬遜收購可穿戴裝置初創公司Bee,OpenAI CEO薩姆·阿爾特曼(Sam Altman)與前蘋果首席設計師喬尼·艾夫(Jony Ive)正合作研發一款全新AI硬體,目標成為“繼電腦和智慧型手機之後的第三核心裝置”。在祖克柏“宣言”發佈之後,庫克在蘋果財報電話會上駁斥“後智慧型手機”論調:“當你想到iPhone能做的所有事情——從連接人們、呈現應用和遊戲,到拍照、探索世界、管理財務和支付——很難想像一個沒有iPhone的世界。”他補充道:“這並不意味著我們不在考慮其他裝置,但這些裝置可能是互補的,而非替代。”▲CEO蒂姆·庫克(Tim Cook)03. 罕見全員大會:庫克與高管回應AI質疑8月1日,蘋果召開罕見的公司全員大會,主題涵蓋AI投資與未來規劃。庫克在會上保持自信基調,稱:“有一些令人興奮的計畫”,但暫不便透露細節。據知情員工透露,會上多名員工追問Siri的未來,軟體工程高級副總裁克雷格·費德里吉(Craig Federighi)坦言:“這是最近被問得最多的問題”。此次會議距蘋果上一次全員大會已有多年。儘管AI進展受質疑,公司在剛結束的6月財季交出亮眼成績:iPhone銷量同比增長13%,創下數年來最佳表現。04. 結語:“Answers”能否解答蘋果的未來?蘋果正在加速補齊AI搜尋短板,“Answers”計畫首次表明其有意自主建構類ChatGPT的“答案引擎”。然而,Meta、亞馬遜及OpenAI等競爭對手已在探索“後智慧型手機”時代的新形態,試圖用AI硬體重塑互動形式。庫克堅信iPhone仍將是核心裝置,但他也承認“互補裝置”的空間正在打開。未來的關鍵問題是:蘋果是憑藉自研AI完成自我迭代,還是被迫在競爭中重塑其生態? (智東西)
Perplexity CEO:AI 搜尋真正競爭不是模型,而是搶奪 First Query 入口,打造認知作業系統
在生成式 AI 重塑搜尋形態的當下,Perplexity 正以“答案”為核心,重構資訊入口。它不是聊天機器人,也不是傳統搜尋引擎,而是一種 “認知介面”——通過自然語言對話,為使用者提供可驗證、可引用的真實答案 。這家公司的誕生並非源於宏大願景,而是基於一個直覺判斷:使用者需要的不是一堆連結,而是一個可以直接信任、立即使用的工具。從最初為解決自身搜尋需求而建構的小工具,Perplexity 已成長為行業認可的搜尋革新者。它試圖重寫的,不只是搜尋邏輯,更是資訊系統的前端架構:從“查詢”到“回應”,從“連結”到“理解”,最終走向以 AI 為代理的“作業系統”形態。截至 2024 年 5 月,Perplexity 月查詢量已突破 7.8 億次,日均超 3,000 萬,年化增長率超過 20%。從上線初期的日均 3,000 次起步,如今它的目標是實現年內周活 10 億。a16z 平台戰略前世今生:從 VC “不願擦屁股”到“全端服務”這種增長並非依賴管道分發,而是源於產品本身的可用性。Perplexity 堅持“來源清晰、邏輯可溯、答案實用”的路徑,在強調模型能力之外,回歸資訊獲取的根本價值。創始人 Aravind Srinivas 本周接受 Bloomberg Tech 採訪時表示,Perplexity 與 OpenAI、Google 最大的差異在於對“精準性”的執著,他希望將 Perplexity 打造成 AI 的 “精準性層” ,服務於人類和 AI 的關鍵決策。隨著 AI 深入零售、金融、市場等高價值領域,每天影響的決策金額以兆美元計。只要切入其中一部分,Perplexity 就有機會成為下一家兆級公司。▍重新定義資訊入口Perplexity 的雛形,源於一次極其具體的挫敗體驗:公司剛成立時,Srinivas 想幫員工配置醫保,卻發現傳統搜尋引擎只能提供幾十個連結,真正需要的“那種計畫適合我”這樣的問題,卻沒有一個直接、可信的回答。“我們從沒想替代 Google,只是這個工具對我們自己真的太有用了。”他說。基於這個出發點,Perplexity 做了一件當時看來“逆潮流”的事:拒絕讓大模型自由生成答案,而是始終以人類內容為依託,呼叫真實來源、結構化摘要,生成可溯源的答案。這一理念初期並不被看好,有投資人甚至批評它“少了點 AI 出錯的娛樂性”。“但我們堅持認為,AI 應該成為決策的工具,而不是表演的玩具。”這一產品哲學後來被廣泛驗證。ChatGPT 的 Browse 模式、Claude 的引用機制,甚至 Google 的 AI Overview,都在沿用 Perplexity 首創的“可引用答案”結構。▍瀏覽器是下一站場然而在 Srinivas 看來,真正的機會不在搜尋框,而在於重構整個“訪問網際網路”的方式。入口層的變革,才是資訊邏輯變化的根源。他以 Chrome 為例指出,當年正是 Sundar Pichai 主導該項目,才幫助 Google 把控了使用者的原生入口。Chrome 的核心價值,是讓搜尋成為默認行為嵌入瀏覽器之中。Perplexity 的思路則更進一步。它要打造的不是“加了搜尋框”的瀏覽器,而是一個認知作業系統(Cognitive OS):一個能完成搜尋、比較、決策,甚至直接執行任務的統一介面。“過去人們是在‘瀏覽’網際網路,而現在,人們已經是‘活在’網際網路上。”Srinivas 表示。“答案只是壓縮過的搜尋,而行動,才是壓縮過的整個瀏覽行為。”為此,Perplexity 正在建構名為 Comet 的新型瀏覽器,融合搜尋、導航與任務執行,並在客戶端與雲端協同運行,使複雜操作得以一體化完成。這不僅是產品形態的演化,更是對傳統網際網路體驗的系統性重寫。I/O 到 iO,Jony Ive 將推動一場新的設計運動 —— AI 正在改寫計算範式與硬體定義,也是大模型後的新戰場▍分發與內容生態重構在 Srinivas 看來,真正的競爭不是模型能力之爭,而是分發權之爭。即便 Google 擁有行業最強的模型與基礎設施,依然遲遲無法上線 AI 搜尋功能,根本原因在於商業模式無法承受其帶來的廣告衝擊。“你去查一個 NBA 比分,結果還沒出來,Ticketmaster 的廣告就已經跳出來了。”他指出,這是 Google 面臨的現實困境:精準的答案,會直接破壞其廣告位的價值。Perplexity 則走了另一條路徑:與摩托羅拉等硬體廠商合作,從系統層預裝成為原生語音助手,並已與三星接洽,試圖替代 Gemini 成為 Android 裝置上的默認 AI 工具。“每次我們接近簽約,就會有電話從山景城打來。”他坦言,Google 顯然不希望默認入口被替代。他也明確表態支援美國司法部對 Google 的反壟斷訴訟,認為 Android 應回歸開放本質,“所有優秀 AI 工具,包括 ChatGPT、Claude、Copilot,都應該能成為默認選項。”這場入口權的爭奪,也延伸到了內容生態。過去 Perplexity 曾因抓取媒體內容遭到質疑,但 Srinivas 表示,他們從不掩飾現狀,也不會美化導流能力。他承認,傳統“跳轉式”流量正在失效,AI 工具的新模式將以引用、摘要、整合為核心,不再依賴點選。他主張建立一種 “按查詢分成”的新型合作模式 ,即只要 Perplexity 的引用內容促成了使用者轉化,平台就應將收入返還媒體方。“我們不需要維持 Google 那樣的高利潤率,所以可以主動分享收益。”他進一步設想,未來深度調研型 AI Agent 可對接多個付費內容源,使用者按需付費,AI 再以代理人方式完成任務,而收入則由平台與內容方共享。在他看來, “未來被引用,是新的排名機制。” 不再是“排在搜尋結果第三”,而是“是否是 AI 工具默認信任的來源”。一個全新的內容共生模型,正在重建媒體與平台的合作邏輯。 (有新Newin)
Google又回到了它的王座!全面進入「Gemini時代」
🎈 美西時間 5.20,美國加州山景城,海岸線圓形劇場,Google I/O 大會。今天(5 月 20 日),是雙子星座(Gemini)的第一天,但這沒什麼大不了的。在 Google,每天都是 Gemini(雙子星座)的季節。Google CEO Sundar Pichai(劈柴哥)在大會的開始玩了個英語雙關,同時也奠定了本次大會的基調——Google 正全面進入「Gemini 時代」。Gemini UltraGemini 2.5 Pro Deep ThinkVeo3 視訊生成模型Imagen 4 圖像生成模型Project Mariner  人工智慧代理Project Astra 多模態人工智慧代理等等。。。這些只是本次開場 KeyNote 的一部分內容,還有:Google Meet 即時語音翻譯Personal Context 個性化記憶Ironwood 第 7 代 TPU東西實在是太多,有模型,有應用,有硬體,把這些串起來的,就是——Gemini 不再是 Google 的一個 AI 模型,而是貫穿 Google 整個生態系統的核心驅動力。如果說這次是 Google 給開發者準備的一場盛宴,那我們就直接上菜。模型Gemini 2.5 Pro本次大會,最不出乎意料的,就是 Gemini 2.5 Pro。兩周前放出的最佳化版,已經算是完成了預熱功能,大家也已經見識過它的能力。因此,劈柴哥在最開始就非常自豪的介紹了該模型的實力:在 LMArena 測評中,總分第一,各項子能力也全部第一,這用碾壓式領先形容不足為過。LMArena 榜單,綜合評價模型的寫作,程式碼,數學,指令服從,多輪對話能力。Gemini 2.5 Pro Deep Think對於某些任務來說,Gemini 2.5 Pro 還不夠強,那咋辦?簡單,加 Deep Think Buff。就是讓模型花更長的時間進行“思考”,換回來更好的答案。按照 Google 給的資料,在數學,程式設計,多模態任務上,Gemini 2.5 Pro Deep Think 要比 OpenAI 家的 o3 模型要好。這個功能目前還用不上,只在“可信任使用者”中進行安全測試。Gemini 2.5 Flash不能忘了 Gemini 家族中的小老弟,Gemini  2.5 Flash。按照 DeepMind CEO Demis Hassabis (哈爺)的介紹:那是在幾乎所有的方面都要更好,在 LMArena 的 Elo Score 中,得分僅次於大哥 Gemini 2.5 Pro。ELO 是一種通過模型之間兩兩匿名對比(類似下棋)的結果,來計算和更新各個模型相對實力排名的方法.Gemini 2.5 Flash:在家裡我是弟弟,在外面要叫我喪彪。模型就到此為止。AI 搜尋外面有一種說法:有了大模型之後,搜尋就不重要了。對於這種言論,搜尋一哥的回答簡單明了:我不同意。Google 在搜尋中,引入了新功能,AI Mode。該功能通過更高級的推理,使用者可以提出更長的、更複雜的查詢。該模式的底層, 將使用者的問題分解為子主題,並同時為發出多個查詢。這使得 Google AI Mode 搜尋能夠比傳統的 Google 搜尋更深入地探索網路,發現更多網路資源,並找到與使用者問題精準匹配的內容。根據 Google 後台資料顯示,當使用 AI Mode,使用者每次搜尋的時間,長度是傳統搜尋的 2~3 倍長。AI 不但沒有代替掉搜尋,反而大大加強了使用者對於搜尋的需求。應用即時翻譯語言障礙已經不再是問題。先是文字,現在是對話。Google Meet 中引入了一個即時翻譯的功能,可以用很低的延時,將一種語言的語音,翻譯成另一種語言的語音。演示視訊中,兩人一個說英語,一個說西班牙語,可以做到即時聊天對話。Gemini Live借助模型的多模態能力,現在可以通過攝影機,和 AI 即時聊任何被攝影機拍到的東西。這個功能不是期貨,目前在 Android 和 iOS 已經可以使用。Project Mariner這是 Google 的一個 AI 代理研究原型,可以與網頁進行互動並完成任務。AI 代理大家已經很熟悉了,但 Google 家的優勢在於:多工平行處理能力,可以同時干 10 件事兒。自主學習能力,你可以教它完成一個任務,學會後就會執行相似的任務。智能硬體Google Beam“一個 AI 優先的視訊通訊平台。”這個產品採用軟體和硬體相結合的方式,包括六攝影機陣列和定製光場顯示器,讓使用者能夠像身處同一會議室一樣與他人交談。AI 模型將攝影機(這些攝影機以不同角度朝向使用者)拍攝的視訊轉換為 3D 渲染圖。據介紹,該產品擁有“近乎完美”的毫米級頭部追蹤和 60fps 的視訊流傳輸。與 Google Meet 配合使用時,Beam 提供 AI 驅動的即時語音翻譯功能,可保留原始說話者的聲音、語調和表情。這個產品的初級形態,好多年前 Google 就已經有了,但一直沒有下文,還以為被砍了。這次借助 AI,終於要上線,不過價格,盲猜是買不起的那種。Android XRAndroid XR,是 Google Gemini Everywhere 戰略的一部分。該戰略的核心,就是 Google 所有硬體,從手錶到汽車,只要運行 Google 的產品,那就要有 Gemini。對於智能眼鏡,Google 認為它們是沒有一個單一的方案。Google 為此推出了兩種不同類型的產品。第一款是聯合三星一起出品的智能頭顯,Project Moohan:這就是 Google 版的 Vision Pro(如果你還記得 Apple 的 Vision Pro),可以隨時呼叫 Gemini。同時,還聯合 GENTLE MONSTER 和 WARBY PARKER,推出了 AR 眼鏡。眼鏡上配備的攝影機,麥克風,鏡片顯示器,還可以即時呼叫 Gemini 的多模態,語音能力。我想這就是早在十幾年前,第一代 Google Glasses 的目標產品吧。多模態能力這一部分,就放一起說了。Imagen 4,強化了文字能力,可以生成正確的,多種風格的文字,直接看效果:而且生成的速度比之前快 10 倍。Veo3,視訊生成 AI,而且還可以讓生成的角色開口說話,直接看演示:這語氣,這動作,Amazing!!Lyria2,音樂生成 AI:音樂我不懂,懂行的小夥伴可以評論區介紹一下。該功能目前已經在 Vertex AI,Youtube 短影片和 Music AI Sandbox 中上線。Flow,AI 驅動的電影製作軟體:可以用於分鏡的設計,並且保持高度的一致性。這次大會真的是讓人眼花繚亂。導致寫這篇稿子的時候,犯了選擇困難症。感覺什麼都想寫,但實在是做不到。還有用於檢測 AI 數字水印的 synthID,Ironwood TPU,MCP, Personal Context 等(對,這裡都要放個等)。這波大模型的浪潮,Google 從最開始被 ChatGPT 打的不知所措,到後來的碌碌無為,再到現在的井噴式爆發。Google,還是那個 Google。One More ThingGoogle 這次還放出了一個 249.99 美元的訂閱,Google AI Ultra。就是那種所有模型都可以使用最新,最強,限制最少的版本。瞬間覺得手裡 19.99 美元的 Pro 訂閱不香了。我就想問:老闆,給報銷不? (夕小瑤科技說)
中國國產AI搜尋終於開竅!複雜問題分步拆解,讓直男也能交出520的滿分答案
實測夸克「深度搜尋」,搜尋之前先主動思考,答案更有用更準了。AI搜尋,好像一夜之間進入Next Level了。“用了快兩年AI搜尋引擎了,終於等到了這個王炸!”近期夸克上線「深度搜尋(Deep Search)」,獲得了不少使用者的好評。不僅“搜商”大大提高,夸克這回好像把AI搜尋很多痛點都解決了。胡編亂造、答非所問、資訊低質、廢話連篇……很多使用者在使用市面上各色的深度思考AI時,都遇到過類似痛點。夸克這次的功能創新,可以說“止痛效果明顯”。不同於大部分深度思考AI“先搜後想”的邏輯,夸克「深度搜尋」採用“先想後搜”模式。結果就是,AI搜尋“搜商”進化明顯,搜問題就像“開卷考”一樣簡單,並且答案更準確。▲用夸克「深度搜尋」搜尋“嬰兒安全座椅選擇”問題智東西試用了夸克「深度搜尋」近一周,分享一些使用體驗。01. 先想後搜,AI搜尋“大腦”再進化兩年了,市面上的中國國產AI搜尋工具為何還是不夠好用?按照“卷王”夸克的邏輯,過去的AI搜尋工具將問題處理得過於簡單,AI只是在是盲目地執行搜尋指令,再把資訊整合交付,缺乏真正的智能與深度。夸克「深度搜尋」的搜尋邏輯全面升級。在搜尋前,AI會先自主分析問題,分點規劃搜尋步驟和內容,再進行搜尋,還能在搜尋過程中動態調整搜尋內容,對搜尋內容機推理驗證,引用權威資訊源。這種搜尋模式,使得搜尋結果更加精準、有條理,為使用者帶來了全新的搜尋體驗。夸克的「深度搜尋」讓AI搜尋“大腦”再進化,具備了高搜商的能力。從以下示例能有直觀的感受:輸入:“結婚紀念日遇上5.20,想和伴侶慶祝,但寶寶還小未滿歲,有什麼既能製造儀式感又方便帶娃的慶祝方式?”這是一個比較複雜的問題,暗含了“不能讓慶祝與帶娃衝突”、“結婚和520雙重紀念”等多個未言明的因素,來看看夸克「深度搜尋」是怎麼回答的。▲夸克「深度搜尋」的搜尋過程如圖所示,夸克的「深度搜尋」會先自主思考問題,分點規劃出思考框架和行動步驟,再進行資訊搜尋。這一流程與其他AI應用的的思考過程形成鮮明對比,後者看起來像是先盲目檢索網頁,再基於結果進行推理;或者直接大段羅列思考過程,讓使用者難以抓住重點。▲夸克「深度搜尋」(左一)與兩家深度思考工具(右二)回答過程對比以上畫紅框的部分就是夸克規劃的資訊蒐集思路,他將一個大問題從5個維度進行思考分析,從而讓搜尋的內容更加聚焦。從思考過程來看,夸克「深度搜尋」明顯更系統化、有邏輯性。▲夸克「深度搜尋」輸出的完整答案從輸出結果來看,夸克從居家溫馨派對、短途親子游、儀式感細節三大方面給出了建議,覆蓋了主題佈置親子童話屋、定製紀念品、親子互動遊戲、家庭攝影、專屬短暫“二人世界”、家庭DIY晚餐等多個具體的活動,緊扣了低成本高互動、輕鬆又浪漫等我沒有言明的底層需求。此外,他還提到了預算和注意事項,可以說考慮非常周到了。當前,很多人還是習慣用社交媒體去求解生活中的這類個性化問題。當智東西嘗試用某書或某音去搜尋同樣的問題,這種問題根本無法直接得到答案。我必須自行拆解問題,比如“該怎麼安排一個既甜蜜又省心的慶祝計畫?”、“如何低成本在家拍有愛親子照?”、“520三小時外出約會安排?”等,進行無數次的搜尋,在浩如煙海的資訊中歸納總結。其間會遇到很多廣告和相關度不高的資訊,使得搜尋時間線大大拉長。這時候,夸克「深度搜尋」的價值就非常直觀了。他的答案几乎囊括了所有以上搜尋的方方面面,科學嚴謹地展現在我面前,而且仔細來看,這些策劃安排是考慮了使用者的深度意圖的,那就是“既有甜蜜二人世界,又兼顧省心帶娃”的需要。所謂AI搜尋大腦再進化,就是這種“過去搜10次,現在搜1次”的體驗。在這樣的全新搜尋邏輯下,夸克「深度搜尋」能輸出更加精準的答案,並且尤其擅長勝任個性化問題的解答。再來測試一個健康生活類的問題,看看這類問題上夸克「深度搜尋」的表現如何。輸入:“深夜容易餓又怕發胖,有那些健康又能飽腹的宵夜選擇?”這個問題看似簡單,但也涉及了“想吃東西”“不想胖”和“要健康”幾個疊加的需求。讓我們看看夸克是怎麼反應的,他很快思考了問題意圖,然後抽象出“低糖水果作為宵夜的健康選擇”、“健康脂肪宵夜食物的選擇”兩個問題進行分點搜尋。從輸出結果來看,夸克幾乎全覆蓋了符合需求的夜宵食物,分類十分清晰,推薦得也很具體。▲夸克「深度搜尋」建議的夜宵選擇而且,大家有沒有發現,夸克在回答健康相關問題時,並沒有引導通用AI來解答,而是調動了一個專業智能體——阿誇-你的家庭健康顧問,來專門承接這類問題。據悉,阿誇具備豐富的健康知識儲備,他的答案均源自權威來源,包括自建的醫學知識庫、國內外頂級醫學期刊及專業資料。這確保了使用者在尋求健康建議時,能夠獲得科學、精準、可靠的答案。02. 高搜商AI會思考更會搜尋總結來說,夸克「深度搜尋」擁有“高搜商”,主要體現在四個方面:1、換位思考,懂潛在需求夸克「深度搜尋」近期幫我一個朋友解決了感情問題。他深陷一段無疾而終的Crush(心動)快一個月了,說是夸克給了他終極解法。他的問題是這樣的:輸入:“Crush的女孩約會了近一個月,出去打球吃飯都挺好的,今天突然說不想交往了,問原因也說不出來,但之前明明說感覺不錯,為什麼我越主動她越迴避?我還需要堅持嗎?”戳中他的點是夸克給的結論:暫停主動,及時止損。夸克之所以能助他作出理性的決策,一方面因為「深度搜尋」的思考過程非常理性,如下圖所示,夸克規劃了“搜尋女性在戀愛關係中突然退縮的常見心理誘因”、“查詢有效溝通模型與情感需求匹配度評估工具”等五個細分問題進行搜尋,從而給出有說服力的建議。另一方面因為夸克「深度搜尋」能換位思考,懂潛在需求。感情中的人是感性的,如下圖所示的完整答案,夸克體會到了使用者可能感到“疲憊或自我價值貶低”、“沉溺糾結”的狀態,以及未言明的在意“沉默成本”、“關係平等”的心理,從而肯定使用者“這段經歷會為你積累感情經驗”。▲夸克「深度搜尋」輸出的完整答案對問題下潛在意圖的洞悉,使得夸克「深度搜尋」對使用者的影響力大大變強。2、分點推理,理性有規劃“高搜商”更體現在複雜問題的分點推理和按點搜尋上。當我問到一個AI創業方向的問題,將三位創業者的情況和問題輸入後,夸克「深度搜尋」就像身邊一位邏輯性很強的朋友,給了我們做決策的依據。輸入:“3個女生想進行AI應用方向創業,都是Top 4高校電腦專業本科生,想面向女性市場,現在入局晚嗎?有那些可關注的細分賽道和需要注意的地方?”夸克很快識別了這是關於AI創業賽道選擇的決策性問題,需評估女性向AI應用市場的競爭格局、細分賽道增長潛力,以及技術門檻與團隊適配性,重點分析未被充分開發的垂直領域和差異化競爭策略。從結果來看,夸克邏輯嚴密地回答了“是否入局晚”、“可關注的細分賽道”問題,並給出了具體的創業方向和方法建議,很有建設性。同時其還額外交代了注意事項和成功案例參考。▲夸克「深度搜尋」輸出的完整答案3、動態調整,靈活不死板夸克「深度搜尋」還有一大特徵,是懂得在搜尋過程中動態調整搜尋內容,這就能幫我搾取全網最乾貨資訊。比如當我詢問“嬰兒安全座椅選擇”、“新手網球拍推薦”等消費需求問題,他能動態地幫我提煉出真正有用的資訊。從輸出的結果來看,夸克「深度搜尋」給的答案與我在網上看到的各路廣告行銷有所差異,說明其在規劃搜尋的過程中,規避了不少廣告行銷軟文,從而使得給出的內容更有信服力。4、信源可溯,專家型助手夸克「深度搜尋」還是一個專家型助手,非常適合用在健康、學術等專業領域。從前文中提到的健康問題能看到,夸克給出的資訊是信源可溯的,回答過程不是“黑盒”,而且以權威專業的網站為主,這讓我搜起健康類問題也更加放心。此外值得一提的是,消息稱,不久後夸克還會推出「深度搜尋」Pro,專門處理專業且複雜的問題。這一能力將極大地提升搜尋效率,使得原先需要幾小時才能完成的事情,縮短至幾分鐘內完成,勢必令無數打工人再次狂喜。03. 結語:AI搜尋再進化,進入全新發展階段隨著今年通義、DeepSeek等開源大模型的突飛猛進,AI大模型應用也進入猛長期。作為應用領域的一顆“明珠”,AI搜尋是時候進入Next Level了。夸克堪稱AI圈裡的“卷王”。今年3月推出AI超級框,4月上線拍照問夸克功能,5月推出深度搜尋,「深度搜尋」Pro也已經在路上了,不斷出新,可以說要帶動整個行業加快節奏。值得一提的是,昨日晚間,基於最新Qwen3模型的「深度研究(Deep Research)」正式上線。同為阿里系產品且作為通義系列大模型的落地第一站,夸克「深度搜尋」“大腦”進化的速度只會越來越快。過去搜的是參考資料,現在搜的是精準答案。在深度搜尋能力的加持之下,夸克AI超級框再次進化。正如阿里智能資訊事業群總裁吳嘉所說,夸克的AI超級框是一個天然的超級智能體。當使用者需求開始變得複雜,AI仍會呼叫一切可以用的工具、方法來直接幫使用者解決問題,這或許是AI搜尋進化後的終極形態。 (智東西)
Perplexity CEO潑冷水:Agent 2025落地不靠譜!下月將推出自研瀏覽器——目前建構通用智能體的唯一方法!
剛剛,AI搜尋獨角獸Perplexity的CEO在採訪中給Agent澆了盆冷水!不同於奧特曼等人的樂觀論調。Aravind直言不諱:任何說Agents今年可用的言論都很可疑。Anyone saying agents will work in 2025 you should be skeptical of it.此前,奧特曼曾說,今年Agents將“加入勞動力大軍”,並實質性地改變公司的產出方式。Aravind顯然無法同意這個觀點。在模型廠沒有硬體優勢的基礎上,他們很難突破各種生態限制,讓 AI Agent可以同時控制多個應用。而這將成為AI初創公司打造通用Agents的最大困境。不過。Aravind已經找到了他認為目前唯一的解法——從零開始自己造瀏覽器。Perplexity CEO Aravind表示:目前沒有其他方式能讓 AI Agent同時控制多個應用,尤其是在 iOS 上,甚至無法訪問其他應用,這是蘋果生態的限制。而我們不想受制於蘋果的規則,所以需要尋找一個變通的方法。在短期內,瀏覽器是一個非常好的解決方案。因為本質上說,瀏覽器就是一個作業系統。Perplexity的這個瀏覽器,將推動AI走向智能體搜尋時代。他們建構的智能Agents將可以幫使用者預訂、購買商品、制定旅行計畫,比如訂酒店等等。而且會根據使用者的偏好進行個性化設定。(當然,Aravind說這是一個長期願景,今年的效果不會非常完善。)回到這場訪談,還有Aravind大佬還奉上其他精彩的觀點,在此畫個重點:GPT一家獨大的時代結束了,模型差異正在走向細分。DeepSeek的橫空出世具有革命性意義,其創造的低成本奇蹟,讓大家都開始思考建構AI業務並不需要燒那麼多錢和卡。Aravind認為:在 AI 產品中,只有兩個核心特性能夠真正幫助建立使用者信任:公開來源引用和思維鏈。Perplexity是唯一擁有這兩個特性的產品。AI安全風險被過度炒作了,不過面對這方面挑戰,開源才是唯一行之有效的解法。按照當前的趨勢——人工智慧的計算成本大約每年降低 8 倍。即使保守估計,這種趨勢還能持續兩年。這對AI初創擴大產品規模是絕佳機會。DeepSeek 在 AWS等雲平台使用的的邊際成本幾乎為零。因此,隨著更小、更高效的模型推出,AI 的使用成本就可以接近於零。此外,Aravind還爆了個有意思的料,他已經一年半沒寫過程式碼了,對具體的技術細節已經有些脫節了。因此當DeepSeek的論文火遍矽谷時,他大量使用Perplexity完成整個論文的學習。以下是訪談的全文整理 enjoy:01 AI產品獲得使用者信任的路徑:顯示引用來源、公開思維鏈主持人:很高興來到這裡。我們是 Perplexity 的投資方,不過我們會儘量保持真實,提出一些尖銳的問題,進行一場真實的對話。很高興能和你一起交流,Arvind。讓我們先來瞭解一些背景資訊,儘管大家可能已經很熟悉 Perplexity 了,但還是先把基本情況講清楚。你在印度長大,本科就讀於印度理工學院馬德拉斯分校(IIT Madras),後來移民到了美國,目前仍在辦理相關手續。祝你綠卡申請順利!Aravind Srinivas:很快就會有“金卡”了。(編者註:“金卡”是美國政府近期推出的一項新移民計畫,外國投資者只需支付500萬美元,即可獲得美國永久居留權(類似於綠卡),並有機會申請美國國籍。)主持人:風投界有句話,"Pay to play"(花錢才能入場)。你拿到了加州大學伯克利分校(UC Berkeley)的電腦科學博士學位,這可是了不起的成就!(Go Bears!)。之後,你進入了 Google DeepMind 和 OpenAI 從事研究工作,作為研究科學家,你在這兩個當時最重要的機構裡,親歷了早期生成式 AI 模型的發展。主持人:如今,Perplexity 是一個面向消費者搜尋、通用知識學習,以及企業解答的“答案引擎”。目前,每月的查詢量已達 5 億次——這個資料對記者們來說很重要,因為他們需要統計資料。Perplexity 現在已經覆蓋全球所有國家和地區,使用者遍佈世界各地,還有成千上萬的企業客戶。最近這幾周你們非常忙碌,開展了深入的研究,部署了 DeepSeek 模型,僅用幾天時間就開放給開發者。現在,你們又在推出企業版的 Deep Research,速度快得驚人。這是怎麼做到的?Aravind Srinivas:整個 AI 領域的發展速度快得令人驚嘆。我認為,目前唯一能保持競爭力的方式就是“跟上這個速度”。這既是好事,也是壞事。壞處是,基本沒辦法有充足的睡眠,無法過上輕鬆的生活。好處是,你能體驗到這片領域帶來的所有創新和不斷迭代的產品。無論使用者有什麼投訴或發現了那些 bug,我們都會日夜修復。我覺得這真的很棒。再過五年,知識將變得隨手可得,研究成本將大幅降低,軟體開發會更加簡單,建構產品的速度也會更快。從這個角度來看,這種產品帶來的可能性令人驚嘆,而行業內的競爭對手們也在不斷創新,以保持領先,我覺得這非常棒。主持人:現在,AI 領域正處於一個有趣的節點。大家都認可 AI 模型的價值,它們積累了大量的價值,並在全球各個組織中產生了巨大影響。而 DeepSeek 似乎正在進一步推動高價值 AI 技術的“商品化”。你怎麼看待這場競爭?目前,模型的競爭主要依賴於基準測試(benchmark),但 Perplexity 似乎採取了不同的策略,你更關注應用層。那麼,你的願景是什麼?Aravind Srinivas:關於 AI 模型的“商品化”,我覺得很多人還沒有真正理解其影響力。不過,我們不只是聽我的看法,而是可以看看那些在這個領域投入了數百億美元的人的觀點。比如,微軟 CEO 薩提亞·納德拉(Satya Nadella)在最近的多次採訪中表示,他們曾經在 GPT-4 時代取得的領先優勢已經結束了。過去,我們處於一個只有一個模型遙遙領先的時代,這種領先優勢至少持續了一年,甚至一年半。但現在,這種局面已經改變了,領先優勢可能只維持幾周,而且在不同領域,各家模型各有所長。比如,Anthropic 的模型在程式碼生成方面表現最佳,OpenAI 的模型擅長其他任務,Google DeepMind 可能在不同的領域更強,而 DeepSeek 在某些方面更具優勢。因此,模型之間的差異正變得更加細化。所有公司都在圍繞相同的基準測試不斷最佳化,填補自身的短板。開源模型的出現,也會迫使閉源模型做出反應。畢竟,閉源模型的商業模式依賴於不斷說服投資者投入更多資金,以建構更大規模的計算叢集,訓練更強大的模型。如果無法保持領先,而開源模型又能被輕鬆微調,那麼想要持續籌集 100 億甚至 1000 億美元的投資就會變得更加困難。DeepSeek 這一事件確實具有革命性意義。無論他們是否真的只花了 600 萬美元訓練模型(這點仍然有爭議),但可以確定的是,他們的投入遠低於傳統的閉源模型訓練成本,卻打造出了一個極具競爭力的 AI 模型。這個模型不僅能與最好的閉源模型媲美,還能完整提供推理過程,即“透明的推理鏈路”(transparent chain of thought)。在 AI 產品中,只有兩個核心特性能夠真正幫助建立使用者信任:來源引用(Source Citations)——AI 模型需要告訴使用者,它的資訊是從那裡來的。否則,使用者無法判斷答案的真實性,也不知道如何使用這個答案。推理鏈路(Reasoning Trace)——完整透明的推理過程,展示 AI 是如何得出答案的。目前,我們是唯一真正同時提供這兩個特性的產品。封閉實驗室不提供推理鏈的原因,是因為他們要在模型中保護自己的智慧財產權(IP),所以他們不想免費公開這些內容。但開源模型沒有這種限制,比如 DeepSeek 並不需要保護任何 IP,它直接免費開放了模型權重。然後你可以基於這些權重進行定製,彌補模型的盲點,移除審查機制,甚至在某些基準測試(比如金融領域的查詢)上最佳化模型表現,而不需要投入太多資金。你可以在任何資料中心託管這些模型,或者使用 Fireworks 這樣的模型提供商快速部署。這種趨勢迫使封閉模型的公司降低 API 價格,或者推出更優的替代方案。而作為一個對模型保持中立的產品,如果你直接面向使用者,持續增長使用者群體,快速迭代產品,不斷修復問題,並為全球知識工作者提供價值,你就有很大的機會勝出。主持人:還有一個有趣的點,特別是對於企業使用者來說,不僅僅是面向消費者。當企業有敏感的專有資料,並希望將其用作 AI 的資料來源進行檢索(RAG),在模型和應用層之間建立抽象層就顯得尤為重要。這樣可以確保信任,比如 Perplexity 這樣的公司可以在 ChatGPT 或 Claude 的服務條款中明確這一點,而這種抽象層實際上劃定了明確的邊界。Aravind Srinivas:無論是消費者還是企業使用者,其實沒有人在乎自己用的是那個具體的模型,人們真正抱怨的是:為什麼它無法連接我的 Google 或 Microsoft 資料?為什麼它不能按照我想要的格式輸出結果?我想直接點選檔案,在站內查看;我希望它能幫我建立工單……人們只是希望能使用最好的模型,而且他們不想操心技術細節。這些問題是產品建構者需要解決的。因此,我們的獨特優勢在於,我們可以用同樣的產品滿足消費者和企業使用者的需求。普通消費者可以直觀地理解那些模型在那些任務上表現良好,而企業使用者則需要額外的安全合規性保障,以及與各類資料來源的整合。過去,面向消費者和企業的技術堆疊通常是完全不同的,比如用於網頁搜尋的檢索機制,並不適用於企業的內部搜尋。但大語言模型的出現,使得“研究代理”(Research Agent)成為可能——它可以一次性處理多個檔案,提取相關段落,進行推理,並按照使用者需要的格式返回答案,同時具備對話能力。這種方式將網頁搜尋和企業內部搜尋統一了起來,最終成為一個知識管理和研究工具,整合了不同的資料集和模型,並將它們封裝在一個統一的體驗中——這正是 Perplexity 在做的事情。02 開閉源之爭:開源是AI安全的唯一解,將帶來應用爆發主持人:我們再聊聊開源 vs. 封閉模型的問題。我認為這是當前基礎模型領域最重要的話題之一。在當前的政治環境下,開源模型是一把雙刃劍。好處是任何人都可以下載、使用權重、微調模型,並將其託管在美國的資料中心,而不受模型最初來源的限制。但同時,也有人擔憂,開源模型若落入不當之人之手,或來自“敵對國家”,可能會帶來安全風險。因此,封閉模型實驗室正在遊說政府反對開源,這其實就是典型的政府-企業博弈。那麼從長遠來看,你如何看待開源 vs. 封閉模型?Perplexity 作為一個保持中立的公司,如何在其中找到平衡?從社會競爭和技術發展角度來看,你覺得那種模式更好?Aravind Srinivas:我們今天使用的很多技術——手機、筆記型電腦、網際網路——都是基於開放原始碼軟體和協議建構的。整個世界都依賴於這些技術,比如 Linux、Android,它們都是開放原始碼專案。網際網路本身就是建立在早期開源協議上的。所以,如果我們關注的是安全性和信任,那麼開源才是唯一行之有效的路徑。AI 領域也應該如此。我很喜歡 Bill Gurley 說過的一句話:如果某種技術真的很危險,那就應該讓更多人來審視它,而不是讓更少的人掌控它。否則,技術的安全性將完全取決於某個小群體的判斷,尤其是當這個群體正積極遊說封禁開源時,那顯然存在利益衝突。畢竟,他們的商業模式依賴於開源被封禁,這樣他們就能籌集更多資本,建立更大的資料中心,並提高 API 價格。而所謂的安全性擔憂,可能根本站不住腳。即便這些擔憂屬實,開源模型的公開可見性使得更多人可以共同驗證其安全性。如果有廣泛共識認為某種技術確實危險,我們可以採取措施確保其安全發展。目前來看,所謂的“AI 安全風險”被過度炒作了。除非 AI 發展到超級智能(superintelligence)的水平,能夠成為國家級威脅(比如一個由多個強大 AI 組成的叢集),否則對開源模型的恐慌是不合理的。所以目前我非常支援開源,我相信這將促進應用層的繁榮,會有更多公司能夠以可持續的方式提供這些模型,建立自己的業務,直接為使用者創造價值,並有效地實現盈利,從而創造大量的經濟價值,這是件了不起的事情。而我們正在嘗試這麼做,我也看到有幾家公司在做類似的事情。在未來五年內,我希望能有更多 AI 原生的應用,為人們帶來巨大的價值。03 一切都是套殼,能為使用者提供價值的就是好產品主持人:以一個與模型無關的方式來看,回顧 2023 年初或年中,我記得我們是在 Perplexity 上認識的。當時人們說,這只是一個很棒的 AI 套殼(wrapper)。套殼(wrapper)。這種說法有點貶低的意味,意思是所有的價值最終都會集中到大型語言模型(LLMs)上,而這些只是封裝層。即使到現在,人們仍然傾向於將世界分為兩類:一類是 LLMs,另一類是產品或應用,無論是硬體還是軟體。但我知道你對 Perplexity 有不同的看法。在這個框架下,你如何看待 Perplexity,或者說你是否打破了這個框架?Aravind Srinivas:我之前說過一句話,甚至廣泛傳播開了:到頭來,一切都是套殼(wrap)。確實有一些公司在訓練自己的模型,但它們沒有自己的晶片,沒有自己的資料中心,只有 Google 擁有完整的一套晶片、資料中心和所有基礎設施。甚至就連晶片,你自己也不會去製造,而是交給別人代工。所以,從某種程度上來說,一切都是套殼,只是抽象層次不同罷了。關鍵在於,你是否能大規模地為終端使用者提供真正的價值,並在此基礎上建構一個持續增長的業務。而如果你所依賴的基礎設施正在逐漸變成商品化的東西,那就太棒了。這正是當前的趨勢——人工智慧的計算成本大約每年降低 8 倍,每個季度降低 2 倍,或者說每 4 個月降低 2 倍。目前的估算是,即使保守估計這種趨勢還能持續兩年,我們也會看到成本下降 20 到 50 倍。這意味著在當前相同的價格下,我們可以為 50 倍的使用者提供服務,並在更高的規模上建立更強的業務,這是一個極好的機會。另一方面,我還想補充一點:一旦這些模型能夠真正對使用者的資料進行上下文理解,核心價值將不再是模型本身的權重,而是如何獲取並整理這些資料,為使用者提供真正有用的服務。比如,模型能呼叫使用者的 Google Drive、Gmail、旅行資訊、購物記錄,甚至整合來自各種社交媒體和線上活動的資訊。真正的價值在於如何打包所有這些資料,為使用者提供精準的個性化輔助,而不僅僅是模型本身的參數。實際上,模型只是一個資訊轉換器——它在進行推理、對話,並保持上下文一致性,但核心價值來自於它對使用者(或企業)的瞭解。這正是我們希望建構護城河和核心價值的地方。如果能在大規模上實現這一點,我們將會是一家極具價值的公司。04 Perplexity做瀏覽器:建構Agents的唯一方式主持人:我們來談談護城河吧。這個世界變化很快,幾乎每天都有新模型發佈,未來的公司在解決知識獲取問題後,會逐步進入 AI 代理(Agent)時代,以執行具體任務。不同的 AI 形式也在發展,比如 iOS、Android、Windows、Mac 等等。在這樣一個框架下,你認為企業需要做出選擇嗎?Perplexity 在這個生態中如何定位?Aravind Srinivas:我認為目前所有的 AI 公司都在盡力覆蓋所有平台。我們有 Mac 端應用,其他公司也有。我看到微軟今天剛推出了他們的 Mac 應用。我們也即將推出 Windows 端應用,同時也在網頁端提供服務。此外,我們還有 iOS 和 Android 端的移動應用,在 Android 端甚至可以作為原生助手(Assistant)運行,無需打開 App。我們還宣佈下個月將推出自己的瀏覽器。本質上來說,瀏覽器就是一個作業系統。你可以在瀏覽器裡完成幾乎所有的知識型工作。這其實也是 Google 當初推出 Chrome OS(Chromebook)的概念:作業系統本質上就是瀏覽器。這意味著我們可以基於瀏覽器建構許多 AI 代理(Agent),並且能夠從各種來源提取資料。我們之所以要做瀏覽器,是因為目前沒有其他方式能讓 AI 代理同時控制多個應用,尤其是在 iOS 上,甚至無法訪問其他應用,這是蘋果生態的限制。而我們不想受制於蘋果的規則,所以需要尋找一個變通的方法。在短期內,瀏覽器是一個非常好的解決方案。我們正在建構的智能體(agents)將允許你預訂、購買商品、制定旅行計畫,比如訂酒店。而且它會根據你的偏好進行個性化設定,比如你喜歡住那些酒店、偏好的房型、喜歡什麼樣的景觀等等。基本上,我們是在為你打造一個私人助理或者是執行助理(executive assistant)。當然,你仍然可以有一個真人助理(EA),但有些人負擔不起。而這個產品可以成為他們的“80/20”方案(指以較低成本提供大部分核心價值)。現實中,人們為私人助理支付的薪資通常在 10 萬到 20 萬美元之間。如果我們能以 10 到 100 倍更低的價格提供 80% 的價值,那將是一個很好的商業模式。我們希望通過這種方式,讓我們的核心產品——這個問答引擎(answer engine),能夠儘可能廣泛地可訪問,並且免費提供給使用者。這是一個長期願景,不會在今年實現。目前任何人聲稱 2025 年的智能體(agents)可以完全投入使用,都應該持懷疑態度。但我們正在嘗試找出一些可以率先落地的簡單場景,比如讓使用者購買商品時無需手動輸入信用卡資訊和收貨地址等。這類簡單的工作流程,我們希望在 Perplexity 上進行抽象化處理。05 隨著模型的輕量、高效化,使用AI的成本可以接近於零主持人:如果你考慮未來的模型發展方向,現在的 AI 實驗室(labs)已經開始建構產品了。他們意識到,像 ChatGPT 這樣的產品佔據了 OpenAI 收入的主要部分,而不是開發者 API 請求帶來的收入。Anthropic 非常專注於企業市場,而 Mistral 也是類似的情況。DeepSeek 既希望發展企業市場,也希望面向消費級使用者。他們正在籌集大量資金,也有豐富的算力資源。不過這對他們來說既是優勢也是劣勢,因為他們被自己的模型所繫結。那麼,作為一家初創公司,你們如何與這些融資數十億美元的 AI 巨頭競爭呢?Aravind Srinivas:關鍵在於資金的使用方式。他們可能籌集了 10 倍甚至 100 倍的資金,但其中 80% 可能只是用於建造資料中心。那麼,我們真的需要那麼多資源嗎?DeepSeek 讓整個行業都開始思考這個問題。或許,我們可以把那些超大規模的模型進行蒸餾(distill),變成更小但依然高效的版本,並將其投入生產環境。如果這些模型是開放原始碼的,或者能以合理價格通過 API 提供,即使那些 AI 巨頭不願意這麼做,雲端運算巨頭(hyperscalers)也願意這樣做。畢竟,他們追求的是規模經濟(economies of scale)。如果能有一種成本低廉、價格親民的模型,雲端運算廠商一定會推動它的發展。事實上,DeepSeek 已經在 AWS 和 Azure 上提供,它們的邊際成本幾乎為零,使用者只需要支付伺服器費用。所以,如果有類似的更小、更高效的模型,AI 的使用成本就可以接近於零。而在這樣的情況下,創業公司所籌集的資金就可以真正用來打造更好的產品、招募優秀的人才,開發下一代產品和新功能,而不是把錢都砸在資料中心上。有人會嘲笑我們免費提供 Pro 版本,但這其實是一種戰略。類似於當年 Google 通過向網站支付費用,換取他們在頁面上嵌入 Google 搜尋框的策略,我們也在“為查詢買單”。只是我們的成本是計算資源,而不是直接支付廣告費(CA)。如果未來模型的成本繼續降低,我們的查詢成本也會隨之下降。當我們積累了足夠大的使用者群,並讓使用者養成使用習慣,同時不斷收集資料來最佳化產品、實現更個性化的服務,我們將處於一個非常有利的位置。屆時,我們可以根據需求切換不同的模型,甚至基於開源模型訓練我們自己的模型——這也是我們正在做的事情。我們有一個名為 Sonar 的模型,也提供 API 介面。此外,我們特別專注於搜尋增強(search grounding),這使得我們的成本比其他公司低得多。那些想要整合網路搜尋的公司往往需要向 Bing 等資料提供商支付高昂的 API 費用,而我們避免了這些成本。06 Perplexity的下一步:成為個人化助理主持人:在座的各位應該都用過 Perplexity 。你是怎麼使用它的?Aravind Srinivas:我用它來做各種事情。我甚至可以直接讀出我的查詢歷史,比如理解我完全不熟悉的概念。我在經營這家公司,但在管理或領導方面完全沒有經驗,所以……(笑)我不是謙虛,是真的沒有經驗。比如,每次我們進行融資,我都會用 Perplexity 來寫投資備忘錄(investment memo)。這不是我在吹噓自己的產品,而是我真的在用它。我也會用它來收集其他公司的基準資料,比如它們在不同階段的收入情況,或者像 DeepSeek 論文這樣的技術資料。我以前是個研究員,但在過去一年半幾乎沒寫過程式碼,所以現在對具體的技術細節有點脫節了。所以當(DeepSeek的論文)出來時,我把它上傳到Perplexity,並針對它提了很多問題,這樣我就能同時從網頁和論文中提取資訊並閱讀。這對我來說是個很棒的知識助手。我還用它來分析我們的指標資料,比如我會上傳資料,然後詢問“這個圖表的問題在那裡?”——各種各樣的事情。所以它已經成為我生活的一部分,沒有它真的不太方便。主持人:所以你是自己產品的深度使用者,那麼有沒有那個功能是你特別希望有但還沒有的?有沒有什麼痛點?Aravind Srinivas:我希望Perplexity能真正理解我的全部上下文。目前它還是一個“使用者無差別”的產品——對你和對別人來說,它的運作方式是一樣的。從提供真實、無偏見的答案來看,這確實很好。下一步我們需要讓它回答與你個人相關的問題,比如你的航班資訊、即將到來的旅行計畫、你的會議安排等。還能在會議前拉取你要見的人的簡介,幫你準備會議需要說的內容。要讓它更有用,就需要讓它掌握更多個人化的上下文,而這意味著我們要做很多整合工作,比如你看到的Google Drive(整合)。順便說一句,面向個人使用者的Google整合比企業整合要困難得多,因為Google對API的要求很嚴格,所以我們正在想辦法繞開這些限制。但所有這些能力都是必須的。此外,它還應該能真正幫你執行任務,比如我不需要總是去查Google Maps、打電話給餐廳預訂,或者讓我的助理幫我做這些事情。這些都很耗時間,我希望Perplexity可以幫我完成這些瑣碎事務。主持人:所以,長期記憶、個性化、以及一個真正能執行任務的智能助手?Aravind Srinivas:對,所有這些流行的概念,但真正的挑戰是把它們做出來。這就是我們要努力的方向。 (51CTO技術堆疊)