最好用的 AI,是讓你感受不到它。
半年前,一位中國原生 AI 應用負責人對我們說,如果以過億 DAU(日活躍使用者)為標準,面向 C 端使用者的中國原生 AI 超級應用一定會很快到來,“不是 2025 年,就是 2026 年上半年。”
現在看,這顯然是一個過分樂觀的預測,但在半年前,很多人都這麼想。距離 2025 年只剩兩個多月,原生 AI 應用裡使用者規模最大的豆包也才剛到 4700 萬 DAU 而已。
半年後,市場更務實、可能性也更多。模型巨頭的能力不斷溢出,對應用創業公司既是挑戰也是機會;行業想要看到在傳統業務裡落地的大規模場景,能把 “業務收集資料 - 模型更好 - 讓業務變更大” 的圓環給閉上。
新的技術時代總會不斷出現,但商業的終極問題是相似的 —— 舊王是否會被新王顛覆掉?
網際網路平台、大終端廠商和新的模型巨頭,誰更容易做成那個離大量使用者最近、覆蓋面最大的通用 Agent,或者探索出新的互動方式,抓住 AI 時代的超級入口?
在移動網際網路時代,已經擁有超級入口的大公司,大機率最多的資源會圍繞這個入口的互動方式展開 —— 搜尋,使用者已經習慣了特定的Google使用方式,他們習慣輸入關鍵詞;電商,使用者也習慣了打開淘寶應用,輸入關鍵詞或者向下滑動逛一逛 —— 這決定了他們更傾向思考如何用 AI 來提升自己的搜尋和電商,而不是重新造一個。
《晚點 LatePost》和阿里巴巴中國電商事業群搜推智能總裁張凱夫及淘寶 AI 多位元深度參與者聊了聊 2025 年,阿里最核心的電商業務在 AI 的全景和進展。
我們試圖刻畫淘天描繪的 “AI 電商” 樣子,此時此刻主要在做三件事:隱性的底層技術,用 AI 清洗商品屬性,提升搜尋、推薦的匹配效率和廣告的 ROI(投資回報率);顯性的產品側,為商家提供 AI 經營工具,降本增效,為使用者打造 AI 導購創新產品,解決實際問題。
這三個方向的事,由比過去內部創業更小、更靈活的團隊來負責。AI 時代,一步慢步步慢,在複雜大公司,怎麼去迅速激發創新是一個重要議題。淘寶的選擇是 AI 產品的負責人必須是多面手,既懂產品又有演算法背景,這樣才有可能形成一個以產品為單位的高效創業體,張凱夫說,“我們不存在職能分工,說你寫個需求,讓我幫你實現,千萬別幹這事兒。這是一個非常過時的生產方式,未來的人一定是打通的。”
阿里電商的業務千頭萬緒,AI 要改變什麼?變到什麼程度?指導思想很清晰 —— 到現在為止,淘寶選擇先把這些 AI 功能融入到使用者今天打開淘寶應用後的動線當中,每一個 AI 創新能夠解決具體的使用者問題。
張凱夫希望實現的理想狀態是,“使用者甚至不需要知道有淘寶 AI 產品這個概念,他只需要在不同的場合調取不同的功能,解決他的問題、滿足他的需求,這就是好用的 AI。”
Google搜尋副總裁 Robby Stein 在最新一期《Lenny’s Podcast》說,很多人都沒有充分認識到這一點 —— 人們的很多基本需求並沒有因為 AI 的到來而改變。
電商行業,使用者 “多快好省” 的基本需求一定是經典的,不是一個新東西,但有了新技術,解決需求的方法可能有不同,主要有兩種思路:一種是按照使用者以前的軌跡,把每個環節做得更好;另一種是做一條完全不一樣的動線。
9 月 29 日,ChatGPT 上線了 Instant Checkout(即時結帳/支付),接入 Esty、Shopify 兩家平台,使用者在聊天介面可以直接購買商品。很多行業人士會思考:會不會有一天幾個購物平台變成了管道,而個人管家類 Agent (也或許是其他互動形態)成了新的入口?
“AI 產品首先是產品。” 一位淘寶 AI 相關業務負責人對我們說,此前在美國某大型科技公司工作十年,他觀察到 AI 產品目前普遍存在一個問題是使用者不願意打字,“你能在手機上寫一兩百字,就超越大部分的人了。”
淘寶應用上,每年有 10 億量級的人在這裡至少消費一次,每天有 4.31 億人會打開它逛一逛,是毫無疑問的國民級應用。而在中國,到今天很多使用者的輸入法依然是手寫。人們上了一天班,開了一天會,回到家,在現有的產品邏輯下,最舒服的就是上下滑,因為最不消耗腦力,其次刷雙頻流,然後點點點,最難的就是寫字表達 —— 這就是人性。
張凱夫 2017 年加入淘寶,3 年前開始負責阿里國際電商業務的 AI 應用,又在 2024 年底接管了淘寶智能搜推事業部,統管阿里國內外電商業務的 AI。一直以來,他秉承的一條原則是從來不認為應該為了創新而創新,創新一定得有需求支撐,不管是新的還是舊的,一定要解決使用者的痛點。
張凱夫對內舉了一個例子,OpenAI 是一個 Chatbot 做所有的事,Google 的 AI 產品是滲透到它的使用者動線,包括 YouTube、Chrome、Gmail 等產品,淘寶的思路更像 Google,因為電商的動線很長,使用者痛點太多,所以選擇把新的 AI 產品融到今天的使用者動線裡,解決每個節點使用者可能遇到的問題。
在每一個場景下有不同的使用者需求。當你搜尋 “連衣裙” 這種寬泛的詞,也許只是想要逛一逛,想看看試穿的效果,這時候有個 AI 試衣;但當你都搜了 “農夫山泉 550 ml * 12 瓶”,那很明確是想要最低的價格;當搜尋結果彈出了滿世界的不同商品,你有選擇困難症,這時候有個 AI 幫我挑;主站搜尋和拍立淘裡的圖搜,要解決的問題也不一樣。
為什麼要在使用者的各種行為軌跡裡用 AI 來提效,而不是一步到位,引導使用者把自己的需求直接表達出來?
因為表達本身是一件非常高門檻的事情。“淘寶不是只服務於社會精英,我們在做的事情是要服務於廣大人民群眾,比如家裡的爸媽、農村的老太太。” 上述 AI 業務負責人說,AI 產品最大的一個難點是使用者面臨那個框,他不知道該說什麼。相反,一旦你知道說什麼,有 100 種方法可以去解。“所以,淘寶要把這件事變成,使用者輸一個寬泛的詞語,我們能夠幫他變得更加精確,而不是讓他輸入 100 個詞。”
使用者甚至不需要知道這是 AI,不需要知道原來這些東西都是淘寶有個 AI 部門推出的產品,它們融入在淘寶應用裡,正好能解決使用者的問題。老子《道德經》裡說:“大象無形。” 一些底層的根本法則,之所以 “無形”,因為其超越了具體形態的侷限,充盈於天地之間,影響力又是最普遍的。
2024 年底 11 月剛接手淘寶智能搜推事業部不久, 12 月張凱夫和他的團隊還沒來得及梳理怎麼開展 AI 的工作,就遇到上了輿情,市場上抨擊淘寶搜尋的體驗越來越差,他們迅速打了一場 “體驗保衛戰”,圍繞使用者的搜尋體驗問題做針對性最佳化。
每天開早會分析、看各種案例的過程中,他們也真正意識到淘寶和天貓的商品底層資料的陳舊,做了 22 年電商,過去商品發佈,使用者搜不到想要的東西、搜出來的東西都長得一樣,有時候還不知道怎麼搜。
比如當你已經非常明確輸入 “黃色連衣裙”,但為什麼搜尋結果仍然有黃色、紅色、綠色、藍色的?因為在商家的商品詳情頁當中,包含了那條使用者想搜的黃色連衣裙,但由於綠色連衣裙銷量更好,而被優先推薦。
類似的這些問題這不是一個演算法問題,本質是底層資料的問題。2025 年初,張凱夫和團隊就認定,今年最重要的一件事,是把大語言模型系統地用到搜尋、推薦和廣告的各個環節裡。張凱夫說,“這件事價值足夠大,技術上也一定能實現,那就沒必要猶豫,今年必須做。”
過去,這幾乎是不可能完成的任務。如果去淘寶早年的工位去參觀,會發現淘寶和天貓行業小二的書架上是各行業的百科全書,需要依賴人工查閱百科全書來為海量品類定義屬性,效率低下又難以擴展。最佳化商品資訊這件事情在歷史上被提出了無數次,張凱夫回憶,大家發怵,因為淘寶有幾十億商品,那麼多品類,還要投入大量資源。
現在,淘寶建構了一個 AI 智能體,它能自動消化行業知識、分析使用者真實行為,從而智能地為每個品類篩選出最關鍵、使用者最關心的屬性,指導商家填寫,能解決商品資訊匱乏和不規範的歷史難題。
這其中最關鍵的一步,是利用大模型的語義理解能力,重新梳理商品資訊 —— 這是整個淘寶的商品資料基地,只有商品資訊本身更豐富、更精準,後面的搜尋、推薦和廣告系統,才能進行更相關的召回、更精準的推斷,然後提升使用者體驗和商業效率,還有可能把使用者的決策鏈路往前移。這個決策不依賴 AB 測試,而是基於一個樸素的道理:大模型技術,天生就適合處理這類問題。
一位淘寶搜尋業務人士舉例,當使用者搜尋 “我要買一台能支援掃地機通過的床”,傳統搜尋依賴關鍵詞匹配,無法理解這個搜尋需求裡涉及 “床下離地面高度” 的需求,搜尋系統首先能真正理解使用者的自然語言表達,理解後,還要能展示出精準的商品,這樣一個涉及複雜語義和結構化商品的應用,只有在大模型時代才可能做到。
“目前來看,最主要的問題都在商品上,理解使用者意圖不難,但理解之後能不能把正確的商品抓回來,這個 Gap 非常大。” 他分享了淘寶搜尋對商品資料進行清理的大方向。
最基本的,是規範清楚一個商品本身到底要發佈那些屬性,這裡的核心是解決商家填寫負擔和資料豐富度之間的矛盾。AI 可以幫助分析使用者真實搜尋和購買行為,為不同品類動態設定最關鍵的幾個屬性。比如 T 恤只需強制要求 “顏色” 和 “尺碼”,而連衣裙還要增加 “風格”“裙長” 等。
因此,淘寶主搜團隊啟動了 “SKU 引擎” 項目,利用 AI 幫助系統深入理解每個 SKU 的完整資訊,這裡最大的挑戰在於資料量會從過去的幾十億爆炸性增長到數百億。
因為商品的數量太多,淘寶主搜團隊負責人告訴我們,對淘寶來說,“如何識別出那些商品是同一個品,這對我們來說一直都有點挑戰。”
比如奶粉、手機這種標品,目標是要識別 “絕對同款”,而如果系統無法識別不同商家賣的是同一款商品,就無法將最低價或評分最高的商品推薦給使用者;對於服裝這些非標品重點是識別 “相似款”,解決個性化推薦過強導致的 “推薦單調” 問題 —— 當使用者喜歡一個款式,系統要做的是推薦其他相似但不同的款式,而不是反覆推送看起來差不多的衣服。
儘管大語言模型既可以 “讀懂人心”,又能 “更好理解商品”,但深度學習依然是現在電商裡最重要的模型。據我們瞭解,淘天 AI 現在的策略是讓新老方法一起幹活,各自做自己最擅長的事。
當要預測使用者 “會不會點選” 或者 “會不會買”,還是要依賴深度學習這套模型,因為它特別擅長從大量的歷史資料裡找規律。比如把 “今天天氣冷不冷” 這個資訊喂給它,它通過分析過去的資料就能學會:“哦,天一冷,看羽絨服的人就多了。” 基於此算出一個很具體的分數,回答那個商品更可能被點選。
從年初開始,淘寶 AI 圍繞商品理解的工作已經持續六個月,到現在,張凱夫逐漸總結了團隊工作的三個核心方向,並形成了有機的閉環。
首先,提升核心基建的效率,利用 AI 深度最佳化搜尋、推薦、廣告的匹配精準度,這件事的基礎是對淘天平台 20 億商品庫進行徹底的 AI 重構 —— 通過生成式技術清洗、補全和索引商品資訊,讓演算法能真正 “理解” 商品
第二,為商家降本增效,通過 AI 經營工具(如客服、美工、資料分析)直接降低商家經營成本。關鍵在於,這些工具在幫助商家釋放人力,可以投入到更重要的品牌建設上,促進商家增長,也有利於他們產出更高品質的商品資料,以此來反哺核心基建。
第三,使用者側,更精準的搜尋引擎,可以被新的 AI 導購產品(如 AI 萬能搜、AI 幫我挑、AI 清單、拍立淘、AI 試衣)等作為工具呼叫,為消費者創造場景化、對話式的新購物體驗。
這些複雜、日新月異的工作對業務的提升效果,張凱夫說至少目前,還無法用唯一的一個最重要指標來衡量。
AI 對搜尋和推薦的提升效果是最容易衡量的。AI 搜尋推薦的每一個事件都有 AB 測試。這是一個非常科學、最可衡量、也最資料化的可控實驗。AB 測試和隨機實驗結果顯示,複雜語義下的商品搜尋相關性可以提高 20 個百分點,對淘寶這樣一個成熟且龐大的搜尋系統來說,這樣的改進已經很少見。
這讓張凱夫充分相信,淘寶在 AI 上的投入,未來一定會 “物有所值”。
因為阿里的商業場景豐富,阿里系的商業規模導致一切做乘法的改進都有巨大商業收益,“乘法就是,系統效率提高 1 個點、2 個點,聽起來很小的改進,但後面要乘的數字是巨大的使用者量和成交額,所以邊際收益很大。”
更深層的一個價值是,使用者的搜尋行為未來會被改變,當使用者越來越願意並且敢於在淘寶內搜尋更多、更複雜的問題,一些以前可能會去其他平台搜尋的需求現在會被吸引過來 —— 這相當於把使用者的決策起點前移到了淘寶。
據我們瞭解,淘寶是業界唯一在所有搜尋請求中都應用大模型的平台,每天處理高達 3 億次的頁面訪問量,這為未來探索更多搜尋的可能性打下了基礎。
在商家側,淘寶不指著商家工具賺錢,而是希望通過這些工具幫助商家做好經營,商家的銷售額更加,平台自然受益。淘寶更關注的是規模指標:包括多少人用,商家用這些工具幹了多少活。
在店舖日常經營中,AI 已深度參與多個高成本環節 —— 淘寶的 AI 美工每月一共幫助商家自動生成 2 億張圖片,AI 客服每天大概能為商家節省的成本相當於 2000 萬元人民幣。
阿里媽媽工程技術相關負責人介紹,商家打廣告主要做四件事:定向人群和關鍵詞投放、製作素材、流量的出價競價和設定預算。淘寶建立起了 AIGX 體系,在這些環節提升效率、降低成本。
淘寶還推出一系列 AI 導購產品來輔助使用者購物:通過 “AI 萬能搜” 可以解析模糊的場景化需求;“AI 幫我挑” 能在眾多搜尋結果中提供選購建議;“AI 試穿” 通過模擬真實上身效果幫助使用者判斷衣物是否合身;“AI 清單” 支援以對話方式建立和管理購物清單,“拍立淘” 讓圖片搜尋功能更好用。評價它們的指標和其他產品一樣,就是 DAU 和使用者留存。
張凱夫已經很多年不寫程式碼了,現在他會投入時間 Vibe Coding(氛圍程式設計) 實現一些小系統,這已經成為一種很自然的工作狀態,這並非不務正業,而是因為 AI 技術變化太快,只有親身實踐,才能最直接感知技術的邊界和可能性。
團隊的日常討論,也遠遠超出了電商業務的範疇。張凱夫說,大家對 AI 的興趣濃厚,日常會有很多關於世界未來的討論。我們並不說電商未來會怎麼樣,我們會去討論網際網路的未來會怎麼樣,未來網際網路上會不會 Agent 比人都多,那個時候我們需要什麼樣新的基建,我們的瀏覽器會變成什麼樣的,索引會變成什麼樣?
這裡不像一個嚴陣以待的作戰指揮部,更像一個充滿奇思妙想的創新工坊。就像 AI 對電商的 “無形” 作用一樣,也許 AI 時代的思考方式,也正在成為那個 “大象”,對企業組織產生越來越 “無形” 的影響。 (晚點LatePost)