#APP
阿里CEO吳泳銘:幾場「大仗」打得漂亮
據鞭牛士消息,1月18日,阿里巴巴CEO吳泳銘,發佈新年家書。吳泳銘稱,阿里今年幾場「大仗」打得很漂亮,”淘寶閃購破局逆襲,“吃住行遊購"大消費服務體系加速成型;高德"掃街榜"讓商家專心經營、消費者放心消費,促進線下服務業更健康可持續發展;千問APP公測一周下載量破千萬,阿里AI正在從千行百業走向人人可用......“他表示,這些成果,不只是阿里單一業務的突破,更是阿里生態協同釋放出的化學反應。AI帶來的不是替代,而是升級和更多可能性。全文如下:各位阿里親友和夥伴,新年好!在這辭舊迎新的時刻,提筆寫這封信,心中滿是溫暖與感激。過去這一年,阿里巴巴的發展勢能明顯增強:AI浪潮奔湧,我們抓住時代機遇,跑出了自己的節奏;在大消費領域,我們也交出了紮實的成績單。無論環境如何變化,我們的底色從未改變,對未來的信念,對使用者的敬畏,對創新的執著,始終流淌在阿里的血液裡。今天,阿里巴巴已經成長為一家全球領先的科技企業。勢能並非偶然而來,是源於過去幾年我們主動求變的自我革新,更源於每一位阿里同學日復一日的堅守,相信與付出。這一切,都離不開家人和夥伴的支援。在此,向你們深深鞠躬:與大家同行,是我們最大的幸運。26歲的阿里,仍然走在創業路上,我們正在一個關鍵的時代路口:Al正以前所未有的速度重塑世界,消費方式和結構也在深刻改變。面對這樣的歷史機遇,我們必須全力以赴。令人振奮的是,今年幾場"大仗"我們都打得漂亮——淘寶閃購破局逆襲,“吃住行遊購"大消費服務體系加速成型;高德"掃街榜"讓商家專心經營、消費者放心消費,促進線下服務業更健康可持續發展;千問APP公測一周下載量破千萬,阿里AI正在從千行百業走向人人可用......這些成果,不只是單一業務的突破,更是阿里生態協同釋放出的化學反應。它們讓我們真切看到,AI帶來的不是替代,而是升級和更多可能性。無論走得多遠,阿里人始終記得,追求星辰大海是為了更好地呵護人間煙火。我們希望技術有溫度,演算法懂關懷,持續解決社會問題,讓世界更美好。在阿里,時間不只是數字,更是信任的沉澱。2025年,我們煥新工牌,“一年香,三年醇,五年陳,十年馨"各有色彩,是阿里人共同身份的象徵,也是風雨並肩的同路證明。今年510阿里日,我們還為入職滿十年的同學舉行“十年馨"專場音樂會,致敬長期主義。真正的長期主義,不是一個人走得遠,更是一群人彼此相信,彼此託付,一起走得更穩,更久,更遠。新的一年,挑戰依然存在,但未來更加清晰,期待與所有阿里人同心同行,來風破浪。新的一年,家人親朋的支援仍將是我們最堅實的後盾。我們一起,迎接更值得期待的新一年。 吳泳銘 阿里巴巴集團首席執行長(瑞恩資本RyanbenCapital)
AI終於不再只是“陪聊”了?深度解析通義千問“全能Agent”進化論
2026年1月,當大多數人還在習慣用AI寫周報、潤色郵件時,阿里巴巴旗下的通義千問(千問APP)在一個不起眼的發佈會上,扔出了一枚重磅炸彈:月活破億,並且要讓AI從“副駕駛”坐上“主駕駛”的位置。這場發佈會的主題是“From Question To Action”(從提問到行動)。對於科技愛好者而言,這不僅是一個Slogan,它標誌著大模型應用正在跨越“生成式AI”向“代理式AI(Agentic AI)”的鴻溝。為什麼說這次更新是AI應用的一次質變?作為一名AI應用愛好者,我們需要透過熱鬧的演示,看懂背後的技術邏輯與生態壁壘。1. 從 Chatbot 到 Agent:核心邏輯的重構過去兩年,我們熟悉的AI大多被困在對話方塊裡。你問它答,你讓它寫程式碼它給你文字。但通義千問此次發佈的**“任務助理1.0”,本質上是一個通用的Agent(智能體)**。發佈會透露了支撐這一躍遷的三個底層技術支柱:Coding能力的質變:這是Agent在數字世界“動手”的基礎。AI不僅要懂語言,更要懂程式碼,因為程式碼是操控數字世界的指令。全模態理解(Omni-modal Understanding):AI需要像人一樣看懂複雜的UI介面、讀懂雜亂的Excel報表、聽懂電話裡的語音。超長上下文(Long Context):只有能記住並處理海量資訊,才能執行長周期的複雜任務。2. 數字世界的“暴力美學”:搜尋裂變與自我核驗在工作場景(數字世界)的演示中,有兩個技術細節非常值得極客們關注:A. 搜尋架構的創新:樹狀裂變傳統的AI搜尋往往是線性的(搜尋-總結)。但千問展示的“深度調研”功能,在接到一個指令(如“調研某APP為何火爆”)後,會在後台瞬間裂變出上百個搜尋節點。這就像一棵樹的生長:一部分節點負責廣度(背景資訊),一部分負責深度(邏輯細節),並根據搜尋結果即時裂變新的節點。最終,它能在8分鐘內生成一份24頁的深度報告。這種“思維鏈+並行搜尋”的模式,是對傳統RAG(檢索增強生成)的一次降維打擊。B. 信任機制:Agent的自我博弈企業級應用最大的痛點是“幻覺”。千問在處理財務報銷(OCR識別+Excel統計)時,展示了一個“交叉檢驗機制”。系統在執行完任務後,會啟動另一個獨立的Agent專門負責“找茬”和復驗。這種“執行Agent + 監督Agent”的雙軌制架構,是AI從“玩具”走向“工具”的必經之路。3. 物理世界的“護城河”:生態即能力對於科技巨頭來說,演算法差距終會被抹平,但生態壁壘難以複製。通義千問此次最大的看點,在於它打通了阿里巴巴的底層服務生態(淘寶、支付寶、高德、飛豬、餓了麼等)。這是什麼概念?其他的AI或許能幫你規劃一份完美的旅行攻略,但由於缺乏API介面,你最後還是得自己去一個個App裡下單。而千問實現了**“決策-交易”的閉環**:原生支付整合:演示中,使用者說“點40杯奶茶”,AI直接呼叫淘寶閃購介面,選品、下單、甚至呼叫紅包,最後在對話方塊內直接彈出支付卡片。電話Duplex技術:AI模擬真人給餐廳打電話訂座,能處理“有沒有包間”、“有沒有兒童餐”這種多輪非標詢問。這需要極強的語音識別(ASR)和語音合成(TTS)以及自然語言理解能力。這種能力讓AI不再是一個單純的資訊提供者,而是一個擁有**Service Tool Use(服務工具呼叫)**能力的真實助理。4. 教育場景:Socratic AI(蘇格拉底式AI)在教育類股,千問展示了AI在Fine-tuning(微調)上的細膩度。它沒有選擇做一個簡單的“OCR解題機”(直接給答案),而是利用多模態互動(邊畫板書邊講)和蘇格拉底式教學法(一步步引導提問)。技術上看,這要求模型具備極強的邏輯拆解能力和對使用者反饋的即時推斷能力——它需要判斷孩子是“真懂”還是“裝懂”,從而決定是繼續講解還是進行變式訓練(舉一反三)。5. 結語:One App for All?發佈會最後,通義千問拋出了一個願景:在未來,大部分場景只用一個千問APP就夠了。這實際上是在挑戰移動網際網路時代的“APP孤島”效應。當AI具備了足夠強的Agent能力,並連接了足夠多的API服務,它就有可能成為新的OS(作業系統)入口。對於我們使用者而言,不管你是想讓AI幫你寫個年會抽獎程式碼,還是想一句話搞定春節全家游,通義千問這次的更新都值得你去邀測體驗一番。畢竟,親眼看著AI在螢幕上自動幫你點選、輸入、核對資料的過程,本身就是一種屬於這個時代的科技浪漫。下一步行動:現在的千問已經開啟了任務助理1.0的邀測,各位極客朋友們,不妨去更新一下客戶端,給這個“新物種”出幾道難題試試? (The AI Forntier)
千問APP發佈會:From Question To Action(有問必答)
Jan 17, 2026 阿里宣佈千問從“聊天助手”躍升為“生活辦事中樞”。依託阿里生態,使用者只需說出需求,千問就能自動呼叫淘寶閃購下單、支付寶AI付完成支付,並且全流程無需跳轉App。這也就意味著現在的千問已經成為了阿里系App的“大腦”,將高德地圖、飛豬、淘寶、釘釘、淘寶閃購等不同生態位的產品串聯了起來。未來使用者不再需要思考該用那個App,只用告訴千問自己的需求,它就會指揮淘寶、高德、飛豬、支付寶等具體應用來完成任務。以為阿里千問APP發佈會完整文字稿第一部分:開場與願景演講者:吳佳(千問C端事業群總裁)各位嘉賓、各位媒體朋友們,大家好,歡迎大家來到千問的產品發佈會。還記得上次和大家溝通交流,是在夸克AI眼鏡的發佈會上。當時千問上線一周,快速實現了1,000萬次的下載。在最近這段時間,我們也陸續發佈了多個新功能,涉及AI辦公、AI學習和AI創作。這裡面尤其是PPT製作、AI講題批改和視訊生成,收穫了大量的新使用者和好的口碑,實現了快速的發展。今天,距離千問正式上線兩個月還差兩天,但是我們已經快速實現了千問C端的月度活躍使用者超過了一個億。這個發展速度遠遠超出了我們的想像。當然在這個過程中,我們也收穫了大量好的建議,並在不斷完善自己。確實,整個AI的發展還在初級階段,但是如此快的速度達到這個成績,還是使得我們對未來越來越興奮。說到AI助理,我們其實一直強調其核心還是智力水平和辦事能力。這背後既是我們的業務思考,也是千問大模型和阿里巴巴生態的獨特價值。最近我們在兩者的結合上面取得了一些不錯的進展。那麼今天,我們會正式發佈“千問辦事能力”,也希望由此開啟AI辦事的新時代。我們認為一個好的AI助理,不應該被困在對話方塊中進行簡單的問答和聊天,它其實應該走出搜尋框和對話方塊,能夠自主行動、執行任務並且交付結果。進一步來講,我們也認為它不應該被困在數字世界。當然數字世界的突破已經近在眼前了,在今天高度數位化的中國社會,數字世界辦事的重要性不言而喻。但是,同時能夠進入物理世界,在生活場景中幫人們幹活辦事,才是AI助理的完整形態。第二部分:數字世界辦事能力(千問任務助理1.0)演講者:吳佳首先讓我們來聚焦數字世界的辦事。數字世界辦事的突破依賴於三個非常重要的能力:Coding能力的大幅提升:也就是千問大模型的程式設計能力,這是數字世界的一個基礎。全模態理解能力的突破:它是使AI擁有行動力的關鍵,能夠讓千問看懂介面、聽懂聲音、讀懂報表圖文等等。超長上下文的處理能力:這是交付複雜任務的關鍵。有了這三點,我們認為在數字世界,人類和AI的角色互換會加速發生。在未來兩年,數字世界中60%-70%的常規任務,我們認為都會由AI來直接執行和交付。那麼剩餘的這些創造性的任務,也會因為有AI的深度參與從而大幅提升效率。也就是說,從這個意義上來講,在數字世界辦事的主力會變成AI,AI會從“副駕駛”走向“主駕駛”。基於此,我們今天正式發佈千問任務助理1.0。大家更新客戶端就可以申請參加邀測,未來幾天我們會全面開放,免費讓人人可用。大家在體驗的過程中就會發現,它幾乎可以執行數字世界所有類型的任務,其中核心的400多種,包括像應用開發、Office辦公、以及學習輔導、諮詢調研、資料分析、可視化報表生成等等,在這些任務上都有著非常不錯的交付結果。除了模型的能力,我們還和各大專業資料庫進行了深入的合作,來進一步提升千問任務助理輸出的時效性和權威性。這些領域涉及教育、醫療健康、財經、法律、學術期刊等。在這個執行過程中,大家也可以隨時在任務執行過程來查看其引用的資料,並且進行回訪、修改和保存。接下來我們看幾個例子:案例一(財務場景):這是一個財務同學年底整理髮票生成報銷台帳的例子。眾多的發票命名不同、格式也不同,整理起來非常費時費力。現在交給千問任務助理,只需要幾分鐘。當下我們支援一次性最多上傳100個檔案來處理。案例二(資料分析):這是一個用千問任務助理做資料分析和可視化圖表生成的例子。我們可以將Excel的截圖直接發給千問任務助理,一鍵產出右邊這樣的分析結果,非常方便。案例三(團建方案):這是一個做團隊團建方案的例子。千問交付的結果區別於傳統的文件,它其實是一個圖文並茂、結構清晰並且可以運行的Web頁面。把這個Web頁面分享給團隊同學,每個人都可以進來通過點選上面提供的機票、酒店等資訊,直接去到飛豬、高德來完成相關操作,比傳統文件方便很多。案例四(學習場景):比如一道數學題:“從m點開始,甲要走到b點再返回,乙要走到a點再返回,他們才能在n點再次相遇……”大家可以看到,千問可以和真人老師一樣邊畫板書邊講解,大幅提升學生的學習效率。我們也支援隨時打斷提問,所以千問可以成為學生亦師亦友的學習夥伴,也是家長的好幫手。第三部分:生活世界辦事能力與生態打通演講者:吳佳下面讓我們進入生活場景。在AI時代,我覺得每個人的生活方式也會發生很大的變化。隨著AI的能力越來越強,未來每個人會配備一個生活助理,這是可以想像的。在生活場景辦事和在辦公學習有很大不同:使用者需求主觀且寬泛:很難通過簡單的計算推理提供滿意的服務。資訊環境複雜:如今的中文網際網路充斥著行銷、種草、廣告內容,且中國供給極其豐富,海量資料流動,模型很難保持精準、真實、客觀、時效的輸出。互動方式不同:很多時候使用者的真實需求是在與人溝通、有新輸入後才能精準表述的。使用者往往會有“哦,對,這個東西才是我要的”這種體感。因此,在生活場景,我們需要AI像人一樣和使用者進行有效溝通,尤其是主動溝通、主動輸入、主動提供方案,一起來完成消費決策。針對這兩點,阿里巴巴豐富的供給和生態內每天真實發生的海量交易與服務,使得我們具備強大的競爭力。我們不僅通過視野支援,還把我們的服務和阿里生態的資料服務進行高頻率對齊,確保模型的輸出變得更好。在服務能力方面,我們打通了淘寶、支付寶、高德、淘寶閃購、飛豬、大麥、淘票票等一系列業務的能力。這不僅僅是千問APP具備了上述業務能力,更重要的是實現了從消費決策規劃到交易執行的閉環。使用者可以從消費場景直接發起買東西,而不是從商品發起。使用者也可以直接說自己的出行需求,而不再需要自行組織路程規劃、機票、景點等內容。所有服務都會離使用者需求的原點更近,直接承接需求,使用者不需要自行拆解需求在各大APP間切換。在未來,我們覺得在大部分場景,其實只用一個千問APP就夠了。下面我也來演示一個例子。我看茶台上的咖啡和奶茶消耗得差不多了,我現在用千問來補一波貨,現場點個外賣。(吳佳現場演示):“幫我點40杯霸王茶姬的伯牙絕弦。”(卡片跳出,選擇,輸入支付密碼)好,可以看到已經付款完成,待會兒就會送過來。謝謝大家,我的分享到此結束。第四部分:生活場景深度演示主持人:接下來有請千問APP產品經理李銀旭。演講者:李銀旭(千問APP產品經理)大家上午好。剛剛大家看到吳佳用千問為現場觀眾點了奶茶,現在已經在配送路上了。接下來我復現一下如何在千問上實現“一句話點奶茶”。千問呼叫了淘寶閃購提供服務,它知道我在阿里巴巴西溪園區,幫我推薦了附近最近的霸王茶姬,幫我選好了40杯,還顯示有個千問爆紅包的滿減券,點選支付就可以完成訂單。這也是行業內首次將支付能力原生融入到AI對話中。功能演示一:電話點餐不僅如此,我們還可以打電話點奶茶。使用者:“你好呀,我想喝奶茶,幫我點個奶茶吧。”千問: “好的呀,我現在用淘寶閃購幫你搜一搜。你的收貨地址是阿里巴巴西溪園區C區C6門。附近推薦:一點點的抹茶奶茶(16元)、茶百道的超厚芋泥奶茶(17元)、一點點的米麻薯草莓奶綠(19元)。你想選那款?”如果需求更複雜,比如團建時有人想喝霸王茶姬,有人想喝蜜雪冰城,還有人對甜度有要求,千問任務助理能給出1-3套可選方案,兼顧配送快、評分高、價格低。我們還可以讓任務助理幫我們電話預定餐廳:使用者:“你好,我要訂個位置,明天晚上7點半,五個人,有位置嗎?”AI(撥打餐廳電話):“有位置,需要留個預定電話。”餐廳:“好的,客戶姓李,電話是?”AI:“130...1308070。”餐廳:“明天晚上7點半,五位,好的。”AI:“我想問一下你們有大包間嗎?”餐廳:“有大包間,13人左右的。”AI:“請問餐廳有沒有適合小朋友吃的菜品?”餐廳:“有家常炒菜啊。”AI:“好的,那我這邊再跟客戶確認一下。我是千問AI助手,祝您生意興隆,再見。”大家聽出來了嗎?如果最後不說我是AI助手,很多人可能以為是真人在打電話。這背後是千問全面接入的阿里生態能力。功能演示二:購物決策(掃地機器人)過去兩個月,使用者在千問上主動詢問商品推薦的次數月環比增長超過300%。使用者真正卡住的不是買不到,而是選不出來。舉個例子,今年春天我想幫爸媽換家電,讓千問選一款價格在2000-4000元之間的掃地機器人,並告訴它家裡有隻貓。千問精準卡住了預算區間。針對“有隻貓”這個看似輕描淡寫的條件,千問捕捉非常到位,將推薦重點放在防纏繞能力、高溫殺菌等貼近養寵家庭衛生訴求的點上。給出的三款產品直接列出核心優勢,點選卡片即可進入商品列表頁完成購買。功能演示三:戶外裝備(四姑娘山徒步)我問它:“下周準備去四姑娘山徒步,需要那些裝備?”這是一個非明確購買需求。千問綜合了“冬季”、“高原”、“徒步”幾個關鍵點:給出涵蓋天氣、裝備清單、購買推薦、注意事項的整體建議。核心裝備給出具體購買建議:如登山鞋推薦了凱樂石MT5,登山杖推薦了黑鑽。最後還建議聘請當地嚮導提升安全性。這就是千問在購物場景典型的一幕:不僅幫你買東西,更是幫你把一次高風險、高成本的戶外出行提前做完決策和風控。功能演示四:春節旅遊規劃(三亞一家六口)場景:春節一家六口(五大一小)去三亞,7天6晚深度游。訂機票:“幫我規劃春節去三亞往返機票,杭州出發,直飛,性價比高,時間別太早。”千問沒有直接甩航班列表,而是分析說2月14日已進春運,晚班機溢價嚴重(含稅近5000元),方案三不划算。綜合帶娃和性價比,推薦首選下午3:55出發的方案一;如果預算敏感,可選晚上8點多的航班。訂酒店:“找幾家亞龍灣附近的五星級酒店,含早餐,有兒童設施。”千問基於飛豬資料庫,推薦了天域、萬豪、麗思卡爾頓。特別關注“適合帶娃”,列出了具體的遊玩設施。最後我選擇了性價比最高的天域度假酒店。訂年夜飯:“推薦酒店附近的年夜飯,有小朋友吃的菜。”通過高德地圖周邊查詢和掃街榜,選出三家2公里內的餐廳。我選了一個能邊吃魚邊看魚的海洋主題餐廳,水族箱很大,老人小孩都喜歡。證件辦理:“戶口在杭州,大人小孩怎麼辦護照?”接入支付寶政務服務,給出清晰指引(流程、材料、管道),並直接提供移民局出入境辦理入口。目前千問已接入支付寶覆蓋的50項政務服務(社保、公積金等)。未來,基於阿里生態,千問將呼叫龐大的生活服務網路,把人間煙火氣帶到使用者身邊。第五部分:工作效率與深度任務主持人:接下來有請千問APP產品經理張澤遜。演講者:張澤遜(千問APP產品經理)Hello大家好。我們經常遇到這種情況:加班到深夜,但關鍵工作沒什麼進展,時間都花在了處理表格、調整格式、收集資訊這些繁瑣重複的“黑洞”裡。剛才吳佳提到,未來兩年數字世界70%的常規任務會由AI完成。今天我要介紹千問的全新功能——任務助理,它是一個通用Agent,能自主規劃、呼叫工具。演示一:Coding能力(年會抽獎)公司年會抽獎很麻煩,以前得求助技術同事。現在有了AI Coding,成本大幅降低。我們已經把在場嘉賓資訊脫敏整理成表格上傳給千問,指令:“根據上傳的名單做一個抽獎小程序,送出一個三亞旅行大禮包。”(千問開始工作,此時先介紹其他功能)演示二:財務報銷(貼發票)年底貼發票很痛苦。演示:上傳100張發票附件。指令:“提取資訊,按季度分類統計報銷總額,用另外一個工作簿呈現。”結果:系統快速抓取,生成的表格算上表頭共101行,100張發票一張不少。交叉檢驗機制: 結果下方有一個“啟動核查”按鈕。點選後,系統會讓另一個獨立Agent專門復驗結果。我們在底層為所有計算任務至少加入了兩道自我核驗機制,確保程式碼邏輯和執行結果符合預期,再加上交叉檢驗,多重保險守住精準性底線。演示三:資料匯報(圖表生成)上傳一張只有原始資料的表格圖片,讓它分析資料生成匯報。千問生成了一份可視化報告,首先把老闆最關心的關鍵指標和核心結論放在最前面。通過多維度可視化圖表(客戶貢獻佔比、區域利潤分佈)直觀呈現資料。給出戰略建議:例如敏銳發現了標竿客戶的模式優勢,建議複製到其他線路。目前我們累計支援30多種不同圖表的生成。演示四:資訊收集(深度調研)場景:調研最近很火的“死(Si)了麼”APP。以往要打開幾十個網頁整理一下午。演示:輸入指令。千問瞬間在後台裂變出上百個搜尋節點,一部分負責廣度(關聯背景),一部分負責深度(邏輯細節),累計進行80多次搜尋,像一棵樹一樣生長。結果:8分鐘內交付了一份24頁的PDF報告,包含案例分析、索引清單表格(事件、日期)。生活場景應用:規劃“蘇東坡主題自駕游”。千問12分鐘內規劃了30天的行程,標註全國所有地點、詳細路線、景點介紹、導航跳轉(高德)以及酒店推薦(全季等)。嘉賓分享:財經博主小林張澤遜: 我們邀請了財經博主小林分享體驗。小林: 我給千問出了兩個難題:查資料與分析:讓它找出“小林說”過去一年經濟相關內容並分析,結合宏觀資料,給2026年畢業生就業建議,產出報告。結果:它不僅蒐集了宏觀資料,還精準摘要了我之前的視訊內容(如十五五、全球經濟)。報告結構清晰,先給結論(看好人工智慧、智能製造),再展開資料對比和地區建議。它還會自我檢查。做PPT:基於報告輸出簡報。結果:結構清晰,有主副標題和小圖示,配色美觀。最驚喜的是最後一頁總結了一首五言絕句:“看得清方向,學得會技能,抓得住機會”,這是它自己提煉的金句。張澤遜: 你覺得它作為實習生過關嗎?小林: 必須過關,我已經準備給它發Offer了。(回到抽獎環節)抽獎程序已經生成。小林點選開始和停止。恭喜姓鄭、尾號0372的朋友獲得三亞大禮包。張澤遜:千問任務助理即日起開啟邀測,移動端和網頁端同步上線。第六部分:教育與成長主持人:接下來有請千問APP產品經理曹瑩。演講者:曹瑩(千問APP產品經理)大家好,我也是個孩子的媽媽。輔導作業太讓人頭疼了。所以前幾天我們上線了期末備考大禮包,包含中小學真題卷、錯題舉一反三、千問小講堂等6大功能,全部免費開放。真題卷:千問擁有亞洲最大的中小學真題庫。你可以說“我想要杭州初二上的數學真題卷”,或者“孩子在一次函數這塊特別弱”,千問會立馬生成對應的Word和PDF供下載。錯題批改與分析:千問不僅能完成整卷批改,還會生成自動化批改小結,識別知識弱項並給出提升建議。千問小講堂(互動講解):針對孩子“似懂非懂”的情況,千問能進行啟髮式講解。演示(相遇問題):千問引導孩子思考“從m到n,兩人合起來走的總路程是幾個全程?”它會像老師一樣在虛擬黑板上邊畫邊寫,非常直觀,且孩子可以隨時打斷追問。舉一反三精準練:不盲目刷題。批改後自動分析漏洞,生成三道陷阱相似、考點一致的變式題。比如解含參不等式忽略分類討論,千問就針對這個易錯點生成題目。嘉賓分享:鄉村教師俞贊明曹瑩: 我們邀請了麗水市景寧第二實驗學校的俞贊明老師。俞贊明: 我是來自浙江浙南山區的教師。幾年前阿里公益帶來的少年雲AI雲教室改變了我們。學生案例:有位留守兒童以前作業不會做只能空著,我推薦他用千問。一周後他說:“俞老師,千問真好用,碰到難題我不怕了。”教學案例:上程式設計課時,40個孩子程式碼出錯,我分身乏術。現在孩子們把程式碼給千問,它不僅能檢查問題,還會循循善誘引導孩子學習。這讓我從體力勞動者變成了教學設計師。家長視角:我也是高一學生的家長,千問比我們家長有耐心多了,能緩解親子關係的緊張。AI在教育上突破的是“人教人”的侷限。曹瑩:千問的設想是讓每個孩子都擁有一個懂自己、有耐心的AI家教。我們已經上線了20多項學習能力。第七部分:結語主持人:感謝曹瑩,也再次感謝以上所有演講嘉賓。今天千問帶來的強大AI辦事能力,不僅來自於模型演算法,更來自於它所連接的每一個服務、每一次協作。現在有請幾位重磅的合作夥伴上台,他們是千問AI辦事能力的基石:淘寶、支付寶、淘寶閃購、飛豬、高德、優酷、大麥、菜鳥、阿里健康、1688、盒馬、阿里巴巴資料技術及產品部等生態業務的代表。再次有請千問C端事業群總裁吳佳。 (The AI Forniter)
AI購物時代真的要來了?
近日,阿里旗下千問APP官宣重磅升級,全面接入淘寶、支付寶、淘寶閃購、飛豬、高德等阿里生態業務,首次實現點外賣、買東西、訂機票等AI購物功能。阿里希望將千問APP打造成強大的人類AI助手,能真正幫使用者辦事。此次升級的AI購物功能究竟好不好用,小編拿到邀請碼後進行了體驗。AI外賣:喚起淘寶閃購速度很快 支付效率高千問APP已經可以實現一句話點奶茶或咖啡。小編在聊天框說一句“點兩杯瑞幸的橙C美式”,千問就能快速呼叫淘寶閃購的服務能力。首先根據定位確認位置資訊,然後推薦合適的商家。商品資訊以卡片形式展示,一個卡片一個SKU,但在實際選擇中,需要不斷點選“下一個”按鈕翻找心儀的商品,效率有點低,且不好做對比,不如淘寶閃購APP上簡潔明了。選好商品後,使用者可通過千問內建的“支付寶AI付”功能一鍵付款,非常順暢。如果要修改位置資訊,可以點選商品卡片直接修改。點選“修改商品”按鈕,則可以加入其他商品或一鍵湊優惠。值得一提的是,整個點外賣的過程均在千問對話介面內完成,不需要跳轉至其他應用。此外,生活中還有很多更複雜的點單需求,比如聚餐時想要“20杯咖啡,10杯無糖,10杯加冰”。千問正在內測的“任務助理”功能可以完成這些複雜任務,但從目前的體驗來看,結果還不十分精準,給出了20杯熱的無糖咖啡。一位AI設計師在千問下單之後評價稱,“未來對設計師和AI的挑戰,將會是如何正確識別使用者的意圖,將原子化的元件通過AI組合成互動式的卡片推送給使用者,且使用者在卡片上的操作和上下文形成有效的連接。不過總的來說,有生態的AI值得想像。”據瞭解,用千問APP點外賣還能領取優惠券,部分商品還有大額優惠。根據網友曬單,點一杯冷萃咖啡,“千問爆紅包15元”。AI定機酒:飛豬、高德助力 但選出最優方案不易隨著大模型技術的迭代發展,AI制定旅行攻略已經很熟練了,千問接入飛豬、高德之後,可以直接在對話介面預定機票和酒店。比如,讓千問預定“春節期間北京去大理的往返機票,兩個人,停留5天,出發時間為2月13日。”在完成飛豬帳號繫結及相關授權後,千問給出了兩種方案:注重效率的直飛方案,以及性價比較高的中轉方案,二者價差390元。需要注意的是,春節期間機票價格和庫存變化很快,千問掛載卡片中的機票價格和庫存也會即時波動,所以間隔一段時間問同樣的問題,給出的方案可能完全不同。這也意味著很難選出最優的方案。下一步預訂酒店,可以在千問輸入酒店需求“大理古城附近,性價比高的民宿”,千問給出了5家匹配的民宿,評分都在4.7分及以上,當前價格普遍在100至500之間。但是點開選擇要入住的日期,很多都是售罄狀態。其中一家民宿上了“高德掃街榜”,入圍大理市舒適性酒店榜。據瞭解,千問已全面接入高德掃街榜,此次升級中還推出了AI打電話訂餐廳的功能,在現場演示中,用AI打電話預定包廂,它會自動與餐廳溝通預留時間、人數、有無忌口等細節。 如果不是在最後聽到“我是千問AI助手”,幾乎以為是真人打的電話。AI購物:很多商品顯示無效 仍有最佳化空間AI聊天搭子上連結這事兒,豆包、Kimi、文小言等應用去年已經開始幹了。以豆包為例,就是在聊天回覆的答案中嵌入抖音商城的商品連結,點選後可直接跳轉至抖音商城購買。千問的AI購物功能與此類似。比如,在對話方塊輸入“想買一個掃地機器人,預算2000元以內”,千問給出了兩個方案,一個針對無死角清潔,一個針對大戶型,點選商品卡片,可以看到不同類型和價位的商品列表,選定後即可跳轉至淘寶下單購買。然而,讓千問推薦“含有馬元素的紅毛衣,預算500元以內”,它給出的回覆只有文字推薦,沒有商品連結。進一步要求它“直接上連結”,給出的4個推薦中,有3個顯示“商品失效或不存在”,僅有的1個可以正常顯示的連結與毛衣無關,是千問自己強烈推薦的馬年玩偶“哭哭馬”。再換一種提問,要求千問“為公司年會設定三個獎項,20個名額,獎品選什麼好?”它推薦的獎品包括蘋果手機、華為筆記型電腦、平板、掃地機器人、耳機等,多為3C數位產品,並且帶有商品卡片連結。酒水茶禮、黃金首飾、香包配飾等則只有文字推薦,沒有連結顯示。對於淘寶天貓比較強勢的美妝品類,在相關推薦結果中也沒有卡片展示,有直達連結的,點開則顯示“寶貝不存在,可能已下架或被轉移”。但在淘寶APP中直接搜尋,商品均在正常售賣。據瞭解,千問接入淘寶還在內測中,目前消費電子等品類已經率先接入,其他品類將陸續上線,等到正式上線之後,體驗或許會更好一些。寫在最後千問APP此次最大的更新點在於對阿里生態的深度整合和接入。此前,AI助手的主要功能還是集中在問答聊天,升級之後,千問APP具備了類人化的理解意圖、多步驟規劃與執行任務的能力。用千問C端事業群總裁吳嘉的話說,就是“AI在擁有超強大腦之後,開始長出了能夠觸達真實世界的手和腳。”在實際體驗中,千問的表現有驚喜,也有不如人意的地方。這也說明在初步打通訂機酒、點外賣、買東西等幾大網際網路經典應用場景後,千問APP仍需要持續進化。有意思的是,當小編問豆包、元寶如何看待千問此次更新時,它們都肯定了阿里整合生態資源,建構“超級入口”,推動行業從“聊天”向“辦事”升級;同時也指出千問僅接入阿里系內部業務,存在生態侷限問題,面臨整合與協同難題等。總的來說,AI辦事時代才剛剛開始,但有生態的AI值得想像。 (TechWeb)
豆包的野心,被千問先實現了
2026年剛開始不久,國內AI領域的又一里程碑事件就出現了。題圖 | 阿里巴巴1月15日,阿里巴巴集團旗下的千問App宣佈接入淘寶、支付寶、淘寶閃購、飛豬、高德等阿里生態業務,可以實現點外賣、買東西、訂機票等AI購物功能。和AI助手聊天,讓AI助手尋找資料、生成文件,已經是很多人生活中不可或缺的一部分。但絕大部分情況下,AI助手是和使用者手機裡的“錢”絕緣的,它可以為我們提供理財和消費建議,但不能“上手”。而千問App的這次升級,打破了這個界限。你只需要說幾句話,AI助手就在淘寶給你下單支付了。活動現場,千問C端事業群總裁吳嘉演示了AI外賣功能,給千問App下達一句話指令,“幫我點40杯霸王茶姬的伯牙絕弦”,隨後千問App呼叫淘寶閃購下單,無需任何跳轉即在端內完成AI支付。不久後,淘寶閃購騎手就將奶茶送達現場。更複雜一些的操作也可以,比如像聊天一樣說“想給爸媽家買個掃地機器人,預算2000到4000,家裡還有隻貓”,千問App就能推理出“防纏繞”、“高溫殺菌”的需求,並給出合適的商品;準備春節出遊,千問App一邊呼叫飛豬來預定機票和酒店,一邊呼叫高德來做行程規劃和預定年夜飯,甚至直接打電話訂餐廳。這些操作,不由讓人想起了不久前火爆全網的“豆包手機”,類似的“AI跨應用”設想,為什麼一個被大範圍抵制,一個則順利發佈呢?01.千問App 與豆包手機,差在那?我們來回顧下豆包手機的發展軌跡:2025年12月1日,字節跳動與中興通訊聯合推出了搭載豆包手機助手預覽版的努比亞M153,也就是我們說的“豆包手機”,具備跨應用自動操作能力;僅僅幾天後,就有使用者反饋在使用豆包手機助手操作微信時出現異常退出,同時,支付寶等金融應用因系統權限問題觸發風控,部分使用者帳號被強制退出或限制登錄;2025年12月5日,豆包手機助手發佈《關於調整AI操作手機能力的說明》,明確限制三類場景,其中包括暫停操作銀行、支付等涉及資金安全的App。曇花一現的背後,網路上對其的聲討主要聚焦在使用者隱私方面,但深入思考一下就不難發現,“豆包手機”試圖打通微信、支付寶等不同大廠的App,來實現跨應用的便捷操作,讓AI助手升級成“智能管家”,這種模式顯然觸及了各大廠的商業利益。移動網際網路時代,像微信、支付寶、抖音這樣的超級App是“版本答案”,它們建構起封閉的生態,掌握著流量入口和商業變現模式。但“豆包手機”卻在挑戰超級App的地位,比如,AI助手成為新的流量入口,直接會減少使用者在App的停留時長,進而減少其廣告曝光與商業變現機會,最終可能瓦解超級App的商業閉環,使其淪為工具型App。當然,這樣的模式是非常有想像力的,就像抖音集團副總裁李亮所說的:“AI帶來的變革是真實存在的,使用者的需求也是真實存在的。豆包和中興的探索是個開始,不論這次是不是會成功,但AI一定是未來。”沒有大廠會對這樣的機會視而不見,問題是要怎麼做?千問App和“豆包手機”的不同在於,如果說“豆包手機”是在“砸別人家的牆”,千問App則是在“自家地盤修路”,由於其整合的都是阿里系App,就不存在激烈的利益衝突,千問App只需充當“串聯者”的角色,因此落地的難度大大降低。DoNews 攝這張照片由筆者在現場拍攝,淘寶、支付寶、飛豬、高德等一眾阿里生態業務都來為千問App站台,不誇張地說,除了微信的社交功能無法取代,這些App足夠涵蓋普通人日常的大部分需求了。02.App生態:超級AI的“護城河”老網際網路人還記得“阿里系”和“騰訊系”這兩個標籤,兩家大廠曾在網際網路的各個領域跑馬圈地,通過內部創業和收購,將一系列的App納入自己的生態版圖。本以為這個時代已經逐漸過去,AI的發展,卻讓App生態的協同優勢再次凸顯。阿里系豐富的應用場景,為千問App提供了廣闊施展空間,它就像是使用者手機中阿里系App的“總調度台”。比如淘寶購物、支付寶支付這些高頻場景,在千問App內都能一站式達成,最佳化了使用者的體驗,也進而提高了使用者對千問App乃至阿里系App的粘性。也許未來最強大的人類AI助手,考核的標準不是智能上限,而是可以合法呼叫App的“資格”?能觸達的App生態,將成為移動端超級AI的“護城河”。這裡面要重點提到的就是支付寶,“豆包手機”暫停了操作銀行、支付等涉及資金安全的App,就像被斬斷了伸向現實的觸角,而千問App卻能通過支付寶深度打通各個App業務的支付鏈路,進而實現從“聊天對話”到購物付款等“辦事”的躍遷。但“豆包手機”被拷問的問題同樣存在:AI的操作是否獲得使用者明確授權?資金交易過程是否足夠安全?更換裝置或應用後,服務體驗能否保持連貫?1月16日,支付寶聯合千問App、淘寶閃購等夥伴,發佈了ACT協議(Agentic Commerce Trust Protocol,智能體商業信任協議),回答了這些問題。這是中國首個面向Agent商業需求設計的開放技術協議框架,可以說,就是為AI與電商、外賣等服務平台的協同而打造的一套“通用語言”,保證跨終端、跨系統、跨平台的AI任務執行便捷且高效。支付寶為其搭建了“委託授權域”“商業互動域”“支付服務域”“信任服務域”四個核心基礎設施標準,在ACT協議的規則框架下,AI僅承擔下單操作的執行角色,付款環節由使用者主導或自主授權,在保障資金安全的前提下大幅節省時間成本。還是以在千問App點奶茶為例,使用者在千問App發出指令,千問App推薦附近符合需求的商品,同步完成比價與優惠券自動核銷,使用者點選“選它”確認支付寶付款完成結帳。目前ACT協議可在AI代買、企業自動化採購等場景使用,未來還將持續最佳化,支付寶表示,正積極推動更多支付服務商、商家與平台、AI開發者、智能終端生態廠商加入共同完善協議內容。隨著“AI代辦”服務日漸普及,支付是其中特殊且關鍵的環節,正成為全球科技企業的共識。此前,OpenAI聯合Stripe推出協議以支援ChatGPT結帳功能;近期,Google也發佈AI購物全流程通用商務協議(Universal Commerce Protocol,簡稱 UCP),將實現使用者在 Gemini 內直接下單。繁榮且全面的App生態,和來自支付寶的關鍵支援,是千問App邁向超級AI助手的重要助力;當然,強大的底層能力——千問大模型Coding能力大幅提升、全模態理解能力突破、超長上下文處理能力大幅提升——是一切的前提。能同時滿足這三個條件的科技公司,在國內可以說屈指可數,也許阿里巴巴之後,騰訊有可能跟進整合,字節跳動和百度還要略遜一籌。對中小型AI企業而言,缺乏繁榮的App生態和支付協議,複製千問模式難度巨大。可以預見,手機端的AI競爭將進一步加劇。結語:千問App的這次升級,對使用者來說將帶來諸多便利,但隨著其整合阿里系App,這種閉環模式是否又會限制使用者的選擇權呢?AI進入“辦事時代”的趨勢不可阻擋,但最終的商業模式會是怎樣,還值得持續關注。 (DoNews)
十三年佈局,一朝反超!GoogleAI崛起的真實故事
【新智元導讀】2025年8月,一個叫Nano Banana的圖像生成器沖上LMArena榜首,後來Gemini App成為蘋果商店下載量第一,OpenAI內部發出Code Red。但很少有人知道,這場逆襲的起點是2012年太浩湖賭場酒店的一場秘密競拍。此後十三年,Google收購DeepMind、發明Transformer、自研TPU晶片、經歷ChatGPT衝擊和Bard翻車,直到創始人Sergey Brin回歸、核心人才Noam Shazeer歸來,才在2025年完成反超。這是一個關於人才、時間與長期主義的故事。2025年8月的一個凌晨兩點半。Google的AI項目經理Naina Raisinghani正坐在電腦前,準備把DeepMind實驗室的最新成果——一個超快的圖像生成器——上傳到LMArena排名平台。系統需要一個名字才能提交。這個點沒人線上。於是她隨手用朋友給她起的兩個外號拼了一個:Nano Banana🍌。幾天後,Nano Banana沖上排名榜首,在X上成為熱門話題,全球使用者生成了數十億張圖片。Google一度找不到足夠的算力,只能緊急借用伺服器。負責人Josh Woodward後來把這次發佈稱為「成功的災難」。到9月,Gemini App成了蘋果應用程式商店下載量第一。11月,Google發佈了迄今最強的Gemini 3模型,在多項指標上超越ChatGPT,股價大漲。消息傳回矽谷的另一端,OpenAI內部發出了Code Red。如果說人工智慧是一場馬拉松,那麼Google剛剛完成了一次史詩級的衝刺。但很少有人知道,這場逆襲的起點,要追溯到十三年前一家賭場酒店的703號房間。太浩湖的賭注2012年12月初的一天,一場秘密競拍正在美國滑雪勝地太浩湖(Lake Tahoe)的一家賭場酒店裡進行。太浩湖位於加州和內華達州交界處,是北美最大的高山湖泊,擁有藍寶石般的湖面和頂級雪道。《教父2》曾在這裡取景,馬克吐溫曾在此地流連忘返。由於離舊金山灣區只有200多英里,這裡被稱為矽谷的後花園——祖克柏和埃裡森都在此圈地佔山,興建豪宅。但這一天,矽谷的大佬們沒有來滑雪。他們在競拍一個人。秘密競拍的對象,是一家剛剛成立1個月、僅有3名員工的公司——DNNresearch。它沒有任何有形的產品或資產,但追求者的身份暗示出了它的份量:Google、微軟、DeepMind和百度。65歲的Geoffrey Hinton坐在酒店703房間的地板上。他蒼老、瘦削,飽受腰椎間盤的疼痛折磨——不能開車,也不能坐飛機。這位多倫多大學教授是深度學習領域的宗師級人物,從1972年進入愛丁堡大學算起,他已經在這條路上鏖戰了40年。他為競拍設定了規則:起價1200萬美元,每次抬價至少100萬美元。幾個小時後,價格被推到了4400萬美元。辛頓有些頭暈,感覺「我們像是在拍電影」。他果斷喊停,把公司賣給了最後的喊價者——Google。有意思的是,這場4400萬美元競拍的源頭之一,正是來自6個月前的Google。「Google貓」與最老的實習生2012年6月,Google研究部門Google Brain公開了一個叫「Google貓」的項目成果。簡單來說,這個項目就是用演算法在YouTube的視訊裡識別貓。它由從史丹佛跳槽來Google的吳恩達發起,拉上了Google傳奇人物Jeff Dean入夥,還從創始人Larry Page那裡要到了大筆預算。Google貓搭建了一個神經網路,動用了遍佈Google各個資料中心的16000個CPU進行訓練,最終實現74.8%的識別精準率。這一數字震驚業界。但吳恩達在項目臨近結束前激流勇退,投身自己的網際網路教育項目。臨走前他向公司推薦了辛頓來接替他的工作。面對邀請,辛頓表示自己不會離開大學,只願意去Google待一個夏天。由於Google招聘規則的特殊性,時年64歲的辛頓成為了Google歷史上最年長的暑期實習生。這位實習生瞭解了Google貓項目的技術細節後,馬上看到了項目成功背後的隱藏缺陷。他後來說:他們運行了錯誤的神經網路,並使用了錯誤的計算能力。同樣的任務,辛頓認為自己可以做得更好。於是在短暫的實習期結束後,他馬上投入行動。辛頓找來了自己的兩個學生——Ilya Sutskever和Alex Krizhevsky,兩人都是出生於蘇聯的猶太人,前者極具數學天賦,後者擅長工程實現。三人密切配合,建立了一個新神經網路,參加了ImageNet圖像識別大賽。2012年10月,辛頓團隊的冠軍演算法AlexNet以驚人的84%識別精準率奪冠。相比Google貓用了16000顆CPU,AlexNet只用了4顆輝達GPU。學術界和產業界徹底轟動。AlexNet的論文成為電腦科學史上最有影響力的論文之一,目前被引次數已經超過12萬。而Google貓則被迅速遺忘。太浩湖的4400萬美元,給全球的深度學習大神做了一次重新定價。在那個價格面前,圖靈獎的100萬美元獎金看起來都像是零花錢。天下英雄盡入彀中Google在拿下辛頓團隊後再接再厲。2014年1月,Google以約6億美元收購了當年在太浩湖競拍中與之競爭的DeepMind。這家倫敦公司的創始人Demis Hassabis是一個國際象棋神童,4歲開始接觸國際象棋,14歲成為國際象棋大師。馬斯克曾向Google創始人Larry Page推薦了自己投資的這家公司。為了能帶上辛頓一起去倫敦驗證DeepMind的成色,Google團隊專門包了一架私人飛機,並且改造了座椅——因為辛頓的腰椎問題讓他無法乘坐普通飛機。收購完成後,Google的AI版圖上已經聚集了當時最頂尖的深度學習人才。與此同時,一個不太引人注目的項目正在悄悄進行:Google開始自研AI晶片。他們認為語音識別這類應用會需要大量算力,於是設計了TPU(張量處理單元),比傳統CPU和GPU更省電。這一步棋當時看起來並不顯眼。但十多年後,它將成為Google反超的關鍵武器。Transformer:改變世界的論文2016年3月,DeepMind的AlphaGo以4:1擊敗圍棋世界冠軍李世石,震驚全球。這是AI第一次在這種極其複雜的策略遊戲中戰勝人類頂尖選手。那一年,Sundar Pichai剛接任Google CEO不久。他在部落格裡寫道:過去十年是智慧型手機的時代,未來十年將是AI優先的時代。2017年6月,Google的一個團隊發表了一篇名為《Attention Is All You Need》的論文。8位Google科學家提出了Transformer模型——一種徹底拋棄循環神經網路、完全基於注意力機制的新架構。這篇論文開啟了如今的大模型時代。ChatGPT、Claude、Gemini……所有當今最強大的AI模型,都建立在Transformer的基礎之上。截至2025年,這篇論文被引用超過17.3萬次,位列21世紀被引用最多的論文前十。但諷刺的是,8位作者後來全部離開了Google,創辦或加入了其他公司。其中一位叫Noam Shazeer。記住這個名字。ChatGPT的衝擊儘管Google擁有最強的技術積累和最頂尖的人才,但在聊天機器人這條賽道上,它一直表現得異常謹慎。2021年5月,Google發佈了LaMDA——一個基於Transformer的對話大模型。但它只對少數人開放測試,限制極多。2022年8月,Google推出了測試應用AI Test Kitchen,有三個功能:想像它、列出它、聊狗。沒錯,第三個功能只能聊狗。Google的高管和研究員們擔心安全問題。早期模型很容易被誘匯出種族歧視或性別歧視的回答。前Google Brain員工Julia Winn說,Google對這類風險看得比她待過的任何公司都重。這種謹慎讓一些研究員很沮喪,有的選擇了離開。然後,2022年11月30日,OpenAI發佈了ChatGPT。五天內,一百萬人註冊。使用者沒有太多限制,想聊什麼聊什麼。Google內部一些在AI上耕耘多年的員工氣壞了。分析師和投資者開始質疑:Google是不是要錯過科技史上的下一波大浪?翻車2023年1月,Jeff Dean、Demis Hassabis和新加入的機器人專家James Manyika向董事會匯報了打造最強模型的計畫。但Google等不及了,需要先推一個產品出來。2023年2月6日,他們匆忙發佈了基於LaMDA的聊天機器人Bard。發佈會翻車了。宣傳視訊裡,Bard被問到韋伯望遠鏡的問題,回答說它拍了第一張系外行星照片。這是錯的。第一張系外行星照片是2004年歐洲南方天文台的甚大望遠鏡拍攝的。Alphabet股價當天下跌8%,市值蒸發約1000億美元。這是GoogleAI歷史上最黑暗的時刻之一。創始人的回歸差不多同一時間,已經退休的Google聯合創始人Sergey Brin在一個派對上碰到了OpenAI的研究員Daniel Selsam。Selsam問他:ChatGPT這麼厲害,作為電腦科學家你不心動嗎?怎麼不回來全職搞AI?Brin覺得他說得有道理。這位2019年從執行層退休的聯合創始人,開始幾乎每天參與AI工作。他深入瞭解技術細節,研究損失曲線,每周參與前沿AI研究的討論。他還幫Gemini挑毛病,並且參與了關鍵人才的招聘。Brin後來說:任何電腦科學家現在都不應該退休。他還促成了一筆關鍵的交易。Noam Shazeer是2017年Transformer論文的8位作者之一。他後來離開Google,與Daniel De Freitas共同創辦了Character.AI——一家專注於AI角色對話的創業公司。這兩個人還有另一個共同點:他們都是LaMDA的關鍵開發者。2024年8月,一個價值27億美元的交易讓這兩位叛將回歸了Google DeepMind。嚴格來說,這不是一次收購——Character.AI繼續獨立營運,但Shazeer、De Freitas和約30名研究人員回到了Google。Google要回的不是公司,是人。這兩人後來參與領導了Gemini的開發。整合2023年4月20日,Sundar Pichai宣佈了一個重大決定:Google Brain與DeepMind合併,成立新的GoogleDeepMind。這兩個團隊此前一直分頭運作,文化也不相同。Google Brain偏研究,總部在美國;DeepMind偏產品,根基在英國。兩邊合併後產生了不少摩擦。但在ChatGPT的壓力下,Google別無選擇。Demis Hassabis被任命為Google DeepMind的CEO。Jeff Dean轉任首席科學家。與此同時,Google有一個OpenAI沒有的優勢:OpenAI需要融資,而Google可以從自己每年幾百億美元的利潤裡拿錢做研發。2023年底,Google發佈了第一版Gemini。與ChatGPT主要用文字訓練不同,Gemini從一開始就用文字、程式碼、音訊、圖像和視訊一起訓練。這是技術野心更大的方案,雖然開發時間更長,但後來被證明是值得的。諾貝爾獎2024年10月,Demis Hassabis和John Jumper因AlphaFold獲得諾貝爾化學獎。AlphaFold解決了困擾科學界50年的蛋白質折疊問題——僅憑氨基酸序列就能精準預測蛋白質的三維結構。這是AI對基礎科學的歷史性貢獻。對Google來說,這是一個轉折訊號:他們的科學家正在拿諾貝爾獎,而不只是追著競爭對手的尾燈跑。關於這個故事,歡迎收看我認為目前最精彩的紀錄片。《The Thinking Game | Full documentary | Tribeca Film Festival official selection》十年前的伏筆2025年4月,Google發佈了第七代AI晶片Ironwood。每顆晶片可達4,614TFLOPs的FP8性能。最多9,216顆晶片可以互聯成一個超級算力叢集,總性能達到42.5Exaflops——這是當時世界最強超級電腦El Capitan的24倍。比第一代Cloud TPU能效提升了30倍。當Google在2013年開始秘密研發TPU時,沒有多少人意識到這步棋的意義。那時候,Nvidia的GPU還是AI訓練的絕對霸主;那時候,ChatGPT還不存在;那時候,大多數人連大語言模型這個詞都沒聽說過。但十二年後,這步落子終於開花結果。消息傳出:Google正在和Meta談判,要賣給他們價值數十億美元的TPU晶片。Nvidia股價當天下跌7%。成功的災難2025年8月,Nano Banana橫空出世。這個隨手起的名字沖上了LM Arena排名榜首。全球使用者瘋狂使用,生成了數十億張圖片。Google的伺服器一度不堪重負。負責人Josh Woodward把這次發佈稱為成功的災難。到9月,Gemini App成為蘋果應用程式商店下載量第一。月活使用者從7月的4.5億漲到了10月的6.5億。11月,Gemini 3發佈。在多項基準測試中超越ChatGPT。自研的Ironwood晶片大幅降低了AI模型的運行成本。Pichai在12月的內部備忘錄裡寫道:我們以很棒的姿態結束了2025年。想想一年前我們在什麼位置,這個進步令人難以置信。逆襲的邏輯Google用了十三年完成這場逆襲。從2012年太浩湖的4400萬美元競拍,到2014年收購DeepMind,到2017年發表Transformer論文,到2023年經歷Bard的翻車和團隊的整合,再到2025年Gemini 3的登頂和晶片業務的突破。期間有無數次可能走岔的路口:如果2012年百度而不是Google贏下了辛頓,歷史會怎樣?如果8位Transformer作者沒有全部離開Google,會怎樣?如果Sergey Brin沒有在那個派對上被一句話刺激到,會怎樣?如果Noam Shazeer沒有回歸,會怎樣?但歷史沒有如果。尾聲回看這十三年,有一個貫穿始終的主題:人才。太浩湖的秘密競拍搶的是人。收購DeepMind買的是人。Sergey Brin回歸是人的回歸。Noam Shazeer的27億美元交易,本質上還是請人回來。在前沿技術領域,一個頂級學者的作用,往往大過一萬個普通工程師。這就是為什麼Google願意花4400萬美元買下一家沒有產品、沒有收入、只有三個人的公司。這就是為什麼Brin願意從退休生活中走出來。而另一個主題是:時間。TPU晶片從2013年開始研發,到2025年成為競爭優勢,中間隔了12年。Transformer論文發表於2017年,但它的全部威力要到2022年ChatGPT發佈後才被世界看見。深度學習的先驅們從1970年代就開始了探索,卻要等到2012年才迎來產業化的曙光。偉大之所以為偉大,不是因為其橫空出世時的驚豔,而是因為它要在無邊黑暗中,忍受漫長的籍籍無名與不被理解。直到多年之後,人們才能順著這些標尺,感嘆那時群星璀璨,天才輩出。2025年末,AI競賽遠沒有結束。OpenAI後來也發佈了更強的ChatGPT,使用者量仍然遠超Gemini。這場馬拉松還在繼續。但至少,Google已經證明了一件事:即使是科技巨頭,也可以從落後中爬起來。即使是ChatGPT的衝擊,也沒有把Google打倒。只要有人才,只要有耐心,只要有足夠長的時間線,逆襲永遠可能發生。畢竟,Nano Banana這個名字,不過是一個項目經理在凌晨兩點半隨手起的。而它背後,是十三年的佈局——和無數個不眠之夜。 (新智元)
蘋果臉都被打腫了,多鄰國太騷了
自2022年iPhone 14 Pro將「靈動島」設計帶到手機市場以來,截至2026年1月,除努比亞、紅魔之外,頭部手機廠商們都有了屬於自己的「島」。靈動島的作用,主要是顯示一些即時動態活動,比如音樂播放、外賣資訊等等。但假如,有App想要用你的「島」顯示廣告呢?2026開年第一炸,最愛整活的語言類學習App多鄰國被舉報利用「靈動島」向使用者推送廣告資訊,這在蘋果的靈動島設計規範裡是明確禁止的行為。儘管多鄰國已經將廣告消息撤回,並不再向使用者推送,但依然觸及到了使用者的底線。(圖源:Reddit)的確,靈動島作為即時資訊最佳展示窗口之一,已經成為最主流的設計。但越是主流的展示窗口,越是使用者互動頻次高的入口,越會成為廣告的重災區。靈動島徹底被廣告攻陷多鄰國App之所以敢名正言順往靈動島裡塞行銷廣告,它們給出的理由是「這只是向普通使用者推薦我們的Super Duolingo會員,並不是廣告」。但爭議點在於,這個提示還帶有倒計時樣式,看起來更像是行銷廣告,而非系統或應用的普通狀態提醒。對於靈動島的「上島」標準,蘋果在2022年就已經明確作出規定。這類系統級UI本意是為了即時顯示使用者正在進行的任務或狀態資訊,比如外賣配送進度、航班資訊、運動計時等,不能用於展示廣告或促銷內容。早期,還有一些獨立開發者做的App打擦邊球,在靈動島區域暗戳戳做一些廣告展示,但蘋果對這類操作基本上是零容忍,已經查證立刻下架,維護開發規範。事實上,多鄰國作為全球語言類學習平台頭部,核心營收點就是靠訂閱超級會員,但據統計,該平台訂閱會員常年僅佔總使用者數的5%左右。因此,對於多鄰國而言,靈動島這個展示廣告的絕佳窗口,必然是不可放棄的推廣方向。但此舉很快遭到了反噬效果,不少網友在被推送廣告之後,都表示要立刻解除安裝多鄰國App。(圖源:Reddit)除多鄰國之外,濫用靈動島做廣告的還有不少購物平台。在2025年10月,雙十一購物節前夕,不少網友在社交平台分享自己遇到大量購物平台佔用靈動島推送促銷資訊,比如拼多多,會提醒你領券。還有像是百度App、喜馬拉雅聽App、京東App等都有過類似的情況。不僅是購物平台,連影視類App也學會了靈動島的「妙用」。比如在某些S級大製作劇集開播前,影視平台就會往使用者的靈動島上彈一個即時活動,雖然並不涉及到與付費相關的行銷,也沒有強制使用者開會員,但本質上還是一個廣告、推廣類活動。而且劇集開播,並不是涉及到使用者自身的即時活動,無論從那個角度看,這樣的「上島」都是不合規矩的行為。(圖源:小紅書)不難看出,多鄰國並不是第一個動靈動島念頭的應用,也很可能不會是最後一個。無論是訂閱轉化、購物促銷,還是內容預熱,這些行為本質上都是把行銷資訊包裝成狀態提醒,試圖借助系統級入口獲得更高曝光。雖然引起爭議的是多鄰國,但並不可否認的是,靈動島正在成為流量曝光的灰色地帶。但為什麼這些廣告行銷會在iOS上不斷出現,而在Android陣營沒有類似的爭議?Android的「島」理論上更難被廣告入侵相比起iOS頻繁地被廣告、行銷入侵,同樣也有「島」的Android看起來要更乾淨一點,至少目前為止,還沒有關於被廣告騷擾而引發爭議的大事件發生。同樣都是「島」,背後的設計機制還是有一些差別。iOS的靈動島,在蘋果的設計體系裡,並不是一個裝飾性的UI展示。雖說最開始的目標,是為了擋住螢幕上那顆碩大無比的黑洞,但蘋果將即時活動與之結合,將其變成一個展示的窗口。也就是說,開發者想要“上島”,必須通過ActivityKit這條官方路徑,而蘋果在開發者文件和人機介面指南中,對即時活動的語義限定非常明確,它只能用於展示正在進行中的任務或狀態,而且這種狀態必須與使用者的當前行為直接相關。由於使用ActivityKit相當於直接呼叫了系統級的能力,蘋果對其監管會更嚴格。(圖源:Apple)但監管是一方面,ActivityKit對開發者足夠開放又是另一方面。幾乎所有開發者都能在App裡設計一套接入ActivityKit的功能,即便這項功能看起來並不那麼「即時活動」,例如早期的歌詞顯示,它的確需要不斷滾動來顯示更多歌詞,但並不像航班資訊、網約車資訊那樣緊急。即便是Apple Music上線歌詞功能,也沒有將它做進靈動島,這其實也說明了蘋果對這項設計的態度。而Android陣營的情況,恰恰相反。儘管過去兩年裡,不少Android廠商都做出了自己的「靈動島」形態,但它們並不是Google發佈的Android官方統一定義的一套系統能力,而更像是廠商在現有通知體系、前台服務、媒體會話等機製做出的另一種呈現方式。由於標準並不統一,這就導致每一家手機廠商、每一套OS,都有不同的開發規範、API介面。對於開發者而言,這種不夠統一的介面標準,做適配的積極性會稍低一些。因此,多數第三方App在接入某一家Android的「島」,都是雙方基於合作達成的方案,很少是開發者的自主行為。(圖源:小米)這樣一來,雙方的優劣勢也就非常清晰了。蘋果給iOS提供了一套明確、統一、對第三方開放的系統級能力,同時又在規則層面劃清了邊界,但缺點在於能力是開放的,開發者有太多可以鑽空子的方式。就拿多鄰國App來說,官方的口徑並不認為這是行銷,只是推薦使用者開會員,不應該遭到懲罰。可蘋果並不會在多鄰國推送廣告之前就知道它利用這個介面做了什麼。Android陣營裡,整個「島」的責任是分散的,島的形態由廠商定義,展示策略由系統控制,開發者更多隻是按通知規範提交資訊。這就意味著,被開發者鑽空子的機率,其實遠低於iOS。但對於蘋果而言,想要徹底禁止開發者往靈動島裡塞廣告,也是有很多辦法的,比如在提交更新時要求開發者明確ActivityKit介面的所有展示內容。但蘋果目前還沒有這麼做,這其實也說明,靈動島這個天然的廣告入口,是一塊正在越來越大的大蛋糕。「島」上廣告,將成手機廠商的行銷新入口?實際上,在過去幾年時間裡,往靈動島塞廣告,或是行銷資訊的擦邊行為多得數不勝數,蘋果要是真想全力制止,還是能夠辦到的。但蘋果很顯然並沒有對這些行為一刀切。過去幾年裡,蘋果的營收結構變化非常明顯,雖然硬體還是很重要重要,但增長越來越多來自服務業務,無論是App Store抽成、搜尋廣告,還是訂閱分成,蘋果都在不斷強化系統級分發的盈利能力。App Store裡新增的搜尋廣告位、Today頁的推薦展示,本質上都是在利用系統級的天然流量入口,去完成流量曝光這一商業行為的閉環。在這個背景下,靈動島的誘惑力可就太大了。這個不起眼的小位置,其實藏著廣告展示的絕佳條件,它的位置是固定的、干擾成本比開屏跳轉低,更重要的是,它是系統層級的互動,多數使用者都會認為這是官方默認允許的內容展示。(圖源:雷科技攝製)當然,假如是放在Android陣營,情況其實也差不太多。以小米為例,其網際網路服務收入早已成為財報中不可忽視的一部分。從系統廣告、內容分發到服務訂閱,小米在系統層面對商業化的接受度本就更高。不過,Android廠商對待「島」要展示什麼內容,還是相對謹慎,短期內,這部分應該不會被用於商業用途。其實從手機系統本身的盈利能力來看,無論Android還是iOS,都在不斷探索系統高頻互動位置的變現能力極限。蘋果把iOS的App Store、Today探索設定為廣告展示位,那是因為iOS直接官方商店的應用程式,使用者要想下載應用,就必須打開這個頁面,這裡就是iOS的高頻互動區域。而Android高頻互動有太多太多,負一屏、小窗口、下拉搜尋、應用程式商店等等,「島」反而不一定是一個必選項。無論如何,作為使用者,自然不希望這個增加我們生活便利性的設計,被用於廣告投放。但假如靈動島的商業化是不可避免的趨勢,那麼只能希望廠商們可以保持實用與盈利之間的平衡,像多鄰國此次推銷會員這類型的廣告,能免則免。 (雷科技)
從算力、模型到AI購物全面領跑,阿里坐實中國AI第一標的
2026年1月15日,AI迎來一次新的重要變革。當天,千問App上線400+項新功能,並全面接入淘寶閃購、支付寶、淘寶、飛豬、高德等阿里生態。更重要的是,它把“推薦—下單—支付—履約”拉進同一個應用裡:使用者在千問App內即可點外賣、買商品、訂機票、訂酒店,成為全球首個實現 AI 超級應用(Super App)內閉環的案例。這意味著,阿里AI的“最強大腦”開始與物理世界的“最強履約”合體。千問App不再只是能生成程式碼的聊天機器人,而是第一次長出了“手腳”:能把需求直接變成交易與交付,向“AI辦事時代”邁進。全球AI競賽的焦點,也在從“誰的模型更聰明”,迅速轉向“誰能更完整地履約”。千問C端事業群總裁吳嘉與華爾街見聞對話時表示,AI真正的分水嶺不在於模型能說的多漂亮,而在於能否在複雜場景裡完成交付:簡單問題就簡單回答,複雜問題就要多輪溝通、把需求校準到位。從去年的淘寶閃購,到今天的千問Super App,阿里在大消費與 AI 兩條戰線的“聚合趨勢”越來越清晰:各業務不再各自為戰,而是圍繞同一個AI入口協同作戰。由AI作為粘合劑,也將有望帶動阿里所有資產一起實現AI重估。千問App把AI拉進真實履約,再次彰顯阿里“最強模型+最豐富生態”所具備的競爭優勢,更不斷向外界證明:不論算力基建、模型能力,還是AI購物等應用落地,阿里都全面領跑,不愧是中國AI第一標的。當AI長出“手腳”1月15日,阿里正式宣告AI從“聊天”邁入“AI辦事時代”。使用者在螢幕這端拋出一個模糊意圖,千問在雲端呼叫Qwen3-Max的推理能力,拆解任務、編排工具:調淘寶的商品庫,算高德的路徑,喚起支付寶的支付與資金流。最終,結果以真實的包裹、熱騰騰的外賣、合適的機票,抵達使用者的物理世界。來看一個場景:使用者對千問說,“我是個菜鳥,想去東北滑雪,給我推薦合適的裝備。”在舊邏輯下,使用者往往只會得到一堆攻略:夾雜軟文、資訊過期,還得自己分辨、自己上淘寶搜、比價、下單,鏈路割裂,摩擦極高。在千問的新邏輯下,“菜鳥”意味著更高容錯、更易上手;“東北”意味著更高保暖、更強防風。千問不僅給建議,更能基於淘寶的商品庫與評價體系,生成可執行的具體選品方案:使用者在千問內看詳情,一鍵跳轉下單,中間幾乎沒有斷點。更進一步,打通淘寶閃購後,千問在端內即可完成“推薦—點單—支付”。使用者不必再打開外賣App,也不需要在滿減券裡算數學題,AI直接幫你決策、下單、付款,接入支付寶之後,千問具備了AI原生支付能力,體驗的躍遷是質變。千問成為真正意義上全球第一個可以購物的AI。然而購物只是能辦事的一部分,它甚至能呼叫支付寶的政務能力:一句話查詢簽證、戶口、公積金等約50項民生事項,並直達辦理入口。與此同時,千問在應用開發、Office 辦公、學習輔導、諮詢調研等300+核心任務上,已經具備很高的交付成功率——從“給答案”走向“交結果”。吳嘉在對話中提到,生活場景裡使用者往往並不掌握自己的“真實需求”,必須通過多輪確認來對齊偏好:你沒看到具體方案前,很難判斷“是不是我要的”。這正是Agent該做的事。這些能力看似瑣碎,本質上是在建構一個“生活OS”:AI是核心,淘寶、支付寶、高德等是驅動,物理世界的服務是外設,通過Agent把它們串聯起來。只有阿里,擁有足夠完整的“驅動程式庫”。OpenAI沒有這套庫,Google不夠完整,亞馬遜也不對外開放——這就是阿里真正的優勢所在。最強“大腦”任何商業閉環都要有強技術底座。只有“手腳”沒有“大腦”,最多是自動化指令碼,不是AI Agent。吳嘉強調,團隊不刻意追逐“人均對話輪次”這類指標,衡量標準只有兩件事:使用者真實需求的滿意度與交付率——簡單問題就簡單回答,複雜問題就多輪溝通,把需求校準到位再交付。阿里在模型層的投入很堅決。Qwen3-Max作為核心底座,性能位居全球第一梯隊,千問作為全球最具影響力的開源模型之一,也被輝達、Airbnb、亞馬遜等矽谷公司與開發者廣泛採用,成為“最好用的開源模型”代表。更關鍵的是千問App的進化速度,數百個常用工具中,過半由AI通過Coding自主生成,AI能力不再是“開發上線”,而是“邊用邊長”。傳統App的迭代以周計,而千問可以在識別高頻需求後後台即時寫程序交付,以秒計。架構上,千問App採用通用Agent體系:主Agent負責拆解與規劃,具備反思能力的子Agent在各自領域獨立決策執行,任務結束後系統復盤沉澱經驗,推動Agent持續升級。這也呼應吳泳銘的判斷:ASI演進進入第二階段——AI從“語言交流”走向“自主行動”,不止會說,更能把事辦成。還原資料“場景真相”大腦決定“能不能辦”,但在 Agent 時代,真正決定使用者是否願意把關鍵決策交出去的,是“辦得準不準”。AI Agent的核心痛點是信任與精準。大模型基於全網語料訓練,天然夾雜噪音:軟文、廣告、刷單評論、SEO 文章。使用者問“什麼面膜最好用”,得到的答案可能只是某篇付費通稿的複述,看似有理,實則不可核驗。阿里的解法更“硬”,用海量真實交易與服務資料建構可驗證的“場景真相”。每天發生在淘寶上的真實交易,都是貨幣投票;經過反作弊清洗後的好評與差評,就是信用沉澱。千問App用這套資料增強模型,讓它不僅依賴世界知識,也依賴可落地的商業常識。當AI推薦一塊滑雪板,它不看文案吹得多響,而是看過去一個雪季的真實購買、退換、復購與口碑分佈。剝離軟文與廣告,就剝離了“種草行銷”的偽,從源頭提升輸出的客觀性與穩定性。這種“場景真相”很難被覆制。OpenAI的公共資料來源(如Common Crawl)更容易被SEO噪音污染,即便通過媒體合作補充高品質語料,新聞語料與交易資料之間仍有量級差異。商業資料壁壘來自源頭與閉環,誰掌握交易與服務的入口,誰更接近“真實世界的答案”。這恰恰是阿里二十多年生態積累的優勢,也解釋了為什麼在海外,巨頭們往往需要用“協議”和“聯盟”去補齊履約:路徑不同,成本與不確定性也不同。Google與OpenAI的困局在大洋彼岸,Google也在行動,焦慮顯而易見。1月11日,Google在NRF大會上發佈通用商業協議(UCP)。Google有全球最大的流量入口,但在電商履約上始終缺一條腿:亞馬遜護城河太深,OpenAI來勢太猛,Google必須把盟友拉進同一套體系裡。UCP 的思路是“協議化”:用通用語言與功能原語,把AI Agent與商家後台系統對接起來,於是Shopify、Etsy、沃爾瑪、Target等被拉入陣營。尤其是沃爾瑪。Google與沃爾瑪的合作更像“互補”:沃爾瑪需要流量對抗亞馬遜,Google需要貨盤與履約對抗OpenAI。但協議的天然問題在於鬆散:資料是否會完全共享?庫存是否會即時開放?零售商對Google始終有戒心,沒人願意把自己變成“Google的管道”。所以,Google走的是“借路”:靠協議與盟友拼出閉環;而阿里走的是“自建路”:用自有生態把閉環直接鋪在App裡。再看OpenAI。它點燃了這場革命,但未必是最終贏家。ChatGPT推出“即時結帳”(Instant Checkout),試圖把Chat拉到下單閉環裡,可它仍面對一個物理現實:有大腦,缺手腳。支付、物流、商品與服務供給不在自己手裡,履約只能依賴他人,體驗割裂。於是它不得不與Shopify、Stripe等結盟:靠Shopify的商家供給,靠Stripe的支付能力。這是一種“借雞生蛋”,風險在上游:一旦關鍵平台收緊資料與介面,“全網搜尋”會迅速變成“區域網路搜尋”,閉環覆蓋面也隨之收縮。對消費者而言,如果主流貨盤不開放,Instant Checkout的可用性就會被天然限制。對照之下可以看到:閉環不僅是技術拼圖,更是組織與生態的拼圖。能否把入口、資料、履約擰成一股繩,決定了能不能長期跑下去。阿里的再一次組織變革資本市場習慣把阿里歸類為電商公司或雲公司。但在智能體商業(Agentic Commerce)時代,估值框架需要重構:入口、履約與資料真相共同決定AI的交付上限,也決定商業化的天花板。千問App的全面接入各業務線,正是阿里組織戰略的一面鏡子。過去幾年,各業務類股相對獨立,利於單點突破,但進入AI時代,它反而成了掣肘——AI需要全域資料,也需要跨端能力的協同呼叫。自“淘寶閃購”推出以來,風向開始轉變。餓了麼與淘寶閃購的融合,是大消費領域的生態聚合;千問App的接入,則是AI領域的生態聚合。阿里正在把全集團的力量擰成一股繩,這一次的粘合劑,是AI。淘寶閃購在其中扮演關鍵角色,它把電商與即時零售連接起來,讓“點外賣”這個高頻動作進入淘寶,也進入千問。對千問而言,打通閃購後,推薦、點單、支付形成閉環,才真正具備“能辦事”的履約鏈路。淘寶是貨架,支付寶是錢包,高德是地圖,飛豬是嚮導——這些沉澱多年的商業基礎設施,過去更多是線性增長。在AI帶動下,它們開始被拆解為可編排的“原子能力”,可以被高頻呼叫、靈活組合,衍生出更多服務形態。這既是價值的回歸,也是價值的躍升,當一家公司同時掌握數字世界的“大腦”(Qwen3-Max)與物理世界的“手腳”(淘寶/支付寶/閃購等),它就不再只是若干 App 的集合,而是連接兩個世界的橋樑——這種橋樑的價值,遠高於單點應用的疊加。結語到了2026年,AI開始變成生活本身。AI不必花哨,關鍵是把事辦成、把交付做到位。這是AI時代的必然:誰把大腦接上手腳,誰就更接近未來。 (華爾街見聞)