#千問
千問現象級爆發背後:阿里“通雲哥”硬核首秀
AI的征途總是被描述為星辰大海,這往往意味著人跡罕至。但在阿里的敘事中,AI已經成了普通人都能觸手可及的人間煙火。2月6日,阿里旗下的千問App正式上線“春節30億大免單”活動,使用者可通過AI一句話指令免費點外賣,活動上線僅9小時,由千問APP生成的AI訂單量便突破了1000萬單。當市場上大多數AI還停留在尋找資料和陪使用者聊天的階段,千問已經開始真刀真槍地探索日常生活消費場景。春節將至的熱鬧氛圍中,阿里選擇用一種最親民的方式,讓普通人觸碰到智能的溫度。這並不是一場傳統意義上的春節行銷,而是一次向創業初心的回歸——用最前沿的技術服務每一個普通人,提振社會消費的熱度,服務於人們的生活。一方面,阿里消費生態的全方位優勢,讓打造一個能辦事的AI超級Agent成為可能;另一方面,是阿里的全端AI佈局,則是支撐這場海量互動的幕後功臣。消費者沉浸在奶茶免單喜悅的同時,阿里的技術版圖悄然完成了一次歷史性的閉環。隨著平頭哥自研高端AI晶片“真武810E”正式亮相,它與通義大模型、阿里雲共同構成的“通雲哥黃金三角”正式浮出了水面。這台由晶片、模型、雲協同驅動的“AI超級電腦”,是這場現象級刷屏背後真正的推手。在這場前所未有的“全民AI應用演習”中,阿里用30億大免單證明了,其已徹底從單一電商公司轉型為“電商+AI”雙輪驅動的高科技企業,這也意味著阿里有望迎來一次業務增長+市場價值的全面重估。全民演習上周五,千問App發動一場奇襲,宣佈發起“春節請客計畫”,斥資30億元在春節期間以“吃喝玩樂免單+大額現金紅包”等形式,請全國使用者體驗AI時代全新的生活方式服務。其中第一波的奶茶攻勢,已經在社交平台上出現了刷屏式爆發的效果。其實在這之前,阿里早就做好了準備。1月15日,千問APP已正式接入淘寶閃購、支付寶、淘寶、飛豬、高德等阿里生態場景,上線AI購物功能。千問APP的內部人士此前也曾表示,“我們希望通過春節大免單活動,邀請全國人民體驗AI時代的全新生活方式,讓AI融入到人們真實的生活消費之中。”千問正在用30億免單,突破AI應用進一步普及的致命卡點——“只聊天,不辦事”。從點奶茶開始的交付,讓消費者們第一次意識到,原來AI不止是聊天工具,而是能融入生活的方方面面,真正解決人們日常生活中的常見需求。甚至可以說,這次活動宣告了AI應用正式從嘗鮮者的玩具,變成了億萬普通人的日常。這場消費模式升級也折射出了阿里的科技價值觀:通過最前沿的科技手段,實實在在地幫助普通人建構美好生活。“高科技絕不僅是征服星辰大海,更應該呵護人間煙火。科技人員的責任,不是讓AI取代人類,而是讓AI更懂人類、更好地服務人類。”然而,沒有足夠的技術能力根本無法完成這一切。活動期間海量使用者的瞬間湧入和複雜的即時智能互動,對底層算力的吞吐與模型響應速度,都提出了極高的要求。“外行看熱鬧,內行看門道。”這場活動能成功的另一個重要因素,就是其背後有一個龐大而精密的“黃金三角”在默默支撐。對阿里底層技術的極限壓力測試再次順利過關。這證明了阿里在AI領域的厚積薄發是充分而且必要的——只有地基打得夠深,才能托起這數以十億計算的人間煙火。黃金三角支撐這場30億免單活動海量業務的基底,正是阿里的全端AI佈局。其中最值得注意的是阿里自研高端AI晶片——“真武810E”對外亮相。在平頭哥的官網上,這款之前僅在央視《新聞聯播》中有過驚鴻一瞥的PPU(平行處理單元),終於顯露真容。它不僅是平頭哥晶片研發路上的里程碑產品,更是此次保障大模型在流量洪峰下穩定運行的核心關鍵硬體。這款晶片的硬實力體現在實打實的資料上。根據官方及業內披露的資訊:記憶體與頻寬:擁有96G HBM2e記憶體,片間互聯頻寬高達700GB/s,這為處理大規模AI訓練和推理提供了巨大的吞吐通道。性能對標:其整體性能超越了輝達A800及主流國產GPU,與輝達H20相當;更有外媒報導稱,其升級版性能甚至強於輝達A100。隨著“真武”的亮相,阿里AI戰略的最後一塊拼圖終於出現了。通義實驗室(頂級模型)、阿里雲(超級基座)、平頭哥(自研晶片)的正式集結,組成了阿里AI黃金三角——“通雲哥”,三者可以在晶片架構、雲平台架構和模型架構上協同創新,從而實現在阿里雲上訓練和呼叫大模型時達到最高效率。“通雲哥”的成型,是阿里長達17年戰略投入的結果。從2009年啟動阿里雲研發飛天系統,到2018年成立平頭哥,再到2019年啟動大模型研究,阿里走了一條最艱難的路。目前,通義千問開源模型全球下載量已突破10億次,衍生模型超20萬款,旗艦模型Qwen3-Max-Thinking性能媲美GPT-5.2。當更強的模型(千問)運行在更高效的雲(阿里雲)和更懂AI的芯(真武)上時,不僅大幅降低了供應鏈成本,更解決了算力緊缺背景下的“卡脖子”隱憂。這套組合拳,讓阿里完成了從底層算力到上層應用的完美閉環,“奶茶免單”只是其中的一個表現形式,和面向終端消費者的最終交付。價值重估短期熱度終有消散的一天,但消費者行為與認知的變化卻是長遠且意義深刻的。未來的網際網路消費,大機率將呈現出更強的智能驅動屬性——更多的業務、更大的價值將會被更最佳化地匹配給能力更強的商家。這其中機會眾多。阿里的佈局之充分,在眾多科技企業中也是領先的。隨著“通雲哥”黃金三角浮出水面,阿里已不再是單純的電商平台,而是徹底轉型為以AI+雲為基座的高科技企業——從雲作業系統到晶片,再到千問大模型,完成了從底層算力到上層應用的垂直整合。這是其核心競爭力重塑的標誌,也是一系列投入所預期的最優效果。在全球AI產業化的謀局中,巨頭們主要分化為兩條路徑:一方是以微軟和亞馬遜為代表的“雲+生態”的模式,即在自身強大的雲端運算能力基礎上繫結OpenAI或Anthropic;另一方是以阿里為代表的“全端自研”模式。阿里和Google是當下全球唯二在大模型、雲和晶片三大領域均具備頂級實力的科技公司。這種模式雖然前期投入巨大,可一旦跑通就可以形成極高的競爭壁壘。在未來的AI競賽中,只有那些擁有更強的成本控制權和技術自主權的機構,才不會因為任何一個環節的“卡脖子”而最終掉隊。面對AI時代的機遇,阿里的態度是進行飽和式的技術投入,和更加堅決的新型業務探索。阿里巴巴股價表現(自2021年12月至今)阿里巴巴CEO吳泳銘已明確表態:“阿里正在推進三年3800億元的AI基礎設施建設計畫,並將會持續追加更大的投入。”這種堅決的投入已初見成效,2026財年第二季度財報資料顯示,阿里雲單季度營收達398.24億元,同比增長34%。資本市場也逐步形成了新的共識:隨著“通雲哥”基座的成熟和AI應用(如免單活動)的爆發,阿里有望迎來收入提速與估值修復的“戴維斯連按兩下”。寫在最後阿里選擇了與Google一樣最艱難、卻也最孤獨的全端AI自研之路。如今兩家公司都在長期的蟄伏隱忍之後,對外展示出了在智能時代同樣強大的競爭力。與此同時,阿里更憑藉20多年在消費生態的深厚積累,獲得了AI時代快速打通消費場景、打造AI超級Agent的獨特優勢。這種看似代價高昂的長期堅持,如今換來了最堅實的護城河——不僅打破了底層算力的“卡脖子”焦慮,更是提前掌握了新型智能技術在未來商業化過程中的話語權。技術的終極意義,從來不是為了堆砌冰冷的參數,而是為了照亮每一個普通人平凡的生活。當千問這個包羅萬象的智能助手,能越來越精準地支撐起人們生活中的一次便利,每一次驚喜,阿里便完成了從仰望星辰大海到紮根人間煙火的價值閉環。而這,或許才是市場對阿里進行價值重估的真正邏輯。 (巨潮WAVE)
突破1000萬單!千問把奶茶店搞癱瘓,跪求大家明天再來
今年各行各業最慘的打工人,絕對是奶茶店員工。從外賣大戰到現在如火如荼的 AI 火拚,他們永遠沖在風暴最前線。2 月 6 號,阿里千問突然扔出的一顆“重磅炸彈”——砸 30 億搞春節大免單活動。這次不玩虛的,直接用一杯免費奶茶,把全網使用者的熱情給點燃了。在此之前,誰也沒想到,AI 圈的春節拉新大戰,會以“薅奶茶羊毛”的方式,捲到如此白熱化的程度。操作起來也簡單粗暴,只要你對著千問說一句“幫我點杯奶茶”,它就會自動呼叫淘寶閃購、支付寶等,幫你下單。最主要的是,能直接領到一張 25 元無門檻免單卡。覆蓋全國 30 多萬家茶飲門店。說白了,只要你點的奶茶不超過 25 塊,實付只要 0.01 元就能拿下。另外,每邀請 1 名新使用者下載千問,你和新使用者各得一張 25 元免單卡,單人最多能領 21 張,累計價值 525 元。現在各大相關評論區下面已經被分享二維碼刷屏了。而且這免單卡不只能喝奶茶,千問 APP 早已接入淘寶閃購、支付寶、飛豬、高德、盒馬等核心業務,實現"一句話下單"。購年貨、買生鮮、訂機票……完美打通阿里生態閉環。活動一上線,場面直接失控。不到 3 小時,奶茶訂單就超過 100 萬單,9 小時突破了 1000 萬單。這個速度,比當年外賣大戰最瘋狂的時候還要猛,奶茶股集體上漲,其中茶百道漲 6%,古茗是漲超 3%。效果也是立竿見影,千問反超豆包,元寶,登頂蘋果 App Store 免費應用榜。瞬時湧入的海量使用者,直接把千問的伺服器給干崩了,免單卡領了用不了、下單失敗……網友們一邊吐槽“卡到懷疑人生”,一邊又不死心,反覆刷新頁面。千問和淘寶閃購線上求饒:“今天真的累垮了,求求大家明天再來。伺服器崩了還只是小事,可苦全國的奶茶店員工。他們從早上開門忙到深夜,連吃飯,喝水、上廁所的時間都沒有。還有的門店,因為訂單太多,印表機直接被“累壞”,不停出單導致紙張耗盡。部分熱門品牌門店因為牛奶、小料被快速消耗殆盡,只能臨時閉店補貨,或者乾脆關閉線上點單。外賣騎手扎堆在奶茶店門口取餐,不少使用者下單後,等了好幾個小時才拿到奶茶。不過也有很多網友吐槽,沒搶到、被卡單,心態崩了。其實主要是,很多人都在跟風搶奶茶,根本不知道活動有好幾天呢,也不知道還可以買其他的。好在千問官方反應夠快,緊急擴容伺服器、開通專屬客服通道,還把所有免單卡的有效期延長到了 2 月 23 日,提醒使用者錯峰參與。有網友吐槽:這那是 AI 改變生活,這是改變血糖。其實,每年春節,都是網際網路平台拉新、促活的黃金時期。今年,AI 應用成了新的戰場,元寶、文心一言,千問、三大巨頭摩拳擦掌,紛紛砸錢搶使用者。百度文心丟了 5 億出來,元寶豪擲 10 億 現金,內測 AI 社交功能“元寶派”。後來被微信遮蔽了連結,再加上千問這次放大招,勢頭才弱下來。當然,不出意外,千問的連結也被微信遮蔽了,主打“一視同仁”。而豆包直接拿下了央視春晚的獨家合作夥伴。雖然具體撒多少還沒公佈,但在春晚這個國民級流量入口面前,豆包的野心已經寫在臉上了。在 AI 時代,AI 應用被看作是未來的核心入口。誰能抓住更多的使用者,誰就能在未來的競爭中佔據優勢,這也是各大巨頭不惜砸重金的原因。熱鬧歸熱鬧,所有網際網路從業者都知道一個殘酷的真相。靠紅包拉來的使用者,就像春節的煙花——絢爛但短暫。很多人都是領完紅包、薅完奶茶,就直接解除安裝 APP。而補貼的代價最終轉嫁給底層打工人,他們為巨頭的流量焦慮,透支體力。值得注意的是,為了提升使用者粘性,部分 AI 應用開始探索新功能。像騰訊和百度不約而同地推出了“AI 群聊”功能,但目前時間還短,需要市場的驗證。與社交功能相比,阿里千問選擇了一條不同的道路——強化 AI 的實際執行力,而不是對話體驗。阿里千問團隊內部人士透露:“千問希望在今年春節期間,融入到人們真實的生活消費之中。”方向是對的,但問題是,有多少使用者會在領完奶茶後,繼續打開千問?有多少人會把"有事找 AI"變成生活習慣?這也是千問接下來需要面臨的一大問題,而且這麼一鬧阿里的股價反而跌了。其實,AI 的競爭,最終還是要回歸到價值和使用者體驗。流量來得快,去得也快。只有真正有價值的 AI,才能留住使用者,才能在激烈的競爭中站穩腳跟。 (科技狐)
AI“血洗”奶茶店
史詩級大爆單,AI大戰給奶茶店帶來1000萬單頭圖來自:AI生成2月6日,千問APP上線“春節30億免單”,發放奶茶免單卡,茶飲店又迎來了一場史詩級爆單。據官方介紹,千問APP免單卡可在全國30多萬家奶茶店使用,蜜雪冰城、瑞幸咖啡、霸王茶姬、奈雪的茶、滬上阿姨、茶百道、庫迪咖啡等茶飲咖啡品牌支援使用。可以說,這場奶茶“狂歡”是真正意義上的席捲全國。不少使用者在社交媒體曬出用千問下單的“第一杯AI奶茶”。“一下子來了500單!店裡人手根本不夠,外賣小哥都自己動手打包了。”在天津某霸王茶姬店裡,單子已經堆滿了桌面,“工作人員的胳膊都快掄冒煙了……”內參君樓下的一點點,即使在11點左右關閉線上店舖,到下午兩點,仍然有多杯未做。內參君詢問一天賣了多少單,店員稱:“太忙了,還沒來得及看,比平時多出好幾倍。”附近商場裡的茉莉奶白,店裡店員正來回穿梭,背後的小票像瀑布一樣,做好的奶茶堆在一起,包裝上用馬克筆做了單號標記方便騎手取餐。但即使是加班加點,由於單數過多,還是很難快速出餐。下午三點,仍有騎手在店等單。有騎手表示自己在該店有5單,但已經等了1個多小時,“所有的奶茶店都爆單了,我這全部都超時了,在向平台申訴。”◎攝圖:內參君據悉,活動上線9小時,使用者通過千問APP下單的奶茶已經超過1000萬單,受此帶動,港股茶飲股多數走高,其中古茗漲超5%創上市以來新高,茶百道漲超4%,滬上阿姨、蜜雪集團同步跟隨上漲。一年內史詩級大爆單2次,餐飲人真的“吃飽了”其實,在這場奶茶大戰前,餐飲行業早已被“外賣大戰”席捲近半年。2025年7月5日,餐飲行業打了一場可以說是載入史冊的外賣大戰,同樣是茶飲品類、同樣是史詩級大爆單、同樣是全行業上下叫苦連天……當時,多位餐飲門店工作人員、餐飲品牌相關負責人,不約而同對內參君表示:“停不下來!停不下來!我們要崩潰了!!”滬上阿姨某門店店員當時對內參君說,“我們平時200單封頂,7月5日線上線下將近3000杯!”奈雪的茶在7月5日-6日周末兩天外賣訂單突破峰值,兩天訂單量破100萬單,環比增長50%,單店最高環比增長230%。更有一位外賣員表示,“我一天送了127單,日賺超1700元。現場混亂的不行,像‘搶’一樣。”在那場“外賣大戰”中,不僅是茶飲品牌,中式快餐、西式快餐乃至零售品牌們,全部沒有逃過“流量襲擊”,連連被瀑布般的訂單堆滿。然而,在那一場外賣大戰後,遺留給餐飲人的卻是“疼痛記憶”,甚至讓不少餐飲人“對2025年深表絕望”。更有餐飲人表示,“我們是餓,但也不能一下撐到死吧!”頭部連鎖品牌創始人在“大戰”後接連站出身來表態:嘉和一品創始人劉京京直言“外賣的瘋狂補貼,不是平台的讓利,而是與餐廳堂食的不公平競爭,是對商家的裹挾掠奪,市場不要‘曇花一現的表面繁榮’,而要‘細水長流的生態共生’。”南城香創始人汪國玉在接受《每日經濟新聞》記者獨家採訪時表示“雖然錢多賺了,我們卻高興不起來。”他透露,“外賣大戰以來,南城香單日總流水約增長30%~35%,但堂食並沒有增長,甚至部分門店呈下降趨勢。總利潤是上漲的,差不多增加15%。”西貝創始人賈國龍也坦言:“餐飲生態已經被破壞,但商家‘一點辦法都沒有’。”2025年7月18日,國家市場監督管理總局出手干預,明確要求相關平台秉持理性競爭理念,規範促銷行為,為餐飲行業營造良性發展環境;12月2日,國家推薦性標準《外賣平台服務管理基本要求》施行,在“反內卷”方面提出了多條要求。2026年1月9日,國家層面再度出手,啟動對外賣“內卷式”競爭的專項調查。隨後,三大外賣平台同日發佈公告,呼籲“抵制惡性競爭”。至此,席捲餐飲行業多月的“外賣大戰”熄火,行業重新歸於平靜。然而,這場平靜正如今天所見,不足1個月,再次混亂。奶茶店,成為平台內鬥的“首戰場”從去年的“外賣大戰”到今天的“AI大戰”,奶茶總是首當其衝被各類平台當成流量入口。為什麼“被盯上”的總是奶茶?又為什麼“躺槍”的總是餐飲?原因並不複雜:第一,奶茶早已成為拉攏年輕人的通行證。放眼當下,很少有那個業態能像茶飲店一樣,持續、穩定地聚攏年輕人。iiMedia Research(艾媒諮詢)資料顯示,2024年中國新式茶飲市場規模達3547.2億元,同比增長6.4%,預計到2028年有望突破4000億元。其中,新式茶飲消費者以女性、22-30歲、企業白領為主,僅1.4%的受訪者過去半年未購買過茶飲,72.1%的茶飲消費者每周購買3次以上。此外,線上購買佔比較大,價格是決定消費者購買的重要因素。從消費頻次看,奶茶是少數能做到“低決策成本、高復購率”的品類。不需要等節日,不需要理由,十幾塊錢,就足以構成一次完整消費。它不像正餐那樣有強場景限制,也不像零食那樣容易被替代,更重要的是它天然繫結年輕人。第二,奶茶的高頻高效屬性,可以更快、更低成本獲得使用者。餐飲具備天然確定的消費動機。在所有餐飲中,奶茶又是最有效率的品類,連鎖化率高、門店多,標準化程度高、出品快。這正是平台真正看重的地方。對平台而言,奶茶早已不只是商品,而是被嵌入平台的增長邏輯中,成為使用者爭奪戰的一部分。一杯奶茶,可以完成拉新、促活、留存,甚至使用者畫像採集,而成本,遠低於傳統補貼和廣告。因此,表面看,這波福利是在送奶茶,但實際上,是奶茶店乃至整個餐飲行業,成為了平台呼叫的“線下流量基站”。平台能夠通過餐飲切口,更低成本、更高頻觸達更多使用者。若成功驗證奶茶這一低單價、高誘惑的“鉤子”品類之後,平台的同類活動完全可以延伸至快餐或是正餐。餐飲作為所有人每日離不開的消費大剛需,是流量戰爭中的“基礎設施”,若未來“用千問點餐”成為常態化,勢必將極大地拉高平台日活。爆單背後,奶茶店到底賺不賺錢?拋開分析,讓我們先直面一個最關鍵的問題:這樣的大戰,到底賺不賺錢?答案是:賺錢。但賺得十分艱難。可以說,去年及今年的這兩場“補貼大戰”,對奶茶品牌以及整個餐飲行業而言,是機會:平台們給自身帶來的曝光、訂單和規模,是實打實的。可能在過去一個月才能實現的消費單量,一天兩天內就能讓門店的單量翻倍,甚至刷新歷史紀錄;也是風險:所有餐飲人賺錢的同時,都需要“算好一筆帳”,那就是這種“潑天富貴”驟然而至,門店到底能不能吃得下?畢竟,在大批次流量進入時,餐飲門店端的產品品質及服務,很可能會跟不上節奏。以這次千問活動為例,很多商家無法預測到這一天單量暴漲,而是按照平常工作日排班安排門店工作。有的小型門店可能就2-3個店員在店。突然出現上百個單子,不僅人手忙不過來,貨品調度、供應鏈也可能跟不上。員工疲憊、排班失衡、出單節奏被打亂,也成為最先暴露的問題。在高峰期,原本可以維持的服務標準開始下降:等待時間拉長、製作失誤增多、溝通摩擦頻繁。投訴、差評可能隨之爆發。有騎手已經等了1個小時,攝圖:內參君另外,店員忙到“崩潰”了,騎手也累到“吐血”,那麼對顧客來說,體驗也一定不會太如意。從今天這場爆單的實際結果來看,也的確如此:一邊是平台卡頓。有顧客在微博熱搜上刷到相關資訊,下載千問APP體驗,但因“訪問人數過多”,和AI的對話一直卡在“點杯奶茶”。對於“AI點奶茶崩了”,千問回應稱:“免單送奶茶活動太火爆啦!我們正在緊急加資源,全力保障順暢,請大家稍稍等待。”在微博中,千問也多次提醒“免單卡的使用期限可以持續到2月23日”,呼籲大家分散下單。一邊是過長的配送時間。有顧客稱:“往常30分鐘就能送到的,今天送了快3個小時。”動輒等3個半小時以上,是今天的常態,還有網友反映就算等到了,騎手打電話問能不能隨便拿一杯,最後發現點的大杯熱的,拿到的是中杯冰的。對於商家而言,消費者一次的不佳體驗,可能會消解掉此前長期累積的消費者信任,從而影響到是後面的復購率。多家奶茶店均爆單,攝圖:內參君小結從外賣大戰到這一次的AI大戰,其實反映了商家被捲入一套並不完全由自己主導的增長邏輯裡,意味著未來市場環境會更為複雜,比如獲客方式和品牌節奏會被平台影響更多。趨勢也許不可逆,對商家而言,既要借力平台完成增長,又要避免被平台邏輯完全吞沒。關鍵在於,誰會在補貼退場後,依然被消費者記住。 (虎嗅APP)
中美AI應用的分岔路,出現在這個春節
“AI 的盡頭,是人間煙火。”距離春節還有十天,AI大戰提前進入了白熱化。而這次把戰場迅速燒熱的,是阿里的 AI 入口“千問”。2月6日,千問上線“春節30億大免單”活動,機制簡單粗暴——請全國人民喝奶茶。活動期間,使用者最高可領取21張、總價值525元的無門檻免單卡。這絕非又一場“外賣大戰”,而是一場 AI 辦事能力的“大考”。當成千上萬的使用者湧進 AI 產品,讓最先進的人工智慧與最落地的煙火氣相遇。Agent 時代下,每個人的生活決策已經可以交由 AI 完成。矽谷巨頭們正競相建構面向企業系統的“數字員工”,試圖讓 AI 接管辦公流中的繁瑣環節;而在中國,Agent 的落點則更早地切入了充滿煙火氣的現實世界,開始替人點一杯奶茶、訂一張車票。這並非技術能力的代差,而是基於土壤不同的路徑選擇。而千問,似乎要在幫人辦事這條道路上,走得更深更遠。01重新定義AI時代“搶紅包”2026年春節前夕,AI戰場的硝煙味比往年更甚。字節的“豆包”依託春晚的獨家贊助,試圖用AI生成內容延續短影片時代的流量法則;騰訊的“元寶”則背靠微信生態,試圖在社交連接中尋找AI的落點;百度依然固守搜尋與資訊分發陣地。這三者的共同點在於,它們爭奪的依然是使用者的“注意力時長”。 其本質延續了移動網際網路時代的經典公式:用更優質的內容或更順滑的互動,去爭奪使用者有限的時間與多巴胺,讓使用者願意在App裡多停留一分鐘。相比之下,千問選擇了一條更為艱難、也更為徹底的路徑。與其繼續在紅海中爭奪“使用者停留多久”,千問更在意的是:使用者是否願意把真實生活中的決策與執行,交給AI。因此,千問並未沿用傳統的現金紅包,而是選擇以“免單”切入春節場景。免單無法獨立存在,它必須嵌入真實的消費決策與完整的服務鏈路之中——使用者需要提出明確需求,由系統完成下單,並最終確認履約結果。這也意味著,免單不僅是一種促銷,更是一種被完整驗證的“服務交付”。之所以選中奶茶、外賣、出行等高頻場景,它們共同的特點是決策成本低、使用頻次高、反饋明確。這類日常需求更容易促成使用者完成“第一單”,而在 AI 產品的擴散周期中,“第一次成功交付”的價值,遠勝於反覆的功能演示和能力科普。事實上,AI 進入 Agent 階段後,真正稀缺的不再是模型能力本身,而是模型能力與 B端商業體系的整合能力。從本次活動來看,當使用者發出“點一杯奶茶”的指令時,後台的運行邏輯並非簡單的關鍵詞匹配,而是一次複雜的鏈式呼叫。首先是模型需要解析自然語言等參數,其次是將這些參數被轉化為 B 端系統可識別的 API請求,最後,模型需要遵循平台的計費規則(如配送費計算、優惠券抵扣),生成一個符合財務標準的結構化訂單,並推送到商家的接單系統。在這個過程中,AI 需要跨越單純的語義理解,要與複雜的交易系統、支付體系、履約網路及風控形成穩定協同。因此,千問發起的“AI免單”不只是一次C端流量活動,本質上更是一場大模型能力與B端商業化體系的深度實驗。對於這一策略,坊間不乏質疑之聲:一種典型論調認為:相較於海外廠商集中資源提升模型推理上限、強化多模態、推進基礎設施與系統擴展,國內部分廠商卻選擇在春節期間“發紅包、請喝奶茶”,似乎有點大題小作。但這種判斷,往往忽略了應用層本身:發紅包、請喝奶茶,並非簡單的應用噱頭,而是對模型理解能力、系統穩定性與工程協同的一次集中檢驗。忽視這一點,容易低估了國內廠商的技術投入,這實際上是在強迫千問去“理解”生意的運轉規則。這種“模型+商業”的無縫銜接,遠比單純技術迭代更為複雜。它要求平台必須具備深厚的B 端資源積累和系統介面標準,才能讓大模型真正下沉到商業毛細血管中。更重要的是,這類實踐並非工程團隊能夠自發完成,而是高度依賴內部組織協調能力。模型和真實資源之間的呼叫,背後考驗的是企業對 AI 商業化路徑的整體判斷。因此,千問的30億紅包免單並不是簡單的市場行為,它要求模型理解真實意圖、系統完成下單、支付順暢銜接、履約穩定可控,並在極短時間內承受千萬級使用者的並行呼叫,任何一個環節失效,都會被真實使用者立即放大。在這一過程中,任何一個Token的延遲、一個介面的報錯,都會被真實使用者放大。這種處理複雜極端並行的系統能力,恰恰是許多海外模型與應用公司都渴望擁有的。尤其是在 Agent 時代,對千問而言,它檢驗的並非補貼效率,而是 AI 是否已經具備在真實世界中“替人辦事”的能力——而從首日1000萬 筆 AI 訂單來看,答案正在變得清晰。02從 App 到 Agent:一次互動邏輯的重構一個行業共識是,大模型已進入“後參數時代”,各家基座模型的各項指標逐漸拉平,決定勝負的,不再是“誰的模型參數更多”,而是“誰能讓AI真正完成任務”。過去,網際網路遵循的,是一種“人適應軟體”的路徑——使用者需要穿梭於不同的 App,去適應既定菜單、按鈕和互動流程,才能獲取背後的服務;而現在,MaaS(模型即服務)正在重寫這一規則,在C端互動中,模型本身直接取代了App,成為了服務的交付介面。AI 牌桌上雖然巨頭林立,但若以 MaaS 的標準嚴苛審視,會發現大多數玩家手中都缺失了一塊關鍵拼圖。OpenAI 困於“場景懸浮”: 儘管GPT技術領先,但因缺乏原生應用場景,其模型始終處於“懸浮狀態”。無法嵌入消費、出行等高頻生活場景,導致其只能靠訂閱費和API變現。近期,德意志銀行資料顯示,其歐洲收入已現增長瓶頸,且面臨開源模型與巨頭的雙重夾擊。Google則困於“履約空白”: 坐擁海量資料與TPU算力,Gemini技術表現強勁,但受限於“資訊分發”的基因,Google缺乏電商、本地生活等線下履約體系。面對“即時配送”、“服務執行”等複雜任務,Google陷入了“能精準理解需求,卻無法直接滿足需求”的商業斷層。相比之下,阿里所具備的,並非單點優勢,而是一整套為 Agent 而生的基礎條件。過去四個季度,阿里在“AI+雲”領域的資本開支高達 1200 億元。這筆巨額投入支撐起了中國第一、全球領先的雲端運算網路,為上層應用提供了源源不斷的算力輸血。在算力之上,阿里打造了全球領先的“通義”大模型家族。2025 年發佈的通義千問 Qwen3 系列,作為業界首個具備“混合推理”能力的模型,創新性地融合了“快思考”與“慢思考”雙模式。它既能以極低能耗秒回日常問答,又能針對複雜邏輯進行深度多步推理,真正實現了“大腦”的又快又強。為了讓大腦有效指揮肢體,阿里百煉與 Qwen-Agent 框架建構了生態連接的“萬能介面”。這套工具層加速了 AI 在千行百業的落地,解決了模型與具體業務系統對接的“最後一公里”難題。而最核心的護城河,在於頂層的場景與履約體系。電商、即時零售、外賣、地圖和支付——這些阿里長期積累的實體能力,雖然最初並非為AI而生,但在AI作為新入口出現後,它們第一次有機會被整合進同一個呼叫框架中。既有頂尖的大腦(千問)理解意圖,又有龐大的軀幹(淘寶/天貓)承載交易,更有靈活的手腳(菜鳥/餓了麼)完成履約,最後還有強健的心臟(支付寶)完成商業閉環。當然,AI介入履約服務的這條路也最為艱難,它需要AI理解使用者意圖,還要與複雜的業務系統協同運作。任何環節失誤,都會被使用者感知並放大。風險本身就是壁壘,這種對“全鏈路協同”的極高要求,反而構成了阿里真正的護城河。從行業視角看,這條路徑也解釋了為什麼“AI + 實體”被認為是少數公司才能嘗試的方向。相比純模型公司,擁有現實世界介面的企業,才真正跨過了“工具”與“Agent”的分界線。03Agent 時代下的中美 AI 兩條路毫無疑問,關於 Agent 的敘事已經成為中美科技巨頭押注的下一站。無論是 OpenAI、Anthropic,還是 Google,幾乎所有頭部廠商都在嘗試讓 AI 從“對話者”走向“執行方”。差別不在於是否走向 Agent,而在於——Agent 被首先用來做什麼。前段時間,Anthropic 推出的 Claude Cowork,正是這一趨勢的典型體現。它將 AI 深度嵌入協作與辦公流程,試圖在知識工作場景中,重塑人與軟體的關係。這一動向,也直接衝擊了以 Salesforce、Adobe、SAP 為代表的傳統 SaaS 公司,相關企業股價隨之出現明顯波動。這背後,是一條極具代表性的“美國路徑”:Agent 優先進入的是辦公、開發、管理等生產力場景,核心目標是提升知識工作的效率,讓 AI 成為“數字同事”或“超級 Copilot”。而在國內,Agent 最先被驗證的,並非寫程式碼、做表格,而是點餐、購物、出行、訂票等日常事務。這並非能力差異,而是基礎條件與應用土壤的不同所共同塑造的結果。一方面,我們擁有全球最龐大的網際網路使用者規模,以及成熟的移動支付體系;另一方面,線上線下高度融合的消費與服務場景,為 AI 提供了天然的“試驗場”。在麥肯錫的調研中,已有至多 49% 的企業稱,AI 為企業實現了降本。其中,中國大陸企業在 AI 採用率上提升迅速,已達 75%,與北美地區差距縮小到 7%。在這樣的環境中,Agent被直接放進生活,接受最直觀、也最嚴苛的檢驗——能否把事辦成。從這個角度看,千問的策略,代表了一種務實的中國式路徑:優先尋找高頻場景,將 AI 能力接入日常生活,通過解決真實的使用者需求,來推動 Agent 技術的成熟與迭代。不妨大膽猜測,千問 30 億補貼買到的,並不只是訂單量,而是這代使用者對“下一個網際網路入口”的提前適應。Agent 時代的門,可能已經在這個春節,被推開了一條縫。 (雷峰網)
馬雲又賭贏一局
阿里用真金白銀打了漂亮的一仗。“使用者就是這麼實際,誰發紅包誰排第一。”在春節檔的這場AI紅包大戰中,阿里千問狂撒30億元,騰訊元寶猛砸10億元,百度文心投入5億元,總計45億元的紅包資源讓大眾為之瘋狂。從目前來看,投入金額遠超其他兩家的阿里千問,確實做到了“大力出奇蹟”。在千問APP的“春節30億免單”活動上線後,其下載量與日活飛速暴漲。2月6日下午,千問APP反超元寶,登頂蘋果應用程式商店免費榜。圖源:App Store而透過阿里的大手筆,我們也得以一窺它的野心。從十八年前馬雲決定要建立阿里自己的雲端運算系統,到近年來阿里毅然在AI領域砸進上千億,一直以來,阿里都在AI這條賽道上穩步前行。正是這種十數年磨一劍的堅持,讓如今的阿里千問擁有了吸引使用者、留住使用者的底氣。阿里千問爆火出圈伺服器被擠崩了前幾天,千問APP推出了一項名為“春節大請客”的活動,總投入30億元。當時,官方並未透露活動的具體玩法,引發大眾猜測。2月6日,阿里巴巴公佈了活動細則,並正式開啟千問APP“春節30億大免單”活動。圖源:阿里巴巴本次免單活動有兩個時間節點,第一波免單活動時間為2月6日-2月12日,連續七天邀請全國人民用AI一句話免單點奶茶。具體而言,使用者打開APP就能領到一張25元無門檻免單卡,每人最多可得21張,相當於525元。既能免費喝奶茶,也能買年貨、點外賣,還有額外福利——價值萬元的千問AI生活卡。圖源:阿里巴巴第二波免單活動從2月13日開始,使用者可領取最高288元的紅包。免單活動一經推出,便點燃了大眾的消費熱情。無數使用者湧進千問APP,帶來了一系列的連鎖反應。首先,就是千問APP登頂 App Store 中國區免費榜,反超元寶和豆包,拿下了榜一。很長一段時間裡,豆包穩居榜一;元寶推出紅包活動後,短暫登上榜一。如今,輪到千問站上了這一位置。其次,免單活動引發奶茶店爆單。據千問消息,活動上線不到5小時,送出500萬單,活動上線9個小時,送出1000萬單,增速迅猛。圖源:千問這一次,阿里千問可謂是出盡了風頭。“千問狂砸30億發起奶茶攻勢”“阿里千問登頂 App Store”“千問讓奶茶店爆單了”等詞條沖上了熱搜,宣傳效果顯著。不過,這破天的流量,也帶來了“幸福的煩惱”。千問有點招架不住這波流量,系統差點崩了。不少湧入千問APP的使用者沒能及時下單奶茶,因為發出指令後系統未能正常跳轉到下單流程,而是跳出“當前千問請客活動參與人數較多,正在努力處理中,請稍後再試~”的提示。看來,使用者的熱情,把千問的伺服器擠爆了。圖源:千問APP對此,千問及時作出了回應:我們正在緊急加資源,全力保障順暢,請大家稍稍等待~並提示大家:免單卡使用期限可以到2月13日,如果暫時遇到擁堵,可以稍晚下單,不用著急。圖源:千問不過,這一小插曲並未影響到使用者的消費熱情,奶茶店依舊收到了大量的訂單。部分奶茶店甚至因為單量過多,選擇臨時閉店。同時,因為爆單,有騎手反映取餐受到影響,超時率較高,有些單子等一個小時還沒取到。圖源:微博這場用真金白銀搭建起來的免單活動,為千問帶來了實打實的紅利。雖然過程中出現了一些小問題,但整體是向好的。如今第一波活動就取得了巨大的市場反響,足以說明千問的潛力。下一波活動開始後,千問APP或許還能再迎來新一輪的增長,讓我們拭目以待。千問進入“AI辦事”時代這一仗,阿里千問確實打得漂亮,並且目標明確。其實,馬雲就很看好千問。前幾天,有阿里員工分享了在千問項目組辦公區偶遇馬雲的照片,估計馬雲是要為千問加油打氣。而千問確實沒有讓馬雲失望,在春節這個節點持續發力。圖源:小紅書千問APP春節項目組負責人鄭嗣壽表示:在春節這個生活消費活動密集的節點,千問希望通過真金白銀的投入,培養使用者“有事找AI”的習慣,推動AI融入到真實世界的衣食住行之中。這和千問最初的定位是一致的,不同於偏向娛樂化的AI助手,千問本就明確聚焦於“生產力工具”賽道,要推動AI從“會聊天”向“能辦事”轉型。而千問的“能辦事”,就主要體現在AI購物上。前陣子,千問APP就已宣佈全面接入淘寶、支付寶、淘寶閃購、飛豬、高德等阿里生態業務,實現點外賣、買東西、訂機票等AI購物功能。這意味著,單單在千問APP這一AI入口,使用者就能享受到阿里業態的相關消費服務,無需跳轉至其他APP。圖源:微博“1分錢喝奶茶”的活動,就是千問APP與淘寶閃購的有效聯動。使用者不僅能享受到紅包帶來的優惠,還能在消費中體驗“AI辦事”的價值。當使用者通過自然語言指令完成在淘寶閃購下單、支付的流程,就在無形中培養了使用AI的習慣,同時加速“有事找AI”心智的形成。除了直接的消費免單,千問APP還設定了互動環節,即抽取“AI生活卡”與現金大獎。在活動期間,使用者通過完成指定任務,可獲得抽獎資格,獎品即為“萬元AI生活卡”。具體而言,AI生活卡的擁有者,可以享受“萬元商超外賣免單卡”或者“機票酒店立減券”這兩項權益,也可以用“5000元現金紅包”作為代替方案。圖源:千問這進一步豐富了千問APP上的消費場景,比如去淘寶閃購點外賣享受即時零售服務,去飛豬上買車票訂酒店,讓使用者真切感受到千問與阿里生態的協同效應,強化 “AI 辦事” 屬性,同時反哺生態業務的增長。當使用者享受過“AI+消費”的便捷性,就能激發下一次使用千問APP的需求,並進行其他消費場景的嘗試,進一步延伸到衣食住行,培養起用AI辦事的心智。本質上,這一場免單活動,是阿里用真金白銀購買使用者對AI產品的第一次深度接觸和體驗的嘗試。通過場景化服務與生態協同,將千問打造成AI時代的超級入口,重塑使用者心智與行業競爭規則,助力阿里在 AI 時代的超級入口爭奪戰中搶佔先機。春節AI紅包大戰,誰是贏家?阿里的這30億,確實花得值。畢竟,什麼福利都不如真金白銀來得實在。在AI時代的入口爭奪戰中,大廠玩家們再次利用紅包在同一賽道中短兵相接。千問APP利用這30億紅包,帶動使用者用AI體驗點外賣、出行規劃、買年貨等消費場景,強力普及“AI辦事”功能。騰訊元寶投入10億現金紅包,通過社交裂變的方式快速拉新促活,搶佔AI社交心智。具體而言,引導使用者通過微信或QQ好友分享紅包、建立“元寶派”群聊等方式,提升日活與使用者規模。該活動推出的前幾天,元寶也迅速登頂 App Store 中國區免費榜。圖源:微博百度文心則利用5億現金紅包,引導使用者使用AI助手,並設定AI生成春聯、祝福等互動任務,讓使用者在互動中體驗AI生成能力,強化工具屬性。特別的是,字節跳動旗下的豆包並未砸錢撒紅包,而是借助抖音生態並依託火山引擎的技術支援,深度參與央視春晚互動,將AI深度嵌入短影片創作與互動場景。不難看出,四位玩家都在通過不同的打法來搶奪新使用者。而紅包大戰,確實能在短期內實現使用者的激增。但難以忽視的一點是,這些大量湧入的新使用者,一定程度上可以說是“羊毛黨”,是為了“薅羊毛、搶福利”才下載註冊的。沒有人能保證,福利結束後這些使用者還能繼續使用AI助手。這是很現實的問題,玩家們其實也考慮到了這一點。為此,從推出的紅包互動活動中可以看出,他們有意培養使用者的使用習慣,讓使用者真實感受到AI作為生產力工具的能力。很明顯,撒錢搶使用者只是第一步,真正的挑戰是留住使用者。能讓使用者每天都想打開並真正覺得有用的AI助手,才是真正的贏家。這背後,是對AI助手技術硬度、場景深度和服務溫度的考驗。 (大佬說)
歷史性一刻!恭喜阿里!
就在剛剛,義大利米蘭傳來超級重磅消息。台北時間2026年2月5日,國際奧委會正式宣佈:奧運史上首個官方大模型橫空出世!國際奧委會主席考文垂,現場為我們中國的技術點贊!因為驅動這個奧運“大腦”的核心技術,正是來自阿里巴巴的千問大模型!考文垂表示:得益於千問大模型的技術支撐,2026米蘭冬奧會展現了奧林匹克運動的智能化未來,將成為史上最智能的一屆奧運會。可能有人會問,全球那麼多科技巨頭,為什麼奧委會最終要把這項開創歷史的“超級工程”交給我們?僅僅是因為性價比嗎?絕對不是!隨著核心細節的披露,全世界都看懂了,這背後是兩項無可替代的硬核實力。第一,是經歷過“地獄級”實戰考驗的穩定性。奧運會是全球數十億人圍觀的直播,技術容錯率是0!而在高並行流量抗壓這件事上,中國技術早就練就了“金剛不壞之身”。無論是“雙十一”的交易洪峰,還是春運的搶票壓力,阿里的雲端運算技術早就證明了自己。奧委會很清楚:把後台交給中國雲,就是兩個字:放心!第二,是真正“讀懂”世界的智能化能力。這屆冬奧會被稱為史上“最智能”的一屆。首先是溝通零障礙。基於千問的多語言能力,全新的“奧運AI助手”讓全球代表團和觀眾都能用母語提問,從比賽規則到後勤調度,AI瞬間給出精準答案,徹底打破了語言的隔閡。其次,是極致的視覺體驗。冬奧會轉播有個老難題,雪地太白、紋理太單一,傳統技術很難捕捉高畫質細節。但這次,阿里雲通過AI增強特效技術,硬是在漫天風雪中實現了超高精度的場景重建。大家在電視機前,能看到比現場更清晰的“子彈時間”特效,運動員在空中的每一個極速翻轉,都被完美定格!這也是為什麼考文垂主席會給出如此高的評價,她說:“過去,我們通過衛星連接世界;今天,我們通過阿里巴巴的雲和AI連接世界。”從2008年北京奧運會我們努力向世界展示自己,到今天世界主動擁抱中國技術。這一刻,我們不僅贏得了合作,更贏得了全球的尊重。米蘭冬奧會,中國健兒在賽場拚搏,中國科技在幕後護航。這,就是屬於我們的中國排面! (王晶華說AI)
大戰,全面升級
人工智慧(AI)應用的入口爭奪戰、客戶爭奪戰,全面升級!今天上午,阿里旗下的千問APP宣佈投入30億元,將在2月6日上線“春節請客計畫”。春節期間,千問聯合淘寶閃購、飛豬、大麥、盒馬、天貓超市、支付寶等阿里生態業務,以免單形式請全國人民在春節期間吃喝玩樂。而在此前,騰訊元寶公佈了10億元紅包計畫,百度文心助手公佈了5億元紅包計畫,字節豆包公佈了超6億元的紅包計畫。其他玩家,比如螞蟻集團、美團、京東、拼多多也都有春節紅包計畫,大多跟推廣AI應用或功能有關。但到目前為止,阿里(千問)的手筆最大。情況每天都變化,未來不排除有更多的網際網路大廠加入2026年春節紅包大戰,也不排除有大廠調高紅包量總金額。網際網路大廠通過春節紅包搞行銷、拓展客戶,始於2014年、2015年。當時微信為了跟支付寶爭奪移動支付的蛋糕,連續兩年發紅包,甚至跟央視春晚獨家互動,搞了搖一搖紅包,獲得了極大的成功,甚至改變了移動支付的市場格局。從此,春節發紅包成了網際網路大廠的保留節目,並在2021年達到了高峰。那年的春節,抖音、快手、百度、拼多多、淘寶、支付寶等主流平台總投入高達180多億元(含實物、權益)。雖然今年紅包大戰規模遠不是史上最高的,但意義重大,因為今年競爭的核心是關係到下一個20年、30年的AI應用。今年的春節紅包大戰,不再是單純的 “撒錢拉新”或“支付爭奪”,而是以紅包為載體,繫結 AI 應用下載、AI 功能體驗,本質是大廠對AI 入口、AI 使用者習慣、AI 生態閉環的戰略爭奪。人工智慧的大潮正席捲世界,這將是新一輪財富大洗牌。如果不能抓住這個風口,即便你現在有兆市值,未來也將不可避免地走向衰落。反之,如果能在這一輪洗牌中搶佔先機,則可能逆襲。過去幾年,輝達、台積電、OpenAi的財富效應,已經昭示了這一點。如果說過去兩年,人工智慧硬體企業率先享受到了AI帶來的財富效應,那麼接下來就輪到AI應用了。無論是國外的輝達、國內的寒武紀,之所以業績高速增長,都是因為網際網路大廠瘋狂的算力投入。網際網路大廠瘋狂投入,建好基礎設施之後,就需要找到客戶。過去兩年,是大廠們的投入期,從今年開始,他們就要迅速擴展使用者,找到最能轉化利潤的應用場景了。設想中,未來的應用場景應該是這樣的:當一個人準備出差或者旅遊的時候,只需通過AI超級應用(APP)設定條件,提出要求,AI就可以自動比價、比質,給他預定機票、接機服務、酒店、餐廳、旅遊景點,提供保姆式服務。這意味著大家消費的方式變了,不再去分別打開攜程、美團、淘寶、京東、小紅書等APP,而是更加依賴某個新的超級入口——它可能是豆包、千問、元寶,或者其他什麼。如果網際網路大廠不能搶到這個超級入口,原有的客戶就會流失,衰落將不可避免。按照馬斯克的預言,未來手機、APP都會消失,因為手機是反人性的,不方面的。而AI眼鏡+AI手錶的組合,或者什麼新的穿戴裝置,最終會取代手機。手機可能忘帶、遺失,容易摔壞,用多了手腕還會痛;穿戴裝置就沒有這種麻煩。未來的虛擬螢幕,將讓手機折疊屏顯得笨重可笑;腦機介面的輸入方式,將讓手動輸入、聲音輸入變得“老登”。看懂了這一點,你就會知道這場變革來得有多麼劇烈,多麼徹底。未來智能體就是你的司機+秘書,人形機器人還能當你的保姆,甚至伴侶。對於網際網路大廠來說,AI時代的第一張門票,就是先有一個AI超級應用,並擁有足夠多的活躍使用者,粘性足夠好;然後,才談得上賣東西、賣服務,掙錢養家、升級裝置。在這背後,是巨大的算力中心投入+行銷投入,還需要有正確的戰略、對市場的前瞻性。由於國家正在反內卷、反不正當競爭,所以今年的紅包大戰看起來規模不太大。如果沒有這個背景,我估計今年的春節紅包搞到200個億、300個億都有可能。大廠們會不會宣佈一個較小的金額,實際投入遠遠超過呢?有可能,這大概可以稱之為“低調的奢華”吧。總之,人工智慧應用的時代到來了,前期所有的算力中心投入,最終都需要通過C端使用者賺回來,否則遊戲無法持續。而今年股市的主線之一,也必然是人工智慧應用。今天上午,受到貴金屬、工業金屬等類股大調整的拖累,上證指數跌了54個點。春節之前,還有9.5個交易日,這期間大盤大機率處於垃圾時間,需要進行一輪修整,但部分個股還會活躍。 (劉曉博財經)
千問版Gemini3,來了
第一個中國國產版Gemini3,來了。1月26日,阿里正式發佈千問旗艦推理模型Qwen3-Max-Thinking。據介紹,Qwen3-Max-Thinking總參數超兆、預訓練資料量高達36T Tokens,在科學知識(GPQA Diamond)、數學推理(IMO-AnswerBench)、程式碼程式設計(LiveCodeBench)等多項權威評測中刷新了全球紀錄。它在數學推理AIME 25和HMMT 25上拿到了國內首個雙滿分,甚至在“人類最後的測試”HLE中得分58.3,大幅超過GPT-5.2-Thinking的45.5和Gemini 3 Pro的45.8。更關鍵的是時間點。如果你最近關注AI圈,會發現各家大模型廠商都在憋大招,阿里搶在這個節骨眼上發佈Qwen3-Max-Thinking,擺明了就是要搶“中國國產第一個Gemini 3”的名號。榜單資料再好看,到底能不能媲美Gemini3?試了幾次Qwen生成程式碼,前幾次任務失敗率還挺高的,但只要碰到阿里擅長的場景,表現就完全不一樣。比如讓它做一個賣水果的電商網站,商品分類、加購物車、一起結算這些功能,基本一次就寫出來了,而且邏輯很完整,體驗也流暢。很明顯,電商這種場景它見得太多了,淘寶天貓的資料喂得夠飽,所以做起來特別順手。但換成其他類型的任務,成功率就不太穩定了。如果你的需求正好在它的舒適區裡,那體驗確實要相對好;如果偏離了,可能得多試幾次調整提示詞。我還專門測試了一個更複雜的互動案例:用攝影機做體感控制的打氣球遊戲,這也是Gemini 3展示過的經典demo。具體需求是:用手勢控制螢幕上的準星,做捏合動作(拇指和食指併攏)來射擊從下往上飄的氣球,還要有天空背景、雲層漂移、擊中特效、連擊反饋這些細節。千問的表現讓我有點意外。整個遊戲的框架它一次就搭出來了:天空漸變背景、氣球從底部生成往上飄、大小不同速度不同、UI顯示分數和連擊數,這些基礎邏輯都沒問題。互動效果做得挺有意思。伸出食指,螢幕上的準星就會跟著手移動,拇指和食指捏合就能開火。擊中氣球的瞬間,螢幕會輕微震動,氣球爆開時有粒子特效散開,還有“啵”的一聲音效,反饋感做得很足。連續擊中會顯示combo數字,這種即時反饋確實有代入感。但實際玩起來有個明顯的問題:瞄不準。手指明明對著一個氣球,但準星位置總是偏的,打了好幾發才能碰巧打中。這應該是手部追蹤和螢幕坐標對應之間有偏差,或者校準演算法不夠精確。雖然Qwen做出了體感控制的完整流程:攝影機呼叫、手勢識別、射擊反饋這些環節都跑通了,但核心的“指那打那”這個精度沒做好,導致遊戲性打了折扣。不過,千問這次最厲害的地方,不是參數有多大,而是它“想問題”的方式變了。在關鍵的模型推理能力提升中,千問新模型採用了一種全新的測試時擴展(Test-time Scaling)機制,推理性能提升的同時還更經濟。打個比方,以前的AI做數學題是這樣的:同時寫10份答案,然後投票看那個對的人多,就選那個。這種方法很笨,浪費算力,而且10份答案裡可能犯的都是同一個錯誤。Qwen3改成了人類的做法:先做一遍,做完看看那裡不對,總結一下經驗,再重新做。就像你做錯題本一樣,第二遍肯定比第一遍做得好。結果就是,在那個需要用工具解決問題的測試裡,Qwen拿了58.3分,Gemini只有45.8分,差了一大截。在呼叫工具層面,千問的做法是把工具使用能力“訓練進”模型裡,在完成初步的工具使用微調後,通義團隊對模型進一步在大量多樣化任務上進行了基於規則獎勵與模型獎勵的聯合強化學習訓練,使得Qwen3-Max-Thinking擁有更智能結合工具進行思考的能力。它用三步訓練法:先教會用工具,再在各種任務裡強化練習,最後形成條件反射。好處很明顯:用起來又快又順,不用每次都去讀工具說明書,而且模型自己知道該在什麼時候用什麼工具。這就是為什麼Qwen在HLE測試裡比Gemini高出12分,特別是需要連續用好幾個工具解決複雜問題的時候,這種“肌肉記憶”優勢就體現出來了。對比之下,Gemini走的是傳統軟體工程的路子:模型只負責理解你要幹什麼,具體調工具靠外部API框架。這樣做最大的好處是靈活:Google想接入沃爾瑪的購物功能,不用重新訓練模型,插個API就行。但代價是每次用工具都要走“理解意圖—翻譯成API呼叫—執行—解析結果”這一整套流程,慢而且容易出錯。千問的程式碼生成能力,已超越單純的“語法翻譯器”,更像一位理解你意圖的技術夥伴。它不僅能將需求轉化為可運行的程式碼,更具備工程直覺:知道何時最佳化性能、何時簡化實現、何時加入容錯機制。這種“度”的把握,恰恰是AI從“工具”走向“協作者”的關鍵躍遷。 (硅星人Pro)