#Qwen3.5
最強開源大模型除夕登場!397B參數千問3.5超越Gemini 3,百萬Tokens低至8毛
我滴媽,最卷AI大模型,今年除夕又上新了!剛剛,阿里全新一代大模型Qwen3.5-Plus重磅開源發佈,直接登頂最強開源模型寶座。這一次,“源”神標竿再次被千問拔到了一個新高度:不僅性能全面領先同級開源模型,更是媲美Gemini-3-Pro、GPT-5.2等頂級閉源模型,多項基準測試甚至直接反超。更炸裂的是,Qwen3.5-Plus總參數隻有3970億,啟動僅需170億,性能卻比兆參數的Qwen3-Max還要強。直觀對比還包括——部署視訊記憶體佔用降低60%,最大推理吞吐量可提升至19倍,也就是說部署成本,以及推理效率雙雙實現大幅最佳化。這波“以小勝大”的史詩級PK,千問做到了。重點還沒說完,千問這次直接把技術紅利釋放給使用者,直接讓SOTA級模型做到了平民價。阿里雲百煉這次給千問3.5 API的定價極具競爭力:百萬Tokens輸入低至0.8元,相當於同等級模型Gemini-3-pro的1/18。並且,千問3.5首次實現201種語言的全覆蓋,詞表規模從150k大幅擴充至250k,小語種編碼效率最高提升60%,真正讓頂尖大模型走向全球使用者。截至目前,普通使用者只需登錄千問APP或PC端,即可免費體驗千問3.5模型;開發者們也可前往魔搭社區或HuggingFace,第一時間下載部署這款最強開源力作。據悉,千問3.5還只是阿里春節檔的第一彈。接下來幾天,他們將繼續開源多款千問3.5模型,可部署在本地、端側等不同場景,無論是開發者還是中小企業,通通都能用上。旗艦版Qwen3.5-Max也將在年後壓軸登場。u1s1,DeepSeek之後,中國開源模型的“瘋狂二月”太頂了。多項能力超越Gemini 3、GPT-5.2,視覺能力橫掃權威基準話不多說,千問3.5有多強,我們先來看基準測試結果。在推理、程式設計、智能體等核心維度上,千問3.5能夠以不到40%的參數量比肩國際一流梯隊。比如,在考核綜合認知能力的MMLU-Pro測試中,千問3.5得分87.8分,超過GPT-5.2。在目前公認難度最高的博士級科學推理評測基準GPQA上,更是一舉斬獲88.4分,比以嚴謹邏輯著稱的Claude 4.5還要高。這就意味著千問3.5同時兼具推理廣度與深度,不僅具備極強的知識遷移能力,還在底層邏輯上實現了突破。在指令遵循方面,千問3.5表現同樣亮眼。它以76.5分的成績領跑IFBench榜單,刷新了該項指標的最高紀錄。除此之外,千問3.5在Agent能力上也是全面發力。無論是考察通用能力的BFCL-V4,還是側重搜尋能力的Browsecomp,其評分均全面超越Gemini-3-Pro,展現出優秀的Agent協同能力。綜合來看,相比前幾代的千問模型,千問3.5在性能上更全面,不僅多維度無短板,更重要的是,能夠落地實用。之所以能夠實現這種代際躍遷,關鍵在於它的“眼睛”。與上一代的純文字模型千問3不同,千問3.5從預訓練第一天起,就是在視覺和文字的混合Token資料上進行的,而且資料量也從原先的36T Tokens進一步提升。同時新增中英文、多語言、STEM和推理等資料,讓千問3.5真正睜眼看世界,擁有了整合複雜世界知識和邏輯推理的原生多模態理解能力。這一核心能力的進化,在MathVison(多模態推理)、RealWorldQA(通用視覺問答)、CC_OCR(文字識別)、RefCOCO-avg(空間智能)、MLVU(視訊理解)等多模態主流評測中得到了有力印證:千問3.5幾乎橫掃了所有指標,刷新開源大模型多模態天花板。其中,在學科解題、任務規劃與物理空間推理等高難度場景上,千問3.5也表現出超越專項模型Qwen3-VL的綜合素養。眾所周知,Qwen3-VL是千問團隊推出的旗艦級多模態視覺語言模型,主打超長上下文、強視覺推理、視訊理解與視覺Agent能力。但作為綜合模型的千問3.5,其空間定位和圖文推理能力得到顯著增強,尤其是在處理複雜視覺資訊時,Qwen3.5會比Qwen3-VL推理邏輯更嚴謹,輸出結果也更可靠。千問3.5還突破了傳統大模型的視訊處理邊界:支援長達2小時的超長視訊直接輸入,配合1M Tokens原生上下文,能夠輕鬆應對長視訊內容的精準分析與一鍵摘要。換言之,無論是情節豐富的影視巨作還是專業的深度講座,千問3.5都能捕捉到每一處關鍵細節。同時,千問3.5還打通了視覺理解和程式碼邏輯的原生融合,讓視覺內容能夠直接轉化為技術產出。過去要開發一個介面,往往需要經過“原型設計→修改成稿→轉譯程式碼”的一系列過程,而千問3.5能夠瞬間將手繪介面草圖重構為高品質前端程式碼,並支援通過單張截圖定位並修復UI缺陷,做到“所見即所得”。由此,開發門檻被迅速抹平,視覺程式設計真正變為開發者手中的提效工具。模型實際表現如何?來看一波官方demo展示。先看最近很火的洗車靈魂拷問:我想去洗車,洗車店距離我家50米,你說我應該開車過去還是走過去?千問3.5一眼識破陷阱,精準抓住核心,車必須過去洗,邏輯線上:再來點難度,考考眼力+圖像推理能力。prompt:從所給的四個選項中,選擇最合適的填入問號中,使其具有合理性,應該選什麼?對千問3.5來說小菜一碟,輕鬆看懂圖形規律,並順利給出了正確答案:就連IMO競賽級數學幾何題,be like:也能一步步推理,迅速做出來:不只會做靜態題,出一道滑動方塊動態推理:千問3.5照樣拿捏:多模態生成也很強。讓它為Qwen Code生成一個推廣視訊:成片效果相當流暢自然,直接發佈都很OK。除了生成視訊,做網站也不在話下。讓千問3.5閱讀本地視訊檔案,就能根據內容製作一個網站,分分鐘生成完成程式碼:無論是產品宣傳片,還是核心特性突出,千問3.5都一網打盡。就連最燙的OpenClaw,千問3.5也可以與之整合,共同完成程式設計任務驅動。OpenClaw可以作為第三方智能體環境,協助千問3.5進行網頁搜尋、資訊收集和結構化報告生成等內容。千問3.5還可以作為視覺智能體,自主操控手機與電腦完成日常任務。模型架構全面革新,原生多模態不到四千億參數打贏兆,API價格打到閉源模型的零頭,千問3.5此次的突破,根源在於底層架構層面的升級。過去兩年,大模型行業整體遵循Scaling Law路徑演進,即參數規模越大、模型能力越強。從千億級邁向兆級,模型在複雜推理和多工泛化等方面持續取得進展。但這種路徑的代價同樣明顯——訓練依賴超大規模算力叢集,推理成本隨參數規模同步增長,部署門檻不斷提高,使得中小企業難以負擔,也限制了端側的落地。模型能力持續增強的同時,計算效率與可擴展性逐漸成為新的瓶頸。在這一背景下,千問3.5不再單純擴大模型規模,而是對Transformer經典架構進行了一次深度重構,通過多項關鍵技術協同最佳化,在強性能與高效率之間找到了新的平衡點。據官方介紹,千問3.5引入了四項關鍵技術。首先,是注意力機制的結構最佳化。Transformer的核心是自注意力機制,但傳統實現存在一個固問題:無論資訊是否重要,每個Token都需要與全部上下文進行計算關聯,複雜度隨上下文長度持續增長。這使得長文字處理的計算成本迅速上升,也成為限制模型長上下文能力的主要因素之一。千問3.5為此引入了混合注意力機制,不再對所有資訊一視同仁,而是根據重要程度動態分配計算資源——關鍵資訊高精度處理,次要資訊低成本帶過。在保持理解精度的同時,顯著壓低了計算開銷,長上下文處理效率也隨之提升。第二,是極致稀疏的MoE架構設計。如果說注意力最佳化解決的是“怎麼讀資訊”的問題,那MoE架構解決的是“用多少參數來回答”的問題。傳統稠密模型每次推理必須啟動全部參數,參數越多成本越高。MoE架構的思路是將模型拆分為大量專家子網路,每次推理只啟動其中最相關的一部分。千問3.5把這一思路推向極致:總參數3970億,單次推理啟動僅170億,啟動比例不到5%。大規模參數積累的知識優勢被保留,但規模帶來的成本負擔被大幅卸掉。第三,是原生多Token預測機制。傳統語言模型逐Token生成,每次輸出一個再預測下一個,序列結構直接限制了推理速度。千問3.5在訓練階段就學習聯合預測多個未來Tokens,使模型從逐字輸出變為批次輸出,而非單點預測。推理速度接近翻倍,對話響應明顯加快。第四層突破是系統級訓練穩定性最佳化。稀疏架構雖然效率極高,但訓練難度遠高於傳統稠密模型。為瞭解決訓練穩定性問題,千問團隊將此前獲得NeurIPS 2025最佳論文的注意力門控機制,引入到了千問3.5之中。該機制可以理解為注意力輸出端的“智能開關”。它即時控制資訊流強度,強化有效訊號,抑制噪聲干擾。避免訓練過程中的梯度異常和資訊失衡。除此之外,歸一化策略、專家路由初始化等深層最佳化手段也被引入,分別解決不同環節的穩定性難題,共同保證前述架構創新在超大訓練規模下穩定運行。四大殺招齊出,千問3.5實現了顛覆性的效率飛躍。官方資料顯示,新架構訓練成本降幅高達90%。與Qwen3-Max相比,Qwen3.5-Plus部署視訊記憶體佔用降60%,意味著節算力部署成本大幅降低;最大推理吞吐量可提升至19倍,大幅提升推理效率。架構創新解決的是效率問題,而千問3.5的另一重躍遷,指向的是智能本身——它要讓大模型真正“看得見”。目前行業裡不少所謂的多模態方案,做法其實是分步拼接:先把語言模型訓好,再把視覺模組接上去,中間加一層對齊網路把兩邊的表徵勉強拉到一起。更直接的做法甚至連對齊都省了,前端看起來是一個統一入口,後端其實是不同任務調不同模型,本質上就是個路由器。這類方案能用,但談不上真正的融合,而且一個常見的副作用是:視覺能力加上去了,語言能力可能反而往下掉。千問3.5選擇了更徹底的原生多模態路徑。預訓練階段就不再區分“先學文字、再學圖像”,而是把文字和視覺資料混在一起,讓模型從第一步就在同一參數空間裡同時消化這兩種資訊。這樣訓出來的模型,處理圖片和處理文字走的是同一條神經通路,不需要中間再做翻譯或對齊。這種融合在工程上極具挑戰。圖像和文字的資料結構差異很大,如果強行套用同一套平行策略,計算資源的浪費會很嚴重。千問3.5的處理方式是讓兩種模態在訓練過程中各自按最適合自己的方式走,只在必要的環節進行資訊交匯。最終,那怕同時輸入文字、圖像和視訊三種資料,整體訓練吞吐量和純文字基座模型幾乎沒有差別。同時,團隊還加上了一套針對性的混合精度方案,在不同環節靈活切換FP8和FP32,啟動記憶體砍掉了大約一半,訓練速度還額外快了10%。這套精度策略不只用在預訓練階段,強化學習和推理環節也統一部署了進去。在智能體訓練這塊,團隊又專門造了一套大規模強化學習框架,純文字、多模態、多輪對話全都能跑,訓練效率直接拉高了3到5倍。當然,上述能力的實現,最底層離不開阿里雲AI基礎設施的支撐。超大規模混合資料訓練的穩定性、多模態平行策略的工程落地、訓練到推理全鏈路的精度最佳化,每一項都需要底層算力平台的深度配合。最最關鍵的是,千問不光技術能打,更是在開放原始碼的路上一路狂飆。阿里是真“源”神不知道還有沒有人記得啊,去年阿里就在春節期間連發好幾個模型,春晚直播進行時,掐著點甩出Qwen2.5-Max,直接把DeepSeek V3給反超了。當時網友們的評論是:杭州這群人,不睡覺也要送上新春大禮包。一年過去了。又是除夕,又是千問。從2.5到3.5,千問再把“開源”兩個字做到了極致。回顧千問開源之路:自2023年開源以來,阿里已累計開源400多個模型。從0.5B到235B全尺寸覆蓋,從端側到雲端全面佈局,涵蓋文字生成、視覺理解與生成、語音理解與生成、文生圖、視訊模型等全模態領域……千問直接把開源模型貨架,擺的滿滿噹噹。而且,每一代、每一個尺寸,都在穩定輸出天花板級產品,換來實打實的戰績:全球下載量突破10億次,單月下載量超過第2名到第8名的總和,開發者基於千問開發的衍生模型已超過20萬個。千問目前已穩居全球最大AI大模型族群。“最強開源得投千問一票”,從一部分人的判斷,變成了全球開發者的共識。不論是開源開放,還是把API價格打到0.8元/百萬Tokens,亦或是將支援語言擴展到186種,千問的意圖很明顯:讓更多人能用上、用得起最頂尖的模型。當開源模型在核心能力上追平甚至反超閉源,而且免費可商用,競爭的邏輯就變了。這不再是一個模型和另一個模型之間爭跑分的遊戲,而是兩種生態路徑的選擇。Linux沒有靠賣系統成為商業巨頭,卻成為了全球伺服器領域的主流支撐。Android也不靠系統授權盈利,卻讓智慧型手機真正普及到每一個人。千問想走的路,大概也是這一條。最後別忘了,這些只是模型禮盒!今年春節請喝奶茶、紅包雨還沒算在內。阿里千問這過年的排面,太瘋狂了。 (量子位)
“源神”啟動!阿里殺手鐧——全新架構千問3.5來了,最強性能x最低成本
千問3.5"以小勝大"背後,是全新架構的效率代際躍遷"源神"啟動!阿里巴巴正式開源Qwen3.5-Plus,性能指標直接對標Gemini 3 pro與GPT 5.2等頂級閉源模型。千問團隊憑藉這一代際跨越,坐上全球最強開源模型交椅。核心突破在架構。397B總參數,推理時僅啟動17B,這種精巧設計讓其全面超越上代兆參數的Qwen3 Max,部署視訊記憶體佔用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍,速度也更快了。過去束縛大模型商業化的算力瓶頸被打破。支撐點是阿里長期堅持的基礎技術創新。研發團隊深度應用混合專家架構,拋棄簡單參數堆砌。預訓練階段採用統一架構同時處理多模態資料,建構出同等性能等級中參數量最小的模型底座。但千問3.5隻是開始。這次發佈揭開了阿里多模態戰略佈局的一角,千問研發團隊正在探索文字、視覺、語音與操作反饋的全模態融合,這條大一統架構路徑,指向通用人工智慧(AGI)。科技估值體系、企業AI應用滲透率、開源生態話語權,都將在此刻重新定義。01. 千問3.5,更小模型,更強性能發佈即開源——"極致性價比"參數規模曾被視為提升智能的唯一路徑。千問3.5用資料終結了這一迷信。更精簡的模型實現了更強性能,同時帶來顛覆性定價。Qwen3.5 Plus的API價格降至0.8元/百萬Token,同等性能下僅為Gemini 3 pro的十八分之一。頂級AI能力跳出了高算力、高成本的閉環。個人開發者、初創團隊、中小企業都能以極低門檻獲取世界級智能基礎設施,AI向下滲透的管道被打通。性價比背後是模型基礎能力的全面升級。千問3.5具備真正的跨模態理解能力,標誌著千問系列從語言模型進化為原生多模態大模型。行業內多數"多模態"方案仍停留在工程拼裝:先訓練語言模型,再外掛視覺或音訊模組,各模組通過適配層勉強對齊。有些產品只是在統一入口後用路由分發任務給不同單模態模型。這類方案能應對基礎任務,但無法實現真正的多模態融合,甚至會出現視覺能力增強、語言能力下降的降智現象。Qwen3.5走了另一條路。從預訓練第一天起,模型就在文字與視覺混合資料中聯合學習。視覺與語言在統一參數空間內深度交織。模型看到圖像能理解深層語義,讀到文字能在神經網路中建構對應畫面。中間翻譯環節被抹除,資訊折損降到最低,千問具備了人類等級的跨模態理解力。這種原生融合帶來了寬廣的能力邊界。細粒度視覺定位能做到像素級精度,長時序理解長達2小時視訊內容的演變過程與內在因果關聯,跨模態生成,能把手繪草圖輕鬆轉化為可運行的前端程式碼。模型進化真正意義上重構了工作流。千問3.5可以作為視覺智能體,自主操控手機與電腦系統,跨多個應用完成複雜多步驟指令。從模式識別到跨模態邏輯推理,Qwen3.5推動大模型從文字工具進化為理解現實世界的基座,為更自然的多模態生成與複雜推理打下技術基礎。02. 千問3.5"以小勝大"背後全新架構與效率的代際躍遷過去兩年,大模型行業陷入算力競賽。參數從千億堆到兆,性能緩慢爬升,成本指數級膨脹。企業部署需要昂貴GPU叢集,日常推理燒錢,中小企業付不起帳單,端側裝置跑不動模型,技術越強大,落地越困難。Qwen3.5顛覆了這條路徑。競爭重點從"誰的參數更多"轉向"誰的模型更聰明",用更小規模通過技術創新獲取超越規模的智能。這不是偶然,是阿里大模型團隊多年技術積累的集中兌現。四項核心突破共同驅動了這場代際躍遷。第一,混合注意力機制。傳統模型處理長文字時,每個Token都要與所有歷史上下文做全量計算,算力消耗呈平方級增長。Qwen3.5讓模型學會有詳有略地閱讀——動態分配注意力資源,略讀無關資訊,精讀關鍵節點。效率與精度雙重提升。第二,極致稀疏的混合專家架構。傳統稠密模型每次推理都要啟動全部參數,規模越大開銷越高。Qwen3.5將397B參數庫中與任務最相關的專家子網路精準啟動,每次推理僅用17B參數——用不到5%的算力調動全域知識儲備。第三,原生多Token預測。模型不再一個字一個字輸出。預訓練階段就學會了對後續多個Token進行前瞻性聯合預測。在長文生成、程式碼補全、多輪對話等場景中,推理速度接近翻倍。第四,系統級訓練穩定性最佳化。通義團隊獲NeurIPS 2025最佳論文的注意力門控機制是關鍵。在Transformer注意力輸出端嵌入基於Sigmoid的智能開關,防止稀疏資訊被噪聲淹沒,抑制無效擾動放大。這削弱了注意力下沉負面效應,消除了對特定位置編碼的過度依賴,長上下文泛化能力質變。配合歸一化策略與專家路由初始化,新架構在大規模訓練中表現穩健。四項技術疊加帶來化學反應:訓練成本降90%,相比Qwen3 Max視訊記憶體佔用降60%,推理吞吐量最高提升19倍。原生多模態融合使訓練提速10%、啟動記憶體減少50%。大規模強化學習框架讓智能體訓練效率提升3到5倍。當其他廠商還在跑分榜上爭論小數點,Qwen3.5已經降維打擊,競爭維度變成了誰的模型更好用、更實用、讓更多的企業毫無壓力地用得起。03. 模型+基礎設施,"powered by阿里雲"成為AI時代印記在電話會中,皮查伊正式確認了外界猜測已久的傳聞——Google與蘋果達成深度合作。這不僅穩固了Google在iOS生態中的地位,更可能成為其AI模型分發的關鍵管道。卓越模型如果脫離生態與基礎設施,只能是實驗室展品。阿里採取雙管齊下戰略:研發端高頻推出SOTA級模型,生態端堅持開源,讓頂尖模型免費可得。千問產品矩陣覆蓋從輕量端側到千億旗艦,全線遵循Apache 2.0協議完全開放。這將核心技術直接推向全球數千萬開發者,千問迅速成為最受歡迎的開源大模型。開源資料顯示優勢明顯。千問官方開源模型超400個,全球開發者衍生的微調與垂直定製模型突破20萬個,總下載量超10億次,在熱度、活躍度與生態廣度上全面超越Meta的Llama生態。李飛飛團隊、愛彼迎等頂尖力量已將千問深度嵌入其AI引擎。當開源模型在邏輯推理與跨模態理解上追平甚至超越頂級閉源模型時,免費且最強成為開發者無法拒絕的選項。競爭主軸從單點跑分轉向生態系統的整體替代。企業端市場,阿里雲與平頭哥構築了技術護城河。平頭哥真武晶片針對MoE混合專家架構做了底層指令級最佳化,這種軟硬體深度耦合實現了模型演算法、晶片與雲網路的協同效能爆發。真武晶片對路由分發機製做硬體級加速,滿足千問大模型對大規模稀疏計算的需求。軟硬協同釋放了晶片算力潛能,資料中心叢集效率大幅提升,企業微調訓練與高並行推理時間被壓縮,這是API價格降至0.8元/百萬Token的底氣。軟硬協同與開源生態反哺推動阿里雲進入新增長期。Omdia《中國AI雲市場,1H25》報告顯示,2025年上半年中國AI雲市場規模達223億元,阿里雲以35.8%市場佔比排名第一,超過第二至第四名總和。Omdia預測2025-2030年中國AI雲市場復合年增長率為26.8%,其中MaaS層增速最快,複合增長率超72%,2030年將達177億元規模,2025年阿里雲在中國雲市場份額從33%升至36%,優勢持續擴大。財務資料印證這一趨勢。近期財報顯示,阿里雲公共雲收入同比增長34%,AI相關產品收入連續9個季度保持三位數增長。資本市場對中國科技資產的舊有低估偏見正在被徹底拋棄,全球資金對中國科技股的定價邏輯正經歷著重塑。縱觀科技產業史,真正定義時代的往往不是最貴的閉源產品,而是被最多人使用的基礎設施。Linux定義了伺服器時代,Android定義了移動網際網路時代。開源、免費、無處不在的特質,將使千問成為AI產業默認的底層基石。"powered by 阿里雲"正深深烙印在每個智能應用的程式碼深處,成為這個時代的技術印記。04. 結語這次阿里"源神"啟動的是AI產業的範式切換。千問3.5用技術創新重構行業規則,當最強性能遇見最低成本,AI真正從少數人走向所有人的生產力工具。這場由阿里雲主導的技術革命,正在重寫全球AI的遊戲規則。 (硬AI)
阿里下一代模型Qwen3.5發佈在即!
從基座模型到上層應用,阿里春節AI戰事仍在持續。昨日,千問APP進一步融入阿里生態體系,開始測試接入大麥平台,實現“一句話買電影票”。此前,阿里於2月6日推出“千問春節30億大免單”活動,上線9小時訂單即突破1000萬單。在應用火爆的同時,阿里亦在推進底層技術迭代。阿里新一代圖像生成及編輯模型Qwen-Image-2.0發佈,該模型將作為千問大模型的圖像生成底座,支援1K token長文字輸入與2K高解析度輸出。阿里新一代基座模型Qwen3.5也釋出發佈訊號。在全球最大AI開源社區HuggingFace的開放原始碼專案頁面中,已出現Qwen3.5併入Transformers的新PR(提交程式碼合併申請)。▍新一代基座模型Qwen3.5發佈在即在全球最大AI開源社區HuggingFace的開放原始碼專案頁面中,最新出現Qwen3.5併入Transformers的新PR(提交程式碼合併申請)。這一最新動態印證了此前有消息稱Qwen3.5將在春節期間開源。相關資訊透露,千問3.5採用了全新的混合注意力機制,並且極有可能是原生可實現視覺理解的VLM類模型。有開發者進一步挖掘出,Qwen3.5或將開源至少2B的密集模型和35B-A3B的MoE模型。昨日,阿里還發佈了新一代圖像生成及編輯模型Qwen-Image-2.0。作為千問大模型的圖像生成模型底座,Qwen-Image-2.0集生圖和編輯於一體,在AI Arena文生圖評測中斬獲1029分,超過Seedream4.5、Flux2-Max等模型,僅次於GoogleNano Banana Pro和GPT Image1.5。Qwen-Image-2.0支援1K token的超長文字輸入和2K高解析度,可渲染複雜指令,生成專業的PPT及資訊圖。同時,千問新模型擁有中文漢字渲染能力,數百字的古文全文幾乎能完全渲染在圖片中。在模型的應用落地上,千問大模型高級解決方案架構師熊撼天在採訪中向《科創板日報》介紹,當前AI漫劇生成已形成規模龐大和快速迭代的產業鏈。這些產業鏈裡面的上下游公司正將千問最新模型應用於生產級場景。“動漫視訊的單整合本有望從數百元迅速降至幾十元,同時整體質感將大幅提升。”對於後續的研發方向,千問Qwen視覺生成負責人吳晨飛表示,一是要解決幻覺和錯誤,二是探索分層模型(Layered),讓生圖形成生產力,而不只是玩具。此外,資訊圖生成亦是關鍵方向之一。“資訊圖可以理解為是一種爸爸圖,爸爸圖裡可以包含很多子圖,每一個子圖有各自的細節。這意味著系統能一次性生成多張關聯圖像,而不僅是單張圖片。該能力在漫畫生成、複雜海報設計、PPT製作等領域,非常有價值,是目前生圖領域的一大趨勢。”▍千問加速滲透阿里生態 AI消費習慣能否養成?在應用層面,千問APP是阿里面向AI消費級市場的重要落子。昨日,千問APP進一步完成其對阿里生態體系的覆蓋,開始測試接入大麥,可實現一句話買電影票,完成影片推薦、選座到支付出票的過程。比如,發出“幫我買兩張《驚蟄無聲》上映首日的電影票,最後一排,晚上8點左右”這樣的指令”,千問會根據使用者位置推薦附近的影院,還會匹配合適時間段,並為使用者鎖定要求的位置。使用者也可以在修改資訊頁自行調整時間、位置等資訊。確認後,使用者在對話方塊內即可直接完成支付並獲取取票碼。《科創板日報》記者嘗試提問“飛馳人生年初一下午”的場次,千問提供了不同影院的場次推薦,並可以直接點選購票。為了更快實現引流,千問已在2月6日上線“千問春節30億大免單”活動,可以一句話免費點奶茶。千問還把免單活動的範圍擴展至天貓超市、盒馬,以及各大連鎖商超和便利店的酒水零食、米面糧油、生鮮水果等。過去一周,隨著“元寶發紅包”“千問送奶茶”,蘋果應用程式商店免費榜榜首競爭激烈。截至發稿,阿里千問位列榜首,二、三位分別是元寶、豆包。相較元寶依託微信入口拉新,阿里更注重結合淘寶、大麥、盒馬等自有生態,培養使用者通過AI進行購物的習慣。艾媒諮詢CEO張毅認為,阿里希望借助AI引流與生態變現,打通商業閉環。“這對於培育使用者AI辦事的習慣,預計將起到顯著的喚醒作用。”盤古智庫高級研究員江瀚則表示,使用者習慣的養成關鍵在於“高頻觸達+正向反饋”,此次免單活動恰好提供了低風險試用場景,讓使用者在節日剛需中感受AI的便利。一旦使用者在特定場景形成使用路徑依賴,便可能產生“錨定效應”,提升未來付費意願。隨著更多人使用並分享成果,將形成社交示範效應,進一步強化使用慣性。因此,若配合後續階梯式產品設計,此波活動確實有望成為使用者AI辦事習慣的重要培育契機。▍免單活動被限流 基礎設施能力迎考驗《科創板日報》記者測試發現,千問APP已對免單購買採取限流措施。多名使用者反映,曾遭遇長時間無法下單的情況。對於暫時無法提供服務,千問通過系統提示解釋道:“我們監測到‘千問免單’流量激增,商家出餐和騎手配送正在加速……抱歉啦,我通往外賣餐廳的‘腦回路’正在修路……”另一條提示則稱:“現在‘千問免單’參與人數較多,騎手運力緊張。”這源於千問APP推出的春節免單活動參與人數超預期,此前已連續多日出現系統擁堵甚至短暫崩潰。有使用者耗時近6小時才成功下單,活動還導致部分奶茶店訂單激增,出餐壓力較大。江瀚認為,活動火爆反映出市場對高性價比AI服務存在顯著需求彈性,儘管瞬時流量壓力大,但系統並未完全崩潰,說明其基礎設施具備一定承載能力。正如春運搶票現象所示,即便資源緊張,只要分配機制相對透明、參與門檻低,仍能實現較廣覆蓋,這有助於提升品牌好感度,並為後續商業化轉化積累潛在使用者池。張毅表示,此次活動後續的使用者轉化效果,很大程度上取決於阿里自身的基礎設施佈局。其技術營運能力、算力儲備以及外賣、配送等線下履約能力,將直接影響活動落地的最終成效。▍閒魚商家做起拉新買賣 新一輪紅包戰役將開啟據悉,免單卡的有效期已延長至2月28日。千問方面表示,使用者可先集滿21張免單卡,再進行購物。按照活動規則,每邀請一名新使用者下載千問APP,雙方可各得一張25元免單卡,每人最多可得21張,相當於525塊錢。當日累計成功邀請3位新使用者,則可獲得機會,抽取價值萬元的千問AI生活卡。隨著活動的覆蓋面擴大,不少使用者反映難以找到新使用者進行邀請。“通訊錄都邀請遍了,還有誰是新使用者啊?”一名網友感嘆道。與此同時,二手交易平台上出現了針對千問APP的“付費拉新”服務。“千問新使用者邀請,1元一個。”一位閒魚商家在商品描述中寫道。記者瀏覽發現,千問新人帳號的“助力”價格多在1至3元之間。根據活動安排,千問後續將加入紅包大戰。從2月13日開始,使用者可領取現金紅包,最高可得2888元。值得一提的是,字節也將在同日晚8點啟動現金紅包抽獎活動。這預示著,網際網路大廠之間的新一輪春節行銷比拚,即將拉開帷幕。 (財聯社AI daily)
燒掉300億後,阿里又新開戰場
外賣大戰沒有絕對贏家今年夏天的外賣補貼大戰,彷彿一瞬間把我們帶回了十年前的網際網路各種補貼大戰,不用再做複雜算術題,只要會點外賣就能享受優惠。相信大部分人或多或少都享受到了外賣優惠甚至免單,但我們吃爽了,幾家平台卻“虧爽了”,虧得最少的京東也付出了三季度虧損150億左右的代價。那麼網際網路巨頭們為何又捲出重來盯上“你手中的外賣”呢?因為“外賣真香”,外賣是苦生意,外賣成本高利潤薄,這些他們都知道。但是外賣業務卻是難以放棄的陣地,因為做閃購零售業務必須要做高頻業務來帶動,而外賣就是最好的切入點,沒有之一,只有外賣市場擁有新增1億日活訂單的可能。從阿里第三季財報我們可以看出這場“大戰”的必要性,財報顯示,包含即時零售在內,整個中國電商集團的EBITA同比減少了約338億元,主要由於“對即時零售、使用者體驗以及科技的投入所致”。本季度阿里現金流淨額為100.99億元,相比同期下降約68%,自由現金流從2024年同期淨流入137.35億元,變為淨流出218.40億元,主要因為“對即時零售的投入以及雲基礎設施支出增加”。財通證券、高盛對即時零售虧損的預估均為360億元,多家主流分析師認為在350億元左右。虧損確實不少,但是從流量入口的來算帳的話還是可以的,淘寶閃購日均訂單突破了8000萬單;淘寶APP日活使用者達4.4億(據QuestMobile資料),月活使用者首次突破10億,月度交易買家數達3億,相比4月提升200%。據蔣凡透露,10月以來,淘寶閃購的每單虧損較7、8月降低一半。淘寶閃購在第一階段完成了規模的快速擴張,第二階段的經濟效益最佳化符合預期,這為外賣業務長期可持續發展奠定了基礎,也增加了在即時零售長期投入的信心。不誇張的說,即時零售,100天閃電戰,一度追平友商單量規模。這一戰,讓阿里整合淘天、飛豬、餓了麼為阿里巴巴中國電商集團,並進一步演化為大消費平台,在競爭激烈的電商市場,重獲增長,收入增速恢復到15%,遠超拼多多的9%增速。另一方面,看空的聲音還很強,有些還有一定道理。據多家機構評估,Q3中國即時零售市場GTV(交易總額)中,美團與淘寶閃購的比例約為6:4,美團繼續以優勢領跑,在中高客單價市場,美團優勢更為明顯,在實付15元以上訂單的市場份額中佔比超三分之二,實付30元以上訂單的市場份額中佔比超過70%。訂單量上,本季度美團即時零售日均訂單峰值1.5億。從數字對比來看,美團用阿里五分之二的虧損,守住了60%的GTV份額,而且使用者與商戶生態未受衝擊,核心使用者還能持續拉新。客觀來說阿里的進攻當然沒有打垮美團,但是美團作為防守方短期內壓力會更大。雖然美團單均虧損只有一塊多,而阿里是三四塊,可以得出美團效率更高的結論。但正因為美團在市場中佔據接近六成的恐怖市場份額,會導致美團的總量虧損一定是更驚人的,線下履約鏈條是複雜且標準化程度相對較低的,每一單的虧損帶來的鏈條虧損一定是更多的。美團的護城河還在,但已經沒有那麼強了。相比之下,市場更注意的是美團護城河被侵蝕後能不能恢復。有美團人士對媒體表示,原來美團對戰爭很自信,但現在美團也不確定護城河能不能夠恢復,因為這是一個跟阿里長期博弈的過程。對阿里來說流量入口之戰已經迫在眉睫,阿里如果不做,市場份額會被美團、抖音、京東不斷地蠶食,這件事看似是進攻,其實也是在防守。Q3財報會議上阿里高管,已經將即時零售的重點放在最佳化投入結構、減少虧損上——本財季,是淘寶閃購投入的高點,整體投入會在下個季度出現“顯著收縮”。被問到"對消費者端的補貼是否維持原有強度"的時候,吳泳銘沒有直接回答,而是將話題多次轉向“客單價的上漲”,“改變我們的補貼方式”。但對阿里來說最好的流量入口真的只有外賣嗎?筆者覺得不一定,AI或許是更大更有前景的流量入口,且阿里已經拿到了一些入場券,有並不輸於同行的表現。阿里仍在加碼AI總的來看,市場目前最關心的還是AI驅動的雲端運算增長。對於外賣大戰是否能在長期拉動淘寶天貓的增長,資本市場半信半疑,尚未形成一致意見。高盛表示,市場低估了阿里雲在國際雲領域的增長潛力,以及國際雲的收入還要給獨立的雲估值,所以阿里的敘事非常吸引外資,尤其是在近期看到Google用TPU訓練出最好的Gemini 3模型後,阿里的敘事幾乎是一模一樣。從基礎設施到基礎模型,再到終端市場應用,正為阿里現有業務開闢增量增長空間與盈利機遇。阿里的財報足以證明高盛所言非虛,阿里在財報裡表示,旺盛的AI需求推動雲智能集團收入進一步加速,季度收入同比增長34%,其中AI相關產品收入連續9個季度實現3位數增長。阿里Qwen3-Max在多項專項測試中躋身全球第一梯隊,性能超越GPT-5、Claude Opus 4等國際頂級模型。據Omdia報告,2025年上半年,阿里雲在中國AI雲市場份額達35.8%,超過第二至第四名總和。在企業級市場,阿里雲的AI能力正被越來越多全球頭部客戶認可,NBA、萬豪、中國銀聯、博世等企業近期均與阿里雲達成AI合作。不難看出阿里在AI全產業鏈確定性很高的。尤其是從供給側來看,當前全球AI伺服器產業鏈各環節——從半導體製造廠、儲存器廠商到CPU供應商——自今年下半年起普遍缺貨,擴產周期至少需要兩三年。阿里最新的PPU晶片在關鍵參數上已經達到了輝達特供版H20的水平,在推理場景和雲服務協同方面具備優勢,其相容輝達CUDA生態對開發者較為友好。所以阿里在當前就會變得“比較搶手”,阿里可能是為數不多能夠對外提供高品質AI全端算力服務的企業。從市場角度來說,目前分析師都在關注,AI資本開支是否足夠,模型能力是否領先,沒有足夠的資金就不足以長期留在牌桌上。過去四個季度,阿里資本開支已達1200億元。對此,阿里巴巴CFO徐宏在財報電話會上明示:當前AI需求旺盛,未來不排除會根據需求再增加投入,“3800億元這個數還是提少了”。那麼阿里憑什麼這麼有信心呢?除了AI雲業務之外,阿里還有什麼大招呢?千問打開C端流量入口11月17日,阿里正式推出“千問”APP公測版,背靠其開源模型Qwen3,並同步宣佈國際版即將上線。事實上,把“千問”端上C端舞台,阿里有十六年連續投入與路徑累積。從2009年阿里雲成立,到達摩院設立、再到近年來在大模型領域的密集技術突破,阿里掌握“模型+算力+生態”三條命脈。技術層面,Qwen系列從0.5B到480B參數的全尺寸佈局、以及覆蓋文字、圖像、語音、視訊等全模態開源矩陣,使得阿里能把底層能力無縫派生到行業場景與終端應用。阿里不一定實現GoogleAI晶片的故事,但阿里的故事一定是基於自身特點生長出來的能力。11月初,香港大學商學院的講台上,阿里巴巴集團主席蔡崇信就給出了答案:AI 競賽的贏家,不是誰的模型最好,而是誰能讓更多人用起來。蔡崇信在對談中明確表示:阿里不靠模型賺錢,靠的是雲基礎設施變現。在很多人眼裡,阿里開源 Qwen 是一種公益性質的技術分享。但在阿里內部,它被視為撬動雲服務增長的一種必要決策。Qwen已經殺入了矽谷市場。Airbnb CEO布萊恩·切斯基公開表示,公司正“大量依賴Qwen”,因其比OpenAI模型更快更好。輝達CEO黃仁勳表示,Qwen已佔據全球開源模型的大部分市場,並在持續擴大份額。阿里開放原始碼的模型Qwen正在成為矽谷的根基。過去存在對於阿里系應用的刻板印象,那就是工具屬性強,用完即走,其使用者留存和流量成本也高,所以阿里是幾家大廠“流量飢渴”最嚴重的。但千問或許可以打破這個魔咒,千問App公測一周下載量突破1000萬次。千萬量級是AI產品的重要門檻,ChatGPT實現這一目標用了40天,DeepSeek用時20天,而千問僅用一周,刷新了紀錄。在傳統應用模式中,使用者需要打開多個App,分別完成介面點選、資訊篩選和格式轉換等步驟。但在千問的體驗中,上述任務可以通過一個復合指令觸發。另外,阿里巴巴正計畫將地圖、外賣、訂票、辦公、學習、購物、健康等各類生活場景接入千問APP,讓千問具備更強大的辦事能力。更重要的是,阿里把這些能力放在自有雲上進行訓練與推理最佳化,構成“訓練端—推理端—應用端”的閉環,這種閉環在落地效率與成本控制上對C端產品而言至關重要。千問助手與其說像APP,不如說正在成為一個作業系統,如果真的能夠成為一個相對完整能力的系統,那麼使用者留存和復購的問題就不再是問題。據《21世紀商業評論》,今年10月,豆包接入抖音商城,正式上線“商品卡”功能。使用者隨便問幾句商品推薦,豆包不僅提供資訊羅列,還附上連結,供點選跳轉到抖音商城。 總之,豆包的成績驗證了AI原生應用從零開始拔高流量,再用流量變現的路徑是可行的。這是阿里在C端的又一次創業,也是阿里擅長的資源創新戰役,過去的阿里雲如此,相信千問也會如此。寫在最後當前AI泡沫論不僅有市場,已經在美股和港股市場產生了一些擾動,但問題的關鍵真的是估值太高泡沫太大了嗎?筆者認為大眾更多的質疑還是在於AI實際產出比,能不能服務我的業務,產出比如何?而在這些方面,是阿里一直重點關注,所以阿里選擇了開放原始碼的路,一條短期在財報上會比較難看,建構AI基礎成本更高的路,但一定是條更踏實的路。 (首席商業評論)
阿里攻勢不減,這一仗是AI to C
將千問定義為“AI時代的未來之戰”,阿里並非一時興起,而是戰略的必然。阿里AI通往未來的野心越來越清晰了。11月13日,阿里巴巴傳聞將秘密啟動“千問”項目,當日股價最高上漲6%。11月17日,“傳言”落地成了現實:阿里巴巴正式官宣“千問”,全力進軍AI to C市場——千問App公測版正式上線,並同步提供網頁和PC版。面向全球市場的千問App國際版也將在近期上線,基於全球性能第一的開源模型Qwen3,以及與各類生活場景生態的結合,與ChatGPT直接對戰。上線首日,有消息稱千問公測便因使用者湧入過載,遭遇流量洪峰,部分服務出現擁堵和中斷。隨後,“阿里巴巴千問崩了”相關話題沖上微博熱搜。對此,阿里千問通過其官方微博回應稱:“我好著呢,狀態良好,歡迎來問。”11月18日,千問App在公測上線次日便迅速衝入蘋果App Store免費應用總榜第四位。市場對千問的熱情,首先源於技術期待。千問底座基於阿里開源模型Qwen3。自2023年全面開源以來,阿里Qwen在技術上全球領先。截至目前,Qwen共計開源模型超300款,覆蓋文字、程式設計、圖像等全模態,下載量突破6億次,衍生模型超17萬個。將千問定義為“AI時代的未來之戰”,阿里並非一時興起,而是戰略的必然。來源:受訪者今年9月的雲棲大會上,吳泳銘宣佈了阿里雲的新定位,要做全球領先的“全端人工智慧服務商”。通義千問希望成為下一代作業系統,阿里雲要成為“超級AI雲”,把Token做成未來的電。吳泳銘還拋出了一個關鍵論斷:“通用人工智慧AGI並非AI發展的終點,而是全新的起點。AI不會止步於AGI,它將邁向超越人類智能、能夠自我迭代進化的超級人工智慧(ASI)。”而通往ASI的第二階段便是“自主行動”,AI不再侷限於語言交流,AI掌握工具使用和程式設計能力以“輔助人”,且具備了在真實世界中行動的能力。這裡面有兩個隱含的重要資訊,一個是“全端”。AI發展至今,已經不是單純技術上的迭代和比拚了,而是一場體系性的革命。這意味著大廠之間的競賽已經不侷限於軟體/硬體、B端/C端的單點突破,而是全鏈條的競爭,任何一個環節的短板都有可能成為制約整體的瓶頸。阿里在模型層上很強,但在與海外ChatGPT、Gemini的全端比拚中,要追求系統上的最優,在C端的佈局不能過於謹慎。另一個重要資訊便是ASI的“自主行動”。不久的未來,AI將重構整個基礎設施、軟體和應用體系,顛覆人機互動的入口。從這個角度來看,千問比拚的也並非單純的C端應用能力,更是下一代的流量入口。AI to C,阿里必須要做,而且必須要贏。而千問,正是目前承載著阿里野心的最佳載體。01 阿里的AI野望目前的千問App幾乎整合了通義系模型的能力,在千問的對話欄中,支援深度思考、AI修圖、翻譯、即時記錄、拍照講題、AI生視訊、PPT創作、AI生圖等多種功能。阿里方面表示,這次發佈的千問App還只是一個初級版本,它不僅“會聊天”,未來還將成為“能辦事”的AI助手。雖然剛剛上線,千問已經展現出了一定的辦事能力。比如,一句指令就能在幾秒鐘完成一份研究報告,並製作成幾十頁的精美PPT。這種產品形態,與全球已擁有8億使用者的ChatGPT有著明顯的相似性。二者均以全場景AI入口為核心定位,通過統一的互動介面,滿足使用者從日常閒聊、知識查詢到複雜任務處理的全維度需求。在當下的全球競爭中,使用者對AI工具的期待已從單點功能轉向全端賦能:一個基礎模型如果只支援文字或者圖像某一個能力,未來空間必然受到制約。但在“模型即產品”的時代邏輯下,C端產品強大與否,更要看底層能力。在這一層面,阿里雲有充足底氣。Qwen下載量超過Llama。來源:受訪者自全面開源以來,阿里Qwen已經超越Llama等模型,成為全球性能最強、應用最廣泛的開源大模型。在AI雲端運算層,阿里巴巴營運著中國第一、全球領先的AI基礎設施和雲端運算網路。三方機構Omdia資料顯示,中國AI雲市場阿里雲佔比35.8%,超過2到4名總和;在已採用生成式AI的財富中國500強中,超53%的企業選擇阿里雲,滲透率位列第一。黃仁勳在2025年GTC大會上的演示,Qwen在全球開源模型中市佔率最高且還在增長。來源:受訪者Qwen還在迅速搶佔矽谷市場。Airbnb CEO布萊恩·切斯基公開表示,公司正“大量依賴Qwen”。輝達CEO黃仁勳也表示過,Qwen已佔據全球開源模型的大部分市場,並在持續擴大份額。近期,阿里發佈的旗艦模型Qwen3-Max,性能超過GPT5、Claude Opus 4等國際競爭者,躋身全球前三。不久前,千問更在與ChatGPT、Gemini、Grok等全球頂級模型PK的實盤投資大賽中斬獲冠軍。對阿里而言,並非此時才開始重視AI C端,而是阿里這一場AI敘事的線索彙集到今天,放大C端戰果的時機剛好成熟。吳泳銘在雲棲大會上的發言佐證了這一點。當各家科技公司還在“通用人工智慧”(AGI)道路上苦苦求索、爭論不休時,吳泳銘已對下一程“超級人工智慧”(ASI)打開暢想,其意在展露阿里對AI長期投入的決心。面向未來,吳泳銘將通往ASI的路徑分為三個階段:第一階段是“智能湧現”,AI通過學習人類知識具備泛化智能,目前通義千問已進入這一階段;第二階段是“自主行動”,AI掌握工具使用和程式設計能力以“輔助人”;第三階段是“自我迭代”,AI通過連接物理世界的全量原始資料實現自學習,最終達成“超越人”。阿里管理層認為,目前大模型的能力已經進入到“輔助人”的Agentic AI時代。C端應用湧現並接入現實場景的時機已到。阿里千問項目的產品經理在接受《晚點LatePost》採訪時提到:當下做C端的時機剛剛好,一方面是模型成熟度,Qwen3-Max整體性能、效果都已經達到全球領先。另外不管是三方生態,還是阿里集團內部,Agent生態都到了更能被模型普遍呼叫、能解決更多問題的階段。儘管現在國內已經有多款大模型產品提供給C端使用者選擇,但在阿里千問項目的產品經理看來,“客觀來說,還處於初級階段,還沒有真正演進到能解決很多實際問題的程度。”02 打造未來的AI生活入口那麼,AI to C為何在今天對阿里變得如此重要?在阿里的生態中,現有最大體量的to C產品無疑是淘寶、支付寶、高德。而下一個時代,流量入口或許將被AI重構。從這個角度思考,就不難理解阿里全力投入AI to C的必要性——這並非單純的C端產品競爭,而是一場事關未來入口的爭奪戰。強大的模型和完整的生活消費生態,構成阿里AI to C的競爭力。阿里方面也表示,千問App的戰略目標是打造未來的AI生活入口,成為阿里全端生態系統的“中樞神經”。比如,在傳統手機OS裡,淘寶找商品、支付寶付錢、飛豬訂酒店,每個步驟都要切換App。未來,千問或將讓使用者無需關心“服務來自那個App”,只需說“規劃周末親子游,訂門票、酒店,用餘額寶支付”,系統便可以在淘寶上比價下單,或自動完成跨平台協同,打破應用壁壘。雲棲大會阿里AI七連發,通義佔據HF全球模型榜單前十中的七席。來源:受訪者阿里的“合力”與“聚焦”的趨勢越來越明顯。今年以來,阿里打破業務類股壁壘,電商、支付、本地生活、雲端運算、健康、文娛等多條業務線,都在圍繞AI進行資源整合與重構。這些線索最終都指向一個“大腦”,那就是千問——或許在未來不久,千問會成為阿里生態內的服務連接器,以及新的高頻流量入口;讓阿里的各個生態協同性更強,將分散的場景需求與業務能力匹配,實現流量的二次啟動。當然,“打通生態”絕非易事,打破部門牆也將是對阿里組織能力的巨大考驗。但今年淘寶閃購和餓了麼、高德等業務的協同作戰、流量互導,實現了單業務線難以達成的增長突破,也激發了阿里內部的戰鬥力和士氣,證明了打破壁壘的可能性。毫無疑問,阿里必須打贏AI to C這場戰役,這不僅關乎搶佔全球AI競爭主導權的當下,更決定了阿里未來在數字生態領域的生死成敗。03 三場硬仗,阿里持續進擊回過頭看,阿里從2月宣佈未來三年投入3800億重注AI,到5月強勢入局即時零售、9月上線高德掃街榜,再到11月上線千問App、全力進軍AI to C,今年阿里多條業務線接連爆發,逐漸匯聚為一股強勁的增長勢頭。在幾場關鍵戰役中,阿里在持續增長的AI需求驅動下,阿里雲收入加速增長至26%,AI相關產品收入連續8個季度實現同比三位數增長。在競爭激烈的即時零售市場,淘寶閃購快速拿下市場份額,日訂單峰值達1.2億單,協同效應更帶動電商MAC(月度活躍消費者數)增長25%。9月高德發佈“掃街榜”,上線僅23天使用者數便突破4億。單一產品的成功或許有偶然,但業務生態的繁榮必然依賴佈局。阿里正在推進的這盤大棋,關鍵在於發揮協同效應——各業務類股深度聯動,帶動公司整體勢能持續回升。更重要的是,在這場關乎未來的AI時代競爭中,人們看到那個敢於破局、持續進擊的阿里又回來了。這也構成阿里未來最堅實的發展底氣。 (中國企業家雜誌)
中國大模型首進全球三甲,阿里扔出技術“核彈”
阿里雲在2025雲棲大會上擲出一枚技術“核彈”,Qwen3-Max以兆參數和36兆訓練token數,在全球AI競賽中重新洗牌。01 阿里Qwen3-Max突破全球AI三強9月24日,阿里巴巴通過“通義千問Qwen”微信公眾號正式宣佈推出Qwen3-Max——該公司迄今為止“規模最大、能力最強的模型”。該模型的預覽版在權威的LMArena文字排行榜上位列全球第三,超越了OpenAI的GPT-5-Chat。Qwen3-Max-Instrurct測評分數這不僅是一次技術迭代,更是中國AI企業首次在通用大模型核心評測中躋身全球頂尖陣營。Qwen3-Max的正式版本在程式碼能力和智能體能力方面進一步提升,在涵蓋知識、推理、程式設計、指令遵循的全面基準測試中均達到業界領先水平。Qwen3-Max作為阿里通義千問家族的旗艦模型,展現了令人矚目的技術規格。模型總參數超過1T(兆),預訓練資料量達到36T tokens。Qwen3-Max-Thinking-Heavy 測評分數這一參數規模使Qwen3-Max穩穩站在全球大模型的第一梯隊。在模型架構上,Qwen3-Max採用了MoE(混合專家)架構。這種設計允許模型根據不同任務啟動不同的專家網路,既保證了模型的能力,又提高了計算效率。與傳統的密集模型相比,MoE架構在大規模擴展時具有明顯優勢。Qwen3-Max還支援1M tokens的上下文長度,這一指標對於處理長文件、複雜程式碼庫和延展對話至關重要。超長上下文支援意味著模型可以理解和處理更為複雜的資訊結構,為高級推理任務奠定基礎。在訓練效率方面,Qwen3-Max實現了30%的MFU(模型浮點運算利用率)提升,表明阿里在訓練超大規模模型方面已經積累了深厚的技術經驗。02 性能表現 全面超越國際頂尖模型的實測資料Qwen3-Max在多項國際權威基準測試中展現出卓越實力。在專注於解決現實程式設計挑戰的SWE-Bench Verified測試中,Qwen3-Max-Instruct版本取得了69.6分的優異成績,穩居全球第一梯隊。在評估智能體工具呼叫能力的Tau2-Bench測試中,Qwen3-Max更是實現了突破性表現,以74.8分超越Claude Opus 4與DeepSeek-V3.1。數學推理能力上,Qwen3-Max的推理增強版本Qwen3-Max-Thinking展現出非凡性能,在AIME 25和HMMT等高難度數學推理測試中均取得滿分100分的成績,這是國內大模型首次在此類測試中獲得滿分。該模型在解數學題時懂得調動工具,能夠寫程式碼做題,同時增加測試時的計算資源也讓模型表現進一步提升。在涵蓋知識、推理、程式設計、指令遵循、人類偏好對齊、智能體任務和多語言理解的全面基準測試中,Qwen3-Max-Instruct版本均達到業界領先水平,展現出全面而均衡的能力圖譜。03 戰略意義 中國大模型技術的里程碑突破Qwen3-Max的發佈標誌著中國在大模型領域正式躋身全球第一梯隊。這一成就對國內AI產業發展具有深遠戰略意義。大模型預訓練的Scaling Law(規模化法則)認為,持續增長資料和參數規模是通向AGI的可能路徑之一。面對自然資料數量有限的挑戰,有學者認為預訓練的Scaling Law即將逼近上限,但Qwen3-Max的性能突破顯示,繼續增巨量資料、模型參數,依然能鍛造出更強的模型。阿里雲已建構起從0.5B到超兆參數的全尺寸模型覆蓋,包含三百多個大模型,可滿足不同場景的需求。這種全端式佈局為AI技術在各行業的應用落地奠定了堅實基礎。Qwen3-Max的成功驗證了“算力投入—模型提升—應用落地”的正向閉環模式,預計將推動國內AI產業在2025年第四季度迎來應用商業化的加速期。Qwen3-Max的發佈不僅代表技術突破,更具有深遠的產業影響。阿里巴巴集團CEO吳泳銘在雲棲大會上表示,大模型是下一代作業系統,而AI雲是下一代電腦。公司計畫三年內投入超過3800億元用於AI模型與基礎設施建設,彰顯了對AI技術的長期承諾。資本市場對這一突破反應積極。模型發佈當日,阿里巴巴港股漲幅擴大至逾4.5%,創近4年來新高;美股夜盤漲超5%。值得注意的是,美國"女股神"凱西·伍德(Cathie Wood)重新開倉買入阿里巴巴股份,為四年來首次,顯示國際資本對中國AI技術的認可。04 全球競爭格局的重塑Qwen3-Max的成功標誌著全球AI競爭格局正在重塑。當前LMArena排行榜前三名分別是Google的Gemini-2.5-Pro、Anthropic的Claude-Opus-4.1和OpenAI的GPT-O3。Qwen3-Max的崛起使中國首次在頂級大模型競爭中躋身第一梯隊,改變了由美國科技巨頭主導的競爭格局。從技術路線來看,Qwen3-Max採用了與GPT-5-Chat不同的發展路徑。GPT-5-Chat是OpenAI專門為企業級對話設計的獨立模型,支援多模態輸入、上下文感知和自然語言理解。而Qwen3-Max更注重通用能力與專業能力的平衡,在保持強大對話能力的同時,在程式碼生成、邏輯推理等專業領域表現突出。隨著Qwen3-Max-Thinking推理版本的正式發佈臨近,阿里雲有望在高端企業市場與國際廠商展開直接競爭,重塑全球AI大模型市場格局。05 編輯點評 從追隨者到規則制定者Qwen3-Max的里程碑意義遠超技術本身:它標誌著中國大模型首次在核心能力標準(程式設計、數學、工具呼叫)上主導話語權。當GPT-5因忽視使用者體驗跌落神壇,阿里以“頂級性能+場景深耕”的組合拳打開新局。隨著Thinking版本即將發佈,中國AI的“算力投入—模型提升—應用落地”閉環正加速形成——大模型的競爭,終於迎來東方時間。 (壹零社)
阿里一夜扔出三個開源王炸!猛刷32項開源SOTA
阿里持續發力多模態大模型。智東西9月23日消息,深夜,阿里通義大模型團隊連放三個大招:開源原生全模態大模型Qwen3-Omni、語音生成模型Qwen3-TTS、圖像編輯模型Qwen-Image-Edit-2509更新。Qwen3-Omni能無縫處理文字、圖像、音訊和視訊等多種輸入形式,並通過即時流式響應同時生成文字與自然語音輸出。其在36項音訊及音視訊基準測試中斬獲32項開源SOTA與22項總體SOTA,超越Gemini-2.5-Pro、Seed-ASR、GPT-4o-Transcribe等閉源強模型,同時其圖像和文字性能也在同尺寸模型中達到SOTA水平。Qwen3-TTS支援17種音色與10種語言,在語音穩定性與音色相似度評估中超越SeedTTS、GPT-4o-Audio-Preview等主流產品。Qwen-Image-Edit-2509的首要更新是支援多圖編輯,可以拼接不同圖片中的人物+人物、人物+物體等。▲阿里開源首頁阿里開源了Qwen3-Omni-30B-A3B-Instruct(指令跟隨)、Qwen3-Omni-30B-A3B-Thinking(推理)和通用音訊字幕器Qwen3-Omni-30B-A3B-Captioner。Hugging Face開源地址:https://huggingface.co/QwenGitHub開源地址:https://github.com/QwenLM/Qwen3-Omni01. 支援119種語言互動能隨意定製、修改人設在通義千問國際版網站上,只需點選輸入框右下角,即可喚起視訊通話功能。目前該功能仍處於Beta測試階段。我們在實際測試中發現,網頁端的視訊互動體驗尚不穩定,因此轉而使用通義千問國際版App進行進一步體驗。在App中,Qwen-Omni-Flash的視訊響應延遲較低,幾乎達到無感水平,接近真人面對面交流的流暢度。Qwen-Omni-Flash具備良好的世界知識儲備,我們通過識別啤酒品牌、植物等畫面進行測試,模型均能給出精準回答。官方部落格提到,Qwen3-Omni支援119種文字語言互動、19種語音理解語言與10種語音生成語言,延遲方面純模型端到端音訊對話延遲低至211ms,視訊對話延遲低至507ms,還能支援30分鐘音訊理解。但在實際使用中,當模型輸出英語、西班牙語等外語時,仍可察覺其發音帶有明顯的普通話語調特徵,不夠自然地道。而在粵語互動場景下,Qwen-Omni-Flash仍會不時夾雜普通話詞彙,一定程度上影響了對話的沉浸感。官方演示的幾個Demo中,展示了西班牙語、法語、日語的互動效果。該模型可以分析義大利餐廳的菜單,然後用法語為朋友推薦義大利面,其回覆提到了經典的義大利面,並結合菜單的說明進行了簡要介紹。Qwen3-Omni還能查看網站內容,為使用者總結這是巴塞隆納畢加索博物館的官方網站,提到五座建築以及相關街道的歷史背景等。日語交流場景中,模型可以分析視訊中人物所處的環境,以及他們交流的內容是什麼。Qwen3-Omni支援system prompt隨意定製,可以修改回覆風格、人設等。演示中,模型扮演的角色是廣東幼兒園老師,通過模型的特點總結圖為小朋友講解Qwen3-Omni,其涵蓋了圖片中模型的四個特點,還用了小朋友更容易理解的比喻。多人互動場景中,Qwen3-Omni也能分析人物的性別、說話的語氣、內容等。例如下面這段談話中,既有說四川話的女生邀請朋友來玩,還有說普通話的男生失戀了,以及另外的男生被偷狗等不同事件,Qwen3-Omni被問到那個女生說的什麼方言、說了什麼,其問答分析出了是四川話,進行了自我介紹、發出邀請、讚美家鄉。讓模型分析視訊中那個人最開心,Qwen3-Omni認為是最後一個說話的小王,重點分析了他的語氣和豎大拇指的動作。此外,Qwen3-Omni還支援分析音樂風格、元素,以及對視訊中畫面進行推理,如當其分析出視訊中的使用者是在解數學題,還會對這道題進行解答。02. 22項測試達SOTA預訓練不降智Qwen3-Omni在全方位性能評估中,單模態任務表現與參數規模相當的Qwen系列單模態模型持平,在音訊任務中表現更好。該模型在36項音視訊基準測試中,32項取得開源領域最佳性能,22項達到SOTA水平,性能超越Gemini-2.5-Pro、Seed-ASR、GPT-4o-Transcribe等閉源模型,在語音識別與指令跟隨任務中達到Gemini-2.5-Pro相同水平。其部落格提到,Qwen3-Omni採用Thinker-Talker架構,Thinker負責文字生成、Talker專注於流式語音Token生成,直接接收來自Thinker的高層語義表徵。為實現超低延遲流式生成,Talker通過自回歸方式預測多碼本序列:在每一步解碼中,MTP模組輸出當前幀的殘差碼本,隨後Code2Wav合成對應波形,實現逐幀流式生成。其創新架構設計的要點包括,音訊編碼器採用了基於2000萬小時音訊資料訓練的AuT模型,具備通用音訊表徵能力;Thinker與Talker均採用MoE架構,支援高並行與快速推理。同時,研究人員在文字預訓練早期混合單模態與跨模態資料,可實現各模態混訓性能相比純單模態訓練性能不下降,同時顯著增強跨模態能力。AuT、Thinker、Talker+Code2wav採用全流程全流式,支援首幀Token直接流式解碼為音訊輸出。此外,Qwen3-Omni支援function call,實現與外部工具/服務的高效整合。03. 發佈文字轉語音模型多項基準測試達SOTA阿里通義還發佈了文字轉語音模型Qwen3-TTS-Flash。其主要特點包括:中英穩定性:Qwen3-TTS-Flash的中英穩定性在seed-tts-eval test set上,取得了SOTA的表現,超越SeedTTS、MiniMax、GPT-4o-Audio-Preview;多語言穩定性和音色相似度上,Qwen3-TTS-Flash在MiniMax TTS multilingual test set上,WER在中文、英文、義大利語、法語達到SOTA,顯著低於MiniMax、ElevenLabs、GPT-4o-Audio-Preview,英文、義大利語、法語的說話人相似度顯著超越MiniMax、ElevenLabs、GPT-4o-Audio-Preview。高表現力:Qwen3-TTS-Flash具備高表現力的擬人音色,能夠穩定、可靠地輸出高度遵循輸入文字的音訊。豐富的音色和語種:Qwen3-TTS-Flash提供17種音色選擇,每一種音色均支援10種語言。多方言支援:Qwen3-TTS-Flash支援方言生成,包括普通話、閩南語、吳語、粵語、四川話、北京話、南京話、天津話和陝西話。語氣適應:經過海量資料訓練,Qwen3-TTS-Flash能夠根據輸入文字自動調節語氣。高魯棒性:Qwen3-TTS-Flash能夠自動處理複雜文字,抽取關鍵資訊,對複雜和多樣化的文字格式具有很強的魯棒性。快速生成:Qwen3-TTS-Flash具有極低首包延遲,單並行首包模型延遲低至97ms。在具體性能方面,在MiniMax TTS multilingual test set上,Qwen3-TTS-Flash在中文、英文、義大利語和法語的WER均達到了SOTA,顯著低於MiniMax、ElevenLabs和GPT-4o-Audio-Preview。在說話人相似度方面,Qwen3-TTS-Flash在英文、義大利語和法語均超過了上述模型,在多語言的語音穩定性和音色相似度上展現出了卓越的表現。研究人員引入了多項架構升級和加速策略,使得模型實現更低的首包延遲和更快的生成速度。04. 圖像編輯模型更新支援多圖編輯阿里此次還推出了圖像編輯模型Qwen-Image-Edit-2509的月度迭代版本。相比於8月發佈的Qwen-Image-Edit,Qwen-Image-Edit-2509的主要特性包括:多圖編輯支援:對於多圖輸入,Qwen-Image-Edit-2509基於Qwen-Image-Edit結構,通過拼接方式進一步訓練,從而提供“人物+人物”、“人物+商品”,“人物+場景”等多種玩法。單圖一致性增強:對於單圖輸入,Qwen-Image-Edit-2509提高了一致性,主要體現在以下方面:人物編輯一致性增強,包括增強人臉ID保持,支援各種形象照片、姿勢變換;商品編輯一致性增強,包括增強商品ID保持,支援商品海報編輯;文字編輯一致性增強,除了支援文字內容修改外,還支援多種文字的字型、色彩、材質編輯。原生支援ControlNet,包括深度圖、邊緣圖、關鍵點圖等。05. 結語:多模態賽道發力!阿里通義家族模型加速擴員此次三大模型的新進展進一步強化了通義在多模態生成領域的競爭力,其中Qwen3-TTS-Flash在多說話人能力、多語言支援、多方言適配以及文字處理魯棒性等方面實現了性能突破,且與Qwen3-Omni結合實現了大模型語音表現的更新。阿里通義大模型的團隊在部落格中提到,對於Qwen3-Omni未來他們將沿多個技術方向持續推進模型升級,包括多說話人ASR、視訊OCR、音視訊主動學習等核心能力建設,並強化基於智能體的工作流與函數呼叫支援。阿里在多模態大模型領域持續發力,且部分性能全面超越競品,未來或許能在更多實際應用場景中推動落地。 (智東西)