千問3.5"以小勝大"背後,是全新架構的效率代際躍遷
"源神"啟動!
阿里巴巴正式開源Qwen3.5-Plus,性能指標直接對標Gemini 3 pro與GPT 5.2等頂級閉源模型。千問團隊憑藉這一代際跨越,坐上全球最強開源模型交椅。
核心突破在架構。
397B總參數,推理時僅啟動17B,這種精巧設計讓其全面超越上代兆參數的Qwen3 Max,部署視訊記憶體佔用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍,速度也更快了。
過去束縛大模型商業化的算力瓶頸被打破。
支撐點是阿里長期堅持的基礎技術創新。研發團隊深度應用混合專家架構,拋棄簡單參數堆砌。預訓練階段採用統一架構同時處理多模態資料,建構出同等性能等級中參數量最小的模型底座。
但千問3.5隻是開始。
這次發佈揭開了阿里多模態戰略佈局的一角,千問研發團隊正在探索文字、視覺、語音與操作反饋的全模態融合,這條大一統架構路徑,指向通用人工智慧(AGI)。
科技估值體系、企業AI應用滲透率、開源生態話語權,都將在此刻重新定義。
參數規模曾被視為提升智能的唯一路徑。千問3.5用資料終結了這一迷信。
更精簡的模型實現了更強性能,同時帶來顛覆性定價。Qwen3.5 Plus的API價格降至0.8元/百萬Token,同等性能下僅為Gemini 3 pro的十八分之一。頂級AI能力跳出了高算力、高成本的閉環。
個人開發者、初創團隊、中小企業都能以極低門檻獲取世界級智能基礎設施,AI向下滲透的管道被打通。
性價比背後是模型基礎能力的全面升級。
千問3.5具備真正的跨模態理解能力,標誌著千問系列從語言模型進化為原生多模態大模型。
行業內多數"多模態"方案仍停留在工程拼裝:先訓練語言模型,再外掛視覺或音訊模組,各模組通過適配層勉強對齊。有些產品只是在統一入口後用路由分發任務給不同單模態模型。這類方案能應對基礎任務,但無法實現真正的多模態融合,甚至會出現視覺能力增強、語言能力下降的降智現象。
Qwen3.5走了另一條路。
從預訓練第一天起,模型就在文字與視覺混合資料中聯合學習。視覺與語言在統一參數空間內深度交織。模型看到圖像能理解深層語義,讀到文字能在神經網路中建構對應畫面。
中間翻譯環節被抹除,資訊折損降到最低,千問具備了人類等級的跨模態理解力。
這種原生融合帶來了寬廣的能力邊界。
細粒度視覺定位能做到像素級精度,長時序理解長達2小時視訊內容的演變過程與內在因果關聯,跨模態生成,能把手繪草圖輕鬆轉化為可運行的前端程式碼。
模型進化真正意義上重構了工作流。
千問3.5可以作為視覺智能體,自主操控手機與電腦系統,跨多個應用完成複雜多步驟指令。
從模式識別到跨模態邏輯推理,Qwen3.5推動大模型從文字工具進化為理解現實世界的基座,為更自然的多模態生成與複雜推理打下技術基礎。
過去兩年,大模型行業陷入算力競賽。參數從千億堆到兆,性能緩慢爬升,成本指數級膨脹。
企業部署需要昂貴GPU叢集,日常推理燒錢,中小企業付不起帳單,端側裝置跑不動模型,技術越強大,落地越困難。
Qwen3.5顛覆了這條路徑。
競爭重點從"誰的參數更多"轉向"誰的模型更聰明",用更小規模通過技術創新獲取超越規模的智能。
這不是偶然,是阿里大模型團隊多年技術積累的集中兌現。四項核心突破共同驅動了這場代際躍遷。
第一,混合注意力機制。
傳統模型處理長文字時,每個Token都要與所有歷史上下文做全量計算,算力消耗呈平方級增長。Qwen3.5讓模型學會有詳有略地閱讀——動態分配注意力資源,略讀無關資訊,精讀關鍵節點。效率與精度雙重提升。
第二,極致稀疏的混合專家架構。
傳統稠密模型每次推理都要啟動全部參數,規模越大開銷越高。Qwen3.5將397B參數庫中與任務最相關的專家子網路精準啟動,每次推理僅用17B參數——用不到5%的算力調動全域知識儲備。
第三,原生多Token預測。
模型不再一個字一個字輸出。預訓練階段就學會了對後續多個Token進行前瞻性聯合預測。在長文生成、程式碼補全、多輪對話等場景中,推理速度接近翻倍。
第四,系統級訓練穩定性最佳化。
通義團隊獲NeurIPS 2025最佳論文的注意力門控機制是關鍵。
在Transformer注意力輸出端嵌入基於Sigmoid的智能開關,防止稀疏資訊被噪聲淹沒,抑制無效擾動放大。這削弱了注意力下沉負面效應,消除了對特定位置編碼的過度依賴,長上下文泛化能力質變。配合歸一化策略與專家路由初始化,新架構在大規模訓練中表現穩健。
四項技術疊加帶來化學反應:訓練成本降90%,相比Qwen3 Max視訊記憶體佔用降60%,推理吞吐量最高提升19倍。原生多模態融合使訓練提速10%、啟動記憶體減少50%。大規模強化學習框架讓智能體訓練效率提升3到5倍。
當其他廠商還在跑分榜上爭論小數點,Qwen3.5已經降維打擊,競爭維度變成了誰的模型更好用、更實用、讓更多的企業毫無壓力地用得起。
在電話會中,皮查伊正式確認了外界猜測已久的傳聞——Google與蘋果達成深度合作。這不僅穩固了Google在iOS生態中的地位,更可能成為其AI模型分發的關鍵管道。
卓越模型如果脫離生態與基礎設施,只能是實驗室展品。阿里採取雙管齊下戰略:研發端高頻推出SOTA級模型,生態端堅持開源,讓頂尖模型免費可得。
千問產品矩陣覆蓋從輕量端側到千億旗艦,全線遵循Apache 2.0協議完全開放。這將核心技術直接推向全球數千萬開發者,千問迅速成為最受歡迎的開源大模型。
開源資料顯示優勢明顯。千問官方開源模型超400個,全球開發者衍生的微調與垂直定製模型突破20萬個,總下載量超10億次,在熱度、活躍度與生態廣度上全面超越Meta的Llama生態。
李飛飛團隊、愛彼迎等頂尖力量已將千問深度嵌入其AI引擎。當開源模型在邏輯推理與跨模態理解上追平甚至超越頂級閉源模型時,免費且最強成為開發者無法拒絕的選項。競爭主軸從單點跑分轉向生態系統的整體替代。
企業端市場,阿里雲與平頭哥構築了技術護城河。
平頭哥真武晶片針對MoE混合專家架構做了底層指令級最佳化,這種軟硬體深度耦合實現了模型演算法、晶片與雲網路的協同效能爆發。
真武晶片對路由分發機製做硬體級加速,滿足千問大模型對大規模稀疏計算的需求。軟硬協同釋放了晶片算力潛能,資料中心叢集效率大幅提升,企業微調訓練與高並行推理時間被壓縮,這是API價格降至0.8元/百萬Token的底氣。
軟硬協同與開源生態反哺推動阿里雲進入新增長期。
Omdia《中國AI雲市場,1H25》報告顯示,2025年上半年中國AI雲市場規模達223億元,阿里雲以35.8%市場佔比排名第一,超過第二至第四名總和。
Omdia預測2025-2030年中國AI雲市場復合年增長率為26.8%,其中MaaS層增速最快,複合增長率超72%,2030年將達177億元規模,2025年阿里雲在中國雲市場份額從33%升至36%,優勢持續擴大。
財務資料印證這一趨勢。
近期財報顯示,阿里雲公共雲收入同比增長34%,AI相關產品收入連續9個季度保持三位數增長。
資本市場對中國科技資產的舊有低估偏見正在被徹底拋棄,全球資金對中國科技股的定價邏輯正經歷著重塑。
縱觀科技產業史,真正定義時代的往往不是最貴的閉源產品,而是被最多人使用的基礎設施。Linux定義了伺服器時代,Android定義了移動網際網路時代。
開源、免費、無處不在的特質,將使千問成為AI產業默認的底層基石。"powered by 阿里雲"正深深烙印在每個智能應用的程式碼深處,成為這個時代的技術印記。
這次阿里"源神"啟動的是AI產業的範式切換。
千問3.5用技術創新重構行業規則,當最強性能遇見最低成本,AI真正從少數人走向所有人的生產力工具。
這場由阿里雲主導的技術革命,正在重寫全球AI的遊戲規則。 (硬AI)