#Qwen3
自立自強再落一子:中國AI程式設計能力實現重要跨越
在數字經濟時代,高端AI程式設計能力就是數字世界的“工業母機”。它是智能體應用落地、工業軟體開發、產業數位化轉型的核心底座,更是決定一個國家數字產業安全與長期競爭力的關鍵底層技術。長期以來,這一核心領域始終被海外Claude、GPT等主流頂尖模型主導。國產大模型雖歷經多輪迭代追趕,但在複雜工程化程式設計、長程智能體任務等核心實戰場景中,長期處於跟跑狀態。4月2日,中國AI產業迎來了標誌性突破。阿里發佈新一代大語言模型Qwen3.6-Plus。此時距離阿里整合AI核心力量成立ATH事業群,僅過去兩周半。具體來看,千問3.6整體性能較千問3.5進步顯著,並且湧現出極強的智能體程式設計能力,在系列程式設計能力權威評測中,千問3.6程式設計表現超越2倍乃至3倍參數量的GLM-5、Kimi-K2.5等模型,比肩(直逼)全球最強程式設計模型Claude系列。這不是一次普通的企業產品發佈,而是中國科技自立自強在AI核心技術領域落下的關鍵一子。從榜單到實戰,國產模型叩開全球超級陣營大門AI模型的真實實力,從來不由自說自話的行銷定義,而是要經過權威評測的專業驗證、全球開發者的實戰檢驗。據CodeArena全球程式設計模型榜單最新資料,千問3.6-Plus登頂國產最強程式設計模型,綜合性能全球僅次於Claude Opus 4.6,超越OpenAI、Google、xAI等國際巨頭,紙面實力已達到世界領先模型水平。在更細分的專業評測中,Qwen3.6-Plus 在SWE-bench系列真實程式設計任務測試、Terminal-Bench2.0終端程式設計評測、NL2Repo長程程式設計任務測試,以及Claw-Eval、QwenClawBench等真實世界Agent能力評測中,表現可完全匹敵Claude Opus 4.5,整體性能已接近全球頂尖水平。這一系列評測結果的核心意義,不在於一個簡單的排名,而在於它打破了多年來“國產模型在高端程式設計領域只能跟跑”的行業共識:我們終於在數字世界的核心底層技術上,拿出了能和全球領先梯隊正面抗衡的成果。在實戰層面,作為全球最大的AI模型API聚合平台,OpenRouter被業內稱為全球AI模型的“實戰試金石”,平台呼叫量完全由全球開發者基於模型性能、穩定性、性價比自主選擇,是衡量模型真實落地能力的核心風向標。就在剛剛,發佈僅1天的千問新模型Qwen3.6-Plus,以1.4兆Token的日呼叫量沖上OpenRouter的日榜榜首,並打破了該平台的單日單模型呼叫量的全球紀錄,成為當下最受企業和開發者熱捧的大模型之一。據OpenRouter平台公開資料顯示,平台中國開發者佔比僅6.01%,模型的市場表現完全由全球開發者的真實使用需求驅動。值得關注的是,全球開發者的選擇,是對模型能力最客觀的投票。這意味著,不是我們自說自話模型的進步,而是全球最挑剔的技術使用者,已經認可了中國大模型的實戰能力。三次認知破局,走出中國AI自主創新路徑Qwen3.6-Plus的發佈,其核心意義遠不止於單次模型性能的提升,更在於它打破了行業長期存在的三大固有認知,為中國AI產業探索出了一條高效、自主、普惠的創新路徑。它首先打破了“參數越大越厲害”的行業迷信,走出了輕量化高效技術路線。長期以來,海外巨頭主導的AI行業陷入了“堆參數、堆算力”的內卷模式,將參數量作為衡量模型能力的核心標尺。而Qwen3.6-Plus以遠小於競品的參數量,實現了對參數量2-3倍模型的全面超越,用更低的算力消耗、更小的運行成本,交出了對標全球尖端水平的成績單。從產業發展的視角看,這不僅是演算法架構的核心突破,更意味著中國AI企業徹底擺脫了海外模型定下的內卷規則。當全球都在比拚誰的模型更大、誰燒的算力更多時,我們走出了一條更高效、更適合產業落地、更具長期競爭力的技術路徑,這正是中國AI實現彎道超車的核心底氣。它同時打破了“國產模型重跑分、輕實戰”的行業偏見,實現了工程化落地的核心跨越。過去,不少國產模型在標準化榜單中表現亮眼,但在真實開發場景中,面對複雜的倉庫級任務、多步驟長程規劃,往往出現程式碼跑不通、bug無法自主修復、任務理解偏差等問題。而Qwen3.6-Plus真正讓代理式程式設計從概念走向了現實:在前端網頁開發、倉庫級複雜程式碼任務等實測場景中,模型可自主拆解任務、規劃執行路徑、編寫程式碼、測試修復bug,直至全流程閉環完成任務。不僅能實現高品質程式碼修復,更擅長複雜的終端操作與自動化任務執行,在多個高難度長程規劃任務中取得了極優成績。對中國數字產業而言,這種工程化落地能力,遠比榜單上的分數更重要。只有能真正解決真實場景的複雜問題,能真正為產業創造價值,核心技術才不會淪為“花瓶”,才能真正築牢我們數字經濟的底層根基。它更打破了高端程式設計能力的高門檻壁壘,實現了尖端技術的普惠落地。程式設計能力的核心價值,不止於服務專業開發者,更在於讓普通人也能享受到數位技術的紅利。普通人只需一句簡單的自然語言指令,就能調動模型完成任務拆解、智能體系統編排,實現專業程式設計師數小時乃至數天才能完成的程式設計效果。最關鍵的是,Qwen3.6-Plus每百萬Tokens輸入最低僅2元人民幣,以極具競爭力的定價打破了海外巨頭的高端溢價格局。技術的終極價值,在於普惠。當頂尖的AI程式設計能力不再是少數企業、少數專業人士的專屬工具,而是能被小微企業、普通開發者低成本使用,它才能真正啟動整個數字產業的創新活力,這正是中國技術不同於海外壟斷巨頭的核心格局。全鏈路協同成型,中國AI進入體系化競爭新周期Qwen3.6-Plus的突破,不是單一企業的單點勝利,而是中國AI產業從單點突圍邁向體系化競爭的重要標誌。它首先補齊了高端智能體程式設計的核心技術短板,加固了數字經濟的安全防線。高端AI程式設計能力,是數字時代所有數字產業的核心底座,小到企業數位化管理系統、網際網路產品,大到工業控制軟體、關鍵領域資訊基礎設施,都離不開底層程式設計能力的支撐。國產模型在這一領域實現自主可控、比肩國際先進水平,意味著中國大幅降低了在數字核心技術上的對外依賴,從底層提升了數字經濟的安全保障能力。更重要的是,它標誌著中國AI的算力—模型—應用全鏈路協同已經成型,正式進入體系化競爭新階段。全球AI競爭的下半場,早已不是單一模型、單一技術的比拚,而是全產業鏈、全生態的體系化對抗。以阿里為代表的中國AI企業,已經建構起了完整的全鏈路生態:底層有自主可控的算力底座,為模型迭代提供穩定支撐。中層有核心模型持續突破,覆蓋多模態、生成式AI、智能體程式設計等核心賽道。上層有豐富的應用矩陣,能快速將模型能力落地到千萬企業和普通使用者手中。這種全鏈路協同的體系化能力,才是中國AI能和全球頂尖巨頭長期同台競技的核心底氣。單點技術的突破或許能帶來一時的熱度,但只有完整的、自主可控的產業生態,才能讓我們在全球科技競爭中站穩腳跟,不被“卡脖子”。與此同時,中國模型正在以普惠價值打破海外技術溢價,為全球AI產業提供了中國方案。長期以來,海外巨頭憑藉技術壟斷,維持著頂尖AI模型的高溢價,讓全球大量中小企業、普通開發者難以享受到技術紅利。而以Qwen3.6-Plus為代表的國產模型,以極高的性價比,為全球開發者提供了對標全球領先水平的全新選擇,正在改變全球AI產業的供給格局,讓更多市場主體用得上、用得起尖端AI技術,為全球AI產業的普惠發展貢獻了中國企業方案。科技自立自強,從來不是一句空洞的口號,而是靠一項項硬核技術突破、一次次向全球頂尖水平的衝鋒,一步一個腳印拼出來、幹出來的。從跟跑到並跑,中國AI在程式設計這一“數字工業母機”領域實現重要跨越,再次印證:在高端科技領域,中國企業完全有能力走出一條自主創新的發展道路,拿出世界一流的技術成果。全球AI競爭的下半場,拼的從來不是參數噱頭、行銷概念,而是實打實的技術實力、產業落地能力與體系化競爭力。從產業規律來看,真正的長期競爭優勢,不在於單一模型的性能參數,而在於能否建構完整的技術生態、能否為開發者和使用者創造持續價值。值得肯定的是,以阿里為代表的中國科技企業,正朝著這一方向穩步前進,紮根真實市場需求,推動技術與產業深度融合,走出了一條自主創新與開放合作平行的發展道路。 (環球時報)
中國最強程式設計模型來了! 阿里Qwen3.6-Plus性能直逼Claude,國產大模型殺入決賽圈
什麼這code那code,先別code了,因為——中國最強程式設計模型來了!就在剛剛,阿里突襲發佈Qwen3.6-Plus新一代基座大模型,在程式設計和智能體能力上,直接捅破了國產大模型的天花板,強到Next Level~那…到底有多Next呢? ?1M上下文直接拉滿,不僅能獨立拆解任務、規劃執行路徑、全程自測迭代達到目標,還能根據簡單提示詞搓出Vibe Coding。這不嘛,前幾天模型的preview版本提前上了OpenRouter,小編也拿到開白資格搶先實測了一番!我只給了AI一句話,幾秒鐘就得到了一個可移縮放的3D的雪山場景多模態網頁,連雪花都是動態飄落的~模型表現歸模型表現,關鍵還是要拉到真實評測中見真章啊!!值得一提的是,在涵蓋智能體程式設計、真實世界任務的權威評測中,Qwen3.6-Plus目前已經成為了最接近全球最強Claude系列的國產模型:(Claude:不er,哥們兒???)專業搞程式碼的大佬們拿到Qwen3.6-Plus更是爽感拉滿,這不嘛,提前體驗過的網友們速速給出反饋了——下面這位大哥直言,速度和生成體驗感比Claude更夯,Opus 4.6你還得加把勁兒啊!更有硬核網友直接開了壓力測試,在5個復合倉庫裡輪番轟炸,得出的結論嘛:甭說別的,這模型是真靠譜~目前,Qwen3.6-Plus已第一時間上線阿里雲百煉,且API服務已全面開放;此外,在悟空、千問APP等阿里AI應用和平台也已同步上線。這下好了,大家可以——直接上手搓搓搓了!!Vibe Coding、多模態理解能力忒夯不知道大家們還記不記得,上個月Qwen3.5剛發佈的時候,全網都在感嘆模型強大的程式設計能力。但老話說得好,一代更比一代強,事實上相較於上一代模型,這次發佈的Qwen3.6-Plus在程式設計Coding能力、智能體Agent能力和工具呼叫能力上直接上演了一場大型的《自己卷自己》的戲碼。(doge)咋個卷法呢?在性能上,Qwen3.6-Plus表現出了比上一代模型更敏銳的理解感知能力和更強大的多模態推理能力。在SWE-bench系列真實程式設計任務測試、考察終端程式設計的Terminal-Bench2、長程程式設計任務NL2Repo,以及Claw-Eval、QwenClawBench等真實世界Agent能力評測中——Qwen3.6-Plus幾乎直逼Claude Opus 4.5,甚至部分性能表現比Claude更優,還超越了2倍乃至3倍參數量的其他主流模型。看來,千問妥妥掌握了「以小勝大」的秘方啊??不僅如此,基於百萬token的上下文窗口。模型還集中對OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode等系列Agent框架進行了最佳化支援。是的,這模型卷的已經不只是模型本體,連整套Agent工作流的適配度都梭哈了…只能說——《夯,極夯》。咱們直接老規矩,圍繞模型擅長的Vibe Coding、多模態理解、問題重構等幾個能力維度上實打實測一波!Vibe Coding能力實測常言道,用程式設計模型必玩Vibe Coding,所以,咱就先來考一考Qwen3.6-Plus在網頁開發上的能力~大家都知道,對AI或者Agent來說,網頁開發其實不是啥難事兒,真正的挑戰在於——只用一句簡單提示詞,就能做出兼具視覺設計、互動邏輯與頁面跳轉的完整頁面,所以咱這次直接把難度抬高。用一句大白話指令,讓AI一鍵生成一個可互動的「AI資訊日曆網站」!幫我生成一個有科技感的AI日曆網站。首頁為月曆檢視,每一天標註對應的AI大事件,使用者點選日期後可進入詳情頁查看完整內容,包括事件標題、一句話簡介、時間和來源連結。大概2分鐘的時間,AI就給我搓出來了個完成度相當高的AI資訊日曆網頁。從前端生成效果來看,整體視覺簡潔而且科技味兒還蠻濃,不僅清晰呈現了日曆結構,還自動對不同資訊做了色彩區分,閱讀體驗十分友好!!!在具體互動能力上,還支援前後月份翻閱查詢,每日日期格子內均標註可點選的資訊入口,點一下就能查看摘要內容。此外,不知道大家發現沒,頁面右側還附帶一個可跳轉連結,一鍵就能跳到原資訊網站,查閱資訊源賊方便:接下來,我們換種玩法,不生成網頁了,改玩點有意思的。挑戰用一句話讓AI幫忙製作一個可互動的色彩度比較鮮明的3D的雪山場景,看看這AI在前端視覺上的表現力咋樣。製作一個3D的雪山場景,雪山中間有一個日式的寺廟,整體風格參考塞爾達曠野之息。先看視覺效果,u1s1確實有點塞爾達那種清新明快畫風的意思,色彩飽和度和光影質感肉眼看都還是蠻舒服的。不僅如此,我還可以靈活拖動視角,360度旋轉場景、用滾輪自由縮放遠近這些都ok,甚至,連雪花粒子都是動態飄落的???我們繼續挑戰,再來實測一些更好玩的場景,這回看看Qwen3.6-Plus的「遊戲網站」搭建能力咋樣~幫我做一個虛擬寵物養成網頁,頁面主體是寵物的房間,使用者可以隨時看到它的狀態,寵物有飢餓、心情、體力和成長值,會隨時間變化,使用者可以在房間裡進行喂食、玩耍、洗澡、睡覺等互動,加入簡單動畫、表情變化、隨機事件和任務系統,完成可獲得金幣購買道具,整體風格可愛~So cute!!瞬間夢迴小時候玩的《皮卡堂》小遊戲~(萌翻了.jpg)從實際效果看,在這個頁面裡我不僅可以查看寵物的動態,寵物還可以跟著我的滑鼠位置進行移動。不僅如此,頁面右側還設有狀態值、互動功能、任務和商店四大類股,我還可以根據寵物狀態進行喂食、玩耍等互動操作。你還真別說,Qwen3.6-Plus在審美和互動設計這塊兒提升不少,確實真·有兩下子…咱們最後再來試一個大家幾乎都玩過的消消樂小遊戲,這次我直接把提示詞寫到簡單不能再簡單:生成一個美食卡通主題的消消樂小遊戲網站。那怕提示詞如此大白話,那怕如此簡單,這輸出效果也確實沒得說。是的,我只用了一句提示詞,Qwen3.6-Plus把核心玩法、連鎖機制、視覺UI、輔助能力這些全cover了…多模態理解能力實測除了強大的Vibe Coding能力外,Qwen3.6-Plus在多模態理解這塊兒也屬實有兩把刷子。具體來說,就是從視覺感知,到多模態推理,再到智能體執行都能hold得住!這次我喂給了模型一段AI資訊類的視訊內容,整個視訊時長說實話還蠻長的,很考驗模型的內容解析能力。我要讓它做的,不單單只是解析視訊核心內容,而是要讓它幫我進行逐秒指令碼分析,並且根據內容二創成一份適合小紅書筆記發的爆款文案,以下是我喂給Qwen3.6-Plus的原視訊:請你幫我解析一下這條視訊內容,做逐秒指令碼拆解,並根據視訊內容二創成一篇適合發小紅書的爆款筆記文案:可以看到,Qwen3.6-Plus不僅給我進行了逐秒的視訊指令碼拆解,而且每一個視角戳裡還幫我貼心地將指令碼從視覺、內容、目的三個維度進行了推理判斷。不僅如此,在下方還按照要求輸出了對應的小紅書爆款文案,並將文案概括成開頭鉤子、核心內容、關鍵發現、引起共鳴幾個維度,666啊~最後的最後,我們再來上點難度,讓Qwen3.6-Plus嘗試根據圖片內容復刻一個線上網頁。這次,我喂給了它一個旅遊規劃的頁面圖片,讓它根據頁面裡的功能,直接復刻並搭建出一個完整的線上網頁——那怕幾乎沒有任何文字的提示詞指令,Qwen3.6-Plus依舊通過多模態能力精準出了圖片的內容,並且嘛——比我圖片裡手畫的頁面佈局效果更好、視覺呈現更牛、內容更充實??更複雜的程式設計場景照樣在行看到這兒估計有朋友該說了,上面這些場景多少有點太簡單了吧。你還真別說,更硬核的程式設計場景這不就來了嘛!事實上,除了能用簡單提示詞實現Vibe Coding、解析並執行多模態內容外,Qwen3.6-Plus還能基於命令列工具生成頁面、進行程式碼問題分析與重構,甚至自主開發工具。在命令列頁面生成能力上,Qwen3.6-Plus支援通過CC等工具直接呼叫API。我們只需輸入 「根據開源倉庫生成landing page」這類簡潔指令,就能快速產出完整網頁,實現高效自動化的前端開發!!話不多說!先給咱們「電子老婆」來個項目官網首頁~這裡說的電子老婆,正是GitHub上的開放原始碼專案AIRI—— 仿照超火虛擬主播Neuro-sama打造,能即時陪聊、陪打遊戲,妥妥全天候線上的電子伴侶(doge)。通過VS Code中的Qwen Code外掛,我讓Qwen3.6-Plus直接讀取開放原始碼專案介紹,自主理解需求、規劃頁面結構,並一次性輸出完整可用的程式碼:(提供項目)根據這個開放原始碼專案生成landing page,輸出HTML+tailwind CSS。從Thinking過程可以清晰地觀察到Qwen3.6-Plus一步步查看需求、建立檔案,整個過程能夠即時監測:Done!耗時約3分鐘,Qwen3.6-Plus就生成好了項目官網頁面,程式碼自動保存在landing-page.html檔案中:咱打開html檔案來看下效果~首先,看上去還蠻符合項目的宣傳邏輯,把臨時體驗頁面、項目開源地址、社區地址全都關聯上了。不僅如此,導覽列還能夠跳轉到對應內容,把項目介紹裡包含的能力、可相容的模型廠商、部署步驟都給概括全了,不戳不戳~接下來,我們來測試模型的「問題分析與程式碼重構」能力。這次我又在Qwen Code命令列工具裡,喂給了Qwen3.6-Plus一坨問題不小的老舊程式碼,讓它捉捉蟲:(提供項目)我剛接手這個項目,該怎麼最佳化呢?Qwen3.6-Plus看懂了原有邏輯,自動整理了一份最佳化清單,但是在動手之前還是詢問了一句「需要開始實施嗎」。比起其他大刀闊斧直接上手的模型來說,這份分寸感把握得還是相當不賴的~下一步,當然就是讓它幫我修改x山程式碼了!!我反手就是一個——這裡一定要說個好玩的,Qwen你的碎碎念也有太活人感了,先給產品經理畫餅,然後去push伺服器,接著又在老闆面前裝!模!作!樣!(還有啥是你做不出來的??)說歸說鬧歸鬧,任務還得按部就班搞下去,修完Bug、再做最佳化,主打一個有條不紊~最佳化完成!人家具體都改了點啥呢——請看下方總結。最後嘛,還來了點小建議,be like:安裝依賴、寫測試指令碼都可以直接交給它來做,我全程省心省力只負責點頭。(美哉美哉~)(Qwen3.6-Plus:俺的程式設計本事,可是不孬!!!)AI程式設計的門檻,這回是真被打下來了說實話,從今年年初開始,我們真的接觸了太多太多的AI Agent和各種Claw字輩兒的龍蝦。此外還有一個大家感知很深的事是,當下廠商們也越來越押注模型的程式設計能力,各種Vibe Coding產品也層出不窮。我自己也在社交軟體上刷到過很多感興趣的項目,點開之前覺得蠻有意思,可一看對方用到的提示詞和輔助工具,我很快就意識到了一個問題。那就是沒點提示詞本事,沒點基礎程式設計能力,想做出和人家同款效果的Vibe Coding產品,真的蠻難的…(哭死…)只能說,大家還是苦Vibe Coding《上手門檻》久矣。△圖片由AI生成這次實測Qwen3.6-Plus下來,除了對於模型在複雜程式碼治理、跨域長程規劃等真實世界的專業程式設計任務的中呈現的過硬能力外,我更大的感受在於——它確確實實把普通人的「程式設計門檻」大幅拉低了。基於自然語言驅動的Vibe Coding不再是概念,只要一句大白話,我們就能把腦子裡的想法直接變成可運行的現實。在過去很長一段時間,行業默認用參數規模來換性能提升,模型越大,效果越好,也越貴。而這一次,Qwen3.6-Plus通過一個體量更輕的模型,交出了可以對標甚至超過2到3倍參數模型的結果,這對我們使用者來說當然是好事情。當然,更進一步從行業角度看,也不難看出Qwen3.6-Plus也正是阿里ATH(Alibaba Token Hub)思路在程式設計模型上一次很有代表性的落地。創造高效Token、輸送低成本Token、應用普惠化Token,在ATH成立後僅一個月的時間,就速速口號照進現實了。最後值得一提的是,Qwen3.6-Plus是千問3.6系列推出的第一個模型。後面千問3.6系列還會開源更多不同尺寸的版本給大家,另外性能更強的旗艦款Qwen3.6-Max也會在近期發佈。大家可以小小期待一下子~ (量子位)
中國最強程式設計模型來了! 阿里Qwen3.6-Plus性能直逼Claude,國產大模型殺入決賽圈
什麼這code那code,先別code了,因為——中國最強程式設計模型來了!就在剛剛,阿里突襲發佈Qwen3.6-Plus新一代基座大模型,在程式設計和智能體能力上,直接捅破了國產大模型的天花板,強到Next Level~那…到底有多Next呢? ?1M上下文直接拉滿,不僅能獨立拆解任務、規劃執行路徑、全程自測迭代達到目標,還能根據簡單提示詞搓出Vibe Coding。這不嘛,前幾天模型的preview版本提前上了OpenRouter,小編也拿到開白資格搶先實測了一番!我只給了AI一句話,幾秒鐘就得到了一個可移縮放的3D的雪山場景多模態網頁,連雪花都是動態飄落的~模型表現歸模型表現,關鍵還是要拉到真實評測中見真章啊!!值得一提的是,在涵蓋智能體程式設計、真實世界任務的權威評測中,Qwen3.6-Plus目前已經成為了最接近全球最強Claude系列的國產模型:(Claude:不er,哥們兒???)專業搞程式碼的大佬們拿到Qwen3.6-Plus更是爽感拉滿,這不嘛,提前體驗過的網友們速速給出反饋了——下面這位大哥直言,速度和生成體驗感比Claude更夯,Opus 4.6你還得加把勁兒啊!更有硬核網友直接開了壓力測試,在5個復合倉庫裡輪番轟炸,得出的結論嘛:甭說別的,這模型是真靠譜~目前,Qwen3.6-Plus已第一時間上線阿里雲百煉,且API服務已全面開放;此外,在悟空、千問APP等阿里AI應用和平台也已同步上線。這下好了,大家可以——直接上手搓搓搓了!!Vibe Coding、多模態理解能力忒夯不知道大家們還記不記得,上個月Qwen3.5剛發佈的時候,全網都在感嘆模型強大的程式設計能力。但老話說得好,一代更比一代強,事實上相較於上一代模型,這次發佈的Qwen3.6-Plus在程式設計Coding能力、智能體Agent能力和工具呼叫能力上直接上演了一場大型的《自己卷自己》的戲碼。(doge)咋個卷法呢?在性能上,Qwen3.6-Plus表現出了比上一代模型更敏銳的理解感知能力和更強大的多模態推理能力。在SWE-bench系列真實程式設計任務測試、考察終端程式設計的Terminal-Bench2、長程程式設計任務NL2Repo,以及Claw-Eval、QwenClawBench等真實世界Agent能力評測中——Qwen3.6-Plus幾乎直逼Claude Opus 4.5,甚至部分性能表現比Claude更優,還超越了2倍乃至3倍參數量的其他主流模型。看來,千問妥妥掌握了「以小勝大」的秘方啊??不僅如此,基於百萬token的上下文窗口。模型還集中對OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode等系列Agent框架進行了最佳化支援。是的,這模型卷的已經不只是模型本體,連整套Agent工作流的適配度都梭哈了…只能說——《夯,極夯》。咱們直接老規矩,圍繞模型擅長的Vibe Coding、多模態理解、問題重構等幾個能力維度上實打實測一波!Vibe Coding能力實測常言道,用程式設計模型必玩Vibe Coding,所以,咱就先來考一考Qwen3.6-Plus在網頁開發上的能力~大家都知道,對AI或者Agent來說,網頁開發其實不是啥難事兒,真正的挑戰在於——只用一句簡單提示詞,就能做出兼具視覺設計、互動邏輯與頁面跳轉的完整頁面,所以咱這次直接把難度抬高。用一句大白話指令,讓AI一鍵生成一個可互動的「AI資訊日曆網站」!幫我生成一個有科技感的AI日曆網站。首頁為月曆檢視,每一天標註對應的AI大事件,使用者點選日期後可進入詳情頁查看完整內容,包括事件標題、一句話簡介、時間和來源連結。從前端生成效果來看,整體視覺簡潔而且科技味兒還蠻濃,不僅清晰呈現了日曆結構,還自動對不同資訊做了色彩區分,閱讀體驗十分友好!!!在具體互動能力上,還支援前後月份翻閱查詢,每日日期格子內均標註可點選的資訊入口,點一下就能查看摘要內容。此外,不知道大家發現沒,頁面右側還附帶一個可跳轉連結,一鍵就能跳到原資訊網站,查閱資訊源賊方便:接下來,我們換種玩法,不生成網頁了,改玩點有意思的。挑戰用一句話讓AI幫忙製作一個可互動的色彩度比較鮮明的3D的雪山場景,看看這AI在前端視覺上的表現力咋樣。製作一個3D的雪山場景,雪山中間有一個日式的寺廟,整體風格參考塞爾達曠野之息。先看視覺效果,u1s1確實有點塞爾達那種清新明快畫風的意思,色彩飽和度和光影質感肉眼看都還是蠻舒服的。不僅如此,我還可以靈活拖動視角,360度旋轉場景、用滾輪自由縮放遠近這些都ok,甚至,連雪花粒子都是動態飄落的???我們繼續挑戰,再來實測一些更好玩的場景,這回看看Qwen3.6-Plus的「遊戲網站」搭建能力咋樣~幫我做一個虛擬寵物養成網頁,頁面主體是寵物的房間,使用者可以隨時看到它的狀態,寵物有飢餓、心情、體力和成長值,會隨時間變化,使用者可以在房間裡進行喂食、玩耍、洗澡、睡覺等互動,加入簡單動畫、表情變化、隨機事件和任務系統,完成可獲得金幣購買道具,整體風格可愛~So cute!!瞬間夢迴小時候玩的《皮卡堂》小遊戲~(萌翻了.jpg)從實際效果看,在這個頁面裡我不僅可以查看寵物的動態,寵物還可以跟著我的滑鼠位置進行移動。不僅如此,頁面右側還設有狀態值、互動功能、任務和商店四大類股,我還可以根據寵物狀態進行喂食、玩耍等互動操作。你還真別說,Qwen3.6-Plus在審美和互動設計這塊兒提升不少,確實真·有兩下子…咱們最後再來試一個大家幾乎都玩過的消消樂小遊戲,這次我直接把提示詞寫到簡單不能再簡單:生成一個美食卡通主題的消消樂小遊戲網站。那怕提示詞如此大白話,那怕如此簡單,這輸出效果也確實沒得說。是的,我只用了一句提示詞,Qwen3.6-Plus把核心玩法、連鎖機制、視覺UI、輔助能力這些全cover了…多模態理解能力實測除了強大的Vibe Coding能力外,Qwen3.6-Plus在多模態理解這塊兒也屬實有兩把刷子。具體來說,就是從視覺感知,到多模態推理,再到智能體執行都能hold得住!這次我喂給了模型一段AI資訊類的視訊內容,整個視訊時長說實話還蠻長的,很考驗模型的內容解析能力。我要讓它做的,不單單只是解析視訊核心內容,而是要讓它幫我進行逐秒指令碼分析,並且根據內容二創成一份適合小紅書筆記發的爆款文案,以下是我喂給Qwen3.6-Plus的原視訊:請你幫我解析一下這條視訊內容,做逐秒指令碼拆解,並根據視訊內容二創成一篇適合發小紅書的爆款筆記文案:可以看到,Qwen3.6-Plus不僅給我進行了逐秒的視訊指令碼拆解,而且每一個視角戳裡還幫我貼心地將指令碼從視覺、內容、目的三個維度進行了推理判斷。不僅如此,在下方還按照要求輸出了對應的小紅書爆款文案,並將文案概括成開頭鉤子、核心內容、關鍵發現、引起共鳴幾個維度,666啊~最後的最後,我們再來上點難度,讓Qwen3.6-Plus嘗試根據圖片內容復刻一個線上網頁。這次,我喂給了它一個旅遊規劃的頁面圖片,讓它根據頁面裡的功能,直接復刻並搭建出一個完整的線上網頁——那怕幾乎沒有任何文字的提示詞指令,Qwen3.6-Plus依舊通過多模態能力精準出了圖片的內容,並且嘛——比我圖片裡手畫的頁面佈局效果更好、視覺呈現更牛、內容更充實??更複雜的程式設計場景照樣在行看到這兒估計有朋友該說了,上面這些場景多少有點太簡單了吧。你還真別說,更硬核的程式設計場景這不就來了嘛!事實上,除了能用簡單提示詞實現Vibe Coding、解析並執行多模態內容外,Qwen3.6-Plus還能基於命令列工具生成頁面、進行程式碼問題分析與重構,甚至自主開發工具。在命令列頁面生成能力上,Qwen3.6-Plus支援通過CC等工具直接呼叫API。我們只需輸入 「根據開源倉庫生成landing page」這類簡潔指令,就能快速產出完整網頁,實現高效自動化的前端開發!!話不多說!先給咱們「電子老婆」來個項目官網首頁~這裡說的電子老婆,正是GitHub上的開放原始碼專案AIRI—— 仿照超火虛擬主播Neuro-sama打造,能即時陪聊、陪打遊戲,妥妥全天候線上的電子伴侶(doge)。通過VS Code中的Qwen Code外掛,我讓Qwen3.6-Plus直接讀取開放原始碼專案介紹,自主理解需求、規劃頁面結構,並一次性輸出完整可用的程式碼:(提供項目)根據這個開放原始碼專案生成landing page,輸出HTML+tailwind CSS。從Thinking過程可以清晰地觀察到Qwen3.6-Plus一步步查看需求、建立檔案,整個過程能夠即時監測:Done!耗時約3分鐘,Qwen3.6-Plus就生成好了項目官網頁面,程式碼自動保存在landing-page.html檔案中:咱打開html檔案來看下效果~首先,看上去還蠻符合項目的宣傳邏輯,把臨時體驗頁面、項目開源地址、社區地址全都關聯上了。不僅如此,導覽列還能夠跳轉到對應內容,把項目介紹裡包含的能力、可相容的模型廠商、部署步驟都給概括全了,不戳不戳~接下來,我們來測試模型的「問題分析與程式碼重構」能力。這次我又在Qwen Code命令列工具裡,喂給了Qwen3.6-Plus一坨問題不小的老舊程式碼,讓它捉捉蟲:(提供項目)我剛接手這個項目,該怎麼最佳化呢?Qwen3.6-Plus看懂了原有邏輯,自動整理了一份最佳化清單,但是在動手之前還是詢問了一句「需要開始實施嗎」。比起其他大刀闊斧直接上手的模型來說,這份分寸感把握得還是相當不賴的~下一步,當然就是讓它幫我修改x山程式碼了!!我反手就是一個——這裡一定要說個好玩的,Qwen你的碎碎念也有太活人感了,先給產品經理畫餅,然後去push伺服器,接著又在老闆面前裝!模!作!樣!(還有啥是你做不出來的??)說歸說鬧歸鬧,任務還得按部就班搞下去,修完Bug、再做最佳化,主打一個有條不紊~最佳化完成!人家具體都改了點啥呢——請看下方總結。最後嘛,還來了點小建議,be like:安裝依賴、寫測試指令碼都可以直接交給它來做,我全程省心省力只負責點頭。(美哉美哉~)(Qwen3.6-Plus:俺的程式設計本事,可是不孬!!!)AI程式設計的門檻,這回是真被打下來了說實話,從今年年初開始,我們真的接觸了太多太多的AI Agent和各種Claw字輩兒的龍蝦。此外還有一個大家感知很深的事是,當下廠商們也越來越押注模型的程式設計能力,各種Vibe Coding產品也層出不窮。我自己也在社交軟體上刷到過很多感興趣的項目,點開之前覺得蠻有意思,可一看對方用到的提示詞和輔助工具,我很快就意識到了一個問題。那就是沒點提示詞本事,沒點基礎程式設計能力,想做出和人家同款效果的Vibe Coding產品,真的蠻難的…(哭死…)只能說,大家還是苦Vibe Coding《上手門檻》久矣。△圖片由AI生成這次實測Qwen3.6-Plus下來,除了對於模型在複雜程式碼治理、跨域長程規劃等真實世界的專業程式設計任務的中呈現的過硬能力外,我更大的感受在於——它確確實實把普通人的「程式設計門檻」大幅拉低了。基於自然語言驅動的Vibe Coding不再是概念,只要一句大白話,我們就能把腦子裡的想法直接變成可運行的現實。在過去很長一段時間,行業默認用參數規模來換性能提升,模型越大,效果越好,也越貴。而這一次,Qwen3.6-Plus通過一個體量更輕的模型,交出了可以對標甚至超過2到3倍參數模型的結果,這對我們使用者來說當然是好事情。當然,更進一步從行業角度看,也不難看出Qwen3.6-Plus也正是阿里ATH(Alibaba Token Hub)思路在程式設計模型上一次很有代表性的落地。創造高效Token、輸送低成本Token、應用普惠化Token,在ATH成立後僅一個月的時間,就速速口號照進現實了。最後值得一提的是,Qwen3.6-Plus是千問3.6系列推出的第一個模型。後面千問3.6系列還會開源更多不同尺寸的版本給大家,另外性能更強的旗艦款Qwen3.6-Max也會在近期發佈。大家可以小小期待一下子~ (量子位)
阿里Qwen3.5馬年首開源!35B性能逆襲235B,給開發者送省錢絕招
千問份額半年翻倍至32.1%,Qwen3.5成新王牌。智東西2月25日報導,今日,阿里推出馬年首批新模型——Qwen3.5中型模型系列,包括推出Qwen3.5-122B-A10B、Qwen3.5-35B-A3B、Qwen3.5-27B(Dense)三款開源模型,同時Qwen3.5-Flash(Qwen3.5-35B-A3B生產版本)API已上線阿里雲百煉。Qwen3.5最新三款中型模型在指令遵循、研究生級推理、哈佛-MIT數學競賽級數學、多語言知識、智能體工具使用等12項能力測評中,在通用推理、數學、智能體、多模態等多個方面,整體表現可與GPT-5 mini、Claude Sonnet 4.5等國際一流模型相媲美。▲Qwen3.5中型模型系列測評情況模型一經發佈在開發者圈引起關注。多位開發者稱這些模型尺寸是本地推理的絕佳選擇,讚歎其“更小模型實現更強性能”,甚至有人稱Qwen3.5-35B-A3B有望將其每月花費從2000歐元(購買Gemini服務)降至50歐元,大大節省成本。▲社交平台X上的網友評論具體來看,其中最受關注的Qwen3.5-35B-A3B,性能已超越參數規模大數倍的Qwen3-235B-A22B-2507和Qwen3-VL-235B-A22B。正如一位海外網友所說:“架構+資料質量>原始參數。我一年來一直這麼說。”▲社交平台X上的網友評論Qwen3.5-122B-A10B和Qwen3.5-27B進一步縮小了中型模型與前沿模型之間的差距,尤其是在複雜智能體場景中表現突出。Qwen3.5-Flash是與35B-A3B版本一致的託管生產版本,主打以較快速度提供強性能,每百萬Token價格低至0.2元,默認支援1M超長上下文長度,滿足長文件與複雜任務處理需求。目前,Qwen Chat上的模型均已更新為Qwen3.5系列,最新四款中型模型也已上線。智東西第一時間對這三款開源模型進行了初步體驗,發現這三款中型模型已能滿足多種日常的多模態理解、知識解答、視覺程式設計等任務,達到匹敵Qwen3-235B-A22B-2507的效果,不過在SVG卡通場景繪製等場景仍有提升空間。▲四款新模型已上線Qwen Chat持續迭代的產品力有望讓阿里千問佔據更大市場。近期,國際市場調研機構沙利文報告顯示,2025年下半年,中國企業級大模型日均呼叫量千問(Qwen)佔比32.1%位列第一,相較上半年的17.7%幾乎翻倍,相比字節豆包(21.3%)、DeepSeek(18.4%)領先優勢擴大。Hugging Face地址:https://huggingface.co/collections/Qwen/qwen35魔搭社區地址:https://modelscope.cn/collections/Qwen/Qwen35體驗地址:https://chat.qwen.ai/01. 實測多模態與知識能力出色小體格程式設計強,SVG生成待提升在智東西的初步體驗中,三款模型在多模態理解和知識能力上都效果不錯。比如當我上傳一張“公雞根雕”的圖片,三款模型都能夠精準識別其為根雕藝術品,能夠根據顏色和紋理精準識別材料為“崖柏”,能結合中國傳統文化解讀這一物件的意義,甚至能基於材質、工藝水平、尺寸大小等因素進行價格評估,評估結果基本符合這一領域的專業水平,令人很驚喜。如下圖所示,Qwen3.5-122B-A10B和Qwen3.5-35B-A3B的輸出答案都基本接近事實,對“這是什麼物件,用的什麼原材料,有什麼寓意,可能值多少錢?”四個問題進行了準確的理解作答。▲Qwen3.5-122B-A10B生成的答案Qwen3.5-27B的輸出內容在形式上更加別出心裁,不僅對幾個問題進行了準確回答,還通過圖表、格式變化等方式,讓內容呈現更加重點分明,並最終給出了“5000-15000元”較為直接可參考的估價,體現了其“工程實用度高”的特點。▲Qwen3.5-27B生成的答案而後智東西著重考察了Qwen3.5-27B(Dense)的程式設計能力,讓其生成一個“虛擬助手個人智能體OpenQwen的官方首頁”,並提出“該助手可輔助程式設計、辦公、購物等各類事務。生成高品質圖片作為網站素材,包含智能體頭像及功能使用場景演示”等特徵。如下圖所示,Qwen3.5-27B能夠比較完整地生成這一網站的頁面,邏輯上基本與提示詞描述契合,展現其以較小參數規模實現了較強視覺程式設計能力的特徵。不過相比Qwen3.5-397B-A17B的視覺程式設計能力,Qwen3.5-27B在視覺元素豐富程度、互動性等方面仍有一些差距。▲Qwen3.5-27B生成的程式碼預覽情況(部分)▲Qwen3.5-397B-A17B生成的程式碼預覽情況而在SVG卡通場景繪製的場景中,智東西要求三款模型輸出“陽光沙灘”的SVG卡通圖,對尺寸、主題、元素、風格和細節要求具體,三款模型在複雜約束下輸出的SVG基本結構清晰,但太陽、海浪、遮陽傘、椰子樹等物體的貼近程度仍表現不足。▲提示詞Qwen3.5-122B-A10B生成的SVG相對更加精準,椰子樹下的陰影更符合物理規律,畫面的飽和度更加高。▲Qwen3.5-122B-A10B生成的SVG▲Qwen3.5-35B-A3B生成的SVG▲Qwen3.5-27B生成的SVG02. 35B模型超235B開發者喜迎降本,催更1B小版本2月16日,阿里正式推出原生視覺語言模型Qwen3.5,Qwen3.5系列的第一款模型Qwen3.5-397B-A17B首次以開源權重形式亮相,該模型在推理、程式設計、智能體能力與多模態理解等全方位基準評估中領先,引起產業關注。僅僅一周多之後,阿里發佈了Qwen3.5系列幾款中型模型,進一步在海內外引起開發者的高熱討論。其中最受關注的當屬擁有350億參數的Qwen3.5-35B-A3B。多位網友稱Qwen3.5-35B-A3B擊敗2350億參數的Qwen3-235B-A22B-2507是“重點”、“大新聞”。有網友稱:“更小的模型在更便宜的硬體上運行速度更快,同時還能達到甚至超越大型模型的性能——這才是AI真正的民主化。”還有網友分享:“我現在在一個項目上每月要花2000歐元購買Gemini服務,如果這是真的,那費用就降到每月50歐元了。”▲社交平台X上的網友評論一位開發者分享了其部署Qwen3.5-35B-A3B的情況,稱模型可以跑在16GB的視訊記憶體機器上,處理32k上下文時,每秒處理數能達到60-70個任務;但他也提到,模型吞token的速度驚人,一個短謎題就用了大約6k token,但最終答案是正確的。▲社交平台X上的網友評論Qwen3.5-27B的模型參數更小,也做到了“小規模強性能”。一位網友稱:“Qwen3.5-27B型號的得分為何如此之高?GGUF版本何時發佈?”另一位網友也稱:“這次發佈太棒了!我對27B參數模型特別感興趣,不過以後你們能不能把GGUF模型也和主版本一起發佈?這樣使用者就能更快地用上這個模型。”▲社交平台X上的網友評論也有網友開啟了催更模式。有網友稱:“有計畫發佈小型模型嗎?比如1B/3B/7B?”,也有網友喊話:“我希望未來幾周內也能推出2-4B參數的型號,Qwen3-4B-2507或許是迄今為止性能與體積比最高的型號,我希望你們能延續這一傳統。”▲社交平台X上的網友評論不過也有網友表達了更高的期待:“我真搞不懂為什麼這張圖表(測評圖表)裡沒有Claude Sonnet 4.6和Opus 4.5這兩款在SWE認證評分中分別高達79.6分和80.6分的機型。”▲社交平台X上的網友評論03. 基準測試:122B大而全35B強在智能體,27B工程實用度高看完實際體驗,我們再回過頭來看看具體的測評成績。從這三款模型的定位來看:Qwen3.5-122B-A10B是一個相對大而全的模型,綜合能力最強,相對適合多模態、視訊、多語言場景;Qwen3.5-35B-A3B的優勢集中在智能體深度能力,適用於智能體規劃、深度推理、任務調度,空間智能能力強;Qwen3.5-27B(Dense)主打輕量化部署,工程實用度高,互動、程式設計、長文字、數學拔尖。在知識維度,Qwen3.5-122B-A10B在專業領域知識與推理(MMLU-Pro)、多語言與多領域知識(MMLU-Redux)、研究生級知識與推理(SuperGPQA)三項取得最高分。在指令遵循、長上下文處理和STEM推理三大維度,Qwen3.5全系列都取得領先的成績。在程式設計能力上,Qwen3.5-27B在SWE-bench Verified(真實軟體工程問題解決能力)中取得最高分,Qwen3.5-122B-A10B在Terminal Bench 2(終端環境下的程式碼執行與偵錯能力)和 FullStackBench en(英文全端開發能力)中表現最佳。在通用智能體維度,Qwen3.5系列呈“梯隊式優勢”,在BFCL-V4(通用智能體工具使用能力)、TAU2-Bench(智能體任務執行與適配能力)、DeepPlanning(智能體深度規劃與邏輯推演能力)等多項測評中取得最佳成績。在搜尋智能體維度,Qwen3.5-122B-A10B主導英文/中文瀏覽檢索,Qwen3.5-27B包攬複雜推理與綜合搜尋最高分。在多語言能力維度,Qwen3.5-122B-A10B表現尤為突出。在多模態能力維度,其在通用VQA領域也表現強勢,拿下RealWorldQA(真實世界場景下的視覺問答能力)、MMStar(多模態綜合理解與推理能力)等四項最高分;Qwen3.5-27B在HallusionBench(多模態幻覺抑制與事實一致性能力)、CharXiv(RQ)(學術文件的理解與檢索能力)等評測中表現最佳。在空間智能方面,Qwen3.5系列實現全維度領跑。在視訊理解方面,Qwen3.5-122B-A10B成為本次測評的絕對領跑者,包攬帶字幕的視訊多模態理解能力、視訊與語言結合的跨模態理解能力等6項單項最高分。聚焦視覺智能體與專業視覺能力,Qwen3.5系列壟斷視覺智能體與醫療視覺核心能力:在8項測評中,Qwen3.5系列包攬了6項最高分,僅在桌面系統互動(OSWorld-Verified)上落後於GPT-5-mini,整體視覺智能體與醫療視覺能力領先。04. 對比Qwen3解讀Qwen3.5五大技術升級按照千問研發團隊的思路,智能進步的關鍵,從來不是堆參數,而是更優架構+更高品質資料+強化學習(RL)的有效協同。相比於阿里上一代旗艦模型Qwen3,Qwen3.5具有以下增強功能:統一視覺語言基礎:在多模態標記上進行早期融合訓練,實現了與Qwen3的跨代對等,並在推理、編碼、Agent和視覺理解基準測試中優於Qwen3-VL模型。高效混合架構:門控Delta網路與稀疏混合專家相結合,可實現高吞吐量推理,同時最大限度地減少延遲和成本開銷。可擴展的強化學習泛化:將強化學習擴展到百萬智能體環境,並逐步增加任務分佈的複雜性,以實現強大的現實世界適應性。全球語言覆蓋範圍:擴展支援201種語言和方言,實現包容性的全球部署,並具備細緻入微的文化和區域理解。下一代訓練基礎設施:與僅文字訓練相比,多模態訓練效率接近100%,非同步RL框架支援大規模代理支架和環境編排。05. 結語:企業級大模型市場頭部效應初顯產品迭代能力是關鍵通過此次發佈Qwen3.5中型模型系列,阿里試圖以“更優架構+更高品質資料+強化學習”,驗證了“規模法則”之外的另一條進化路徑。三款模型的發佈時間距離Qwen3.5-397B-A17B僅一周,分別切入多模態、智能體深度推理與輕量化部署三大場景,在開發者圈引發了模型成本熱議,也快速補齊了其產品矩陣。從市場格局看,Qwen系列在國內企業級市場的日均呼叫量份額從17.7%躍升至32.1%,進一步拉大領先優勢。此次發佈通過分層產品矩陣,有望進一步鞏固其在企業級市場的頭部地位。 (智東西)
最強開源大模型除夕登場!397B參數千問3.5超越Gemini 3,百萬Tokens低至8毛
我滴媽,最卷AI大模型,今年除夕又上新了!剛剛,阿里全新一代大模型Qwen3.5-Plus重磅開源發佈,直接登頂最強開源模型寶座。這一次,“源”神標竿再次被千問拔到了一個新高度:不僅性能全面領先同級開源模型,更是媲美Gemini-3-Pro、GPT-5.2等頂級閉源模型,多項基準測試甚至直接反超。更炸裂的是,Qwen3.5-Plus總參數隻有3970億,啟動僅需170億,性能卻比兆參數的Qwen3-Max還要強。直觀對比還包括——部署視訊記憶體佔用降低60%,最大推理吞吐量可提升至19倍,也就是說部署成本,以及推理效率雙雙實現大幅最佳化。這波“以小勝大”的史詩級PK,千問做到了。重點還沒說完,千問這次直接把技術紅利釋放給使用者,直接讓SOTA級模型做到了平民價。阿里雲百煉這次給千問3.5 API的定價極具競爭力:百萬Tokens輸入低至0.8元,相當於同等級模型Gemini-3-pro的1/18。並且,千問3.5首次實現201種語言的全覆蓋,詞表規模從150k大幅擴充至250k,小語種編碼效率最高提升60%,真正讓頂尖大模型走向全球使用者。截至目前,普通使用者只需登錄千問APP或PC端,即可免費體驗千問3.5模型;開發者們也可前往魔搭社區或HuggingFace,第一時間下載部署這款最強開源力作。據悉,千問3.5還只是阿里春節檔的第一彈。接下來幾天,他們將繼續開源多款千問3.5模型,可部署在本地、端側等不同場景,無論是開發者還是中小企業,通通都能用上。旗艦版Qwen3.5-Max也將在年後壓軸登場。u1s1,DeepSeek之後,中國開源模型的“瘋狂二月”太頂了。多項能力超越Gemini 3、GPT-5.2,視覺能力橫掃權威基準話不多說,千問3.5有多強,我們先來看基準測試結果。在推理、程式設計、智能體等核心維度上,千問3.5能夠以不到40%的參數量比肩國際一流梯隊。比如,在考核綜合認知能力的MMLU-Pro測試中,千問3.5得分87.8分,超過GPT-5.2。在目前公認難度最高的博士級科學推理評測基準GPQA上,更是一舉斬獲88.4分,比以嚴謹邏輯著稱的Claude 4.5還要高。這就意味著千問3.5同時兼具推理廣度與深度,不僅具備極強的知識遷移能力,還在底層邏輯上實現了突破。在指令遵循方面,千問3.5表現同樣亮眼。它以76.5分的成績領跑IFBench榜單,刷新了該項指標的最高紀錄。除此之外,千問3.5在Agent能力上也是全面發力。無論是考察通用能力的BFCL-V4,還是側重搜尋能力的Browsecomp,其評分均全面超越Gemini-3-Pro,展現出優秀的Agent協同能力。綜合來看,相比前幾代的千問模型,千問3.5在性能上更全面,不僅多維度無短板,更重要的是,能夠落地實用。之所以能夠實現這種代際躍遷,關鍵在於它的“眼睛”。與上一代的純文字模型千問3不同,千問3.5從預訓練第一天起,就是在視覺和文字的混合Token資料上進行的,而且資料量也從原先的36T Tokens進一步提升。同時新增中英文、多語言、STEM和推理等資料,讓千問3.5真正睜眼看世界,擁有了整合複雜世界知識和邏輯推理的原生多模態理解能力。這一核心能力的進化,在MathVison(多模態推理)、RealWorldQA(通用視覺問答)、CC_OCR(文字識別)、RefCOCO-avg(空間智能)、MLVU(視訊理解)等多模態主流評測中得到了有力印證:千問3.5幾乎橫掃了所有指標,刷新開源大模型多模態天花板。其中,在學科解題、任務規劃與物理空間推理等高難度場景上,千問3.5也表現出超越專項模型Qwen3-VL的綜合素養。眾所周知,Qwen3-VL是千問團隊推出的旗艦級多模態視覺語言模型,主打超長上下文、強視覺推理、視訊理解與視覺Agent能力。但作為綜合模型的千問3.5,其空間定位和圖文推理能力得到顯著增強,尤其是在處理複雜視覺資訊時,Qwen3.5會比Qwen3-VL推理邏輯更嚴謹,輸出結果也更可靠。千問3.5還突破了傳統大模型的視訊處理邊界:支援長達2小時的超長視訊直接輸入,配合1M Tokens原生上下文,能夠輕鬆應對長視訊內容的精準分析與一鍵摘要。換言之,無論是情節豐富的影視巨作還是專業的深度講座,千問3.5都能捕捉到每一處關鍵細節。同時,千問3.5還打通了視覺理解和程式碼邏輯的原生融合,讓視覺內容能夠直接轉化為技術產出。過去要開發一個介面,往往需要經過“原型設計→修改成稿→轉譯程式碼”的一系列過程,而千問3.5能夠瞬間將手繪介面草圖重構為高品質前端程式碼,並支援通過單張截圖定位並修復UI缺陷,做到“所見即所得”。由此,開發門檻被迅速抹平,視覺程式設計真正變為開發者手中的提效工具。模型實際表現如何?來看一波官方demo展示。先看最近很火的洗車靈魂拷問:我想去洗車,洗車店距離我家50米,你說我應該開車過去還是走過去?千問3.5一眼識破陷阱,精準抓住核心,車必須過去洗,邏輯線上:再來點難度,考考眼力+圖像推理能力。prompt:從所給的四個選項中,選擇最合適的填入問號中,使其具有合理性,應該選什麼?對千問3.5來說小菜一碟,輕鬆看懂圖形規律,並順利給出了正確答案:就連IMO競賽級數學幾何題,be like:也能一步步推理,迅速做出來:不只會做靜態題,出一道滑動方塊動態推理:千問3.5照樣拿捏:多模態生成也很強。讓它為Qwen Code生成一個推廣視訊:成片效果相當流暢自然,直接發佈都很OK。除了生成視訊,做網站也不在話下。讓千問3.5閱讀本地視訊檔案,就能根據內容製作一個網站,分分鐘生成完成程式碼:無論是產品宣傳片,還是核心特性突出,千問3.5都一網打盡。就連最燙的OpenClaw,千問3.5也可以與之整合,共同完成程式設計任務驅動。OpenClaw可以作為第三方智能體環境,協助千問3.5進行網頁搜尋、資訊收集和結構化報告生成等內容。千問3.5還可以作為視覺智能體,自主操控手機與電腦完成日常任務。模型架構全面革新,原生多模態不到四千億參數打贏兆,API價格打到閉源模型的零頭,千問3.5此次的突破,根源在於底層架構層面的升級。過去兩年,大模型行業整體遵循Scaling Law路徑演進,即參數規模越大、模型能力越強。從千億級邁向兆級,模型在複雜推理和多工泛化等方面持續取得進展。但這種路徑的代價同樣明顯——訓練依賴超大規模算力叢集,推理成本隨參數規模同步增長,部署門檻不斷提高,使得中小企業難以負擔,也限制了端側的落地。模型能力持續增強的同時,計算效率與可擴展性逐漸成為新的瓶頸。在這一背景下,千問3.5不再單純擴大模型規模,而是對Transformer經典架構進行了一次深度重構,通過多項關鍵技術協同最佳化,在強性能與高效率之間找到了新的平衡點。據官方介紹,千問3.5引入了四項關鍵技術。首先,是注意力機制的結構最佳化。Transformer的核心是自注意力機制,但傳統實現存在一個固問題:無論資訊是否重要,每個Token都需要與全部上下文進行計算關聯,複雜度隨上下文長度持續增長。這使得長文字處理的計算成本迅速上升,也成為限制模型長上下文能力的主要因素之一。千問3.5為此引入了混合注意力機制,不再對所有資訊一視同仁,而是根據重要程度動態分配計算資源——關鍵資訊高精度處理,次要資訊低成本帶過。在保持理解精度的同時,顯著壓低了計算開銷,長上下文處理效率也隨之提升。第二,是極致稀疏的MoE架構設計。如果說注意力最佳化解決的是“怎麼讀資訊”的問題,那MoE架構解決的是“用多少參數來回答”的問題。傳統稠密模型每次推理必須啟動全部參數,參數越多成本越高。MoE架構的思路是將模型拆分為大量專家子網路,每次推理只啟動其中最相關的一部分。千問3.5把這一思路推向極致:總參數3970億,單次推理啟動僅170億,啟動比例不到5%。大規模參數積累的知識優勢被保留,但規模帶來的成本負擔被大幅卸掉。第三,是原生多Token預測機制。傳統語言模型逐Token生成,每次輸出一個再預測下一個,序列結構直接限制了推理速度。千問3.5在訓練階段就學習聯合預測多個未來Tokens,使模型從逐字輸出變為批次輸出,而非單點預測。推理速度接近翻倍,對話響應明顯加快。第四層突破是系統級訓練穩定性最佳化。稀疏架構雖然效率極高,但訓練難度遠高於傳統稠密模型。為瞭解決訓練穩定性問題,千問團隊將此前獲得NeurIPS 2025最佳論文的注意力門控機制,引入到了千問3.5之中。該機制可以理解為注意力輸出端的“智能開關”。它即時控制資訊流強度,強化有效訊號,抑制噪聲干擾。避免訓練過程中的梯度異常和資訊失衡。除此之外,歸一化策略、專家路由初始化等深層最佳化手段也被引入,分別解決不同環節的穩定性難題,共同保證前述架構創新在超大訓練規模下穩定運行。四大殺招齊出,千問3.5實現了顛覆性的效率飛躍。官方資料顯示,新架構訓練成本降幅高達90%。與Qwen3-Max相比,Qwen3.5-Plus部署視訊記憶體佔用降60%,意味著節算力部署成本大幅降低;最大推理吞吐量可提升至19倍,大幅提升推理效率。架構創新解決的是效率問題,而千問3.5的另一重躍遷,指向的是智能本身——它要讓大模型真正“看得見”。目前行業裡不少所謂的多模態方案,做法其實是分步拼接:先把語言模型訓好,再把視覺模組接上去,中間加一層對齊網路把兩邊的表徵勉強拉到一起。更直接的做法甚至連對齊都省了,前端看起來是一個統一入口,後端其實是不同任務調不同模型,本質上就是個路由器。這類方案能用,但談不上真正的融合,而且一個常見的副作用是:視覺能力加上去了,語言能力可能反而往下掉。千問3.5選擇了更徹底的原生多模態路徑。預訓練階段就不再區分“先學文字、再學圖像”,而是把文字和視覺資料混在一起,讓模型從第一步就在同一參數空間裡同時消化這兩種資訊。這樣訓出來的模型,處理圖片和處理文字走的是同一條神經通路,不需要中間再做翻譯或對齊。這種融合在工程上極具挑戰。圖像和文字的資料結構差異很大,如果強行套用同一套平行策略,計算資源的浪費會很嚴重。千問3.5的處理方式是讓兩種模態在訓練過程中各自按最適合自己的方式走,只在必要的環節進行資訊交匯。最終,那怕同時輸入文字、圖像和視訊三種資料,整體訓練吞吐量和純文字基座模型幾乎沒有差別。同時,團隊還加上了一套針對性的混合精度方案,在不同環節靈活切換FP8和FP32,啟動記憶體砍掉了大約一半,訓練速度還額外快了10%。這套精度策略不只用在預訓練階段,強化學習和推理環節也統一部署了進去。在智能體訓練這塊,團隊又專門造了一套大規模強化學習框架,純文字、多模態、多輪對話全都能跑,訓練效率直接拉高了3到5倍。當然,上述能力的實現,最底層離不開阿里雲AI基礎設施的支撐。超大規模混合資料訓練的穩定性、多模態平行策略的工程落地、訓練到推理全鏈路的精度最佳化,每一項都需要底層算力平台的深度配合。最最關鍵的是,千問不光技術能打,更是在開放原始碼的路上一路狂飆。阿里是真“源”神不知道還有沒有人記得啊,去年阿里就在春節期間連發好幾個模型,春晚直播進行時,掐著點甩出Qwen2.5-Max,直接把DeepSeek V3給反超了。當時網友們的評論是:杭州這群人,不睡覺也要送上新春大禮包。一年過去了。又是除夕,又是千問。從2.5到3.5,千問再把“開源”兩個字做到了極致。回顧千問開源之路:自2023年開源以來,阿里已累計開源400多個模型。從0.5B到235B全尺寸覆蓋,從端側到雲端全面佈局,涵蓋文字生成、視覺理解與生成、語音理解與生成、文生圖、視訊模型等全模態領域……千問直接把開源模型貨架,擺的滿滿噹噹。而且,每一代、每一個尺寸,都在穩定輸出天花板級產品,換來實打實的戰績:全球下載量突破10億次,單月下載量超過第2名到第8名的總和,開發者基於千問開發的衍生模型已超過20萬個。千問目前已穩居全球最大AI大模型族群。“最強開源得投千問一票”,從一部分人的判斷,變成了全球開發者的共識。不論是開源開放,還是把API價格打到0.8元/百萬Tokens,亦或是將支援語言擴展到186種,千問的意圖很明顯:讓更多人能用上、用得起最頂尖的模型。當開源模型在核心能力上追平甚至反超閉源,而且免費可商用,競爭的邏輯就變了。這不再是一個模型和另一個模型之間爭跑分的遊戲,而是兩種生態路徑的選擇。Linux沒有靠賣系統成為商業巨頭,卻成為了全球伺服器領域的主流支撐。Android也不靠系統授權盈利,卻讓智慧型手機真正普及到每一個人。千問想走的路,大概也是這一條。最後別忘了,這些只是模型禮盒!今年春節請喝奶茶、紅包雨還沒算在內。阿里千問這過年的排面,太瘋狂了。 (量子位)
“源神”啟動!阿里殺手鐧——全新架構千問3.5來了,最強性能x最低成本
千問3.5"以小勝大"背後,是全新架構的效率代際躍遷"源神"啟動!阿里巴巴正式開源Qwen3.5-Plus,性能指標直接對標Gemini 3 pro與GPT 5.2等頂級閉源模型。千問團隊憑藉這一代際跨越,坐上全球最強開源模型交椅。核心突破在架構。397B總參數,推理時僅啟動17B,這種精巧設計讓其全面超越上代兆參數的Qwen3 Max,部署視訊記憶體佔用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍,速度也更快了。過去束縛大模型商業化的算力瓶頸被打破。支撐點是阿里長期堅持的基礎技術創新。研發團隊深度應用混合專家架構,拋棄簡單參數堆砌。預訓練階段採用統一架構同時處理多模態資料,建構出同等性能等級中參數量最小的模型底座。但千問3.5隻是開始。這次發佈揭開了阿里多模態戰略佈局的一角,千問研發團隊正在探索文字、視覺、語音與操作反饋的全模態融合,這條大一統架構路徑,指向通用人工智慧(AGI)。科技估值體系、企業AI應用滲透率、開源生態話語權,都將在此刻重新定義。01. 千問3.5,更小模型,更強性能發佈即開源——"極致性價比"參數規模曾被視為提升智能的唯一路徑。千問3.5用資料終結了這一迷信。更精簡的模型實現了更強性能,同時帶來顛覆性定價。Qwen3.5 Plus的API價格降至0.8元/百萬Token,同等性能下僅為Gemini 3 pro的十八分之一。頂級AI能力跳出了高算力、高成本的閉環。個人開發者、初創團隊、中小企業都能以極低門檻獲取世界級智能基礎設施,AI向下滲透的管道被打通。性價比背後是模型基礎能力的全面升級。千問3.5具備真正的跨模態理解能力,標誌著千問系列從語言模型進化為原生多模態大模型。行業內多數"多模態"方案仍停留在工程拼裝:先訓練語言模型,再外掛視覺或音訊模組,各模組通過適配層勉強對齊。有些產品只是在統一入口後用路由分發任務給不同單模態模型。這類方案能應對基礎任務,但無法實現真正的多模態融合,甚至會出現視覺能力增強、語言能力下降的降智現象。Qwen3.5走了另一條路。從預訓練第一天起,模型就在文字與視覺混合資料中聯合學習。視覺與語言在統一參數空間內深度交織。模型看到圖像能理解深層語義,讀到文字能在神經網路中建構對應畫面。中間翻譯環節被抹除,資訊折損降到最低,千問具備了人類等級的跨模態理解力。這種原生融合帶來了寬廣的能力邊界。細粒度視覺定位能做到像素級精度,長時序理解長達2小時視訊內容的演變過程與內在因果關聯,跨模態生成,能把手繪草圖輕鬆轉化為可運行的前端程式碼。模型進化真正意義上重構了工作流。千問3.5可以作為視覺智能體,自主操控手機與電腦系統,跨多個應用完成複雜多步驟指令。從模式識別到跨模態邏輯推理,Qwen3.5推動大模型從文字工具進化為理解現實世界的基座,為更自然的多模態生成與複雜推理打下技術基礎。02. 千問3.5"以小勝大"背後全新架構與效率的代際躍遷過去兩年,大模型行業陷入算力競賽。參數從千億堆到兆,性能緩慢爬升,成本指數級膨脹。企業部署需要昂貴GPU叢集,日常推理燒錢,中小企業付不起帳單,端側裝置跑不動模型,技術越強大,落地越困難。Qwen3.5顛覆了這條路徑。競爭重點從"誰的參數更多"轉向"誰的模型更聰明",用更小規模通過技術創新獲取超越規模的智能。這不是偶然,是阿里大模型團隊多年技術積累的集中兌現。四項核心突破共同驅動了這場代際躍遷。第一,混合注意力機制。傳統模型處理長文字時,每個Token都要與所有歷史上下文做全量計算,算力消耗呈平方級增長。Qwen3.5讓模型學會有詳有略地閱讀——動態分配注意力資源,略讀無關資訊,精讀關鍵節點。效率與精度雙重提升。第二,極致稀疏的混合專家架構。傳統稠密模型每次推理都要啟動全部參數,規模越大開銷越高。Qwen3.5將397B參數庫中與任務最相關的專家子網路精準啟動,每次推理僅用17B參數——用不到5%的算力調動全域知識儲備。第三,原生多Token預測。模型不再一個字一個字輸出。預訓練階段就學會了對後續多個Token進行前瞻性聯合預測。在長文生成、程式碼補全、多輪對話等場景中,推理速度接近翻倍。第四,系統級訓練穩定性最佳化。通義團隊獲NeurIPS 2025最佳論文的注意力門控機制是關鍵。在Transformer注意力輸出端嵌入基於Sigmoid的智能開關,防止稀疏資訊被噪聲淹沒,抑制無效擾動放大。這削弱了注意力下沉負面效應,消除了對特定位置編碼的過度依賴,長上下文泛化能力質變。配合歸一化策略與專家路由初始化,新架構在大規模訓練中表現穩健。四項技術疊加帶來化學反應:訓練成本降90%,相比Qwen3 Max視訊記憶體佔用降60%,推理吞吐量最高提升19倍。原生多模態融合使訓練提速10%、啟動記憶體減少50%。大規模強化學習框架讓智能體訓練效率提升3到5倍。當其他廠商還在跑分榜上爭論小數點,Qwen3.5已經降維打擊,競爭維度變成了誰的模型更好用、更實用、讓更多的企業毫無壓力地用得起。03. 模型+基礎設施,"powered by阿里雲"成為AI時代印記在電話會中,皮查伊正式確認了外界猜測已久的傳聞——Google與蘋果達成深度合作。這不僅穩固了Google在iOS生態中的地位,更可能成為其AI模型分發的關鍵管道。卓越模型如果脫離生態與基礎設施,只能是實驗室展品。阿里採取雙管齊下戰略:研發端高頻推出SOTA級模型,生態端堅持開源,讓頂尖模型免費可得。千問產品矩陣覆蓋從輕量端側到千億旗艦,全線遵循Apache 2.0協議完全開放。這將核心技術直接推向全球數千萬開發者,千問迅速成為最受歡迎的開源大模型。開源資料顯示優勢明顯。千問官方開源模型超400個,全球開發者衍生的微調與垂直定製模型突破20萬個,總下載量超10億次,在熱度、活躍度與生態廣度上全面超越Meta的Llama生態。李飛飛團隊、愛彼迎等頂尖力量已將千問深度嵌入其AI引擎。當開源模型在邏輯推理與跨模態理解上追平甚至超越頂級閉源模型時,免費且最強成為開發者無法拒絕的選項。競爭主軸從單點跑分轉向生態系統的整體替代。企業端市場,阿里雲與平頭哥構築了技術護城河。平頭哥真武晶片針對MoE混合專家架構做了底層指令級最佳化,這種軟硬體深度耦合實現了模型演算法、晶片與雲網路的協同效能爆發。真武晶片對路由分發機製做硬體級加速,滿足千問大模型對大規模稀疏計算的需求。軟硬協同釋放了晶片算力潛能,資料中心叢集效率大幅提升,企業微調訓練與高並行推理時間被壓縮,這是API價格降至0.8元/百萬Token的底氣。軟硬協同與開源生態反哺推動阿里雲進入新增長期。Omdia《中國AI雲市場,1H25》報告顯示,2025年上半年中國AI雲市場規模達223億元,阿里雲以35.8%市場佔比排名第一,超過第二至第四名總和。Omdia預測2025-2030年中國AI雲市場復合年增長率為26.8%,其中MaaS層增速最快,複合增長率超72%,2030年將達177億元規模,2025年阿里雲在中國雲市場份額從33%升至36%,優勢持續擴大。財務資料印證這一趨勢。近期財報顯示,阿里雲公共雲收入同比增長34%,AI相關產品收入連續9個季度保持三位數增長。資本市場對中國科技資產的舊有低估偏見正在被徹底拋棄,全球資金對中國科技股的定價邏輯正經歷著重塑。縱觀科技產業史,真正定義時代的往往不是最貴的閉源產品,而是被最多人使用的基礎設施。Linux定義了伺服器時代,Android定義了移動網際網路時代。開源、免費、無處不在的特質,將使千問成為AI產業默認的底層基石。"powered by 阿里雲"正深深烙印在每個智能應用的程式碼深處,成為這個時代的技術印記。04. 結語這次阿里"源神"啟動的是AI產業的範式切換。千問3.5用技術創新重構行業規則,當最強性能遇見最低成本,AI真正從少數人走向所有人的生產力工具。這場由阿里雲主導的技術革命,正在重寫全球AI的遊戲規則。 (硬AI)
阿里下一代模型Qwen3.5發佈在即!
從基座模型到上層應用,阿里春節AI戰事仍在持續。昨日,千問APP進一步融入阿里生態體系,開始測試接入大麥平台,實現“一句話買電影票”。此前,阿里於2月6日推出“千問春節30億大免單”活動,上線9小時訂單即突破1000萬單。在應用火爆的同時,阿里亦在推進底層技術迭代。阿里新一代圖像生成及編輯模型Qwen-Image-2.0發佈,該模型將作為千問大模型的圖像生成底座,支援1K token長文字輸入與2K高解析度輸出。阿里新一代基座模型Qwen3.5也釋出發佈訊號。在全球最大AI開源社區HuggingFace的開放原始碼專案頁面中,已出現Qwen3.5併入Transformers的新PR(提交程式碼合併申請)。▍新一代基座模型Qwen3.5發佈在即在全球最大AI開源社區HuggingFace的開放原始碼專案頁面中,最新出現Qwen3.5併入Transformers的新PR(提交程式碼合併申請)。這一最新動態印證了此前有消息稱Qwen3.5將在春節期間開源。相關資訊透露,千問3.5採用了全新的混合注意力機制,並且極有可能是原生可實現視覺理解的VLM類模型。有開發者進一步挖掘出,Qwen3.5或將開源至少2B的密集模型和35B-A3B的MoE模型。昨日,阿里還發佈了新一代圖像生成及編輯模型Qwen-Image-2.0。作為千問大模型的圖像生成模型底座,Qwen-Image-2.0集生圖和編輯於一體,在AI Arena文生圖評測中斬獲1029分,超過Seedream4.5、Flux2-Max等模型,僅次於GoogleNano Banana Pro和GPT Image1.5。Qwen-Image-2.0支援1K token的超長文字輸入和2K高解析度,可渲染複雜指令,生成專業的PPT及資訊圖。同時,千問新模型擁有中文漢字渲染能力,數百字的古文全文幾乎能完全渲染在圖片中。在模型的應用落地上,千問大模型高級解決方案架構師熊撼天在採訪中向《科創板日報》介紹,當前AI漫劇生成已形成規模龐大和快速迭代的產業鏈。這些產業鏈裡面的上下游公司正將千問最新模型應用於生產級場景。“動漫視訊的單整合本有望從數百元迅速降至幾十元,同時整體質感將大幅提升。”對於後續的研發方向,千問Qwen視覺生成負責人吳晨飛表示,一是要解決幻覺和錯誤,二是探索分層模型(Layered),讓生圖形成生產力,而不只是玩具。此外,資訊圖生成亦是關鍵方向之一。“資訊圖可以理解為是一種爸爸圖,爸爸圖裡可以包含很多子圖,每一個子圖有各自的細節。這意味著系統能一次性生成多張關聯圖像,而不僅是單張圖片。該能力在漫畫生成、複雜海報設計、PPT製作等領域,非常有價值,是目前生圖領域的一大趨勢。”▍千問加速滲透阿里生態 AI消費習慣能否養成?在應用層面,千問APP是阿里面向AI消費級市場的重要落子。昨日,千問APP進一步完成其對阿里生態體系的覆蓋,開始測試接入大麥,可實現一句話買電影票,完成影片推薦、選座到支付出票的過程。比如,發出“幫我買兩張《驚蟄無聲》上映首日的電影票,最後一排,晚上8點左右”這樣的指令”,千問會根據使用者位置推薦附近的影院,還會匹配合適時間段,並為使用者鎖定要求的位置。使用者也可以在修改資訊頁自行調整時間、位置等資訊。確認後,使用者在對話方塊內即可直接完成支付並獲取取票碼。《科創板日報》記者嘗試提問“飛馳人生年初一下午”的場次,千問提供了不同影院的場次推薦,並可以直接點選購票。為了更快實現引流,千問已在2月6日上線“千問春節30億大免單”活動,可以一句話免費點奶茶。千問還把免單活動的範圍擴展至天貓超市、盒馬,以及各大連鎖商超和便利店的酒水零食、米面糧油、生鮮水果等。過去一周,隨著“元寶發紅包”“千問送奶茶”,蘋果應用程式商店免費榜榜首競爭激烈。截至發稿,阿里千問位列榜首,二、三位分別是元寶、豆包。相較元寶依託微信入口拉新,阿里更注重結合淘寶、大麥、盒馬等自有生態,培養使用者通過AI進行購物的習慣。艾媒諮詢CEO張毅認為,阿里希望借助AI引流與生態變現,打通商業閉環。“這對於培育使用者AI辦事的習慣,預計將起到顯著的喚醒作用。”盤古智庫高級研究員江瀚則表示,使用者習慣的養成關鍵在於“高頻觸達+正向反饋”,此次免單活動恰好提供了低風險試用場景,讓使用者在節日剛需中感受AI的便利。一旦使用者在特定場景形成使用路徑依賴,便可能產生“錨定效應”,提升未來付費意願。隨著更多人使用並分享成果,將形成社交示範效應,進一步強化使用慣性。因此,若配合後續階梯式產品設計,此波活動確實有望成為使用者AI辦事習慣的重要培育契機。▍免單活動被限流 基礎設施能力迎考驗《科創板日報》記者測試發現,千問APP已對免單購買採取限流措施。多名使用者反映,曾遭遇長時間無法下單的情況。對於暫時無法提供服務,千問通過系統提示解釋道:“我們監測到‘千問免單’流量激增,商家出餐和騎手配送正在加速……抱歉啦,我通往外賣餐廳的‘腦回路’正在修路……”另一條提示則稱:“現在‘千問免單’參與人數較多,騎手運力緊張。”這源於千問APP推出的春節免單活動參與人數超預期,此前已連續多日出現系統擁堵甚至短暫崩潰。有使用者耗時近6小時才成功下單,活動還導致部分奶茶店訂單激增,出餐壓力較大。江瀚認為,活動火爆反映出市場對高性價比AI服務存在顯著需求彈性,儘管瞬時流量壓力大,但系統並未完全崩潰,說明其基礎設施具備一定承載能力。正如春運搶票現象所示,即便資源緊張,只要分配機制相對透明、參與門檻低,仍能實現較廣覆蓋,這有助於提升品牌好感度,並為後續商業化轉化積累潛在使用者池。張毅表示,此次活動後續的使用者轉化效果,很大程度上取決於阿里自身的基礎設施佈局。其技術營運能力、算力儲備以及外賣、配送等線下履約能力,將直接影響活動落地的最終成效。▍閒魚商家做起拉新買賣 新一輪紅包戰役將開啟據悉,免單卡的有效期已延長至2月28日。千問方面表示,使用者可先集滿21張免單卡,再進行購物。按照活動規則,每邀請一名新使用者下載千問APP,雙方可各得一張25元免單卡,每人最多可得21張,相當於525塊錢。當日累計成功邀請3位新使用者,則可獲得機會,抽取價值萬元的千問AI生活卡。隨著活動的覆蓋面擴大,不少使用者反映難以找到新使用者進行邀請。“通訊錄都邀請遍了,還有誰是新使用者啊?”一名網友感嘆道。與此同時,二手交易平台上出現了針對千問APP的“付費拉新”服務。“千問新使用者邀請,1元一個。”一位閒魚商家在商品描述中寫道。記者瀏覽發現,千問新人帳號的“助力”價格多在1至3元之間。根據活動安排,千問後續將加入紅包大戰。從2月13日開始,使用者可領取現金紅包,最高可得2888元。值得一提的是,字節也將在同日晚8點啟動現金紅包抽獎活動。這預示著,網際網路大廠之間的新一輪春節行銷比拚,即將拉開帷幕。 (財聯社AI daily)