#阿里Qwen | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#阿里Qwen

阿里新一代模型Qwen3.5曝光

2月9日，在全球最大AI開源社區HuggingFace的開放原始碼專案頁面中，最新出現Qwen3.5併入Transformers的新PR（提交程式碼合併申請）。業內猜測阿里千問新一代基座模型Qwen3.5發佈在即。記者瞭解到，千問3.5採用了全新的混合注意力機制，並且極有可能是原生可實現視覺理解的VLM類模型，Qwen3.5或將開源至少2B的密集模型和35B-A3B的MoE模型。 (第一財經)

開源模型TOP5，被中國廠商包圓了

開源大模型，進入中國時間。10月，公開資料顯示，來自中國的開源大模型已經牢牢佔據榜單前五。阿里的Qwen系列和DeepSeek，更是從2024年下半年起，就在開源社區建構起越來越深遠的影響力。這一結果正在引發熱議。有不少網友指出：這種情況確實已經持續了很長一段時間。比如半年前Llama 4翻車時的梗圖，就又被挖了出來：無論是模型質量還是開放程度，這一次，國產模型已經從追趕者，轉變為引領潮流的一方。緊跟SOTA閉源模型更具體的情況，可以在LMArena公開榜單中窺見一二。在文字排行榜中，頂級閉源模型如GPT-5、Gemini-2.5-pro、Claude-Sonnet-4.5等之後，緊隨而來的就是智譜的GLM-4.6和DeepSeek-v3.2。而Qwen3-max-preview則躋身到了TOP3，不過目前該版本模型並未開源。前端開發排行榜中，國產開源模型更是實現了跟程式設計SOTA Claude的分庭抗禮，DeepSeek-R1/V3.1、GLM-4.6和Qwen3-Coder都排到了前10。視覺方面，騰訊的Hunyuan-vision-1.5注和Qwen3同樣緊跟閉源SOTA，位列開源最強。註：Hunyuan-vision-1.5處於計畫開源狀態，技術報告和模型權重尚未公佈。視訊模型方面，開源模型中Wan-v2.2表現最佳。值得注意的是，在這個領域，國產閉源模型同樣表現不俗，Kling-2.5、Seedance-v1-pro、Hailuo-02等都位居榜單前列。另一個角度，從HuggingFace的模型下載量和模型趨勢上，也可以看出開源模型領域，中國力量越來越活躍、越來越強大了。在趨勢榜中，螞蟻的Ling-1T、智譜的GLM-4.6，都是當下最受關注的開源模型。最受歡迎模型，依然由DeepSeek-R1擔當。下載量方面，Qwen3是下載量最高的模型之一。如果將參數規模具體到百億級，Qwen3更是領先包括gpt-oss在內的其他開源模型。競爭推動創新，而開源已經被證明，是加速創新的重要力量。有網友認為：現在，這股推動力來自中國。還有人指出，開源模型領域主導地位的轉變，不僅僅關乎誰將引領潮流，更重要的是，這或將重新定義全球創新格局。Llama 5要無了？Anyway，回到開頭那張圖片上，中國開源力量對大模型格局的衝擊，一個重要的節點是“DeepSeek時刻”。而Llama 4的翻車，也不能說沒有貢獻一份力量（doge）。最近小扎不是終於把OpenAI前CTO Mira的公司聯創Andrew Tulloch挖走了嘛，傳聞是給了一份35億美元的offer。消息一出，又把大家對Llama 5的關注給勾起來了：挖了這麼多人，花了這麼多錢，Meta超級智能實驗室能搞出好東西來吧？但這邊剛期待，就有人冒出來潑冷水：Llama 5無了。爆料人說是Meta的資料集供應方。不過後來他又刪掉了這個回覆，表示以上並非官方消息，他只是從另一個獲得Meta資金的團隊那裡得到了這個消息。那麼，被亞歷山大·王動搖了開源決心的小扎，究竟會拿出點什麼？板凳，瓜子，長期準備吧~ (量子位)

你敢信？阿里Qwen3逆襲，DeepSeek的寶座失守。

就在幾天前，阿里巴巴的Qwen3如一匹黑馬，橫空出世，硬生生將DeepSeek的R1從全球開源AI模型的王座上拉了下來！🌟 這場無聲的較量，不僅點燃了科技圈的熱情，更讓無數人開始思考：中國AI的崛起，到底有多猛？今天，就讓我們一起揭開Qwen3的逆襲密碼，探尋它如何用實力改寫全球AI版圖！🔥王者交鋒，Qwen3的驚豔逆襲想像一下，AI世界如同一場沒有硝煙的賽場，全球頂尖模型在這裡角逐桂冠。DeepSeek的R1，曾經是開源AI的“常勝將軍”，自今年1月以來穩坐LiveBench排行榜的頭把交椅。然而，Qwen3的出現，宛如一顆璀璨的流星，劃破了這片寧靜的天空。🌌LiveBench，這個被譽為AI界的“高考”平台，用最嚴苛的測試標準，考察模型在程式設計、數學、資料分析和語言指令等領域的表現。Qwen3不僅通過了考驗，還以碾壓之勢超越了R1，登頂全球開源AI模型排行榜！這一刻，Qwen3用實力向世界宣告：中國AI，不容小覷！💪Qwen3的“內功”有多強？Qwen3為何能一鳴驚人？答案藏在它的“內功”之中。阿里巴巴雲端運算團隊傾力打造的Qwen3家族，涵蓋了從6億到2350億參數的八大模型。參數，簡單來說，就是AI的“智慧結晶”，決定了模型處理複雜任務的能力。🌱從程式設計到資料分析，從數學推理到語言理解，Qwen3展現了全能選手的風采。它的每一次推理，都像一位棋手在千百步之外精準落子；它的每一次輸出，都如詩人在字裡行間揮灑靈感。這樣的Qwen3，不僅是技術的結晶，更是阿里巴巴對全球AI未來的一次大膽暢想。✨開放原始碼的力量，中國的擔當Qwen3的成功，離不開開放原始碼的土壤。開源，像是科技世界的“共享花園”，讓開發者們自由修改、分享程式碼，共同澆灌技術的參天大樹。🌳 過去幾十年，開源技術為中國科技產業插上了騰飛的翅膀，而今，Qwen3的登頂，正是中國在全球開源社區的一次高光時刻。阿里巴巴用行動證明：開源不僅是技術的共享，更是責任的傳遞。Qwen3的程式碼向全球開發者敞開懷抱，激發著無數創新的火花。這不僅是中國AI的勝利，更是全球科技協作的里程碑。🌍雖勝猶謙，Qwen3的未來之路儘管Qwen3在開源領域獨佔鰲頭，但LiveBench排行榜也提醒我們，它與閉源模型（如OpenAI的o3、Google的Gemini Pro 2.5、Anthropic的Claude 3.7）仍有差距。這就像一位年輕的武林高手，雖已名震江湖，但距離“天下第一”還需苦練內功。⚔️然而，正是這種差距，激發了Qwen3前行的動力。阿里巴巴的研發團隊，已經在為下一場戰役厲兵秣馬。未來的Qwen3，會如何進化？它能否帶領國產AI，衝擊全球AI的巔峰？這些問題，值得我們拭目以待。👀Qwen3的逆襲，不僅是阿里巴巴的勝利，更是中國科技的一次集體狂歡。🌈 它讓我們看到，技術可以跨越國界，創新可以點燃希望。你如何看待Qwen3的崛起？你覺得它會成為下一個改變世界的AI力量嗎？歡迎在評論區留下你的想法，或者把這篇文章分享給你的好友，一起聊聊中國AI的無限可能吧！🚀讓我們共同期待，Qwen3的下一個奇蹟！ (澤問科技)

超越DeepSeek，中國開源“集團軍”正重塑全球AI生態

導語：中國開源，正在形成集團化作戰的優勢。DeepSeek和阿里Qwen等基礎模型撐起了中國開放原始碼的上限，而更多的中小企業正在它們的基礎上，不斷推出體量更小卻能力更強的垂直模型，讓今年以來中國大模型更新的速度不斷加快，不斷帶來新的驚喜。而在美國仍以閉源為主的背景下，中國企業擁抱開放原始碼的做法充分展現了中國的技術自信，也開闢出一條技術普惠與全球共生的新路徑，持續開拓海外市場，代表著全球AI技術從“單極霸權”轉向“多極共生”。01. 中國開源，正形成合力2月初，當中國開源大模型DeepSeek在全球140個國家和地區的應用市場下載排行榜同時登頂，OpenAI卻公然在媒體上指責，DeepSeek未經許可使用了ChatGPT的蒸餾資料。這樣的指責非但沒能為OpenAI“挽尊”，卻招來全球科研從業者的“群嘲”。如今，又一個把蒸餾buff疊滿的選手出現了。4月13日，崑崙萬維推出Skywork-OR1(Open Reasoner 1)系列模型，同規模下性能超越阿里QwQ-32B，對齊DeepSeek-R1。資金實力並不雄厚的崑崙萬維，為什麼也可以做出SOTA等級的大模型？其實官方並不諱言，他們的模型是基於DeepSeek-R1-Distill-Qwen-7B和DeepSeek-R1-Distill-Qwen-32B這兩款模型訓練而來。而正如名字裡體現的那樣，DeepSeek的這兩款模型，又蒸餾了阿里的Qwen系列模型。在借力優秀開源模型的同時，崑崙萬維也在為開源社區做出自己的貢獻。相比於只開源模型權重的DeepSeek，崑崙萬維還開放了自己使用的資料集和訓練程式碼，更加接近於“真開源”的概念。這意味著，任何使用者都可以去嘗試復刻他們的模型訓練過程。崑崙萬維這份成果，充分展示了開源最重要的意義——不僅僅是讓給使用者提供一個免費可用的產品，更能夠讓更多開發者站在前人的肩膀上，快速、低成本地推動技術繼續前進。事實上，就在去年業界還在討論大模型預訓練遭遇瓶頸的背景下，今年以來，中國大模型的迭代速度卻仍在加快，並且越來越多的企業投入開源。阿里雲通義千問從除夕夜開源全新的視覺模型Qwen2.5-VL，再到3月初發佈並開源了全新推理模型QwQ-32B，在開源當日就登頂全球主流AI開源社區HuggingFace的趨勢榜。階躍星辰則在一個月左右時間開源三款多模態大模型，其最新開放原始碼的是圖生視訊模型Step-Video-TI2V，支援生成的視訊具備運動幅度可控和鏡頭運動可控兩大核心特點，同時自帶一定的特效生成能力。智譜則在4月宣佈開源32B/9B 系列GLM模型，涵蓋基座、推理、沉思模型，均遵循MIT許可協議。甚至一度閉源的百度，也宣佈將於6月30日完全開源文心大模型。相比於國內開源生態的日益繁榮，美國大模型公司至今仍以閉源為主，這也讓中國大模型的出海迎來難得機遇——DeepSeek讓印尼教育公司Ruangguru借此低成本最佳化了教學模型；新加坡 B2B旅遊技術公司Atlas將Qwen整合至智能客服系統，實現7×24小時多語言支援……02. 為何美國閉源，中國開源？美國AI傾向閉源而中國AI愈發開放，實際上是兩國AI發展環境的必然結果。美國的AI產業主要由科技大廠和VC（風險投資人）主導，由於資方對於AI有著巨大的資本回報預期。因此美國的AI模型企業普遍具有強烈的技術信仰，即追求技術領先後實現一定程度的市場壟斷後創造巨額利潤，其生態也天然的傾向於閉源。以OpenAI發展歷程為例，其在創立期間作為非盈利實體，此後卻不斷走向封閉——GPT-1時完全開源，GPT-2部分開源遭遇反對後才全面開源，GPT-3正式走向閉源，隨後GPT-4時閉源策略進一步強化，模型架構、訓練資料完全保密，甚至限制企業使用者的API呼叫頻率。儘管OpenAI表示閉源是基於合規和管控技術濫用的出發點，但市場普遍認為OpenAI轉向閉源的標誌性事件是其與微軟達成百億美元級合作，將GPT-3嵌入Azure雲服務，形成“技術-資本”閉環。在去年10月微軟首次在財報披露其對OpenAI投資時就表示：“我們對OpenAIGlobal,LLC進行了投資，總投資承諾為130億美元，投資按權益法核算。”所謂的權益法也可以理解為微軟對於OpenAI的投資的目的是獲得回報而不是單純的慈善科研，顯然OpenAI通過閉源生態賣高價API就是其目前最大的收入來源，也成了OpenAI不願開放原始碼的最大阻力。而從OpenAI“分家”成立的Anthropic，更是在一開始就堅定了閉源路線，其大模型產品Claude則全面採取了閉源模式。而即便是美國開源唯一扛把子的META旗下的Llama，開源時也加入了兩條防友商條款：1、開源模型在META批准前不能用於超過7億月活的產品和服務2、不能利用Llama模型的輸出內容來訓練和改進其他的大語言模型可以看到，即便是開源模型，Meta的核心目的依然是打造自己的AI生態而非技術普惠。美國在資本層面選擇了閉源為主，開源為輔的AI戰略，可以說是純商業考量。相比之下，中國自上而下的頂層設計從一開始就重視開源，體現了自主可控思維下的產業優先路徑。早在2017年，中國政府就發佈了《新一代人工智慧發展規劃》，明確提出要加快AI與經濟、社會深度融合的目標，部署構築AI發展的先發優勢。2021年，開源相關內容更是明確列入中國“十四五”規劃中，引發各地積極推動技術革新處理程序。中國科學院院士梅宏就曾表示，語言模型未來的發展必須依賴於開源平台，只有在一個開放的環境中，才能確保各行業使用者對資料上傳和業務整合的安全性與信任度。去年12月工信部等四部門發佈的《中小企業數位化賦能專項行動方案（2025—2027年）》中，明確支援開放原子開源基金會設立“中小企業AI開源專項”，提供可複製，易推廣的訓練框架、測試工具等資源，降低企業技術門檻。工信部等四部門發佈的《中小企業數位化賦能專項行動方案（2025—2027年）》一個更現實的問題是，由於美國的潛在技術封鎖，中國在AI領域並不能單純的做追隨者，而必須打造能夠獨立自主的國產生態，在美國已經建設了一套閉源為主的生態下，再建設一套閉源生態無異於閉門造車，唯有開源生態才能快速助力AI產業的發展。除了頂層支援外，各地對開源生態上也付出了真金白銀的支援。智譜聯合北京國資成立的專注於大模型生態投資的Z基金宣佈，出資3億元支援全球範圍內的AI開源社區發展，任何基於開源模型（不侷限於智譜開源模型）的創業項目均可申請。中美AI產業在開源與閉源策略上的分野，本質是發展邏輯的根本差異——美國受資本驅動，科技大廠與VC的盈利訴求催生了“技術壟斷-高價變現”的閉源生態，即便如Meta嘗試開源，也難逃商業壁壘的桎梏；中國則依託頂層設計，以“技術平權+產業協同”為核心理念，通過政策賦能建構開放生態，讓開源成為降低技術門檻、推動實體經濟融合的基礎設施。這種戰略選擇，既塑造了兩國AI產業的不同路徑，也預示著全球AI生態正從“壟斷競爭”向“開放共贏”加速演進。03. 夠用就是夠好中國的AI開源生態，不僅正在加速中國及全世界的AI產業化發展，還讓美國技術優先的信仰陷入了一個尷尬的陷阱。面對DeepSeek效應帶來的步步緊逼，4月5日，Meta發佈自稱有史以來最強多模態大模型Llama4。然而實測下來，這是一款讓人大跌眼鏡的模型，號稱10m tokens的上下文長度頻頻出錯、初代小球測試難以完成、9.11>9.9的比大小失誤……模型上線幾天內，高管離職、測試作弊等醜聞也被內部員工爆料證實。更多消息證明，Llama4可謂是祖克柏趕鴨子上架的產物。那麼問題來了，為什麼祖克柏一定要趕在4月上線呢？正如前文所述，美國AI產業界對於技術有一種迷之信仰，認為自己的產品必須最強、最先進，因此紛紛開啟軍備競賽。而訓練AI所需的邊際效應遞減，使得大廠們在消耗了天量成本後，技術門檻不僅沒有建成，反而陷入了算力瓶頸的泥沼。OpenAI剛發佈GPT-4o的圖像生成功能，幾天後Altman就發推說他們的GPU“快燒了”。Gemini2.5發佈不到一周，GoogleAIStudio負責人就說他們仍受“速率限制”困擾，開發者每分鐘只能發20個請求。似乎沒有一家公司能應對超大模型的推理需求。GPT-4o生成的吉卜力風格的AI圖片實際上，美國正在陷入誤區。智源研究院的負責人表示：“如果一個新模型用100倍成本跑出了10分基準測試分的提升，那麼這個新模型對於80%以上的應用場景就毫無意義，因為沒有任何性價比。”而中國大模型企業加速開源生態，看似不再去爭奪這個第一，反而憑藉著“夠用就好”贏得了更多的客戶，尤其是工業界客戶的認可。相比於政企客戶動不動千萬的預算，很多企業和機構既有迫切的AI需求，但是又沒有那麼多預算現成解決方案，利用開源模型自行開發幾乎成為了他們不二之選：寶鋼用冶金工程關鍵工序“大模型+小模型”進行生產裝置智能預警；中煤科工的“煤科衛士大模型ChinamjGPT”，使煤機裝備裝置故障停機時間、維修成本分別降低30%和20%；上海孟伯智能物聯網科技有限公司基於輕量大模型打造了邊剪檢測、連退爐工藝最佳化應用平台；彌費科技基於大模型技術實現了半導體晶圓廠自動物料搬運系統智能預測維護與管理。這些都是開源模型在工業場景落地的代表案例。而除了工業用途外，開源生態也能幫助更多的公益事業。山水自然保護中心致力於雪豹及高原生態系統的保護，布設的紅外相機每個季度會拍攝大量照片或視訊，靠人工識別雪豹蹤跡效率極低，耗費大量時間和人力。華為昇騰與山水自然保護中心合作進行雪豹蹤跡識別華為把三江源紅外影像物種識別的相關模型和工具開源，降低了參與AI開發的門檻，讓更多使用該模型的研究保護機構受益，可舉眾人之力在資料集、資料處理和資料清洗多方面最佳化模型。04. 開放原始碼的 “集市”效應開放原始碼軟體運動的旗手、美國人埃裡克·雷蒙德在1999年的《大教堂與集市》一書中提出一個比喻：傳統的、封閉的軟體開發模式如同建造一座大教堂，軟體由少數專家（建築師）在與世隔絕的環境中精心設計和建構，只有在最終完成後才發佈給使用者；而開放原始碼的開發模式。如同一個熙熙攘攘、看似混亂但充滿活力的集市，軟體開發是公開的、去中心化的、演進式的。書中認為，對於許多類型的軟體項目，尤其是複雜的系統級軟體（如作業系統核心），開放、協作、去中心化的“集市”開發模式，儘管看起來可能混亂，但實際上比傳統、封閉、集中式的“大教堂”模式更有效率、更能產生高品質、更健壯的軟體。它通過“早發佈、常發佈”和利用大規模同行評審（“足夠多的眼睛”）等機制，能夠更快地發現和修復錯誤，並更好地吸納使用者反饋和社區貢獻，從而推動軟體的快速迭代和創新。Linux等開放原始碼專案的巨大成功，驗證了雷蒙德的觀點。開源運動曾經為美國和世界帶來遠超投入本身的巨大價值。哈佛大學2024年的一份研究報告表示：“開源投入41.5億美元，為企業創造了8.8兆美元價值（即每投入1美元，創造2000美元價值）。如果沒有開源，企業在軟體上的支出將是現在的3.5倍。”如今，中國公司學到了這一點。美國AI企業似乎卻忘了。事實上，對於中國的大模型企業們，即使不考慮社會效益，選擇擁抱開源生態對於企業本身也並非無利可圖。多家大模型企業均告訴觀察者網，開源並不是放棄商業化，開源依然有開放原始碼的盈利邏輯，比起開不開源，如何技術上更加服務好客戶才是關鍵的問題。以智譜AI為例，其宣稱為國內唯一全面對標OpenAI的企業，但相比於OpenAI的閉源戰略，其反而是行業內開源戰略最堅定的踐行者之一。智譜於2023年率先開源國內第一個Chat大模型ChatGLM-6B，成立近六年來，智譜已開源55餘款模型，在國際開源社區累計下載量近4000萬次。智譜告訴觀察者網，智譜希望自己的開源戰略為北京打造人工智慧“全球開源之都”貢獻自己的力量。而具體到商業層面，智譜則選擇了開源吸引開發者生態，向B端和G端提供付費的定製解決方案。而除了賣解決方案，賣API也是一個重要的盈利環節。以DeepSeek為例，開源模型的第一筆生意是高性能API的銷售。基礎服務雖免費，但企業可提供高性能API服務，按呼叫量收費。DeepSeek-R1的API定價為每百萬輸入Token1元，每百萬輸出tokens16元。免費token額度用完了或者基礎API滿足不了需求，使用者就傾向於使用付費版保持業務流程的穩定性。相比於只有模型服務的企業，阿里則選擇另一種開源變現模式——生態捆綁。阿里的Qwen系列作為開源急先鋒，通過全模態開源吸引開發者使用雲端運算等基礎設施，形成場景閉環。他們的模型在前期只是一個引子，明碼標價的商品實則是雲服務。中國開源大模型的全球化應用已從“技術跟隨”轉向“生態主導”。當美國陷入“閉源壟斷”與“開源失控”的兩難時，中國通過“協議創新+場景深耕”，正在重構全球AI開源生態的底層邏輯。這場博弈的終極戰場，不在參數規模的競賽，而在AI技術與實體經濟深度融合的兆級市場。 (科工力量)

中文性能反超VLM頂流GPT-4V，阿里Qwen-VL超大杯限免！

【導讀】多模態大模型將是AI下一個爆點。最近，通義千問VLM模型換新升級，超大杯性能堪比GPT-4V。最重要的是，還能限時免費使用。最近，通義千問實火。前段時間被網友玩瘋的全民舞王，讓「AI科目三」頻頻登上熱搜。讓甄嬛、慈禧、馬斯克、貓主子和陶俑能跳舞那款AI，就藏在通義千問APP背後。