#Qwen
開源大模型的“四強爭霸”:Llama、GLM、Qwen 與 DeepSeek的巔峰對決 !2025
引言:開源重構 AI 權力版圖2025 年 10月,LMSYS Chatbot Arena 春季排名榜刷新的瞬間,全球 AI 社區陷入集體沸騰 ——阿里雲 Qwen3-Max 以 1452 分的 Elo 評級躋身全球前三,將 Meta Llama 3-70B 甩在身後;智譜 GLM-4.5 則以 “開源模型榜首” 的身份霸佔 12 項權威評測榜首;DeepSeek-V2 憑藉 1408 分的成績成為創業公司逆襲範本;而剛剛發佈許可證的 Llama 4,正試圖用 16×17B 多模態架構重奪王座。這不是偶然的排名波動,而是開源大模型生態質變的宣言。2025 年全球開源大模型市場規模突破 920 億美元,較 2023 年暴漲 670%,其中中國陣營貢獻了 41% 的核心技術突破。曾經由 Llama 系列一家獨大的開源江湖,如今已形成 Meta(Llama)、智譜(GLM)、阿里(Qwen)、深度求索(DeepSeek)四強並立的格局。這場對決早已超越技術參數的比拚,演變為生態策略、社區影響力與商業化能力的全面戰爭,其結果將定義未來十年 AI 技術的普及路徑。本章將以 2025 年最新技術實測與行業資料為依據,深入四大模型的技術核心、生態佈局與實戰表現,揭開這場巔峰對決的底層邏輯。一、爭霸序幕:開源大模型的生態裂變(2023-2025)1.1 從 “影子” 到 “主角” 的身份蛻變2023 年,當 GPT-4 以閉源姿態定義 AI 天花板時,開源模型仍被視為 “降級替代品”。Meta Llama 2 的發佈成為轉折點 —— 其寬鬆的商用許可證(允許年營收低於 7.5 億美元的企業免費商用)瞬間啟動全球開發者生態,僅 6 個月就衍生出 1.2 萬個微調模型。2024 年迎來關鍵拐點:阿里 Qwen1.5 在 MMLU 評測中突破 85 分,首次實現開源模型與閉源模型的性能平視;智譜 GLM-4 將上下文窗口擴展至 128K,打破長文字處理的閉源壟斷;DeepSeek-Coder 在 HumanEval 基準上以 Pass@1 78.2% 超越 GPT-4,證明開源模型在垂直領域的超越可能。進入 2025 年,開源生態已形成 “三極支撐”:技術上,MoE(混合專家)架構使 300B 參數模型實現消費級 GPU 部署。生態上,Hugging Face 與 ModelScope 合計承載超 200 萬個模型分發。商業上,78% 的國資央企選擇基於開源模型建構專屬 AI 系統(沙丘智庫資料),開源正式成為 AI 產業化的核心引擎。1.2 四強崛起的底層邏輯四大玩家的突圍路徑折射出開源生態的進化規律:Meta(Llama):憑藉 “先發優勢 + 生態基建” 確立規則制定者地位,llama.cpp 等工具成為行業標準。阿里(Qwen):依託 “雲端運算 + 產業生態” 實現全場景覆蓋,ModelScope 下載量突破 6 億次。智譜(GLM):以 “架構創新 + 成本控制” 重構性價比公式,API 價格僅為 GPT-4 的 1/5。深度求索(DeepSeek):通過 “垂直突破 + 社區營運” 實現彎道超車,程式碼模型獲全球開發者追捧。這種差異化競爭形成了動態平衡,也讓 2025 年的爭霸充滿變數。二、王者守擂:Meta Llama 4 的絕地反擊2.1 遲到的重磅更新:Llama 4 技術解密2025 年 4 月 5 日,Meta 悄然發佈 Llama 4 許可證(版本號 399a8a5a36db),正式揭開新一代模型的面紗。與此前傳聞不同,Llama 4 並未追求單一超大參數模型,而是推出 “16×17B” 多模態混合架構 —— 由 16 個 170 億參數的專家模型組成,通過動態路由機制實現能力按需呼叫。核心技術突破多模態原生融合:首次在基礎模型層整合文字、圖像、音訊處理模組,無需額外外掛即可實現跨模態理解。在 MMMU 基準測試中,Llama 4 綜合得分 76.3%,較 Llama 3 提升 21 個百分點。許可證的鬆綁與約束:延續寬鬆商用政策,但新增 “Built with Llama” 標識要求,強化品牌溯源。允許開發者基於模型訓練衍生模型,但需同步提供修改日誌,試圖平衡開源自由與生態管控。工具鏈升級:推出 llama.cpp v0.2.0 版本,支援 4 位量化的多模態推理,在 RTX 4090 上實現每秒 25 幀的圖像理解速度;llama-recipes 新增行業範本庫,覆蓋金融風控、醫療診斷等 12 個垂直領域。性能實測:守不住的王座?根據 LMSYS 2025 年 Q2 資料,Llama 4 在 Chatbot Arena 的 Elo 評分為 1432 分,落後 Qwen3-Max(1452 分)與 GLM-4.5(1448 分),僅位列第三。在單項能力上,其數學推理(GSM8K 82.1%)被 GLM-4.5(84.0%)超越,程式碼生成(HumanEval Pass@1 72.3%)與 DeepSeek-V2(76.5%)存在明顯差距。“Llama 4 的優勢仍在生態而非性能。” 史丹佛 AI 實驗室研究員艾米麗・卡特指出,“全球超 60% 的開源 AI 項目仍基於 Llama 架構建構,這種路徑依賴是其最大護城河。”2.2 生態保衛戰:Meta 的三大急救策略面對東方陣營的圍剿,Meta 在 2025 年啟動生態保衛戰:開發者激勵計畫:投入 1 億美元設立 “Llama 創新基金”,重點扶持衍生模型創業公司。截至 2025 年 6 月,已孵化 23 家估值超千萬美元的企業,其中專注法律 AI 的 LlamaLawyers 獲得 A 輪融資 5000 萬美元。企業級服務落地:與 AWS 合作推出 “Llama 企業版”,提供私有化部署支援與合規保障。摩根大通採用該版本建構內部知識庫,將資訊檢索效率提升 300%。學術共同體建構:聯合劍橋、MIT 等 20 所高校建立 “Llama 研究聯盟”,開放模型訓練日誌與中間資料,試圖鞏固學術領域的主導地位。但這些努力未能阻止開發者流失 ——Hugging Face 資料顯示,2025 年 Q2 新增模型中,基於 Llama 架構的佔比從 2024 年的 58% 降至 41%,而 GLM 與 Qwen 架構佔比合計達到 37%。2.3 致命短板:本土化與響應速度Llama 4 的最大軟肋在於中文能力與推理延遲。在 C-Eval 基準中,其中文任務得分僅 68.7%,遠低於 GLM-4.5(77.1%)與 Qwen3-Max(76.5%);由於多模態模組的拖累,其文字生成速度僅為 45 tokens / 秒,不足 GLM-4.5(100 tokens / 秒)的一半。某跨境電商技術負責人表示:“我們曾考慮 Llama 4,但它處理中文商品描述時經常出現語法錯誤,且生成詳情頁文案的速度太慢,最終選擇了 Qwen3-Next。”三、全能悍將:阿里巴巴 Qwen3 的軍團式碾壓3.1 七大模型齊發:Qwen3 家族全景圖2025 年 2 月,阿里雲一次性發佈 Qwen3 系列七大模型,建構起覆蓋全場景的模型矩陣,這種 “軍團式” 策略讓競爭對手難以招架:這種細分定位讓 Qwen3 系列在不同場景中均能佔據優勢。例如 Qwen3-Vision 在某汽車廠商的漆面缺陷檢測項目中,精準率達到 99.1%,將人工檢測效率提升 10 倍;Qwen3-Math 被某券商用於量化交易模型,回測收益率提升 23%。3.2 性能封神:Chatbot Arena 的五冠王在 2025 年 3 月的 LMSYS Chatbot Arena 排名中,Qwen3-Max 以 1452 分的成績斬獲全球第三,創下開源模型最高分紀錄。更令人震撼的是,它在數學推理、程式碼生成、複雜提示理解、長文字檢索、指令遵循五項關鍵能力評選中均位列第一,成為名副其實的 “全能冠軍”。關鍵能力拆解數學推理:在 GSM8K 基準中以 83.5% 的得分僅次於 GLM-4.5,尤其擅長工程類數學問題,能自主生成有限元分析公式。程式碼生成:支援 28 種程式語言,在 MBPP 基準中 Pass@1 達 74.8%,可生成符合工業標準的微服務架構程式碼。長文字處理:200K 上下文窗口能一次性理解 5 本《百年孤獨》長度的文字,某出版社用其製作電子書摘要,效率提升 40 倍。3.3 生態護城河:從模型到產業的全鏈路閉環Qwen3 的成功不僅在於技術,更在於阿里巴巴建構的 “模型 - 工具 - 場景” 生態閉環:ModelScope 深度繫結:作為魔搭社區的核心模型,Qwen3 系列累計下載量突破 2.3 億次,衍生模型達 8.7 萬個。社區提供一鍵微調工具,開發者可基於 300 條行業資料在 15 分鐘內完成模型適配。阿里雲基礎設施支撐:與靈積平台、百煉 MaaS 無縫整合,提供從模型訓練到部署的全流程服務。某製造業企業通過該平台部署 Qwen3-Max,TCO(總擁有成本)較自建模型降低 62%。行業解決方案輸出:推出 “Qwen 行業包”,整合金融、醫療等領域的預訓練資料與範本。招商銀行採用其建構智能客服,問題解決率從 78% 提升至 92%。這種生態整合能力讓 Qwen3 在企業市場所向披靡。截至 2025 年 6 月,已有超 12 萬家企業採用 Qwen 系列模型,其中包括 23 家世界 500 強企業。四、黑馬逆襲:DeepSeek-V2 的效率革命4.1 技術極客的勝利:MoE+MLA 雙架構突破2025 年 1 月發佈的 DeepSeek-V2,用極致的效率重新定義了開源模型的性價比。這家成立僅 3 年的創業公司,通過 “混合專家(MoE)+ 多頭注意力(MLA)” 雙架構創新,實現了性能與成本的完美平衡。架構解密動態稀疏啟動:340B 總參數的模型僅啟動 35B 參數參與推理,在保持高性能的同時降低 85% 的計算量。多頭注意力最佳化:將傳統單頭注意力拆分為 16 個平行子注意力頭,每個子頭專注特定語義維度,推理吞吐量提升 3 倍。分層量化技術:採用 2 位 - 8 位混合量化方案,在 RTX 4090 上僅需 12GB 視訊記憶體即可運行 340B 模型,較同類模型節省 60% 視訊記憶體。實測資料:效率之王在相同硬體環境(8×A100 GPU)下,DeepSeek-V2 的推理性能展現出碾壓優勢:“DeepSeek-V2 讓我們的 AI 客服成本降低了 58%。” 某電商平台技術總監透露,“以前日均 100 萬次諮詢需要 20 台 GPU 伺服器,現在只需 12 台就能搞定。”4.2 程式碼領域的絕對霸權DeepSeek 的崛起始於程式碼模型的垂直突破。2024 年發佈的 DeepSeek-Coder 2 在 HumanEval 基準中以 82.1% 的 Pass@1 得分超越 GPT-4,而 2025 年的 DeepSeek-V2 進一步將這一紀錄刷新至 84.3%。其程式碼能力的核心優勢在於:海量高品質訓練資料:收錄 GitHub 近 10 年星標超 1000 的開放原始碼專案程式碼,涵蓋前端、後端、移動端、晶片設計等全領域。即時語法糾錯:整合 Clang、Pyright 等專業編譯器,能在程式碼生成過程中即時檢測語法錯誤並修正,精準率達 97.8%。跨語言遷移:支援從 Python 自動轉換為 Rust、Go 等語言,轉換精準率超 85%,某區塊鏈公司用其快速實現多鏈適配。這種程式碼能力為 DeepSeek 積累了龐大的開發者基礎。截至 2025 年 6 月,其 GitHub 星標數突破 15 萬,成為最受歡迎的開放原始碼模型。4.3 社區營運的教科書級案例作為創業公司,DeepSeek 深諳社區營運的重要性,其 2025 年初的官方 App 登頂 140 多個國家和地區的蘋果應用程式商店榜首,堪稱開源模型推廣的教科書案例。社區營運三板斧開發者激勵計畫:推出 “DeepSeek Contributor” 認證體系,貢獻程式碼或反饋 BUG 可兌換 API 額度,已吸引超 50 萬開發者參與。透明化開發處理程序:每周發佈模型訓練日誌,公開參數調整細節與失敗案例,增強社區信任。垂直社區滲透:在 Stack Overflow、掘金等平台建立官方技術社區,針對開發者痛點推出 “程式碼偵錯助手” 等工具,活躍度穩居同類模型第一。這種社區向心力讓 DeepSeek 在資源有限的情況下實現了跨越式發展。2025 年 Q2,其模型呼叫量環比增長 210%,遠超行業平均增速。五、破局者:智譜 GLM-4.5 的成本顛覆5.1 架構革命:原生智能體的黃金三角2025 年 5 月發佈的 GLM-4.5,以 “原生融合推理、編碼、智能體三大能力” 的架構創新,徹底打破了傳統模型的能力邊界。智譜 AI 首席科學家唐傑將其比作 “全科醫生”:“傳統模型是專科醫生,而 GLM-4.5 既能診斷病情(推理),又能開藥方(編碼),還能親自手術(智能體執行)。”核心架構解析三能力原生融合:在 Transformer 基礎層設計三條平行能力通道,分別負責邏輯推理、程式碼生成與工具呼叫,通過注意力共享機制實現能力協同。雙模式推理引擎:思考模式:針對數學證明、科學計算等複雜任務,採用 “長鏈式思維(CoT)+ 自我驗證” 策略,推理步驟可達 500 步以上。直答模式:針對聊天、翻譯等簡單任務,採用 “注意力聚焦” 技術,生成速度提升至 100 tokens / 秒。MoE 參數效率最佳化:滿血版 3550 億總參數僅啟動 320 億參與推理,輕量版 GLM-4.5-Air(1060 億參數)啟動 120 億,參數利用率較同類模型提升 4 倍。5.2 性能與成本的雙重顛覆GLM-4.5 的發佈,讓 “高性能 = 高成本” 的行業定律成為歷史。其在 12 項權威評測中拿下開源模型榜首,同時 API 價格僅為 GPT-4 Turbo 的 1/5、Claude 的 1/10。性能封神時刻綜合能力:LMSYS Chatbot Arena Elo 評分 1448 分,僅次於 Qwen3-Max;12 項權威評測綜合得分 79.3 分,位列全球第三、開源第一。中文能力:C-Eval 基準 77.1% 的得分超越所有開源模型,在古漢語理解、中國法律解讀等本土化任務中精準率超 90%。智能體能力:在 AgentBench 基準中以 86.2% 的得分奪冠,能自主完成 “規劃旅行 + 預訂機票 + 生成行程” 全流程任務,無需人工干預。成本屠夫的底氣智譜通過三大創新實現成本控制:稀疏訓練技術:採用 “重要性採樣 + 增量訓練” 模式,訓練資料量減少 60%,成本降低 75%。國產化算力適配:深度最佳化昇騰 910B 晶片,推理效率較輝達 A100 提升 20%,擺脫對進口算力的依賴。API 分層定價:推出 “基礎版 + 企業版 + 定製版” 三級定價,中小企業可享受 0.8 元 / 百萬 tokens 的輸入成本,僅為行業均價的 1/3。這種性價比優勢迅速轉化為市場份額。截至 2025 年 6 月,GLM-4.5 API 呼叫量突破 100 億 tokens,服務超 8 萬家企業客戶,其中不乏華為、小米等科技巨頭。5.3 行業落地:從實驗室到生產線GLM-4.5 的原生智能體能力使其在行業落地中表現出獨特優勢,以下三個案例展現了其顛覆性價值:案例 1:製造業工藝升級某汽車零部件廠商採用 GLM-4.5 建構工藝知識圖譜,將 200 名老師傅的經驗轉化為 3.6 萬條可執行規則。通過智能體自主分析生產資料,最佳化銲接參數,產品合格率從 92% 提升至 98.5%,年節約成本 1.2 億元。案例 2:金融合規審查某股份制銀行部署 GLM-4.5 企業版,用於信貸合同合規審查。模型可自動識別 237 項風險點,審查時間從 3 天壓縮至 2 小時,精準率達 99.2%,較人工審查效率提升 36 倍。案例 3:全端開發自動化某 SaaS 公司使用 GLM-4.5 進行全端開發,僅需輸入產品需求文件,模型即可自動生成前端程式碼、後端介面與資料庫設計。一個中型項目的開發周期從 3 個月縮短至 2 周,人力成本降低 70%。六、巔峰對決:四大模型實戰橫評(2025 Q2)6.1 評測體系:科學度量的 “雙重標準”2025 年的模型評測已形成 “客觀基準 + 主觀對戰” 的雙重體系,我們綜合 LMSYS、SuperCLUE 等權威平台資料,從六大維度對四大模型進行全面評估。評測基準說明客觀基準:MMLU(知識廣度)、GPQA(深度推理)、GSM8K/MATH(數學能力)、HumanEval/MBPP(程式碼能力)、MMMU(多模態)、C-Eval(中文能力)。主觀對:LMSYS Chatbot Arena Elo 評分(10 萬 + 使用者投票)、SuperCLUE 琅琊榜綜合評分(500 人專家團盲評)。6.2 全維度性能橫評表 1:客觀基準核心得分(%)表 2:主觀體驗與綜合能力評分6.3 優勢領域與適用場景基於評測資料,四大模型的能力邊界清晰可見:Llama 4:適合需要全球化部署、依賴成熟生態的項目,尤其在英文場景與學術研究中仍具優勢。Qwen3-Max:全場景無短板,推薦企業級通用 AI 項目,多模態與長文字處理能力突出。DeepSeek-V2:程式碼生成領域的不二之選,適合開發者工具、軟體開發自動化等場景,性價比極高。GLM-4.5:中文場景與智能體應用的最佳選擇,金融、製造等垂直行業落地能力最強。6.4 實戰案例:四大模型同場競技我們選取三個典型場景進行實戰測試,還原真實應用中的模型表現:場景 1:金融年報分析任務:解析某上市公司 2024 年年報(300 頁 PDF),生成財務風險評估報告並提出投資建議。Llama 4:完成時間 45 分鐘,識別出 3 項風險點,建議較為籠統,存在 2 處中文術語錯誤。Qwen3-Max:完成時間 32 分鐘,識別出 5 項風險點,建議具體,圖表分析精準。DeepSeek-V2:完成時間 28 分鐘,識別出 4 項風險點,生成 Python 分析指令碼輔助驗證。GLM-4.5:完成時間 25 分鐘,識別出 6 項風險點,結合中國會計準則提出合規建議,精準率最高。場景 2:全端應用開發任務:根據需求文件生成一個電商商品管理系統(前端 + 後端 + 資料庫)。Llama 4:生成程式碼完整性 75%,需手動修復 12 處語法錯誤,無部署文件Qwen3-Max:生成程式碼完整性 88%,需修復 3 處錯誤,提供基礎部署指南DeepSeek-V2:生成程式碼完整性 95%,零錯誤,自動生成單元測試與 Docker 配置GLM-4.5:生成程式碼完整性 92%,零錯誤,支援一鍵部署至阿里雲伺服器場景 3:醫療影像診斷任務:分析肺部 CT 影像,識別病變區域並給出初步診斷建議。Llama 4:識別精準率 82%,漏診 1 處微小病灶,建議過於保守。Qwen3-Max:識別精準率 91%,無漏診,提供 3 篇相關醫學文獻支援。DeepSeek-V2:識別精準率 88%,漏診 1 處,生成影像分析程式碼供醫生驗證。GLM-4.5:識別精準率 90%,無漏診,結合患者病史給出個性化治療建議。七、生態博弈:分發平台的雙雄會與社區戰爭7.1 Hugging Face vs ModelScope:全球與本土的角力模型的競爭背後是分發平台的較量。2025 年,全球最大 AI 社區 Hugging Face 與中國本土的 ModelScope 形成 “雙雄會” 格局,它們的戰略選擇深刻影響著四大模型的傳播路徑。平台生態資料對比(2025 Q2)Hugging Face 憑藉全球化優勢仍是 Llama 4 與 DeepSeek-V2 的主要分發管道,而 ModelScope 依託阿里雲生態,成為 Qwen 與 GLM 系列的 “主場”。2025 年 5 月,ModelScope 推出 “模型即服務(MaaS)” 專區,企業可直接呼叫微調後的 Qwen3 與 GLM-4.5 模型,上線首月服務量突破 1000 萬次。7.2 社區營運的生死戰四大模型的社區影響力直接決定其生命力。根據 GitHub 與 Hugging Face 資料,2025 年 Q2 社區活躍度排名如下:DeepSeek:GitHub 星標 15 萬,Hugging Face 下載量 9800 萬次,社區貢獻者超 8 萬人。Qwen:GitHub 星標 12 萬,Hugging Face 下載量 1.3 億次,企業貢獻者佔比 42%。Llama:GitHub 星標 18 萬(歷史積累),Hugging Face 下載量 1.2 億次,學術貢獻者佔比 58%。GLM:GitHub 星標 10 萬,Hugging Face 下載量 8500 萬次,行業解決方案貢獻超 2000 個。DeepSeek 的社區活躍度得益於其開發者導向策略,而 Qwen 與 GLM 則憑藉企業客戶優勢實現商業閉環,Llama 則在學術領域保持傳統優勢。八、未來戰局:2025 下半年三大懸念8.1 技術拐點:多模態與智能體的終極融合2025 下半年,四大玩家將聚焦 “多模態 + 智能體” 深度融合。據業內傳聞,Meta 正研發 Llama 4 Ultra,計畫整合即時視訊處理能力;智譜則準備推出 GLM-4.5 Pro,支援工業機器人的端到端控制。一旦實現突破,開源模型將從 “認知智能” 邁入 “行動智能” 新階段。8.2 商業格局:中小企業的選擇決定終局目前四大模型在不同客戶群體中形成分化:Llama 4 主導歐美中小企業市場,Qwen 與 GLM 壟斷中國大企業市場,DeepSeek 則在全球開發者群體中快速滲透。2025 下半年,隨著輕量化模型的普及(如 Qwen3-Next 1.8B、GLM-4.5-Air),中小企業的選擇將成為決定市場份額的關鍵。8.3 規則制定:中國力量的話語權爭奪2025 年,中國開源模型在全球榜單前五佔據三席(Qwen3-Max、GLM-4.5、DeepSeek-V2),但在國際標準制定中仍處弱勢。智譜與阿里正聯合申請 ISO/IEC 開源模型評測標準,若能成功,將打破 Meta 主導的規則體系,重塑全球開源 AI 格局。九、開發者指南:如何選擇最適合的 “神兵利器”9.1 選型三要素:場景、成本與技術堆疊場景匹配度:通用場景優先 Qwen3-Max,程式碼場景選 DeepSeek-V2,中文與智能體場景選 GLM-4.5,全球化場景考慮 Llama 4。成本控制:中小團隊優先 DeepSeek-V2 與 GLM-4.5,大企業可承受 Qwen3-Max 的生態成本。技術堆疊適配:Python 生態選 Llama 4/DeepSeek,阿里雲技術堆疊優先 Qwen,國產化算力適配 GLM。9.2 快速上手教學:四大模型部署實戰(一)DeepSeek-V2 本地部署(RTX 4090)安裝依賴:pip install deepseek-ai transformers accelerate模型下載:huggingface-cli download deepseek-ai/deepseek-v2推理程式碼:(二)GLM-4.5 API 呼叫申請 API 金鑰:https://open.bigmodel.cn/呼叫程式碼:9.3 性能最佳化技巧量化壓縮:採用 GPTQ 量化 Llama 4,視訊記憶體佔用減少 70%。推理加速:使用 vLLM 部署 Qwen3-Max,吞吐量提升 4 倍。微調策略:小樣本任務採用 LoRA 微調 DeepSeek-V2,訓練成本降低 90%。多模型協同:複雜任務採用 “GLM-4.5(推理)+DeepSeek-V2(程式碼)” 組合。結語:開放原始碼的勝利,創新的共贏2025 年的 “四強爭霸” 沒有失敗者,這場激烈的競爭推動開源大模型的能力邊界不斷突破 —— 推理延遲從秒級降至毫秒級,部署成本從百萬級降至千元級,應用場景從實驗室走向生產線。Llama 的生態奠基、Qwen 的全端整合、DeepSeek 的效率革命、GLM 的架構創新,共同構成了開源 AI 的繁榮圖景。對於開發者而言,這是最好的時代。前所未有的技術選擇、極低的准入門檻、活躍的社區支援,讓每個人都能成為 AI 創新的參與者。而對於整個社會,開源大模型正以普惠之力,推動 AI 技術從少數巨頭的壟斷走向全民共享的新時代。這場爭霸仍在繼續,2025 下半年的技術更新將帶來更多驚喜。但無論最終格局如何變化,開源精神所孕育的創新活力,終將成為驅動 AI 時代前行的核心動力。 (AI雲原生智能算力架構)表 1 2025 年開源大模型“四強爭霸”格局分析
外媒報導:矽谷吹起“千問恐慌"
阿里巴巴推出的AI語言模型──Qwen系列/千問App,美國產學研各界都有較好的應用。而據評價稱,Qwen系列可與ChatGPT匹敵,這已經使得矽谷漸漸有些坐立難安。外媒稱:「千問恐慌」正在矽谷吹起。而這也折射了中美兩國AI越發激烈的競爭態勢。►►► 大語言模型:應用和成本之戰過去一年,阿里巴巴不僅推出了Qwen大型語言模型系列,還發佈了一款與ChatGPT直接競爭的消費級App。想像一下,一個AI代理人可以協助你在淘寶購物、用地圖規劃路線、在支付寶處理付款、支援企業協作與最佳化供應鏈物流。這就是千問App最大優勢:AI能直接嵌入一個龐大且成熟的應用宇宙。相較之下,ChatGPT多數情況仍是獨立產品,與消費者的生活應用場景連結有限。Airbnb  CEO 布萊恩·切斯基(Brian Chesky)公開表示,說他們依賴阿里Qwen模型勝過勝過ChatGPT,形容它「快速、便宜到不可思議」。千問恐慌,背後代表的是AI競賽正從「誰的模型更聰明」,轉向「誰能打造最強的開發生態與更高的滲透速度」。►►►矽谷開發者的選擇:性價比才是王道就跟今年初DeepSeek出現帶來的影響一樣,當全球開發者發現,他們可以用更低的成本,獲得性能足夠好的AI模型和運算能力時,「技術最先進」的重要性就會被「性價比最高」取代。《DIGITIMES》報導指出,Qwen系列在美國技術社群的下載資料、採用率明顯上升。2025年,Qwen系列模型,在開源社群平台Hugging Face平台的下載量達到3.85億次,超越了Meta的Llama(3.46億次)。目前有誰在用阿里的Qwen模型呢?亞馬遜用Qwen開發下一代送貨機器人的模擬軟體;蘋果因監管限制,選擇Qwen為中國大陸版Siri提供AI功能。OpenAI  前CTO  Mira Murati的新實驗室也將Qwen納入預設的微調選項。學術界頂尖機構也正在採用Qwen模型,史丹佛大學李飛飛領導的研究團隊,用Qwen2.5-32B建構頂級推理模型S1,成本不到50美元。Google前 CEO  施密特(Eric Schmidt)曾提出一觀點,他表示,美國最大的AI模型,由於受限於監管風險,不但沒有開源,而且收費昂貴;反觀中國AI模型免費還開源,世界無可避免地將轉而採用中國AI模型。據瞭解,為了應對Qwen的崛起,美國甚至啟動ATOM計畫(American Truly Open Models),一個由產業領袖和研究人員組成的聯盟,用以推動美國的開源模型發展。►►►中國AI產業贏過美國?阿里巴巴帶起的千問恐慌,可能只是體現出一部份的中國AI技術潛力。《經濟學人》指出,中國半導體產業得到政府大力支援:從設立基金、限制外資晶片產品流通、到本地晶片優先採購政策。而人才基數龐大、AI開發者社群活躍,也在加速建立中國半導體生態系統,這些都是中國AI模型得以快速落地的重要推力。中國「低成本的開源模型」最終可能讓多數開發者倒戈,幫助讓中國的晶片競爭力進一步崛起。新南威爾斯大學AI專家Toby Walsh表示:「這些中國模型的成功證明了,美國出口管制未能限制中國。事實上,它們反而鼓勵中國公司更有創造力,打造出體積更小、還能在舊世代硬體上訓練與運轉的優秀模型。」美國的「千問恐慌」反映了未來的AI勝負,恐怕不在於誰擁有最強算力,而是那個模型能最快、最深入地嵌入人們的日常生活。 (芯聞眼)
白宮連夜指控!為何阿里千問讓美國害怕?
再一次,美國對中國科技公司下手了!就在11月14日,阿里的千問APP上線當天,據英國《金融時報》報導稱,白宮連夜緊急拋出“國家安全”備忘錄,指控阿里巴巴協助中國軍方威脅美國。隨後阿里巴巴和中國駐美使館相繼闢謠和駁斥。科技戰烽煙再起。在《金融時報》看來,白宮的指控反映出了美國對中國雲服務、人工智慧以及中企相關技術發展的擔憂日益加劇。而在這場美國精心策劃的指控背後,我們需要重點瞭解幾個問題:為什麼美國在當下這個節點對阿里發起指控,美國在害怕什麼?為什麼是阿里千問讓美國生出了緊迫感,阿里又是如何應對?在這場中美AI競賽的背後,更深層次的邏輯我們又該如何看待?美國,在害怕什麼?美國對阿里“下手”這件事,很多不瞭解的人會覺得突然。但事實上,真正關注AI界的人士就知道這不是美國的心血來潮,因為阿里Qwen(ps:阿里千問APP正是基於阿里Qwen最強模型打造)已經在矽谷乃至全球掀起了一波又一波的風暴:先是在今年10月份,輝達CEO黃仁勳在2025GTC大會上表示在全球開源模型中,輝達與Qwen斷層領先,並且來自中國的Qwen已佔據開源模型的大部分市場份額,這一領先優勢還在持續擴大中。緊接著,在10月22日,愛彼迎Airbnb CEO布萊恩·切斯基在媒體採訪中公開表示,公司正“大量依賴阿里巴巴的Qwen模型”,並直言“比OpenAI更好更便宜”。這一言論更是在美國引發熱議,美國AI知名專家Nathan Lambert甚至表示:矽谷看起來是建立在Qwen之上的?此外,還有馬斯克、推特創始人傑克·多爾西、李飛飛等美國一眾科技大佬紛紛點贊通義千問的開源大模型。並且,更值得一提的是,一眾科技大佬不光是口頭點贊,更是直接將Qwen應用到了企業當中,如亞馬遜在加速佈局的人形機器人領域採用了阿里Qwen模型;多家日本新興AI企業和阿聯穆罕默德·本·扎耶德人工智慧大學均以Qwen為基礎模型進行了二次開發。從矽谷到日本、阿聯等國,可以說,Qwen已在AI領域展現出了強悍的“統治力”。而這就觸犯到了美國當前最重要的“命脈”——在AI這件事情上,美國政商兩界,尤其是美國矽谷正進行著一場價值超1兆美元的世紀“豪賭”。早在今年1月份,由美國川普政府牽頭,OpenAI、軟銀集團和甲骨文公司聯合主導推出了“星際之門”計畫,在未來四年內投資5000億美元建設下一代AI基礎設施,確保美國在AI領域的領導地位。而在今年9、10月份,短短幾周時間內,OpenAI、輝達、AMD、甲骨文和英特爾等矽谷科技企業更是砸下天文資金,開啟了“抱團”內循環模式,並且美國政府也默許這種巨頭間的“聯盟”。這背後很重要的原因就是美國政商界達成了一個共識,美國當下的困境想要得到解決,很大程度上依賴美國AI領域帶來的大爆發。但商業社會中有一個不變的鐵律,同樣成本下的更高品質,或者同等品質下的更低價,永遠是具有第一競爭力的。這是經濟學的基本規律,也是全球化的基本規律。過去這套邏輯對美國最有利,所以美國堅持;但當這套邏輯對美國不利時,美國就開始搞雙標路線:在AI領域,Qwen的闖入,無疑打破了美國的AI內循環,讓美國真真切切感受到了危機,甚至美國擔心自己的AI投入最終淪為他人的“嫁衣”。於是美國對阿里下手了,所以,也就出現了文章開頭那一幕,高舉“安全“之旗,使一些損招、壞招。阿里千問今天的遭遇,不過是現代版的“君子無罪,懷璧其罪”。千問大模型橫掃矽谷後,千問APP上線能夠預見,白宮連夜緊急拋出“國家安全”備忘錄,指控阿里巴巴協助中國軍方威脅美國,只是美國對阿里“使壞招”的第一步,後續顯然還會有更多手段出現。回顧過去美國針對日本東芝、法國阿爾斯通等境外企業的打壓手段,你會發現總是那麼幾樣:設定貿易壁壘,提高關稅,壓榨企業的利潤;限制本國供應商對你的原材料供應、技術支援,從產業鏈上游遏制你的發展;通過扣上莫須有的罪名,企圖通過威逼利誘,讓對方“認罪就犯”……總結來看,美國對外採用的,是一種“規則霸權”,即:先制定一套對美國有利的規則,並要求全世界按照這套規則來,但如果有人能在這套規則下依然能對美國形成挑戰(或者當下的規則不符合美國的利益了),那麼他們就改變規則(或者說,重新定義規則)。但美國忽略了一點,中國企業不是日本東芝,也不是法國阿爾斯通,不會任人宰割。曾經美國想用晶片卡我們的脖子,以為鎖住了我們的硬體,就能鎖住我們的未來。但他們沒想到,我們的晶片產業在短短幾年就追趕了上來,儘管還有差距,但已經不擔心“斷供”的問題了。並且要知道,今時已不同往日,過去面臨科技戰,我們是被壓著打,沒有還手之力,只能臥薪嘗膽。但今天在AI競賽上,中國是能夠和美國抗衡的,其中阿里的Qwen又是佼佼者,這裡再列幾組資料:1.全球下載量及衍生模型雙第一。從2023年至今,Qwen已開源300多款模型,囊括文字、程式設計、圖像、語音、視訊等「全模態」,覆蓋0.5B到480B等「全尺寸」,在全球主要模型社區的下載量已經突破6億,衍生模型突破17萬個,Qwen超越Llama成為全球第一的開源模型家族。過去三年,阿里保持穩定敏捷的研發節奏,堅持最大力度的全面開源策略,推動Qwen為代表的中國開源模型實現對美國頂級模型的追趕乃至反超。如今,Qwen穩居全球AI大模型第一梯隊。2.全球貢獻第三。根據史丹佛大學人工智慧研究所《2025年人工智慧指數報告》指出,中美頂級AI大模型性能差距大幅縮至0.3%,接近抹平,阿里Qwen重要模型貢獻度位列全球第三。3.持續屠榜。Qwen大模型屢次斬獲Chatbot Arena、司南OpenCompass等權威榜單“全球開源冠軍”、“國產模型冠軍”,多次登頂HuggingFace、Github的最熱趨勢榜單。4.最多企業接入。目前,Qwen已經服務了超100萬家客戶,包含寶馬、西門子、星巴克、歐萊雅、渣打集團、萬豪、LV等全球頭部品牌。據國際權威調研機構沙利文(Frost&Sullivan)最新報告顯示,在2025年上半年的中國企業級大模型呼叫市場中,Qwen佔比位列第一,是中國企業選擇最多的大模型。越到難時,越做難事。可以說,阿里Qwen上演了一個在中國AI領域需要領軍者時,主動站出來持續向上突破,向下紮根的故事。還值得一提的是,無懼美國的壓力,阿里的Qwen在橫掃矽谷後,更是直接上線了千問APP。作為基於Qwen最強模型打造的一款同名個人AI助手,千問APP全面對標ChatGPT,加入到全球AI應用的頂級競賽。並且,千問APP的價值,不僅僅只是個人AI助手這一功能,其最大的價值是在於借助Qwen的開源技術優勢,在全球範圍內建構一個以Qwen為底層、以中國開源生態為核心的AI系統入口。當中國AI以“基礎設施”的形式嵌入到世界技術版圖時, 這也正是阿里千問大模型開放原始碼的價值所在。開源,就意味著全世界的科技企業都可以基於Qwen進行開發。這不再是中美兩家公司的競爭,而是中國引領的‘開放生態’和美國主導的‘封閉生態’的競爭。他們築起高牆,我們打開大門。世界AI的牌桌上,曾經只有一個玩家在制定規則。但現在,另一個玩家帶著最強的開源模型和億萬使用者的場景落座了。過去三年時間裡,千問大模型已經贏得了全球開發者。而當千問APP國內版和國際版相繼上線後,新的AI牌局,才剛剛開始。除了勝利,我們別無選擇縱觀歷史,我們從來不惹事,但也從來不怕事。我們始終敞開懷抱,期待在良性競爭中,尋求合作與共贏。但是這一次,當阿里千問以開源之姿登上世界舞台,當中國技術的力量開始重新定義全球AI格局時,美國又坐不住了。商場如戰場,雖無硝煙,卻早已刀光劍影,情勢永遠比你我目光所及的要洶湧澎湃。這不是普通的商業競爭,阿里千問被美國指控這件事,本質上是一場關係著中國有沒有發展高科技、發展AI的權利,有沒有資格參與制定未來規則的根本性較量。這不是某個企業的難題,而是我們所有國人都要面臨的難題;這也不僅是科技和經濟的角逐,更是關乎我們每個人的未來。某種程度上來說,千問的命運其實就是國家命運的一部分。也因此,除了前進,我們別無選擇。除了突破,我們別無選擇。除了勝利,我們別無選擇!面對即將到來的風浪,阿里從來都不孤獨,千問不是唯一一個,也不會是最後一個。但是,在一波又一波的風浪中,我們看到,中國正在走得更加從容;而中國的科技企業們在面臨美國和其他強敵打壓時,也在不斷迎難而上,開創出更加廣闊的天地和未來。 (正和島)
阿里發佈千問APP,白宮又急了
阿里又被白宮盯上了。11月14日,據《金融時報》報導,一份白宮備忘錄指控阿里為中國軍方提供技術支援,威脅美國國家安全。阿里和中國大使館駁斥其言論不實。巧合的是,就在此前一日,彭博社指出,阿里將開拓AI C端應用,打造個人助手 千問APP。這兩個事件的接續發生,難免引起吃瓜群眾的困惑:阿里新發一個APP而已,白宮你慌啥啊?要算起來,阿里也是美國黑名單上的常客了。2011年和2016年,淘寶兩度被美國貿易代表辦公室列入“惡名市場”名單。2018,美國當局阻止了螞蟻金服對美國匯款企業速匯金國際的收購競標,並呈交提案建議將其列入貿易黑名單。2022年,美國以“國家安全”為由,審查阿里雲為美國企業提供的服務是否構成風險。2025年,白宮和眾議院官員對蘋果與阿里合作、為中國市場的iPhone引入AI功能發出質詢。眾所周知,對於中國企業,白宮一向“誰強撅誰”。以上制裁,側面印證了阿里的四項業務在全球範圍內的影響力。電商方面,阿里“全球買、全球賣”的跨境貿易網路已覆蓋200多個國家和地區,服務超7億海外使用者,可與美國老牌電商亞馬遜“爭天下”。在2025年雙11期間,阿里速賣通上超200個品牌的成交額反超亞馬遜日均量的兩倍。專攻金融的螞蟻集團則一度位列全球獨角獸企業首位,全球使用者規模和業務覆蓋範圍均居行業前列。阿里雲是世界上排名第三大的雲端運算公司,與美國最大兩朵雲——亞馬遜AWS、微軟Azure,並稱3A,在全球市場展開激烈競爭。到了AI時代,阿里基於Qwen大模型的AI能力似乎更讓美國膽寒。目前,阿里Qwen系列大模型的下載量、衍生模型量已超越美國Meta公司的Llama,雙雙問鼎世界開源模型界。其在全球的下載量已經突破6億,衍生模型突破17萬個,使用者不乏輝達、微軟、亞馬遜等全球AI領軍企業。▲來源:每日經濟新聞史丹佛大學《2025年人工智慧指數報告》指出,Qwen的重要模型貢獻度位列全球第三,且中美頂級AI大模型性能差距大幅縮至0.3%,接近抹平。在11月4日剛結束的、由美國機構Nof1發起的全球AI大模型即時投資比賽中,Qwen3-Max以22.32%的收益率奪冠;而GPT-5、Gemini 2.5 Pro等四大美國頂尖模型不僅落後還全部虧損,其中GPT-5以虧損超62%墊底。輝達CEO黃仁勳在2025年5月29日的財報電話會上表示,來自中國的Qwen和DeepSeek是開源AI模型中最好的,且已在美國、歐洲及其他地區獲得了巨大關注。愛彼迎CEO布萊恩·切斯基在媒體採訪中公開表示,公司“大量依賴Qwen模型”,並直言“比OpenAI更好更便宜”。推特創始人傑克·多爾西於2025年7月24日發文公開點贊Qwen3-Coder,表示希望“與Qwen3-Coder合作出激烈火花”。而讓美國破防的千問APP正是基於Qwen最強模型打造。據悉千問App劍指ChatGPT——這位業內曾經唯一的規則制定者,這位企圖通過停用令、將中國早早趕下牌桌的C端AI先手玩家。現在,一位中國新玩家帶著最強開源模型落座了。世界AI牌局新啟,懸念迭出。對全球使用者而言,個人AI APP大概將多一個夠好、甚至更好的選項。對美國人來說,曾經的打壓恐怕將托舉起中國C端AI應用的又一顆“超新星”,進一步丟失在全球範圍內的AI份額,他們的慌由此也可理解。而這,也許只是個開始。“我們正在積極推進三年3800億的AI基礎設施建設計畫,並將會持續追加更大的投入。從我們現在看到的AI行業遠期發展以及客戶需求角度來看,為了迎接ASI(超越人類智能、能夠自我迭代進化的超級人工智慧)時代的到來,對比2022年這個GenAI的元年,2032年阿里雲全球資料中心的能耗規模將提升10倍……我們相信通過這樣的飽和式投入,能夠推動AI行業的發展,迎接ASI時代的到來。”阿里巴巴集團CEO吳泳銘於今年9月的雲棲大會上震撼人心的演講,似乎還在耳畔。而在堅定的“飽和式投入”下,Qwen目前所達成就,遠期看也許只是起跑線。千問APP的底氣還不止有Qwen。它的另一個殺手鐧,是阿里集團內的商業生態。我們早已習慣用淘寶天貓購物,用支付寶付款,用高德地圖導航,用釘釘辦公、用夸克搜尋……這些和千問APP同屬於阿里集團的王牌應用,早已深入到我們生活方方面面,從而有望在未來為千問APP提供加持——這些海量真實場景是OpenAI等競爭對手可望不可及的資源。再結合阿里雲在B端服務中沉澱的豐富行業知識,千問APP的前途充滿想像。由此,千問APP在阿里體系內的自我迭代飛輪已呼之慾出,速度可能快到超乎美國人想像。其實回看阿里的發展歷程,會發現toB而優則toC曾反覆上演,且劇情極為精彩。2003年,當時阿里在B2B主業扭虧為盈、打開了局面,卻決定要奔赴一場新的“折騰”。受到雅虎日本商業模式的啟發,以及非典疫情中網際網路商業重要性凸顯的觸動,阿里開發一個名為“淘寶”的C2C平台。後來的故事你已知曉。這一平台不僅打敗了美國網際網路巨頭eBay旗下、當時在中國市場佔據絕對優勢的易趣,成為中國電商界無可爭議的一哥,並在世界範圍內廣為人知。而與淘寶同年誕生的支付寶,最初的使命不過是憑藉“擔保交易模式”,解決集團內的買賣雙方信任問題。十年後的2013年,面向個人使用者的餘額寶產品正式發佈,成為國內首隻網際網路基金。上線後第四天,餘額寶便登上了央視新聞聯播。上線後第六天,使用者數突破100萬。2017年,支付寶成為全球最大的貨幣市場基金,超越了之前的冠軍——摩根大通美國政府貨幣市場基金。歷史屢次重演的背後,大概也有其必然性。在“務實”層面,B端優勢技術往往鑄成C端突圍的利劍。在“務虛”層面,則是“客戶第一”“擁抱變化”的企業文化。當然,還有勇於拚搏的一代代阿里人。這些要素,一次次地助力阿里有效地將B端的優勢傳導至C端的開拓,並最終成為C端市場的重磅玩家,乃至重塑行業形態與認知。而如前所述,在AI時代,阿里的B端優勢已顯著到震撼世界。在如此厚實的家底上,千問App有望續寫阿里自B to C歷史更為輝煌的篇章,且是在全球的尺度上——代表中國力量,粉碎美國AI霸權的美夢。儘管此前阿里在AI領域更多著墨於B端的拓展,千問APP在C端才剛起步,卻已引得美國人嚴陣以待。那麼加油吧阿里,怎麼能讓他們失望? (華商韜略)
獨家丨千問 app,阿里要怎麼做中國的 “ChatGPT”
今年阿里第三次集中力量辦大事。在科技公司大建 AI 的敘事裡,阿里之前更像美國的亞馬遜、微軟 —— 沒有微信、抖音那樣的全民流量入口,AI 投入選擇偏向企業客戶,不斷買卡建算力中心,以雲端運算業務抓住千行百業對 AI 的渴望。過去幾年,阿里在 AI 方面的主要進展也不在應用層 —— 入股多家中國頭部大模型創業公司、自研的 Qwen 系列大模型在諸多測試贏過其他開源模型、阿里雲加速增長。但 AI 助理 “千問 app” 在 11 月 17 日正式宣佈公測說明阿里想要更大的劇本。新的千問應用明確對標 ChatGPT 最新的 5.1 版本。它由此前的通義 app 和夸克 AI 對話助手升級而來,接入阿里通義實驗室最新的 Qwen 3 - Max 模型。這是繼 AI 基建、淘寶閃購後,阿里今年宣佈的又一個集團戰略項目,負責人是阿里巴巴智能資訊事業群總裁吳嘉。9 月起,上百名阿里工程師聚集在阿里巴巴西溪園區 C4 樓封閉開發 —— 和高德掃街榜上線前類似。ChatGPT、千問、豆包登陸後的初始介面。據我們瞭解,此次推出的是初級版本,很快會有大更新。除了會聊天,千問項目團隊還在聯合包括淘寶、高德、閃購、支付寶等產品的團隊聯合開發,希望更深嵌入相關產品,解決使用者的實際問題。一位阿里人士說,“阿里有很好的模型基礎,在 C 端肯定要有一個很強的入口,且要做一個 AI 原生應用,阿里會把 AI 超級入口的重點集中在千問上。”中國網際網路巨頭可能都沒有亞馬遜、微軟那樣奢侈的選擇權——退後一點,讓 ChatGPT、Gemini、Claude 接入自己的產品庫。豆包背後的字節跳動有辦公軟體也有自己的電商平台。在這裡,每個巨頭都必須保證自己有流量入口。拼多多內建短影片、阿里進入外賣大戰都是入口之爭。而聊天助手是目前最直接可見的 AI 入口。我們訪談了千問項目的產品經理和其他一些參與的阿里人士,回答為什麼阿里現在推出千問 app,之後的策略是什麼。以下是阿里相關人士回答,經刪減和調整,未改變對方原意。晚點:距離 DeepSeek 時刻已經過去快一年,為什麼現在做千問 app?千問團隊:阿里肯定要有一個非常強的 to C 的入口。這是每家大公司都在思考討論的問題,只是可能路徑不太一樣,和每家公司的業務構成和業務形態、能力累積等都有關聯。阿里的路徑肯定是從雲、基礎模型開始做,模型能力是最重要的,然後再回到 C 端。當下的時機剛剛好,有兩個原因促使我們要重點去做千問這款原生的 AI 產品:1. 模型的成熟度,Qwen3 - Max 整體性能、效果都已經達到全球領先。2. 整個 Agent 生態的成熟度,不管是整個三方生態還是集團內部的生態,都到了一個更能被模型普遍呼叫、能解決更多問題的狀態,我們也花了大量時間處理內部業務的資料互通,還有整個的授權能力。補充:一些事實和行業情況今年阿里每隔幾個月都會有關於 AI 的大動作 —— 2 月發佈 24Q4 自然季財報前,宣佈未來三年將投入超過 3800 億元建設雲和 AI 硬體基礎設施;5 月發佈 25Q1 自然季財報前,正式發佈通義千問 Qwen3 大模型;9 月中旬,The Information 報導稱阿里開發了一款新的 AI 晶片;再過一周,阿里將發佈新一季財報。晚點:對手產品已經推了半年,阿里現在做一個 AI 原生超級入口,晚嗎?千問團隊:不晚,原因也是兩點:1. 國內還沒有一款 AI 應用能夠穩定突破億級 DAU(日活躍使用者),這是一個重要的體量門檻,意味著至少國內還沒出現一個國民級的 AI 應用;2. 不論國內那款產品,客觀說還處於初級階段,沒有真正演進到能解決很多實際問題的程度。大家都是基於本身的知識和優勢來輔助人,而要邁過這個智力門檻,需要的不只是資料,更多依賴在理解世界、自主學習等底層架構上的突破。”補充:一些事實和行業情況今年 3 月,吳嘉對我們說,隨著模型能力的發展,現在到了應用的爆發階段,如果以過億 DAU 為標準,面向 C 端使用者的中國 AI 超級應用一定會很快到來,“不是 2025 年,就是 2026 年上半年。”QuestMobile 資料顯示,2025 年 10 月,AI 原生應用中,豆包的 DAU 最高,5410 萬;DeepSeek 2860 萬,騰訊元寶 560 萬(未包括直接微信裡使用元寶的使用者,但那更少)。作為對比,OpenAI 10 月披露 ChatGPT 全球周活躍使用者超過 8 億,以此推斷日活不可能少於 1 億,可能接近 2 億。晚點:“對標 ChatGPT”,千問要做成什麼樣的產品?千問團隊:千問定位是一款能聊天、會辦事的產品,能夠幫使用者真正解決很多實際問題。P 圖本身也是需求的組成部分,但只有覆蓋了使用者工作、學習和生活當中的大部分問題,才能走到 1 億 DAU。目前千問團隊最重要的是怎麼能夠徹底去激發模型的力量,把它和使用者現在和潛在、未來的需求進行更高程度的關聯。我們的主要工作分為兩個階段:第一階段,核心做好使用者體驗和口碑評價,基於模型快速進行產品迭代;第二階段是千問和阿里各個業務的整體協同,目前千問與高德、淘寶、支付寶、閃購等都已經在做一些聯合開發的工作,進展非常快,預計很快還會有大版本的更新。辦事能力指的就是能解決更複雜的任務,比如結合淘天的 AI 萬能搜,千問基於過去使用者的喜好習慣給使用者做推薦,甚至比價;再比如使用者有一個晚上想做的菜,千問能基於這個菜幫使用者提前買好對應的食材。晚點:千問和 ChatGPT 的產品思路會有什麼區別?千問團隊:會有不同:1. 我們強調普通人可以隨時用、免費用。目前完全不考慮收費的事,專心做好產品;2. 我們希望 ChatGPT 有的能力我們都有,很多會快速上線,另一方面 ChatGPT 沒有的我們也有,主要就是阿里生態裡的各種 agent 服務,內部業務合作、協同的程度會更深。我們必須承認,中國網際網路實際是封閉的,大家都把自己的資產當作最強的競爭門檻。這對於每一家網際網路大公司都是一個普遍問題。ChatGPT、Gemini 都驗證了一個路徑,依託模型的領先可以在 C 端產品上實現突破,這件事的本質是對模型智力的追求,我們的思考路徑也是一樣的。對千問團隊最大的挑戰是,阿里體系下有這麼多 agent,怎麼基於場景把它們更好地串聯在一起?使用者很多需求使用的不是一個或者兩個 Agent 的服務,比如說我想要規劃一個團建,呼叫的不只是飛豬,可能還有很多支付、出行、購物等一系列能力,怎麼把它們有機且絲滑得串聯在一起,這個難度比較大,因為每一個 Agent 的能力成熟度不一樣。晚點:什麼時候確定開始做千問,誰來主導?千問團隊:產品、演算法層面一直在做相關的準備工作,不是一次拍板,是個演進的過程。差不多在 2025 年夏天,阿里核心管理層的討論會更多一些,確定阿里要投入多少資源,投入多少力度去做這件事情,國慶前是阿里上上下下對千問項目討論最密集的時候。最終是吳泳銘做出的判斷和決定 —— 阿里巴巴必須要有一個 AI 原生的 C 端超級入口。9 月後,從北京、廣東調來上百名工程師,大家在阿里巴巴西溪園區 C4 樓封閉做千問項目,現在這幫人坐的地方是三層和四層,高德掃街榜當時封閉時坐的是二層。千問是高德掃街榜之後的又一個集團戰略級項目,吳嘉是負責人,團隊以智能資訊事業群為主,還有很多業務都參與,包括阿里雲、通義實驗室、淘天、高德等,一起在做共同開發。千問產品和大模型的對接,在產品方向上,由夸克團隊和通義實驗室一起針對拿到的使用者資料和反饋、各種應用場景做定製化的模型訓練和最佳化。晚點:阿里消費端 AI 的戰略具體是什麼樣的?千問團隊:面向使用者,一塊是原生應用,也就是千問;另一塊是原本業務的 AI 化,夸克、淘天、1688、高德、海外電商等都在做一些事實半年前,吳嘉對我們說,他希望夸克成為一個對使用者有用、專業、萬能的 AI 產品。“我們的第一優先順序肯定是讓夸克現如今這麼大的群體都享受到 AI 帶來的價值。”但夸克應用包羅萬象。需求最大的是搜尋,還有相當數量的使用者會在夸克網盤裡直接看劇。88VIP 有一項權益是贈送夸克網盤會員。根據 QuestMobile 的資料,夸克的 DAU 在 2025 年 1 月為 2970 萬,一直到 10 月,這個數字也只小幅增長到 3370 萬,與之對比的是,豆包 9 月較前一個月就多了 850 萬 DAU。一位阿里人士說,夸克的部分流量一直未被第三方資料標記,導致外部統計並不精準,目前實際 DAU 在 5000 萬 - 6000萬之間。2025 年,夸克關於 AI 的動作頻頻,上線了超級框、高考志願大模型、AI 創作平台、AI 眼鏡、AI 對話助手等。千問團隊:產品形態上,千問這樣的 chatbot 和夸克的超級框,其實不完全矛盾。打個比方,肯定不是說 Google 做了 Gemini,Google search 就不重要了。2025 年上半年,阿里當時的確希望通過夸克來嘗試 AI 時代的入口。夸克有原來的使用者、產品基礎,而且是一款年輕人都在用的產品。隨著 AI 能力的提升,我們覺得對話式 AI 助手是更好的形式,接下來阿里會重點發展千問,並把它放進夸克。夸克的定位是 AI 搜尋和 AI 瀏覽器。過去一兩年,阿里在組織上有一個非常大的變化,比如閃購這場仗不是閃購自己也不是淘寶自己打。它在競爭裡能站穩腳跟的本質,是集中了整個阿里所有的優勢資源,明確指揮官,統一指揮。 (晚點LatePost)
阿里秘密啟動"千問"項目,全面對標ChatGPT!AI大戰進入白熱化階段
重磅消息:阿里正式進軍C端AI應用市場11月14日,科技圈傳來重磅消息:阿里巴巴已秘密啟動"千問"項目,基於Qwen最強模型打造一款同名個人AI助手——千問APP,全面對標ChatGPT,正式加入全球AI應用的頂級競賽。這一消息標誌著阿里AI戰略的重大轉向。此前,阿里重兵一直放在B端AI市場,通過阿里雲向各行各業提供模型API服務。基於Qwen的優秀性能和國際影響力,阿里管理層認為啟動千問C端之戰的時機已經成熟。千問項目的戰略意義從B端到C端的全面佈局千問項目的啟動意味著阿里大模型的側重點已經從側重B端(通過雲服務)和開發者(通過開源),正式向C端大眾市場傾斜。通義千問將不再僅僅是嵌入釘釘、淘寶等應用的功能,而是一個獨立的、功能完整的超級APP,這更符合使用者的使用習慣,也更能形成品牌認知。3800億投入後的重要落子這是年初公佈3800億投入AI基礎設施之後,阿里AI戰略的又一重要佈局。阿里核心管理層將其視為"AI時代的未來之戰",希望借助Qwen的開源技術優勢贏得競爭。全球AI競爭格局加速演變馬斯克xAI完成150億美元融資與此同時,馬斯克旗下AI初創公司xAI完成150億美元融資,估值躍升至2000億美元。融資將主要用於採購GPU以支援大語言模型開發,並加速擴建資料中心以增強算力。軟銀孫正義清倉輝達轉投OpenAI軟銀集團創始人孫正義通過一系列激進投資佈局全球人工超級智能(ASI)領域,清倉輝達轉而斥資300億美元加碼OpenAI,並收購ABB機器人業務,建構從晶片設計到AI基礎設施的全產業鏈版圖。技術突破與產業進展中國完成第一階段6G技術試驗從工業和資訊化部瞭解到,中國已連續四年組織開展6G技術試驗,目前已完成第一階段6G技術試驗,形成超過300項關鍵技術儲備。這一進展標誌著中國在下一代通訊技術領域取得重要突破。中國國產GPU廠商迎來上市潮證監會同意沐曦積體電路科創板IPO註冊,同時摩爾執行緒披露首次公開發行股票並在科創板上市招股意向書,本次發行初步詢價日為11月19日,申購日為11月24日。市場反應與投資機會科技股表現分化受AI投資熱潮影響,美股科技類股出現分化。特斯拉跌超6%,英特爾跌超5%,AMD、甲骨文跌超4%,輝達跌超3%,亞馬遜、Google跌超2%。中概股業績亮眼中芯國際披露三季度業績,淨利潤同比大增43.1%;騰訊控股第三季度營收1928.7億元,同比增長15%;京東集團第三季度收入2991億元,同比增長14.9%。未來展望:AI應用生態的全面爆發千問項目的啟動標誌著中國AI產業正式進入應用生態全面爆發的新階段。隨著各大科技巨頭在AI領域的持續投入和佈局,未來幾年將見證AI技術在各行各業的深度應用和商業化落地。從技術研發到產品應用,從B端服務到C端消費,AI正在重塑整個科技產業的競爭格局。阿里的千問項目能否在激烈的競爭中脫穎而出,值得市場持續關注。作者觀點:阿里千問項目的啟動,不僅是對ChatGPT的直接挑戰,更是中國AI產業從技術追趕嚮應用引領轉變的重要標誌。在算力、演算法、資料三大要素的支撐下,中國AI企業有望在全球競爭中佔據更加有利的位置。 (閒來無事觀江流)
彭博:矽谷有多少技術是建立在中國人工智慧基礎上的?
凱瑟琳·索貝克是彭博社專欄作家,主要報導亞洲科技領域。此前,她曾擔任CNN和ABC新聞的科技記者。中國開源人工智慧正在走向世界。 圖片:Ying Tang/NurPhoto/Getty Images輝達公司首席執行官黃仁勳曾表示“中國將在人工智慧競賽中獲勝”,但後來軟化了立場,稱美國“落後納秒”。人工智慧行業正在發生微妙的轉變,低成本、開放原始碼的中國人工智慧模型正在吸引全球使用者,並贏得矽谷的青睞,像 Airbnb 和 Cursor 這樣的公司都在使用中國的人工智慧工具。就開發者累計下載量而言,中國模型已經超過了美國,阿里巴巴的Qwen下載量超過了Meta Platforms Inc.的Llama,基於Qwen建構的衍生系統佔新語言模型的40%以上。輝達公司首席執行官黃仁勳的初步評估過於簡單,他對美國的負面看法也顯而易見。過去一年,他一直辯稱,儘管華盛頓不斷加強出口管制,但他的公司向中國市場銷售晶片,美國仍然從中受益。但他擔心開發者爭奪戰可能已經開始失控,這種擔憂不無道理。 該立場表示,美國的競爭對手僅僅落後“幾納秒”,因此美國必須“奮起直追,贏得全球開發者的青睞”,才能最終勝出。近幾周來,一種微妙的轉變愈發明顯。幾個月來,一直有傳言稱,低成本、開放原始碼的中國人工智慧模型可能會將全球使用者從美國產品中吸引過來。但現在看來,它們也正在悄然贏得矽谷的青睞。風險投資家查馬斯·帕裡哈皮蒂亞(Chamath Palihapitiya)最近在他頗具影響力的播客節目“ All-In ”(由白宮人工智慧主管大衛·薩克斯共同主持)中表示,他合作的一家公司已將大量工作負載轉移到北京登月人工智慧公司開發的Kimi K2平台。他表示,這種開源模式“坦白說比OpenAI和Anthropic便宜得多”。不久之後,Airbnb首席執行官布萊恩·切斯基承認,他沒有將Airbnb的旅行應用程式與OpenAI的ChatGPT整合,是因為相關的連接工具“尚未完全準備就緒”。切斯基表示,Airbnb的新客服代理依賴於十幾種不同的AI模型。他們“非常依賴”阿里巴巴集團控股有限公司的Qwen產品線:“它非常好,而且速度快、成本低。”考慮到切斯基與OpenAI首席執行官薩姆·奧特曼的密切私人關係,他的這番言論尤其引人注目。公開表示認可的案例越來越多。由OpenAI前首席技術官Mira Murati創立的初創公司Thinking Machines Lab在一篇部落格文章中表示,其最新研究受到了阿里巴巴Qwen3團隊的啟發,並在此基礎上進行了拓展。但或許更有意思的是,這種轉變正以更為微妙的方式悄然發生。備受矚目的AI程式設計領軍企業Cursor估值約100億美元,上個月發佈了新版助手。一位科技投資者在X論壇上指出,他在使用Cursor時,它的內心獨白突然切換到了中文。此後,網路上紛紛猜測Cursor的助手是基於類似DeepSeek的中國AI工具開發的。另一家估值約100億美元的美國熱門公司Cognition AI Inc.,似乎也是基於智普人工智慧(Z.ai)的基礎模型開發了其新型編碼代理。在社交媒體使用者表達了他們的懷疑之後,這家總部位於北京的公司似乎在推特上證實了他們的發現,稱此舉“凸顯了開源貢獻對生態系統的積極影響和價值”。這兩家美國公司均未立即回覆我通過電子郵件發出的置評請求。但由於中國人工智慧模型的許可機制較為寬鬆,企業可以免費在其基礎上開發產品。來自 Hugging Face 平台的資料,由支援開源人工智慧的美國聯盟ATOM Project收集,證實了這一點。中國模型在開發者累計下載量方面已經超越了美國。這種轉變起初緩慢,隨後迅速爆發:2024 年初,Meta Platforms Inc. 的 Llama 下載量達到 1060 萬次,而阿里巴巴 Qwen 的下載量僅為 50 萬次。到上個月,Qwen 的累計下載量已達 3.853 億次,而 Llama 為 3.462 億次。基於 Qwen 建構的衍生系統目前佔 Hugging Face 平台上新發佈的語言模型的 40% 以上,而 Meta 的份額已降至 15%。Qwen的累計下載量先是緩慢地,然後突然之間超過了Llama的。資料來源:ATOM Project,經由 Hugging Face 提供 註:衡量累計下載量國際使用者湧入中國人工智慧工具引發了地緣政治方面的擔憂。但對於爭分奪秒推出產品的開發者,尤其是在編碼和軟體開發領域,這些風險的擔憂有所減輕——尤其是在權衡價格和性能之後。此外,開放模型還可以下載、微調並在本地運行,從而降低使用者對內容和資料隱私的擔憂。黃仁勳現在就斷言誰是贏家還為時過早。美國在獲取尖端晶片和計算能力方面仍然擁有明顯的優勢,而這些正是開發先進系統的關鍵元件。但中國推行的低成本和開源策略無疑正在吸引開發者,而開發者正是人工智慧創新的中堅力量。如果華盛頓真的想在長遠來看取得勝利,它首先應該問問自己,為什麼矽谷已經開始倒戈了。 (邸報)
英國《金融時報》丨中國會贏得人工智慧競賽嗎?
The State of AI: is China about to win the race?世界關注美國的領先地位,但中國有辦法、有動機、有機會迎頭趕上。John Thornhill and Caiwei Chen © FT / MIT Technology Review Adobe Stock本周,英國《金融時報》科技專欄作家兼創新編輯約翰·桑希爾和《麻省理工科技評論》中國記者陳彩薇探討中國是否能在技術霸權之爭中擊敗美國。約翰·桑希爾寫道:從國外看,中國成為21世紀的人工智慧超級大國似乎只是時間問題。在西方,我們最初的本能是關注美國在半導體專業知識、前沿人工智慧研究以及對資料中心的巨額投資方面的顯著領先地位。傳奇投資者華倫·巴菲特曾警告說:“永遠不要與美國作對。”他說得對,兩個多世紀以來,沒有其他“釋放人類潛力的孵化器”能與美國匹敵。然而,如今中國有辦法、有動機、有機會進行相當於技術謀殺的行動。在調動全社會資源以最大限度地開發和部署人工智慧方面,與中國作對可能同樣魯莽。資料突顯了這些趨勢。在人工智慧論文發表和專利方面,中國處於領先地位。根據史丹佛大學2025年人工智慧指數報告,到2023年,中國佔所有引用量的22.6%,而歐洲為20.9%,美國為13%。截至2023年,中國還佔所有人工智慧專利的69.7%。誠然,美國在被引用次數最多的前100篇論文中保持著強大的領先地位(2023年為50篇對34篇),但其份額一直在穩步下降。美國在頂尖人工智慧研究人才方面也超過中國,但差距正在縮小。根據美國總統經濟顧問委員會的一份報告,2019年,世界上59%的頂尖人工智慧研究人員在美國工作,而中國為11%。但到2022年,這一比例變為42%對28%。川普政府收緊對外國H-1B簽證持有者的限制,很可能導致更多在美國的中國人工智慧研究人員回國。人才比例可能會進一步向中國傾斜。就技術本身而言,2024年,美國機構開發出了40個世界上最著名的人工智慧模型,而中國為15個。但中國研究人員已經學會了用更少的資源做更多的事情,他們最強大的大型語言模型,包括開放原始碼的DeepSeek-V3和阿里巴巴的Qwen 2.5-Max,在演算法效率方面超過了美國最好的模型。中國未來真正可能擅長的是應用這些開源模型。Air Street Capital的最新報告顯示,中國在人工智慧模型的月下載量方面已經超過了美國。在人工智慧賦能的金融科技、電子商務和物流領域,中國已經超過了美國。也許人工智慧最有趣、潛在生產力最高的應用可能還在硬體領域,特別是無人機和工業機器人。隨著研究領域向具身人工智慧發展,中國在先進製造業方面的優勢將凸顯出來。科技分析師、《極速:中國打造未來的追求》一書的作者DanWang正確地強調了中國工程國家在製造業方面的優勢,儘管他也展示了在社會領域應用這種工程思維的破壞性影響。“中國在技術上越來越強大,在經濟上也在各種方面變得更有活力,”他告訴我。我很想聽聽你,彩薇,對中國人工智慧夢想的優勢和劣勢的看法。中國的工程化社會控制在多大程度上會阻礙其技術雄心?陳彩薇回覆嗨,約翰!你說得對,美國在前沿研究和基礎設施方面仍然佔據明顯領先地位。但“贏得”人工智慧可能有很多不同的含義。丁學良在他的《技術與大國崛起》一書中提出了一個違反直覺的觀點:對於像人工智慧這樣的通用技術,長期優勢往往取決於技術在社會中傳播的廣度和深度。而中國在這場競賽中處於有利地位(儘管“謀殺”這個詞可能有點過分了!)。晶片仍將是中國最大的瓶頸。出口限制阻礙了對頂級GPU的獲取,迫使買家進入灰色市場,並迫使實驗室回收或維修被禁的輝達產品。即使國內晶片項目在擴大,頂級晶片的性能差距仍然存在。然而,這些同樣的限制也促使中國公司採取了不同的策略:集中計算資源、最佳化效率並行布開放權重模型。例如,DeepSeek-V3的訓練僅使用了260萬個GPU小時,遠遠低於美國同行的規模。但阿里巴巴的Qwen模型現在是全球下載量最高的開放權重之一,而智譜和MiniMax等公司正在建構有競爭力的多模態和視訊模型。中國的產業政策意味著新模型可以快速從實驗室走嚮應用。地方政府和大企業已經在行政、物流和金融領域推出推理模型。教育是另一個跡象。中國主要大學正在其課程中實施人工智慧素養計畫,在勞動力市場有需求之前就主動植入相關技能。教育部也宣佈了對所有學齡兒童進行人工智慧培訓的計畫。我不確定“工程國家”是否完全概括了中國與新技術的關係,但幾十年的基礎設施建設和自上而下的協調使這個系統在推動大規模應用方面異常有效,而且往往比其他地方遇到的社會阻力要小得多。大規模的應用自然允許更快的迭代改進。中國公眾也有同樣的感受。史丹佛大學人工智慧研究所2025年的人工智慧指數發現,中國受訪者對人工智慧的樂觀程度在世界上最高,遠遠超過美國或英國。現在,政府和行業的許多人都將人工智慧視為急需的火花。樂觀情緒可以是一種強大的動力,但它能否在增長放緩的情況下持續下去仍是一個懸而未決的問題。新一代中國人工智慧創業者是我見過的最具全球視野的,他們在矽谷駭客馬拉松和迪拜的推介會之間自由穿梭,許多人精通英語,熟悉全球風險投資的節奏。看著上一代人背負著中國標籤的負擔,他們現在建立的公司從一開始就悄然具有跨國性質。美國可能仍然在速度和實驗方面領先,但中國可以塑造人工智慧如何成為國內外日常生活的一部分。速度很重要,但速度並不等同於霸權。約翰·桑希爾回覆的確,彩薇,速度並不等同於霸權(“謀殺”這個詞可能太強烈了)。你強調中國在開放權重模型方面的優勢以及美國對專有模型的偏好也是正確的。這不僅是兩種不同國家經濟模式之間的鬥爭,也是兩種不同技術部署方式之間的鬥爭。就連OpenAI的首席執行官山姆·奧特曼今年早些時候也承認:“我們在歷史的這一邊站錯了隊,需要想出不同的開源策略。”這將是一個非常有趣的後續情節。誰會是正確的一方呢? (邸報)