#通義千問
技術全球前三,使用者倒數第一,“千問”項目暴露了阿里的AI困局
就在昨天,11月13日,阿里秘密啟動了一個代號"千問"的項目。上百名工程師封閉研發,在杭州總部劃出了兩層樓用作專屬辦公,這是要全面對標ChatGPT的節奏啊。但更震撼的,是CEO吳泳銘在雲棲大會上說了一句話:"通義千問要做'AI時代的Android'。"聽起來很誇張,對吧?AI怎麼可能複製Android呢?但現在的Qwen全球下載量已經達到了6億次,相當於全球每12個人就有1個人或團隊下載過。衍生模型超17萬個,就像AI時代的"三星、華為、小米",每個都是潛在的超級應用。連Airbnb的CEO都說:"我們大量依賴Qwen,因為比OpenAI更快更好。"那吳泳銘是誰,他是被馬雲欽點接班、帶領阿里走出低谷的人。曾是淘寶技術負責人,親手打造了中國最大的電商平台。兩年半前他押注Qwen開源路線時被業內質疑,今天6億次的下載量,證明了他當初的選擇無比正確。這個消息在整個科技圈引起了巨大震動。為什麼?因為阿里這步棋,可能會改寫AI時代的遊戲規則。阿里的AI困局要理解阿里這步棋有多大膽,先得看兩個事實。第一個事實是,Qwen模型技術實力已經得到全球驗證。在OpenAI工作了4年、參與過ChatGPT和GPT-4研發的前研究員都說,Qwen的技術路線是對的。最新發佈的Qwen3-Max在全球大模型排行榜上位列第三,性能超過GPT-5、Claude Opus 4等國際頂尖模型。Airbnb CEO布萊恩·切斯基公開表示,公司"大量依賴Qwen",因其"比OpenAI模型更快更好且便宜"。他們使用Qwen後,AI客服平均解決時間從近3小時縮短至6秒,減少了15%的現場需求。另外,阿里在C端AI市場的短板太明顯了。豆包月活1.72億,DeepSeek月活1.45億,通義APP月活遠低於豆包和DeepSeek。技術再強,沒有使用者,也是白搭。這就是阿里要面臨的殘酷現實,B端稱王,C端落後。而剛剛啟動的"千問"項目,就是阿里扳回這一局的非常關鍵之戰。開源VS閉源的終極對決吳泳銘說要做"AI時代的Android",這背後的戰略目的是什麼?我們可以先回顧一下Android的故事。2008年,Google推出Android開源系統,當時蘋果iOS技術領先、體驗更好,很多人斷言Android已經沒有機會了。但關鍵轉折來了——Android開放生態吸引了三星、華為、小米等硬體廠商,應用程式商店迅速繁榮,價格優勢明顯。到2015年,Android佔全球約70%份額,iOS約30%。開放生態,戰勝了封閉產品。現在,Qwen正在複製這個路徑。就像Android開源讓每個硬體廠商都能做手機,Qwen開源讓每個開發者都能做AI應用。你可能會問,AI沒有硬體廠商聯盟啊,怎麼複製Android呢?但事實是,17萬個衍生模型、100萬企業客戶、Airbnb等頂級公司,就是AI時代的"硬體廠商聯盟"。每個衍生模型都是一個潛在的超級應用,就像基於Android誕生了Galaxy、Mate、小米手機。用這組資料對比一下就知道了,Qwen全球下載6億次、17萬衍生模型、100萬企業客戶。而ChatGPT雖然月活4.455億,但生態封閉,主要靠API呼叫,開發者很難深度定製。更關鍵的是成本優勢。開源模型可以二次開發、部署在私有雲,企業不用擔心資料洩露,這是ChatGPT做不到的。歷史告訴我們,開放生態最終會戰勝封閉產品。但問題來了——豆包VS通義:阿里為什麼急?C端AI市場已經是紅海了,豆包月活1.59億,DeepSeek月活1.46億,阿里現在入場還來得及嗎?看一組資料就知道阿里有多急了。豆包背靠字節跳動,有抖音、剪映導流,10月月活環比增長22.2%。DeepSeek雖然環比下滑14%,但基礎盤穩固。騰訊元寶單月投流超10億,月活增長23.6%。而通義APP,日活遠低於豆包和DeepSeek,差距懸殊。更要命的是,獨立AI應用的生存空間正在快速縮小。Kimi月活從2025年3月的1830萬下跌至9月的967萬,跌幅近47%,就是因為停止投流後使用者流失嚴重。這也給了阿里一個警示:沒有生態支撐的AI應用,很難活下去。但阿里也看到了機會。豆包和DeepSeek雖然月活高,但都是"工具型應用",使用者黏性不強。而阿里有淘寶、天貓、餓了麼等天然流量入口——使用者在淘寶購物、支付寶支付時,千問AI可以無縫嵌入,大大降低獲客成本。這是豆包、DeepSeek都不具備的優勢。更重要的是,2025年2月,阿里宣佈未來三年將投入3800億元建設AI基礎設施,9月雲棲大會上表示將在此基礎上追加更大投入。到2032年,阿里雲資料中心能耗規模將提升10倍,算力投入指數級增長。這3800億是什麼概念?相當於建100個鳥巢體育場,或者買下3個迪士尼樂園。時機、資金、生態,三個條件齊了。阿里管理層把"千問"項目視為"AI時代的未來之戰",不是沒有道理的。三張王牌但挑戰也是顯而易見的。阿里To C基因弱、通義APP表現平平,千問APP憑什麼能逆襲?因為阿里手裡還有三張王牌。第一張王牌,Qwen模型的全球影響力。Qwen3-Max性能躋身全球前三,超越GPT-4.5、Claude Opus 4,支援119種語言,全球化能力強。更重要的是,頂級公司的認可。蘋果國行AI確定與Qwen合作,這是中國大模型首次進入iPhone生態。第二張王牌,阿里雲生態資源。阿里雲AI市場份額35.8%是什麼概念?就是說,中國每3家用AI的企業,有1家選阿里雲。更誇張的是,它比第2到第4名加起來還多——就像考試時你考了90分,第2到第4名加起來才85分。財富中國500強裡,超過一半企業都在用阿里雲。你平時點的外賣、打的車、刷的短影片,背後的AI計算,很可能就跑在阿里雲上。通義大模型已服務超9萬家企業和220萬家釘釘企業。第三張王牌,全端AI能力。從算力(阿里雲)、模型(Qwen)、應用(千問APP)到生態(17萬衍生模型),全鏈條覆蓋。這就像華為做手機,技術(麒麟晶片)+生態(鴻蒙系統)+管道(線下門店)三位一體,最終殺出重圍。但手握王牌不等於贏得戰爭。能不能打好這手牌,還得看最後的落地執行。開源能贏嗎?這不僅僅是阿里的戰爭,更是開源生態vs閉源產品的終極對決。阿里的野心不是做一個對標ChatGPT的產品,而是打造AI時代的作業系統,讓每個開發者都能參與這場變革。從Android到Qwen,歷史告訴我們,開放生態最終會戰勝封閉產品。但能否成功,取決於執行力、時機和運氣。OpenAI選擇閉源商業化,字節選擇工具化,阿里選擇開源生態化。三條路線,三種不一樣的打法,最終誰會勝出呢?大家心裡都沒底。阿里選擇了開源,這可能是最慢的路,但也可能是唯一正確的路。而時間會告訴我們答案。AI時代,資訊真假難辨,我是林傑,關注我,這裡不誇大,不虛假,只聊AI行業的真話和事實。(I人林傑聊AI)
阿里將推出國際版“千問”,與ChatGPT競爭
《科創板日報》獲悉,阿里巴巴已秘密啟動“千問”項目,基於Qwen最強模型打造一款同名個人AI助手——千問APP,全面對標ChatGPT,加入全球AI應用的頂級競賽。阿里核心管理層將其視為“AI時代的未來之戰”,希望借助Qwen的開源技術優勢贏得競爭。這是年初公佈3800億投入AI基礎設施之後,阿里AI戰略的又一重要佈局。此前,阿里重兵一直放在B端AI市場,通過阿里雲向各行各業提供模型API服務。基於Qwen的優秀性能和國際影響力,阿里管理層認為啟動千問C端之戰的時機已經成熟。阿里巴巴已經抽調上百名工程師秘密辦公。在阿里巴巴位於杭州的總部園區,已有兩層辦公樓被劃為該項目的專屬區域。面向全球市場的國際版千問APP也在同步研發,將借助Qwen模型的海外影響力與ChatGPT直接爭奪海外使用者。Qwen大模型的研發始於三年前,目前已經成為全球排名第一的開源大模型。資料顯示,Qwen系列模型的全球下載量已突破6億次。Airbnb CEO布萊恩·切斯基此前公開表示,公司正“大量依賴Qwen”,因其比openAI模型更快更好。輝達CEO黃仁勳表示,Qwen已佔據全球開源模型的大部分市場,並在持續擴大份額。不過,阿里雲與通義大模型雖然在AI基礎設施層面技術領先,卻缺乏直達消費者的應用載體。2024年底至2025年初,阿里巴巴就已經通過一系列組織架構調整和戰略部署,正式加碼AI To C業務。2024年12月,阿里巴巴將AI應用“通義”的產品團隊從阿里雲智能劃入智能資訊事業群。調整後,通義的PC端及App端團隊與夸克平級,共同探索AI在C端市場的應用場景,而通義實驗室仍保留在阿里雲體系內,繼續負責基礎技術研發。今年3月13日,阿里巴巴宣佈推出AI旗艦應用——新夸克,作為阿里巴巴AI To C的代表產品。而此次秘密研發的阿里“千問” APP,後續將與夸克如何協同發展,仍有待進一步明確。據麥肯錫預測,到2030年,全球AI To C市場規模將達到1.3兆美元,年均增長率超過35%。這個數字讓任何科技企業都無法忽視。在阿里之外,字節旗下豆包已經獲取了海量使用者流量。根據QuestMobile《2025年三季度AI應用價值榜》,豆包月活環比增長22.2%至1.59億,月均下載量達3447萬。騰訊元寶則一度靠著DeepSeek流量急速攀升。QuestMobile資料顯示,2025年上半年,騰訊元寶的月活使用者數同比增長55.2%。隨著AI應用融入更廣大使用者的日常生活,阿里、字節、百度等廠商之間的比拚也逐漸升溫,曾經在網際網路、移動網際網路時代屢次上演的競爭大戲,如今將在AI的舞台上迎來全新演繹。 (財聯社AI daily)
AI交易員大戰:六大AI模型誰是賺錢王者?
好消息,10.11 幣圈史詩級大跌後,加密交易又開始變得活躍了。壞消息,是 AI 在交易。想像一下這樣的場景:給全球六大頂級 AI 模型每人發 1 萬美元,讓它們在同一個真實市場裡廝殺,會發生什麼?注意,這不是模擬盤,而是正在發生的現實。Claude、GPT-5、Gemini、Deepseek、Grok 和通義千問,每個模型都拿著 1 萬美元真金白銀在加密交易平台 Hyperliquid 交易。所有地址公開,任何人都能即時圍觀這場「AI 交易員大戰」。有意思的是,這六個 AI 用的是完全相同的提示詞,接收完全相同的市場資料。唯一的變數,就是它們各自的「思考方式」。這就像給六個人同樣的槍和子彈,但每個人的射擊技術完全不同。結果會如何?答案令人震驚。戰況激烈:三天分出勝負如果你從 10 月 18 日開始追蹤 Alpha Arena,會發現剛開始幾個 AI 都差不多,但越往後差距越大。開局,大家都在試探。第一天結束時,最好的 Deepseek 也只賺了 4%,最差的 Qwen3 虧了 5.26%。大部分 AI 都在正負 2%之間徘徊,看起來像是都在試探市場。就像一群新手司機第一次上高速,都開得很小心。但到了 10 月 20 日,畫風突變。Deepseek 飆升到 38.03%,而 Gemini 跌到了-31.56%。短短三天,頭部和尾部的差距拉大到了近 70 個百分點。更有意思的是交易頻率的差異:Gemini:完成了 47 筆交易,平均每天 15 筆,像個焦慮的投機交易員Claude:只做了 5 筆,如同謹慎的基金經理Grok:僅 1 筆交易,甚至還有未平倉的持倉,佛系到極點截至 10 月 20 日,也就是開始交易後的第三天,戰局已經出現了明顯的分化:領先梯隊:Deepseek Chat V3.1:$13,862(+38.03%)Grok-4:$13,358(+33.58%)Claude Sonnet 4.5:$12,384(+23.85%)表現平平:Qwen3 Max:$10,831(+8.27%)嚴重落後:GPT-5:$7,294(-27.06%)Gemini 2.5 Pro:$6,876(-31.56%)從盈虧分佈看:Deepseek:最大單筆虧損 348 美元,但整體盈利 3847 美元Gemini:最大單筆盈利 347 美元,最大虧損卻高達 750 美元不同 AI(公版大模型,未經過二次調教),對風險和收益的平衡完全不同。你能在網站上的 Model Chat 選項裡看到不同模型的聊天記錄和思考過程,這些獨白特別有意思:Gemini 的頻繁交易和思考像個多動症患者Claude 的謹慎像個保守的基金經理Deepseek 穩健得像個量化老手,只說倉位,不做任何情緒評價這種性格感覺不像是設計出來的,而是在訓練過程中自然湧現的。當面對不確定性時,不同的 AI 會傾向於不同的應對方式。為什麼是 Deepseek?量化基因的勝利1950 年,圖靈提出了著名的圖靈測試,試圖回答「機器能否像人一樣思考」;現在在幣圈,6 大 AI 在 Alpha 競技場中廝殺,在回答一個更有趣的問題:如果讓最聰明的 AI 們在真實市場裡交易,誰會活下來?或許在這個幣圈版的「圖靈測試」裡,帳戶餘額就是唯一的裁判。最讓人意外又似乎情理之中的當然是 Deepseek 的表現。說意外,是因為這個模型在國際 AI 圈的熱度遠不如 GPT 和 Claude。普通人提到 AI,第一個想到的往往是 ChatGPT 或者 Claude,很少有人會想到 Deepseek。說情理之中,是因為 Deepseek 背後是幻方量化團隊。這家管理規模超千億人民幣的量化巨頭,在進軍 AI 之前,就是靠演算法交易起家的。從量化交易到 AI 大模型,再用 AI 來做真實的加密交易,Deepseek 有點像回到了老本行。這就好比讓一個退役的職業拳擊手和一群健身愛好者比拳擊,雖然大家都有肌肉,但專業基因完全不同。訓練資料的影響可能是關鍵。Deepseek 背後的幻方量化,十幾年來積累了海量的交易資料和策略。這些資料即使不直接用於訓練,是否也會影響團隊對“什麼是好的交易決策”的理解?相比之下,OpenAI 和 Google 的訓練資料可能更偏向學術論文和網路文字,對實盤交易的理解可能不夠親民。同時,有交易員推測,Deepseek 可能在訓練時特別最佳化了時間序列預測能力,而 GPT-5 可能更擅長處理自然語言。在面對價格圖表這種結構化資料時,不同的架構會有不同的表現。這就像讓語言學家和數學家去解讀股價走勢圖,雖然都很聰明,但專業領域不同,結果自然不同。市場才是智能的終極試金石傳統的 AI 評測,無論是讓模型寫程式碼、做數學題,還是寫文章,本質上都是在一個「靜態」的環境裡測試。題目是固定的,答案是可預期的,甚至可能已經在訓練資料裡出現過。但加密市場不一樣。資訊極度不對稱的前提下,每一秒的價格都在變化,沒有標準答案只有盈虧。更重要的是,加密市場是典型的零和遊戲,你賺的錢就是別人虧的錢。市場會立即、無情地懲罰每一個錯誤決策。這個舉辦 AI 交易大戰的 Nof1 團隊,在它們的網站上寫了一句話:Markets are the ultimate test of intelligence(市場是檢測 AI 智能的終極測試)。如果說傳統的圖靈測試是在問「你能不能讓人類分不清你是機器」,那麼這個 Alpha Arena 問的其實是:你能不能在加密市場裡賺錢。這一點其實才是幣圈玩家對 AI 的真實期待。圍觀 AI 交易,也是一門生意當所有人都在關注 AI 的盈虧時,很少有人注意到背後這家神秘的公司。搞出這個 AI 交易大戰的 nof1.ai,並沒有太大的知名度。但是如果你看一下它社媒的關注列表,還是能找到一些蛛絲馬跡。nof1.ai 背後似乎不是一群典型的加密創業者,而是清一色的學院派 AI 研究員。Jay A Zhang(創始人)的個人簡介也很有意思:“Big fan of strange loops - cybernetics, RL, biology, markets, meta-learning, reflexivity”。reflexivity(反身性)是索羅斯的核心理論:市場參與者的認知會影響市場,市場的變化又會影響參與者的認知。讓一個研究“反身性”的人來做 AI 交易市場實驗,本身就顯得很有宿命感。另一個聯創 Matthew Siper 簡介顯示其為紐約大學機器學習方向的博士候選人,同時也是 AI 研究科學家。一個還沒畢業的博士生做項目,更像一個印證學術研究的項目。從他們的動作和背景來看,Nof1 顯然不是為了搞個噱頭。SharpeBench 這個平台名字就很有野心,夏普比率是衡量風險調整後收益的金標準,他們或許真正想做的,是 AI 交易能力的基準測試平台。有人猜測 Nof1 背後有大資本支援,也有人說他們可能在為後續的 AI 交易服務做鋪墊。如果他們推出訂閱 Deepseek 交易策略服務,買單的人或許不在少數。而基於這個雛形,去做 AI 資管、策略訂閱和大企業的交易解決方案,也是一門可以預見的生意。除了這個團隊本身之外,圍觀 AI 交易本身也有利可圖。Alpha Arena 剛上線,就有人開始跟單了:正向跟單:跟著 Deepseek 做。它買什麼你買什麼,它賣什麼你賣什麼反向操作:專門做 Gemini 的對手盤,Gemini 買就賣,賣就買但跟單有個問題:當所有人都知道 Deepseek 要買什麼時,這個策略還有效嗎?這也是項目創始人 Jay Zhang 說的反身性,即觀察本身會改變被觀察的對象。這裡還有一種頂級交易策略民主化的假象。表面上看起來,每個人都能知道 AI 的交易策略,但實際上你看到的是交易結果,不是交易邏輯。每個 AI 的止盈和止損邏輯並不一定連續且可靠。當 Nof1 在測試 AI 交易的行為,散戶在尋找財富密碼,其他的一些交易員在偷師,研究者們也在蒐集資料。只有 AI 本身不知道自己在被圍觀,還在認真地執行每一筆交易。如果說經典的圖靈測試是關於“欺騙”和“模仿”,那現在的 Alpha Arena 交易大戰,是關於加密玩家對於 AI 能力和結果的回應。多年來,AI 一直由靜態基準來衡量。ImageNet、MMLU 以及無數的排行榜告訴我們,那個模型能更好地「理解」圖像、邏輯或語言。但所有這些測試都有一個共同的缺陷,它們都發生在無菌、可預測的環境中。市場則恰恰相反。金融市場是終極的世界建模引擎,也是唯一一個會隨著 AI 變得更聰明而難度同步提升的基準。它們波動、反應、懲罰、獎勵。它們是一個由資訊和情感構成的生命系統。在 Alpha Arena 中,沒有正確的標籤,只有不斷變化的機率。一個模型的成功取決於它解讀波動的速度、權衡風險的精度,以及承認錯誤的謙遜程度。這將交易變成了一種新型的圖靈測試:考驗的不再是「機器能否思考」,而是「它能否在不確定性中生存」。在這個結果主導的加密市場裡,會賺錢的 AI,可能比會聊天的 AI 更重要。 (深潮 TechFlow)
“清華系”VS“阿里系”:誰將定義中國大模型的下一個“範式”?
隨著“百模大戰”的喧囂逐漸退去,中國大模型產業正從技術競賽轉嚮應用落地的深水區。在這場重塑AI格局的處理程序中,兩大“隱形門派”——以清華背景企業為代表的“清華系”,與從阿里“通義”體系走出的創業者構成的“阿里系”,正成為影響未來走向的關鍵力量。源起:學院派與實戰派的兩條路徑“清華系”的根基深植於清華大學電腦系的知識工程實驗室(KEG),在唐傑教授的帶領下,團隊長期深耕知識圖譜、圖神經網路與預訓練模型。這一學派強調理論驅動,追求技術本質的突破。智譜華章便是這一學術傳統的商業延續。其CEO張鵬為清華博士,公司依託GLM(通用語言模型)架構,走出了一條不同於GPT和BERT的技術路線,體現出強烈的“學院派”氣質。而月之暗面則由清華校友楊植麟創立,團隊融合了清華的理論深度與Google Brain的工程經驗。其產品Kimi憑藉支援百萬級長文字輸入的能力,在2023至2024年間迅速引爆市場,展現了“理論+工程”雙輪驅動的潛力。相比之下,“阿里系”的創業者則是在商業實戰中錘煉出的“羅馬軍團”。阿里自2017年設立達摩院以來,持續投入AI研發,並於2023年推出通義千問(Qwen)系列大模型,建構了“模型+平台+業務”的閉環生態。從這一體系中走出的創業者,如前阿里副總裁賈揚青創辦的Lepton AI,以及螞蟻集團前首席AI科學家漆遠創立的無限光年,都帶有鮮明的“場景驅動”烙印。他們更關注技術如何與金融、電商、物流等真實產業結合,擅長高並行、低延遲的系統部署,追求技術的可規模化與商業回報。分野:理想主義與實用主義的碰撞?技術路徑的差異,也對應出兩種截然不同的創業哲學。“清華系”創始人多為學者或頂尖研究員,創業故事常帶有理想主義色彩。他們追求長期技術壁壘,建構以學術成就為核心的“知識共同體”。融資時,他們講述的是“改變世界的技術”和“國家戰略需求”,吸引國家級基金與頂級風投。而“阿里系”則更像一支“戰友聯盟”,創始人多為身經百戰的業務將才。他們決策迅速、執行高效,擅長講述清晰的商業邏輯。在資本眼中,他們的履歷本身就是信用背書——一個被驗證過的團隊,正奔赴一個兆級市場。這種差異也體現在資源爭奪上:兩者都在搶奪頂尖AI人才、GPU算力和企業客戶市場。但“清華系”瞄準的是大模型“智力本質”的突破,在尋求商業突破時更試圖定義下一代AI範式;“阿里系”則聚焦於應用層的快速落地,力求在紅海中建立商業護城河。競合:對手,也是盟友儘管表面上是競爭對手,但“清華系”與“阿里系”之間卻存在著複雜的合作關係。一個耐人尋味的現像是:阿里巴巴通過其戰略投資部門,同時投資了“清華系”的智譜和月之暗面。這意味著,阿里既是“阿里系”創業者的“母校”,也是“清華系”新銳的金主。這種佈局,實則是阿里在核心技術自研之外,建構的“雙軌生態”戰略——既通過通義守住基本盤,又通過投資外部創新力量對衝風險、搶佔前沿。此外,所有大模型玩家都依賴共同的上游生態:輝達的GPU、阿里雲等算力平台、以及ModelScope等開源社區。他們的競爭客觀上推動了產業鏈成熟,共同做大了中國AI的“蛋糕”。未來:融合才是終局?“清華系”與“阿里系”的對決,本質上是中國AI發展兩條路徑的交鋒:由理生工(從理論出發推動工程)與由工反理(在工程實踐中倒逼理論突破)。未來的勝出者,或許不是某一陣營的全面勝利,而是兩類基因的融合體——既擁有“清華系”的技術深度,又具備“阿里系”的商業敏銳。這類新一代AI企業,將不再被簡單的“門派”標籤所定義,而是以更系統、更成熟的能力,迎接全球競爭。當喧囂退去,這場“門派之爭”最終指向的,是中國科技產業對長期主義與系統能力的集體回歸。誰能在理論與商業之間找到最佳平衡,誰就有望定義中國大模型的下一個“範式”。 (元界)
阿里千問3登頂,開源模型掀起產業智慧化新浪潮
阿里Qwen3如何改寫AI生產力格局?當AI從實驗室走向全場景應用,如何兼顧效能與成本,成為每個開發者與企業共同的難題。4月29日凌晨,伴隨著全球網路的猜測與期待,阿里巴巴正式開源新一代通義千問模型Qwen3(以下簡稱「千問3」),並同步發佈了多個版本,試圖改寫上述困境。這款模型以DeepSeek-R1三分之一的參數量,實現了數學、程式碼、多語言理解等核心能力對全球頂尖模型的全面超越,並憑藉「混合推理」架構與全場景部署方案,將大模型的應用成本降至歷史最低水平。這不僅意味著中國AI首次登上全球開源模型性能巔峰,也是AI從實驗室走向產業規模化落地的關鍵。1. 快與慢之間:千問3首次整合“混合推理”在AI模型結構設計中,過往的競爭主要集中在「推理速度」與「推理深度」之間的取捨:要麼快,要麼深,但難以兼得。作為國內首個“混合推理模型”,千問3創造性地將“快思考” 與“慢思考” 整合於同一框架,如同賦予模型人類般的思維靈活性:面對簡單諮詢時,模型以低算力快速響應;處理複雜問題時,則可啟動多步驟深度推理。這種設計不僅大幅降低算力消耗,也解決了傳統模型在任務適配上的效率瓶頸。LangGPT社區創始人云中江樹對「甲子光年」表示,「混合推理」是通義千問模型更新中最大的變化。在千問3問世以前,該系列的推理模型為QwQ,非推理模型是Qwen2.5, 現在推理和非推理能力合而為一。這也預示著,AI應用將告別「一刀切」的粗放模式。在產業落地環節,它能以更智慧、更經濟的方式滲透到金融風控、醫療診斷等對準確度要求極高的領域。對於「千問3是否會弱化提示詞價值」的問題,雲中江樹認為,模型本身越強,提示詞能發揮的價值越高。這裡的“弱化”,更多指涉的是“工程”,也就是弱化提示詞工程中的一些複雜、奇特的提示技巧,迭代調優的精力。千問3背後的混合專家(MoE)架構同樣功不可沒。總參數量235B的千問3,實際啟動僅需22B,結合36T資料預訓練與多輪強化學習,實現效能飛昇的同時,也將成本大幅降低。在測試奧數水準的AIME25測評中,千問3斬獲81.5分,刷新開源紀錄;程式碼能力測試中,千問3 LiveCodeBench得分突破70分,超越Grok3;人類偏好對齊測評裡,ArenaHard 95.6分的成績更是超越OpenAI-o1及DeepSeek-R1。為了適合不同場景需求,千問3同步開源了8款不同規模的模型版本,包括0.6B、1.7B、4B、8B、14B、32B密集模型,以及30B-A3B、235B-A22B兩款MoE大模型,每款模型均獲同尺寸開源模型SOTA(最佳效能),並在多工處理、系統整合與模型壓縮等方面做了針對性最佳化,使得開發者與企業使用者可以根據資源條件靈活選擇,快速落地各類創新應用。以上所有千問3模型都是混合推理模型。經「甲子光年」實測,使用者可按需設定「思考預算」(即預期最大深度思考的tokens數量),進行不同程度的思考,靈活滿足AI應用和不同場景對性能和成本的多樣需求。這個佈局,為AI從「能用」到「好用」的過程提供了關鍵支撐——模型不僅要算得準,還應以更低的成本部署到更多真實場景之中。2. 產業智能化,從千問3開始技術創新的終極目標是服務業。當千問3以突破性的架構刷新開源模型性能天花板後,其多版本、低成本的特性,也將成為撬動各行業智慧化轉型的支點。具體來看,千問3的不同版本將分別適配於不同場景,尤其對手機、智慧眼鏡、智慧駕駛、人形機器人等智慧型裝置和場景的部署更為友善。小型模型(0.6B/1.7B):適合學術探索與輕量級移動應用;中型機型(4B/8B):適配筆記本電腦、車載系統等端側部署;大型模型(14B/32B):服務企業級部署與高效能推理任務;MoE模型(30B-A3B/235B-A22B):面向雲端服務與大型本地部署,兼顧極致效能與極高推理效率。此外,傳統印象中,頂級大模型部署動輒需要上千萬元的硬體投入,而千問3打破了這一魔咒。以其最大規模的235B-A22B模型為例,在典型部署環境下,僅需4張H20顯示卡即可滿血運行,整體部署成本僅為同期滿血版DeepSeek-R1的25%至35%。簡而言之,幾十萬元的預算,就可以擁有全球最強開源大模型的推理與服務能力。在成本控制上,千問3的API「思考預算」 設定堪稱點睛之筆。開發者可根據任務複雜度動態調整推理深度,在效能與成本間自由權衡。結合MoE架構的低部署成本,即使中小企業也能以較低門檻接入頂尖AI能力,加速產業智慧化轉型。雲中江樹對「甲子光年」表示,相較於DeepSeek、Llama模型來說,千問3具有更豐富的譜系選擇,能夠更好的支援全場景的落地應用需求。同時,千問3所有模型均在Apache2.0許可下開源,是非常寬鬆的開源協議,不僅允許商業使用,還允許修改和分發程式碼,不需要分享修改後的原始碼。而Apache 2.0的法律全面性、專利保護較好,是大型企業開放原始碼的常用選擇。更值得關注的是,千問3原生支援MCP協議,並透過Qwen-Agent框架降低智慧體開發門檻。在BFCL評測中,Qwen3以70.8分超越Gemini2.5-Pro等模型,證明其在智慧體工具呼叫上的領先優勢。這意味著開發者可基於MCP協議,快速建構手機助理、辦公機器人等智慧體應用,為即將爆發的Agent生態提供核心技術支撐。MCP協議如同智能體的“通用語言”,而Qwen-Agent框架則是“翻譯器”與“工具箱”。兩者結合,使得開發者只要透過簡單組態,就能將千問3的能力快速轉化為智慧客服、智慧辦公等場景應用,開發周期大幅縮短。總結來看,千問3向產業提供了「人人可用、處處能跑」的全新範式,必將推動AI真正走出技術象牙塔,奔赴產業最前線。3. 3800億元豪賭:AI重估阿里雲技術能力之外,千問3的發佈,也標誌著阿里雲向全球AI中樞的戰略轉型全面提速。千問3的開源,無疑是阿里通義千問開源戰略的另一個里程碑。自2023年起,阿里已開源200余個模型,全球下載量超3億次,千問衍生模型突破10萬個,超越Llama成為全球第一開源模型家族;支援119種語言的千問3,更打破語言壁壘,為缺乏自研能力的國家和地區提供了全球頂尖的AI模型能力。時至今日,通義千問Qwen在全球下載量超過3億,在HuggingFace社區2024年全球模型下載量中千問Qwen佔比超30%,穩居第一。在2025年2月的Huggingface全球開源大模型榜單(Open LLM Leaderboard)中,排名前十的開源模型全部都是基於千問Qwen二次開發的衍生模型。在李飛飛領銜的史丹佛HAI研究所發表的《2025年人工智慧指數報告》顯示,2024年重要大模型(Notable Models)中,阿里入選6個,依照模型貢獻度排名,阿里AI貢獻位列全球第三。「甲子光年」觀察到,全球AI產業已從單點突破、封閉競爭,轉向開放式協作、平台化競爭。開源大模型成為建構開放生態、搶佔產業標準制高點的關鍵。千問3以其領先的性能、完善的產品線和極致的成本優勢,為阿里巴巴在AI生態系統建設中,提供了強有力的技術底座。上線開源數小時後,華為已宣佈升騰支援千問3全系列模型部署,開發者在MindSpeed和MindIE中開箱即用,實現千問3的0Day適配。輝達、英特爾、聯發科、AMD等多家頭部晶片廠商已成功適配千問3,在不同硬體平台和軟體棧上的推理效率均顯著提升,可滿足移動終端和資料中心場景的AI推理需求。在技​​術生態建設上,就在不久之前,阿里雲百煉剛剛上線業界首個全生命周期MCP服務,無需使用者管理資源、開發部署、工程維運等工作,5分鐘即可快速搭建一個連接MCP服務的Agent(智能體)。中國第一AI開源社區魔搭更是上線了國內最大的中文MCP廣場,支付寶、MiniMax等MCP服務首發魔搭。今年2月,阿里巴巴集團CEO吳泳銘還剛剛宣佈,未來三年,阿里將投入超過3800億元,用於建設雲和AI硬體基礎設施。由此,阿里從算力基建,到模型研發,再到應用落地的全鏈條佈局逐步清晰——不僅是要從電商巨頭向智能服務提供商邁進,更要成為全球AI技術領導者。如今的阿里,也將憑藉千問3的技術優勢與開源生態,重新定義自身價值。在AI重估浪潮下,其全球競爭力已不僅限於雲端運算資源,更在於透過技術創新驅動產業升級的能力。隨著夸克、通義APP 等業務全面接取千問3,一個以阿里雲為核心的智慧生態正在成型,而這或許只是阿里主導新一輪AI產業周期的起點。更重要的是,人工智慧將不再是少數巨頭的專屬技術,而是每位開發者、每個企業、每個一般使用者都能觸手可及的創新力量。未來兩到三年,我們一定能見證AI原生應用的爆發式增長,人工智慧成為個人生產力工具的標配,同時企業智慧化加速,形成「千企千面」的智慧營運新格局。全球AI創新的新一輪浪潮,正以更開放、更協同的方式展開。(首圖和文中圖片來自通義千問) (甲子光年)
馬斯克,重大宣佈!
馬斯克預告大動作。4月29日,馬斯克在社交平台上宣佈,下周,Grok 3.5早期測試版將向SuperGrok訂閱者發佈。在馬斯克宣佈這一消息前,阿里巴巴通義千問發佈了新版Qwen 3系列模型。另據最新消息,馬斯克旗下的XAI公司正在與投資者洽談,計畫籌集約200億美元的資金,憑藉此輪融資,XAI公司的估值有望超過1200億美元(約合人民幣8700億元)。值得一提的是,馬斯克在美國政壇又攤上了大麻煩。美東時間4月28日,美國參議院民主黨調查小組發佈報告稱,馬斯克可能“以權謀私”,通過對聯邦政府施加影響來規避超過20億美元的潛在罰款和處罰。馬斯克宣佈4月29日,馬斯克在社交平台上宣佈,下周,Grok 3.5早期測試版將向SuperGrok訂閱者發佈,它是第一個能夠準確回答有關火箭發動機或電化學技術問題的人工智慧。馬斯克稱,Grok是從第一原理推理並得出網際網路上根本不存在的答案。Grok由馬斯克旗下XAI公司研發,該公司於今年3月宣佈成立,由馬斯克的AI初創公司xAI與社交媒體平台X合併而來。Grok為XAI公司的核心產品。作為人工智慧助理,Grok依託X平台海量資料訓練,兼具即時響應能力、幽默表達風格及爭議性話題處理機制。值得一提的是,在馬斯克宣佈Grok 3.5前夕,阿里巴巴通義千問發佈了新版Qwen 3系列模型,包括2個MoE模型和6個dense模型。通義千問表示,作為Qwen系列全新一代的混合推理模型,Qwen 3在GPQA、AIME24/25、LiveCodeBench等多個權威評測中表現出極具競爭力的結果。在相同計算資源下,Qwen 3模型以更小的規模實現了對更大體量上一代模型的超越,真正做到了“小而強大”。Qwen 3融合了推理與非推理能力,在邏輯分析和創意生成等任務中表現卓越。預訓練資料量達到約36兆tokens,並通過多輪大規模強化學習與精細最佳化,在推理、工具呼叫、指令遵循及多語言能力等方面顯著提升。無論是數學推理、程式碼生成還是綜合邏輯分析,Qwen 3均展現出卓越能力,穩居全球開源模型前列。在工具呼叫方面表現優異,大幅降低了複雜任務的實現門檻,同時還支援119種語言,覆蓋全球主要語種,滿足多樣化需求。計畫融資超1400億元據彭博社援引消息人士報導,XAI公司正在與投資者洽談,計畫籌集約200億美元(約合人民幣1450億元)的資金。資料提供商PitchBook的資料顯示,如果達成,這將成為歷史上第二大規模的初創公司融資,僅次於OpenAI公司今年早些時候獲得的400億美元融資。知情人士透露,憑藉此輪洽談中的融資,XAI公司的估值有望超過1200億美元(約合人民幣8700億元)。報導稱,XAI公司正在洽談的融資可能會用於償還馬斯克收購推特時的一部分債務。為了收購推特,馬斯克當時不僅出售了大量特斯拉股票,還向華爾街機構借貸了大約130億美元資金。據媒體此前報導稱,這些債務一直對X構成壓力,僅在今年3月,X就支付了約2億美元與收購相關的債務利息。該公司截至2024年底的年度利息支出已超過13億美元。據悉,目前這輪潛在融資仍處於早期階段,公司計畫在接下來的幾個月內完成籌資,融資的規模可能超過200億美元。融資總額尚未最終確定,相關條款也可能會有所變化。根據今年2月的媒體披露,xAI當時的估值達750億美元。而X的估值據稱已經恢復到了440億美元。這兩個數字之和與媒體最新報導的XAI公司逾1200億美元的估值大致相符。值得一提的是,馬斯克旗下另一家企業太空探索技術公司(SpaceX)估值據稱達到了3500億美元,成為歷史上估值最高的初創公司。馬斯克的大麻煩美東時間4月28日,美國參議院民主黨調查小組發佈報告稱,馬斯克可能通過對聯邦政府施加影響來規避超過20億美元的潛在罰款和處罰。自美國總統川普上任以來,馬斯克領導的“政府效率部”(DOGE)通過大刀闊斧的行動,給華盛頓帶來了天翻地覆的變化:精簡了各機構,並清理了聯邦政府的工作人員。川普對其工作大為讚歎。但民主黨人卻不這麼認為。他們在上述報告中指責馬斯克利用他的影響力“逃避監督,破壞調查,並在他選擇的任何時候、按照他的條件和命令,讓訴訟消失”。這份43頁的報告由參議員理查德·布盧門撒爾(康涅狄格州民主黨人)領導參議院常設調查小組委員會的民主黨工作人員撰寫,是迄今為止最詳盡的指責,詳細描述了馬斯克作為川普顧問和DOGE團隊的主要推手所涉嫌的利益衝突。報告發現,截至川普就職當天,馬斯克和他的公司面臨來自11個聯邦機構的至少65項“實際或潛在的”監管或執法行動。其中40項行動可能導致至少23.7億美元的潛在罰款。這些公司包括太空探索公司SpaceX,電動汽車製造商特斯拉,生產腦部植入物的Neuralink,隧道施工公司The Boring Company,以及人工智慧初創公司XAI。根據這份長達44頁的備忘錄,特斯拉的潛在責任涉及11.9億美元,原因是特斯拉涉嫌對其自動駕駛儀和自動駕駛功能做出誤導性陳述。Neuralink可能面臨2.81億美元的賠償責任,因為它涉嫌對其產品的風險做出虛假陳述。上述報告寫道:“馬斯克對聯邦政府進行了電鋸式的打擊,顯然不顧法律,也不顧那些依賴他肆無忌憚地摧毀的項目和機構的人員。馬斯克的許多決定之間的聯絡似乎都是為了讓自己得利,避開他認為阻礙他推進利益的障礙。”對於民主黨人的一系列“指控”,白宮強烈否認了馬斯克利用他在政府中的角色謀取“個人或經濟利益”的說法,稱“任何說法都是完全錯誤和誹謗的。” (券商中國)