#通義 | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#通義

猛料，GoogleDeepMind公然要挖林俊暘，演都不演了

挖人如同打臉，Google殺人誅心。這兩天，網際網路行業和AI圈被同一條消息刷了屏：阿里千問大模型的核心負責人林俊暘突然發文告別。這條消息如同一塊巨石投入本就波濤洶湧的湖面。直到今天，阿里官方確認了林俊暘已離職的消息。圖源：微博作為阿里的戰略核心，千問（Qwen）團隊的人事變動，絕不僅僅是一個人的去留問題。它背後牽扯的，是一家巨頭在AI狂飆時代的技術路線選擇、組織架構調整，以及那場關於“技術策略”與“商業變現”的殘酷博弈。而更令人意外的是，就在同一天，GoogleDeepMind的相關負責人突然在社交平台上向Qwen團隊拋出了橄欖枝。那個夜晚發生了什麼？3月4日凌晨，當大多數人還在睡夢中時，阿里千問的核心負責人林俊暘在社交平台留下了一句極為克制卻又飽含情感的話：“me stepping down.bye my beloved qwen.”（我卸任了，再見了，我親愛的千問）。短短幾個詞，瞬間引爆了科技圈。圖源：X林俊暘，這個名字在業內代表著什麼？他是1993年出生的技術天才，北大碩士畢業，2019年以應屆生身份加入阿里達摩院。在短短幾年內，他一路晉陞為阿里最年輕的P10級技術負責人，親歷並主導了千問從0到1的全過程。在過去的幾年裡，林俊暘帶領團隊打了一場又一場硬仗。2023年，通義千問正式發佈；此後，團隊以令人炫目的速度推出了從0.5B到110B的系列模型，在開源社區Hugging Face上霸榜數月。正是因為他，Qwen系列成為了全球開發者心中“最能打”的中國開源模型之一，衍生模型數量突破20萬，下載量超10億次。然而，誰都沒想到，在阿里AI戰略被提升至最高優先順序、在馬雲剛剛現身談AI、在品牌剛剛統一為“千問”的節骨眼上，他竟然選擇了離開。緊隨其後的是連鎖反應。Qwen後訓練負責人郁博文、核心貢獻者李凱新等多名技術骨幹，也相繼傳出了離職的消息。GoogleDeepMind開發體驗負責人Omar Sanseviero抓住了這個機會，突然在社交平台上公開喊話：“千問的朋友們，如果想找個新地方來打造優秀模型，並為開源模型生態系統做出貢獻，請隨時聯絡我！我們的路線圖中有很多令人興奮的事情。”圖源：X這則喊話，禮貌、精準，且殺傷力極強。它不僅瞄準了剛剛失去領軍人物的Qwen團隊，更直接指向了“開源模型生態”——這恰恰是林俊暘和Qwen團隊最引以為傲的陣地。而且Omar Sanseviero本人曾是Hugging Face的開源生態負責人，江湖綽號“首席羊駝官”（Chief Llama Officer），對開源社區的運作模式熟稔於心。由他來“接客”，DeepMind顯然是做足了功課。有人說阿里的一個時代結束了。不，或許只是一個階段結束了。但在結束的廢墟上，新的獵手已經舉起了火把。為什麼在鮮花著錦之時轉身離去？對於林俊暘的離開，很多人的第一反應是“宮斗”或“內卷”。但根據多方資訊梳理，林俊暘的離開，更像是一場關於“未來怎麼走”的理念分歧，以及由此引發的權責重構。阿里內部人士透露，實際情況並沒有外界傳言的那麼狗血。隨著千問從一個小小的技術項目被提升為集團的頂層戰略，阿里認為需要招攬更多的全球技術大牛來提升“人才密度”。在這個過程中，林俊暘的權責範圍面臨調整——可能會從原先的垂直整合型負責人，變成負責其中一部分環節。這種變化，他無法接受，因而提出了辭職。簡單來說，過去林俊暘帶領的Qwen團隊更像是一個“特種部隊”：預訓練、後訓練、多模態、Infra全鏈路閉環，人少但戰鬥力極強，適合快速迭代、沖榜造勢。這是典型的“創業團隊”打法，極具理想主義色彩；而隨著集團戰略轉向，阿里希望將Qwen團隊按功能拆分成預訓練、後訓練、視覺理解等多個模組，與通義實驗室的其他團隊（如通義萬相）合併工作。這是“正規軍”的整編打法，更適合大規模協同作戰和商業化的深度落地。雖然在管理上，這種組織重構更利於資源統籌，但對於一個習慣了掌控全域的技術負責人來說，無疑是一種巨大的心理落差。圖源：微博更深層次的矛盾，或許在於“技術”與“商業化”的左右互搏。知名經濟學者盤和林對此分析得頗為透徹：“阿里需要千問快速商業化。今年AI行業有個問題，大量的基礎設施投入無法回收。但千問團隊之前的調性，是服務好使用者，做好開源。”開源，意味著免費、分享、普惠，追求的是技術影響力和社區口碑；商業化，意味著變現、收入、利潤，追求的是財務報表和市場佔有率。兩者並非天然對立，但在資源有限、競爭白熱化的當下，取捨在所難免。艾媒諮詢CEO張毅指出，阿里當前或是在“戰略收縮開源，聚焦高價值的商業閉環”。其實，在不少業內人士看來，此次事件發生的真正導火線，更有可能是新模型表現不佳。雖然Qwen3.5的小模型（如0.5B、4B等）在開發者社區好評如潮，甚至獲得了馬斯克的點贊；但在衡量大模型綜合能力的權威盲測榜單LMArena上，千問的旗艦模型Qwen3.5-397B排名並不理想，僅列第18位，與之前Qwen3-Max Preview的前三位置相去甚遠。圖源：LMArena當旗艦模型表現不及預期，當內部評價出現分歧，當組織架構的調整似乎在印證“不信任”，離開或許成為了一種必然。3月4日下午，通義實驗室緊急召開了全員大會。阿里高層反覆強調：“Qwen沒有收縮，這是一次團隊擴張。”並承認“新人引入肯定會帶來陣型變化，我們可能沒處理好”。這句話的潛台詞是：公司要長大，隊伍要整編，在這個過程中，總會有人走散。人才爭奪戰背後，AI進入“體系對抗”時代進入2026年，AI行業徒步踏進深水區，全球AI人才爭奪戰也逼近極致白熱化。領英發佈的《2026全球勞動力市場洞察報告》顯示，AI工程人才是全球流動最活躍的群體，其跨國流動的意願是普通人才的8倍。國內的資料同樣驚人，獵聘報告指出，2026年開工首周，要求會AI工具的職位同比增長超過200%。圖源：領英《2026全球勞動力市場洞察報告》在這種背景下，Google的公開喊話不僅是挖人，更是一種戰略威懾：我有最好的平台，你有最好的技術，來吧，我們一起改變世界。值得注意的是，DeepMind近期不僅招技術人才，還在公開招聘“首席經濟學家”。這說明頂級的AI實驗室已經開始思考AGI（通用人工智慧）時代的資源分配、經濟模型與社會治理問題。他們需要的不僅僅是寫程式碼的工程師，更是能夠建構未來世界規則的跨學科大腦。此舉，也代表著AI競爭開始從“單點突破”轉向“體系對抗”。正如阿里近期提出的“通雲哥”黃金三角概念——通義實驗室、阿里雲、平頭哥。未來的競爭，不再是一個模型跑分有多高，而是算力供給、模型能力與系統工程的協同作戰。林俊暘時代的Qwen，像是銳利的“矛尖”，鋒利無比，專打技術高地。而現在的阿里，需要的是“矛、盾、戰車、糧草”齊備的集團軍。從“比模型”轉向“拼體系”，用“模型+生態+AI Infra”爭奪下一代平台入口。這也是為什麼阿里會引入具有Gemini背景的周浩來接管後訓練團隊，為什麼要把團隊拆解重組。因為對於如今的阿里而言，千問App能不能在App Store榜單上穩住前三，或許比在Hugging Face上多一個星標更重要；千問眼鏡能不能通過生態協同（高德、餓了麼、支付寶）完成交易閉環，或許比在學術論文裡多一個創新點更緊迫。最後劉峰想說，這更像是技術理想主義與商業現實主義的一次正面碰撞。我們無意評判誰對誰錯。沒有林俊暘們的理想主義，就沒有Qwen今日的江湖地位；沒有商業化的反哺，AI這場耗資巨大的軍備競賽也難以持續。對於阿里而言，陣痛在所難免。但對於整個行業而言，這或許是一次必要的清醒。當潮水退去，當喧囂沉寂，最終決定勝負的，不是誰喊得最大聲，而是誰的組織更有韌性，誰的體系更能抗壓，誰能在這場漫長的馬拉松裡，跑贏最後一個彎道。3月的杭州，春寒料峭。雲谷學校的走廊裡，馬雲關於AI的講話餘音尚在；西溪園區的燈火下，新的千問團隊正在重組。再見了，林俊暘時代的Qwen。你好啊，那個必須直面商業世界所有殘酷與複雜的，全新的阿里AI。 (科技頭版)

矽谷的AI，悄悄換成了中國造。有些改變，來得很靜，但改變的是整個遊戲規則。

“ Airbnb的CEO布萊恩·切斯基說了一句讓矽谷集體沉默的話："我們的AI客服系統用的是阿里巴巴的通義千問，不是ChatGPT。" 停頓了一下，他補充："通義千問非常好，又快又便宜。" 這不是客套，這是帳本上的數字在說話。”（引用網路圖片）01 四十萬美元的選擇題一個美國創業者算了筆帳：把底層AI模型從ChatGPT換成通義千問後，每年省下40萬美元。四十萬美元是什麼概念？兩個矽谷工程師一年的工資，或者讓公司多活半年的救命錢。這就是為什麼越來越多矽谷公司開始"靜默轉向"，不會大張旗鼓宣佈，但會悄悄把技術堆疊換成中國的開源模型。專注AI搜尋的Exa公司發現，用中國模型比GPT-5更快、更省錢。在一款熱門程式設計工具裡，最受歡迎的20個模型中，7個來自中國。免費、好用、不設限：在商業世界裡，這三個詞就是最好的通行證。02 下載量不會騙人2025年9月，一件悄無聲息的事發生了：通義千問在全球最大開源平台Hugging Face上，下載量超過了Meta的Llama，成為全球第一。到2026年1月，下載量突破7億次。7億次下載背後，是全球數百萬開發者用滑鼠投出的票。他們不關心地緣政治，只關心一件事：這個工具能不能幫我把活兒幹好。前GoogleAI工程師、現在在矽谷創業的米沙·拉斯金說得很實在："中國模型已經出人意料地接近前沿了，新一代模型離頂尖水平已經觸手可及。"觸手可及，兩年前，沒人敢說這四個字。（引用網路圖片）03 那場"地震"如果說通義千問是穩紮穩打，DeepSeek就是一記重拳。2025年1月，這家杭州公司發佈了DeepSeek-R1。消息傳出當天，輝達單日市值蒸發5890億美元，創下美國上市公司最大單日跌幅紀錄。原因很簡單：DeepSeek用不到30萬美元，做出了和OpenAI的o1模型相當的效果。而GPT-4的訓練成本估計是7800萬美元。成本是對方的0.4%，效果不差。這個消息對AI行業的衝擊，就像當年有人證明不燒油也能讓車跑得飛快——它打破了一個所有人都相信的"鐵律"：做好AI必須砸錢堆算力。DeepSeek證明：演算法比鈔票更重要。幾天後，微軟、AWS、輝達紛紛接入DeepSeek。連之前還指控它"竊取技術"的微軟，轉頭就把它接入Azure雲平台。真香定律，從不缺席。04 矽谷大佬的真心話有意思的是，矽谷科技圈對中國開源模型的態度，遠比政客們真誠。輝達CEO黃仁勳公開承認："通義千問已佔據開源模型的大部分市場份額，領先優勢還在擴大。"祖克柏在Meta內部會議上說："DeepSeek實現了新穎的技術突破。幸運的是，他們公開了這些進展，我們可以學習。當有人做得比你更好時，這能激勵我們。"圖靈獎得主、Meta首席AI科學家楊立昆說得更直接："上世紀90年代，瀏覽器大多是閉源的，但最終只剩下開源瀏覽器。人工智慧也會走同樣的路。"風投大佬馬克·安德森在社交媒體上寫道："DeepSeek是我見過最令人驚嘆的突破之一。這是AI領域的'斯普特尼克時刻'。"斯普特尼克時刻，1957年蘇聯發射第一顆人造衛星，震驚美國的那個時刻。（引用網路圖片）05 開源不是慈善，是佈局可能有人會問：為什麼要把這麼好的技術免費開源？答案很簡單：通過免費建立生態，通過生態掌握標準，通過標準贏得未來。當全球數百萬開發者都在用你的模型做開發，基於你的框架做創新，你就掌握了這個行業的話語權。這比閉門造車強一萬倍。通義千問、DeepSeek用的都是最寬鬆的開源許可證，任何人都可以免費下載、修改、商業化使用，沒有後顧之憂。對比之下，Meta的Llama商業使用有限制，OpenAI的GPT徹底閉源，只能按次付費呼叫API。限制越少，用的人越多；用的人越多，生態越強。一個矽谷公司的技術負責人說："中國模型不僅性能好，文件豐富、社區活躍、問題能快速解決。這種體驗，比很多美國模型還好。"06 中國開發者的新機會這場革命對想出海的中國開發者來說，是個前所未有的好時機。以前，中國產品出海要面對"中國製造"的刻板印象，要花很大力氣證明自己。但現在，在AI領域，中國模型已經在全球建立了技術信任。一個深圳小團隊，基於通義千問開發的應用，在矽谷開發者眼裡和基於GPT的應用是同一等級。甚至在成本、定製化方面，還有優勢。這是技術紅利帶來的出海便利。但真正賺錢的不是模型本身，而是垂直應用。Airbnb用通義千問做客服就是個好例子，他們沒自己訓練模型，而是基於開源模型針對業務場景最佳化。中國開發者的機會也在這裡：找到細分領域，用中國開源模型做底層，開發真正解決問題的應用。醫療、教育、金融、電商，每個領域都有空間。07 結語一位矽谷風投在給投資人的郵件中寫道："這裡的初創公司正在建構未來，但他們的工具，越來越多印著中國的開源標識。"這句話值得品味。技術競爭，最終是生態的競爭。誰能讓更多人用你的工具，誰能讓更多企業基於你的平台創新，誰就贏了。有些改變來得很靜，但它改變的是整個遊戲的規則。當全球開發者湧向GitHub下載中國模型的那一刻，當Airbnb的CEO公開說"又快又便宜"的那一刻，當矽谷風投在郵件裡寫下"中國的開源標識"的那一刻：新的時代，已經開始了。 (半場Halftime)

字節硬體搶跑，阿里騰訊急了

AI競賽下半場，三巨頭的硬體卡位戰。大模型雲端算力比拚進入白熱化，科技巨頭們的競爭邊界也加速向硬體終端蔓延。其中，字節最早跳出軟體生態競爭，從AI手機、眼鏡乃至汽車，字節已將目光投向全場景終端。近日，騰訊、阿里也強勢入局。不同於字節的自研主導，騰訊以資本為矛，密集編織硬體網路。阿里則以通義大模型為核，繫結海量硬體產品，也借規模效應嘗試拉高Token消耗。火山引擎大模型智能硬體負責人邢孝慈預計：2026年，AIoT（AI硬體）領域單一產品出貨量超過100萬台，單一品類出貨量超過1000萬台的客戶和產品會變多。2025年12月1日，字節跳動上線豆包手機助手，打響了爭奪手機硬體入口的第一槍。此後，有媒體披露，豆包AI眼鏡已經在排產之中，預計2026年第一季度發售。甚至坊間傳言，字節跳動要造“豆包汽車”。雖然這些消息相繼被字節否認，但硬體無疑已成為巨頭爭奪AI生態入口的核心戰場。阿里也醒了。1月8日至11日，阿里在深圳舉辦了阿里雲通義智能硬體展，共吸引超過200家品牌參加，展出了超1000個類別的智能硬體，其品類包羅萬象，涵蓋了AI手機、AI眼鏡、AI陪伴玩具、寵物翻譯、AI調香等。阿里雲通義大模型業務總經理徐棟在接受媒體採訪時說：除了Chatbot和Agent之外，硬體可能是大模型快速形成商業閉環的場景。他預計，2026年的智能硬體之爭將不侷限於手機、汽車和眼鏡，應該會出現新的品類，它們也將有可能成為新的入口。阿里在硬體激戰中的策略，更多是扮演“生態賦能”的供應商角色：與模組、晶片廠商深度合作，將通義的多模態互動、語音識別能力封裝為解決方案，讓硬體商或開發者更易用、成本更低，生態更繁榮。騰訊的策略則是瞄準頭部硬體廠商，比如同在深圳的拓竹與影石Insta360，延續其擅長的“資本+技術輸出”手腕。作為基石投資人，騰訊曾參與了影石Insta360的IPO配售。近期，影石又與騰訊雲合作發售了會議麥克風產品。有消息稱，騰訊還參投了拓竹在2025年11月完成的、估值為100億美元的新一輪融資。雖然拓竹創始人陶冶否認了這一消息，但拓竹與騰訊互動頻繁：騰訊混元3D 3.0大模型接入了拓竹3D模型平台，並推出了名為“印你”的全新手辦生成器。2026年，大公司的第一場“硬仗”圍繞端側入口打響。過去，這個入口更多被硬核聯盟（OPPO、vivo、華為、聯想等手機廠商發起）佔據。如今，互動的舊秩序正在被推倒。01 “封殺”擋不住豆包，阿里跟進入局2025年12月1日，豆包發佈手機助手，其搭載在中興nubia M153系列手機上，通過獲取作業系統層面的高權限，實現打車、買火車票等功能。雖然字節的嘗試被淘寶、微信等超級App火速“封殺”，但已清晰宣示了其爭奪入口的戰略意圖，也初步驗證了模型廠商與手機廠商深度合作的可行性。雖初戰未捷，但豆包手機攪動的行業影響不斷擴大；應用也在持續更新，並且力度更大。《中國企業家》統計了其更新日誌，截至1月12日，豆包手機助手共進行了40多項更新和新增功能。僅在1月12日這周，其新增的助手功能便有：系統相簿支援照片預覽時，底部按鈕快捷打開豆包助手，使用豆包P圖；在UI和系統層面新增“相機前後置視訊美顏”功能，且瀏覽器支援抖音搜尋。字節的更新也透露出了其學習成為手機系統廠商的底層思維。除了在端側大模型能力上做小步快跑式的更新，字節將抖音搜尋、豆包輸入法、豆包大模型語音能力等灌入其中。在設計上，甚至關注到了手機鬧鐘響鈴和小睡時助手關閉鬧鐘這樣的細分需求。阿里和騰訊則沿用了從軟體切入手機市場的整體思路，做法上仍帶有鮮明的大模型時代風格。據悉，對於豆包手機助手的GUI（圖形使用者介面）方案，阿里也在同步探索軟體與手機結合的方案。2025年12月31日，阿里通義實驗室發佈開源“MAI-UI”，這是一個多模態的基礎GUI智能代理。不僅能實現人機互動，還能整合MCP工具使用。阿里還在佈局另外一條技術線“A2A”（Agent-to-Agent）。該路線通過直接呼叫App裡的Agent能力，實現跨應用的調取。徐棟表示：GUI和A2A兩條路線都處於早期階段，齊頭並進。“A2A發展挺快，體驗更好，速度更快，模型消耗成本更低。如果全用GUI，成本可能會更貴。”面對GUI變革浪潮，騰訊也做出了嘗試動作。幾乎在阿里開源“MAI-UI”模型的同時，2025年12月30日，騰訊開源了一款端側翻譯模型Tencent-HY-MT1.5-1.8B，該模型可以在手機等消費級裝置運行，量化後僅需約1GB記憶體。2026年開年，微信小程序聯合騰訊混元、騰訊雲、騰訊廣告推出“AI應用及線上工具小程序成長計畫”。通過提供免費雲開發資源、1億混元大模型Token額度，以及資料分析、廣告變現及流量激勵等支援，幫助開發者快速落地AI應用。02 AI眼鏡阿里先下一城，字節後手兇猛手機入口之外，AI眼鏡是當前硬體競爭的最激烈戰場。今年的國際消費電子展（CES）上，據媒體統計：AI眼鏡展台已達23家，其中中國品牌商家佔了16席，包括阿里巴巴、雷神科技、韶音、Rokid、Xreal等。在政策端，智能眼鏡也首次被納入“國補”。在AI眼鏡市場，阿里暫時佔據了先機。2025年11月27日，阿里正式發佈夸克AI眼鏡，首發提供S1、G1兩個系列共六款單品，最低到手價分別為3799元、1899元。上線不久，其天貓旗艦店已有超過9000人付款購買，京東商城售出超5000件，預售期也來到了45天。但字節正在步步緊逼。根據媒體報導，豆包AI眼鏡即將進入出貨階段，無屏版AI眼鏡將於今年第一季度率先發佈，帶顯示功能的版本預計在今年第四季度推出。對此，《中國企業家》詢問字節跳動方面，豆包相關負責人表示，傳聞不實，目前沒有明確的銷售計畫。但據媒體從供應鏈處瞭解的資訊，眼鏡將由龍旗科技代工，研發落地龍旗惠州工廠，量產則由龍旗南昌工廠承接。雙方分工明確：龍旗負責底層UI開發，字節則主攻上層App研發，以更好地實現產品與手機的互聯。此前，龍旗科技也曾在2025年半年報中披露：公司新承接了國內頭部網際網路客戶AI眼鏡量產項目。此前，魅族前高管李楠在一檔播客裡預言，下一代個人計算中心的產品形態暫時不明確，因為技術能力在快速變化，眼鏡、項鏈、耳機都是可選方案，大模型能力也會強化其競爭。圍繞AI眼鏡生態，騰訊則尚無明確的硬體製造計畫。2024年，曾傳出騰訊代理Meta Quest VR頭顯，但合作始終沒有見諸天日。騰訊更多延續的是“投資槓桿+生態協同”的硬體佈局邏輯。比如2025年10月，騰訊應用寶與中國頭部AI眼鏡廠商影目INMO達成合作，聯合打造AI眼鏡專屬App Store。2025年7月，INMO宣佈完成1.5億元B2輪融資。03 降低合作夥伴使用門檻巨頭之間的硬體卡位戰，本質上還是對AI時代核心話語權的爭奪。當大模型能力泛化至物理世界，誰能佔據更多場景，掌握更多資料和使用者，也將讓模型更快迭代和進化，並消耗更多Token，緩解商業化壓力。目前，阿里和字節分別推出了針對AIot裝置的開髮套件。阿里推出了多模態互動開髮套件，整合了千問、萬相、百聆三款通義基礎大模型，並預置了十多款生活休閒、工作效率等領域的Agent和MCP工具，可應用於AI眼鏡、學習機、陪伴玩具、智慧型手機器人等硬體裝置。相比於字節，阿里的策略是通過標準化技術輸出，降低硬體廠商接入門檻，同時借助海量硬體終端，拉高通義大模型的使用量。近期的阿里雲通義智能硬體展上，從具身智能、AI潮玩，乃至AI包掛，幾乎所有主流AI硬體都有品類搭載了通義大模型，這也為阿里雲的算力業務帶來持續增量。字節則推出了玩具AI框架、音訊AI框架等開髮套件，該套件基於新推出的豆包大模型1.8系列，採取三個月、一年與終身使用不限量等針對性優惠。字節甚至還提出了vibe interaction（氛圍互動）的概念，讓軟體定義硬體。徐棟表示：IoT廠商十多年前強調連接，但沒有達成更多增值服務。但現在，大模型讓單點的IoT廠商有可能誕生相互通訊、相互協作的任務方式。“首先要把（模型使用）成本降下去，增加出貨量，不同的裝置之間找到更好的協作方式，有可能長出一些新的業態和生態。”據徐棟介紹，很多硬體裝置的TTS（從文字到語音）成本佔75%，但有些語音模型可以降低擬人化要求，成本會低很多，這是通義大模型正在做的事情。字節與阿里的相關負責人也不約而同地提到了AIoT裝置的網路連線、訊號傳輸、語音延時以及續航等問題。一位硬體從業者甚至說，“識別精準性就意味著產品的退貨率，每一次誤差可能是退貨率的一個開端。”而音視訊技術騰訊在B端、C端積累多年，這也成為騰訊開展與硬體公司合作的基礎。騰訊雲副總裁商世東在談到與影石Insta360的合作時，對《中國企業家》表示：在大語言模型和深度學習時代，很多任務訓練要求模組之間共同定義一個訓練目標。比如裝置延遲、裝置功耗、晶片算力，怎麼找到更好的平衡點，需要演算法、軟體和裝置廠商，大家共創和緊密協作。在AI時代的下半場，硬體公司正在學著將模型公司的能力內化、規模化；平台型公司則要學習將網際網路的規模效應轉化為對新互動的爭奪——不久的未來，競爭的焦點可能將從使用者數量，走向裝置的數量以及呼叫規模。 (中國企業家雜誌)

技術全球前三，使用者倒數第一，“千問”項目暴露了阿里的AI困局

就在昨天，11月13日,阿里秘密啟動了一個代號"千問"的項目。上百名工程師封閉研發,在杭州總部劃出了兩層樓用作專屬辦公,這是要全面對標ChatGPT的節奏啊。但更震撼的，是CEO吳泳銘在雲棲大會上說了一句話:"通義千問要做'AI時代的Android'。"聽起來很誇張,對吧?AI怎麼可能複製Android呢?但現在的Qwen全球下載量已經達到了6億次，相當於全球每12個人就有1個人或團隊下載過。衍生模型超17萬個,就像AI時代的"三星、華為、小米",每個都是潛在的超級應用。連Airbnb的CEO都說:"我們大量依賴Qwen,因為比OpenAI更快更好。"那吳泳銘是誰,他是被馬雲欽點接班、帶領阿里走出低谷的人。曾是淘寶技術負責人,親手打造了中國最大的電商平台。兩年半前他押注Qwen開源路線時被業內質疑,今天6億次的下載量，證明了他當初的選擇無比正確。這個消息在整個科技圈引起了巨大震動。為什麼?因為阿里這步棋,可能會改寫AI時代的遊戲規則。阿里的AI困局要理解阿里這步棋有多大膽,先得看兩個事實。第一個事實是,Qwen模型技術實力已經得到全球驗證。在OpenAI工作了4年、參與過ChatGPT和GPT-4研發的前研究員都說,Qwen的技術路線是對的。最新發佈的Qwen3-Max在全球大模型排行榜上位列第三,性能超過GPT-5、Claude Opus 4等國際頂尖模型。Airbnb CEO布萊恩·切斯基公開表示,公司"大量依賴Qwen",因其"比OpenAI模型更快更好且便宜"。他們使用Qwen後,AI客服平均解決時間從近3小時縮短至6秒,減少了15%的現場需求。另外，阿里在C端AI市場的短板太明顯了。豆包月活1.72億,DeepSeek月活1.45億,通義APP月活遠低於豆包和DeepSeek。技術再強,沒有使用者,也是白搭。這就是阿里要面臨的殘酷現實，B端稱王,C端落後。而剛剛啟動的"千問"項目,就是阿里扳回這一局的非常關鍵之戰。開源VS閉源的終極對決吳泳銘說要做"AI時代的Android",這背後的戰略目的是什麼?我們可以先回顧一下Android的故事。2008年,Google推出Android開源系統,當時蘋果iOS技術領先、體驗更好,很多人斷言Android已經沒有機會了。但關鍵轉折來了——Android開放生態吸引了三星、華為、小米等硬體廠商,應用程式商店迅速繁榮,價格優勢明顯。到2015年,Android佔全球約70%份額,iOS約30%。開放生態,戰勝了封閉產品。現在,Qwen正在複製這個路徑。就像Android開源讓每個硬體廠商都能做手機,Qwen開源讓每個開發者都能做AI應用。你可能會問,AI沒有硬體廠商聯盟啊,怎麼複製Android呢?但事實是,17萬個衍生模型、100萬企業客戶、Airbnb等頂級公司,就是AI時代的"硬體廠商聯盟"。每個衍生模型都是一個潛在的超級應用,就像基於Android誕生了Galaxy、Mate、小米手機。用這組資料對比一下就知道了，Qwen全球下載6億次、17萬衍生模型、100萬企業客戶。而ChatGPT雖然月活4.455億,但生態封閉,主要靠API呼叫,開發者很難深度定製。更關鍵的是成本優勢。開源模型可以二次開發、部署在私有雲,企業不用擔心資料洩露,這是ChatGPT做不到的。歷史告訴我們,開放生態最終會戰勝封閉產品。但問題來了——豆包VS通義：阿里為什麼急？C端AI市場已經是紅海了,豆包月活1.59億,DeepSeek月活1.46億,阿里現在入場還來得及嗎?看一組資料就知道阿里有多急了。豆包背靠字節跳動,有抖音、剪映導流,10月月活環比增長22.2%。DeepSeek雖然環比下滑14%,但基礎盤穩固。騰訊元寶單月投流超10億,月活增長23.6%。而通義APP,日活遠低於豆包和DeepSeek,差距懸殊。更要命的是,獨立AI應用的生存空間正在快速縮小。Kimi月活從2025年3月的1830萬下跌至9月的967萬,跌幅近47%，就是因為停止投流後使用者流失嚴重。這也給了阿里一個警示:沒有生態支撐的AI應用,很難活下去。但阿里也看到了機會。豆包和DeepSeek雖然月活高,但都是"工具型應用",使用者黏性不強。而阿里有淘寶、天貓、餓了麼等天然流量入口——使用者在淘寶購物、支付寶支付時,千問AI可以無縫嵌入,大大降低獲客成本。這是豆包、DeepSeek都不具備的優勢。更重要的是,2025年2月,阿里宣佈未來三年將投入3800億元建設AI基礎設施,9月雲棲大會上表示將在此基礎上追加更大投入。到2032年,阿里雲資料中心能耗規模將提升10倍,算力投入指數級增長。這3800億是什麼概念?相當於建100個鳥巢體育場,或者買下3個迪士尼樂園。時機、資金、生態,三個條件齊了。阿里管理層把"千問"項目視為"AI時代的未來之戰",不是沒有道理的。三張王牌但挑戰也是顯而易見的。阿里To C基因弱、通義APP表現平平,千問APP憑什麼能逆襲?因為阿里手裡還有三張王牌。第一張王牌,Qwen模型的全球影響力。Qwen3-Max性能躋身全球前三,超越GPT-4.5、Claude Opus 4,支援119種語言,全球化能力強。更重要的是,頂級公司的認可。蘋果國行AI確定與Qwen合作,這是中國大模型首次進入iPhone生態。第二張王牌,阿里雲生態資源。阿里雲AI市場份額35.8%是什麼概念?就是說,中國每3家用AI的企業,有1家選阿里雲。更誇張的是,它比第2到第4名加起來還多——就像考試時你考了90分,第2到第4名加起來才85分。財富中國500強裡,超過一半企業都在用阿里雲。你平時點的外賣、打的車、刷的短影片,背後的AI計算,很可能就跑在阿里雲上。通義大模型已服務超9萬家企業和220萬家釘釘企業。第三張王牌,全端AI能力。從算力(阿里雲)、模型(Qwen)、應用(千問APP)到生態(17萬衍生模型),全鏈條覆蓋。這就像華為做手機,技術(麒麟晶片)+生態(鴻蒙系統)+管道(線下門店)三位一體,最終殺出重圍。但手握王牌不等於贏得戰爭。能不能打好這手牌,還得看最後的落地執行。開源能贏嗎?這不僅僅是阿里的戰爭,更是開源生態vs閉源產品的終極對決。阿里的野心不是做一個對標ChatGPT的產品,而是打造AI時代的作業系統,讓每個開發者都能參與這場變革。從Android到Qwen,歷史告訴我們,開放生態最終會戰勝封閉產品。但能否成功,取決於執行力、時機和運氣。OpenAI選擇閉源商業化,字節選擇工具化,阿里選擇開源生態化。三條路線,三種不一樣的打法,最終誰會勝出呢?大家心裡都沒底。阿里選擇了開源,這可能是最慢的路,但也可能是唯一正確的路。而時間會告訴我們答案。AI時代,資訊真假難辨,我是林傑,關注我,這裡不誇大,不虛假,只聊AI行業的真話和事實。(I人林傑聊AI)

阿里將推出國際版“千問”，與ChatGPT競爭

《科創板日報》獲悉，阿里巴巴已秘密啟動“千問”項目，基於Qwen最強模型打造一款同名個人AI助手——千問APP，全面對標ChatGPT，加入全球AI應用的頂級競賽。阿里核心管理層將其視為“AI時代的未來之戰”，希望借助Qwen的開源技術優勢贏得競爭。這是年初公佈3800億投入AI基礎設施之後，阿里AI戰略的又一重要佈局。此前，阿里重兵一直放在B端AI市場，通過阿里雲向各行各業提供模型API服務。基於Qwen的優秀性能和國際影響力，阿里管理層認為啟動千問C端之戰的時機已經成熟。阿里巴巴已經抽調上百名工程師秘密辦公。在阿里巴巴位於杭州的總部園區，已有兩層辦公樓被劃為該項目的專屬區域。面向全球市場的國際版千問APP也在同步研發，將借助Qwen模型的海外影響力與ChatGPT直接爭奪海外使用者。Qwen大模型的研發始於三年前，目前已經成為全球排名第一的開源大模型。資料顯示，Qwen系列模型的全球下載量已突破6億次。Airbnb CEO布萊恩·切斯基此前公開表示，公司正“大量依賴Qwen”，因其比openAI模型更快更好。輝達CEO黃仁勳表示，Qwen已佔據全球開源模型的大部分市場，並在持續擴大份額。不過，阿里雲與通義大模型雖然在AI基礎設施層面技術領先，卻缺乏直達消費者的應用載體。2024年底至2025年初，阿里巴巴就已經通過一系列組織架構調整和戰略部署，正式加碼AI To C業務。2024年12月，阿里巴巴將AI應用“通義”的產品團隊從阿里雲智能劃入智能資訊事業群。調整後，通義的PC端及App端團隊與夸克平級，共同探索AI在C端市場的應用場景，而通義實驗室仍保留在阿里雲體系內，繼續負責基礎技術研發。今年3月13日，阿里巴巴宣佈推出AI旗艦應用——新夸克，作為阿里巴巴AI To C的代表產品。而此次秘密研發的阿里“千問” APP，後續將與夸克如何協同發展，仍有待進一步明確。據麥肯錫預測，到2030年，全球AI To C市場規模將達到1.3兆美元，年均增長率超過35%。這個數字讓任何科技企業都無法忽視。在阿里之外，字節旗下豆包已經獲取了海量使用者流量。根據QuestMobile《2025年三季度AI應用價值榜》，豆包月活環比增長22.2%至1.59億，月均下載量達3447萬。騰訊元寶則一度靠著DeepSeek流量急速攀升。QuestMobile資料顯示，2025年上半年，騰訊元寶的月活使用者數同比增長55.2%。隨著AI應用融入更廣大使用者的日常生活，阿里、字節、百度等廠商之間的比拚也逐漸升溫，曾經在網際網路、移動網際網路時代屢次上演的競爭大戲，如今將在AI的舞台上迎來全新演繹。 (財聯社AI daily)

AI交易員大戰：六大AI模型誰是賺錢王者？

好消息，10.11 幣圈史詩級大跌後，加密交易又開始變得活躍了。壞消息，是 AI 在交易。想像一下這樣的場景：給全球六大頂級 AI 模型每人發 1 萬美元，讓它們在同一個真實市場裡廝殺，會發生什麼？注意，這不是模擬盤，而是正在發生的現實。Claude、GPT-5、Gemini、Deepseek、Grok 和通義千問，每個模型都拿著 1 萬美元真金白銀在加密交易平台 Hyperliquid 交易。所有地址公開，任何人都能即時圍觀這場「AI 交易員大戰」。有意思的是，這六個 AI 用的是完全相同的提示詞，接收完全相同的市場資料。唯一的變數，就是它們各自的「思考方式」。這就像給六個人同樣的槍和子彈，但每個人的射擊技術完全不同。結果會如何？答案令人震驚。戰況激烈：三天分出勝負如果你從 10 月 18 日開始追蹤 Alpha Arena，會發現剛開始幾個 AI 都差不多，但越往後差距越大。開局，大家都在試探。第一天結束時，最好的 Deepseek 也只賺了 4%，最差的 Qwen3 虧了 5.26%。大部分 AI 都在正負 2%之間徘徊，看起來像是都在試探市場。就像一群新手司機第一次上高速，都開得很小心。但到了 10 月 20 日，畫風突變。Deepseek 飆升到 38.03%，而 Gemini 跌到了-31.56%。短短三天，頭部和尾部的差距拉大到了近 70 個百分點。更有意思的是交易頻率的差異：Gemini：完成了 47 筆交易，平均每天 15 筆，像個焦慮的投機交易員Claude：只做了 5 筆，如同謹慎的基金經理Grok：僅 1 筆交易，甚至還有未平倉的持倉，佛系到極點截至 10 月 20 日，也就是開始交易後的第三天，戰局已經出現了明顯的分化：領先梯隊：Deepseek Chat V3.1：$13,862（+38.03%）Grok-4：$13,358（+33.58%）Claude Sonnet 4.5：$12,384（+23.85%）表現平平：Qwen3 Max：$10,831（+8.27%）嚴重落後：GPT-5：$7,294（-27.06%）Gemini 2.5 Pro：$6,876（-31.56%）從盈虧分佈看：Deepseek：最大單筆虧損 348 美元，但整體盈利 3847 美元Gemini：最大單筆盈利 347 美元，最大虧損卻高達 750 美元不同 AI（公版大模型，未經過二次調教），對風險和收益的平衡完全不同。你能在網站上的 Model Chat 選項裡看到不同模型的聊天記錄和思考過程，這些獨白特別有意思：Gemini 的頻繁交易和思考像個多動症患者Claude 的謹慎像個保守的基金經理Deepseek 穩健得像個量化老手，只說倉位，不做任何情緒評價這種性格感覺不像是設計出來的，而是在訓練過程中自然湧現的。當面對不確定性時，不同的 AI 會傾向於不同的應對方式。為什麼是 Deepseek？量化基因的勝利1950 年，圖靈提出了著名的圖靈測試，試圖回答「機器能否像人一樣思考」；現在在幣圈，6 大 AI 在 Alpha 競技場中廝殺，在回答一個更有趣的問題：如果讓最聰明的 AI 們在真實市場裡交易，誰會活下來？或許在這個幣圈版的「圖靈測試」裡，帳戶餘額就是唯一的裁判。最讓人意外又似乎情理之中的當然是 Deepseek 的表現。說意外，是因為這個模型在國際 AI 圈的熱度遠不如 GPT 和 Claude。普通人提到 AI，第一個想到的往往是 ChatGPT 或者 Claude，很少有人會想到 Deepseek。說情理之中，是因為 Deepseek 背後是幻方量化團隊。這家管理規模超千億人民幣的量化巨頭，在進軍 AI 之前，就是靠演算法交易起家的。從量化交易到 AI 大模型，再用 AI 來做真實的加密交易，Deepseek 有點像回到了老本行。這就好比讓一個退役的職業拳擊手和一群健身愛好者比拳擊，雖然大家都有肌肉，但專業基因完全不同。訓練資料的影響可能是關鍵。Deepseek 背後的幻方量化，十幾年來積累了海量的交易資料和策略。這些資料即使不直接用於訓練，是否也會影響團隊對“什麼是好的交易決策”的理解？相比之下，OpenAI 和 Google 的訓練資料可能更偏向學術論文和網路文字，對實盤交易的理解可能不夠親民。同時，有交易員推測，Deepseek 可能在訓練時特別最佳化了時間序列預測能力，而 GPT-5 可能更擅長處理自然語言。在面對價格圖表這種結構化資料時，不同的架構會有不同的表現。這就像讓語言學家和數學家去解讀股價走勢圖，雖然都很聰明，但專業領域不同，結果自然不同。市場才是智能的終極試金石傳統的 AI 評測，無論是讓模型寫程式碼、做數學題，還是寫文章，本質上都是在一個「靜態」的環境裡測試。題目是固定的，答案是可預期的，甚至可能已經在訓練資料裡出現過。但加密市場不一樣。資訊極度不對稱的前提下，每一秒的價格都在變化，沒有標準答案只有盈虧。更重要的是，加密市場是典型的零和遊戲，你賺的錢就是別人虧的錢。市場會立即、無情地懲罰每一個錯誤決策。這個舉辦 AI 交易大戰的 Nof1 團隊，在它們的網站上寫了一句話：Markets are the ultimate test of intelligence（市場是檢測 AI 智能的終極測試）。如果說傳統的圖靈測試是在問「你能不能讓人類分不清你是機器」，那麼這個 Alpha Arena 問的其實是：你能不能在加密市場裡賺錢。這一點其實才是幣圈玩家對 AI 的真實期待。圍觀 AI 交易，也是一門生意當所有人都在關注 AI 的盈虧時，很少有人注意到背後這家神秘的公司。搞出這個 AI 交易大戰的 nof1.ai，並沒有太大的知名度。但是如果你看一下它社媒的關注列表，還是能找到一些蛛絲馬跡。nof1.ai 背後似乎不是一群典型的加密創業者，而是清一色的學院派 AI 研究員。Jay A Zhang（創始人）的個人簡介也很有意思：“Big fan of strange loops - cybernetics, RL, biology, markets, meta-learning, reflexivity”。reflexivity（反身性）是索羅斯的核心理論：市場參與者的認知會影響市場，市場的變化又會影響參與者的認知。讓一個研究“反身性”的人來做 AI 交易市場實驗，本身就顯得很有宿命感。另一個聯創 Matthew Siper 簡介顯示其為紐約大學機器學習方向的博士候選人，同時也是 AI 研究科學家。一個還沒畢業的博士生做項目，更像一個印證學術研究的項目。從他們的動作和背景來看，Nof1 顯然不是為了搞個噱頭。SharpeBench 這個平台名字就很有野心，夏普比率是衡量風險調整後收益的金標準，他們或許真正想做的，是 AI 交易能力的基準測試平台。有人猜測 Nof1 背後有大資本支援，也有人說他們可能在為後續的 AI 交易服務做鋪墊。如果他們推出訂閱 Deepseek 交易策略服務，買單的人或許不在少數。而基於這個雛形，去做 AI 資管、策略訂閱和大企業的交易解決方案，也是一門可以預見的生意。除了這個團隊本身之外，圍觀 AI 交易本身也有利可圖。Alpha Arena 剛上線，就有人開始跟單了：正向跟單：跟著 Deepseek 做。它買什麼你買什麼，它賣什麼你賣什麼反向操作：專門做 Gemini 的對手盤，Gemini 買就賣，賣就買但跟單有個問題：當所有人都知道 Deepseek 要買什麼時，這個策略還有效嗎？這也是項目創始人 Jay Zhang 說的反身性，即觀察本身會改變被觀察的對象。這裡還有一種頂級交易策略民主化的假象。表面上看起來，每個人都能知道 AI 的交易策略，但實際上你看到的是交易結果，不是交易邏輯。每個 AI 的止盈和止損邏輯並不一定連續且可靠。當 Nof1 在測試 AI 交易的行為，散戶在尋找財富密碼，其他的一些交易員在偷師，研究者們也在蒐集資料。只有 AI 本身不知道自己在被圍觀，還在認真地執行每一筆交易。如果說經典的圖靈測試是關於“欺騙”和“模仿”，那現在的 Alpha Arena 交易大戰，是關於加密玩家對於 AI 能力和結果的回應。多年來，AI 一直由靜態基準來衡量。ImageNet、MMLU 以及無數的排行榜告訴我們，那個模型能更好地「理解」圖像、邏輯或語言。但所有這些測試都有一個共同的缺陷，它們都發生在無菌、可預測的環境中。市場則恰恰相反。金融市場是終極的世界建模引擎，也是唯一一個會隨著 AI 變得更聰明而難度同步提升的基準。它們波動、反應、懲罰、獎勵。它們是一個由資訊和情感構成的生命系統。在 Alpha Arena 中，沒有正確的標籤，只有不斷變化的機率。一個模型的成功取決於它解讀波動的速度、權衡風險的精度，以及承認錯誤的謙遜程度。這將交易變成了一種新型的圖靈測試：考驗的不再是「機器能否思考」，而是「它能否在不確定性中生存」。在這個結果主導的加密市場裡，會賺錢的 AI，可能比會聊天的 AI 更重要。 (深潮 TechFlow)

阿里下場，具身智能迎來超級玩家！

通義團隊已建立機器人和具身智能的小組。多模態基礎模型正轉變為基礎智能體(agents)，而這些智能體將從虛擬世界走向物理世界。阿里通義千問大語言模型負責人林俊暘昨日在社交媒體上發文表示，已在通義團隊內部建立機器人和具身智能的小組。在2025雲棲大會上，阿里雲與輝達在物理AI領域達成合作。而此次阿里組建機器人和具身智能的團隊，標誌著阿里通義大模型正式涉足具身智能大腦領域。▍通義大模型走向物理AI林俊暘提及建立機器人和具身智能團隊時表示，多模態基礎模型正轉變為基礎智能體，這些智能體可以利用工具和記憶通過強化學習進行長時序(long-horizon)推理，而它們絕對應該從虛擬世界走向物理世界。據瞭解，林俊暘畢業於北京大學，其研究興趣集中於大規模語言模型和多模態大模型。他曾在阿里達摩院負責打造超大規模多模態預訓練模型M6，通用統一多模態預訓練模型OFA，中文預訓練模型Chinese CLIP等。目前是阿里通義千問的技術負責人。“多模態基礎模型如果僅用於視訊生成，仍停留在相對初級的階段。視訊生成只能證明AI對物理世界的理解能力，更關鍵的在於控制能力。阿里從純軟體AI應用轉向開發能夠控制智能終端與機器人的‘大腦’，實質上是在重新定義勞動力，這其中蘊含著巨大的市場空間。”快思慢想研究院院長田豐表示。他進一步指出，阿里當前採取的策略是：在軟體層面自研“大腦”，在硬體層面則通過投資整機廠商進行佈局。9月8日，阿里雲領投了機器人初創公司自變數機器人1.4億美元的A+輪融資。此前，阿里還投資了法奧意威、星動紀元、逐際動力、宇樹科技等多家機器人企業。“要實現從通用人工智慧（AGI）到超級人工智慧（ASI）的跨越，關鍵在於是否具備足夠強大的‘大腦’，能夠處理跨工業、農業、服務業等多領域的複雜任務，並達到人類水平。眼下整機技術路徑尚未收斂，硬體形態仍處於發散階段，因此通過投資參與是更為靈活和高效的方式。”田豐稱。▍不止阿里，大廠紛紛入局阿里的此番入局並不意外。當前，全球巨頭都在下場具身智能，物理AI成為新戰場。在今年6月的年度股東大會上，輝達 CEO黃仁勳曾提到：“人工智慧和機器人技術是最大的兩個增長機會，代表著數兆美元等級的增長機會。”9月雲棲大會期間，阿里雲就與輝達在物理AI領域達成合作。阿里雲人工智慧平台 PAI 將整合輝達Physical AI軟體棧，將為企業使用者提供資料預處理、模擬資料生成、模型訓練評估、機器人強化學習、模擬測試等全鏈路平台服務，進一步縮短具身智能、輔助駕駛等應用的開發周期。除了阿里外，京東、騰訊等網際網路廠商也在瞄準具身智能的大腦。京東已經發佈附身智能品牌JoyInside，為機器人、機器狗和AI玩具等提供機器人的“大腦”能力，並與數十家主流機器人品牌達成合作，包括陪伴類的Fuzozo芙崽、火火兔；教育領域的元蘿蔔AI、心大陸、Folotoy、嚕咔博士；產業領域的眾擎、雲深處、魔法原子等。騰訊Robotics X實驗室與福田實驗室聯合發佈具身智能開放平台 Tairos “鈦螺絲”。據騰訊首席科學家張正友介紹，Tairos 具身智能平台希望為機器人本體與應用開發商補齊關鍵軟體能力，就像為各類機器人裝上“大腦”，讓機器人具備感知世界、規劃任務以及自主決策等能力，從被動執行指令的機械體進化為主動適應現實世界的智能生命體。▍具身智能“大腦”邁入發展深水區具體來看，不少大廠選擇從自身業務場景切入，落地具身智能技術。“例如在倉儲、物流、服務業等場景中，讓具身智能‘大腦’達到解決專業任務的水平是具有可行性的。像順豐、美團等企業，都在朝這一方向積極佈局。它們在提升自身生產效率之後，再進一步通過生態合作將技術擴展至更多元的應用場景。”田豐提到。田豐還特別指出，阿里巴巴具備將自身業務與平頭哥晶片技術融合的潛力。“在最佳化機器人大腦的基礎上，與平頭哥進行協同，推動雲端AI晶片逐步向智能終端落地，無論是機器人晶片還是自動駕駛晶片，都將為大模型的規模化推廣提供硬體支撐。未來，更有機會建構起機器人領域的‘AppStore’應用生態圈。”不過，具身智能的大腦仍處於探索階段。宇樹科技創始人王興興曾多次表示，當前硬體的性能其實足夠支撐應用，核心瓶頸在於AI模型本身的能力不足，導致硬體潛力無法被充分釋放。此外，他對於當前熱門的VLA模型也持保留態度，認為其模型架構仍需進一步的迭代升級。談及大廠紛紛入局具身智能大模型所帶來的影響，田豐指出，當前機器人大腦的發展仍需聚焦於專業場景的突破。在他看來，專業場景下的應用仍存在明顯不足，更不必說實現通用場景的覆蓋。“物理AI對可靠性、精確性、速度要求更高。在物理環境中，一旦決策失誤，整條生產線上的太陽能板或鋰電池都可能受到影響，帶來巨大的試錯成本，遠高於軟體AI的容錯空間。目前我們需要彌補的短板非常多，包括物理環境中的任務流程設計、業務深層知識以及行業經驗等，這些方面都尚未被充分挖掘和理解。”田豐相信，未來具身智能的“大腦”將邁入發展的深水區。“從資料、邏輯再到決策，整個業務流的思維鏈條將被拆解得極為細緻，我們必須釐清其中每一個環節的因果依賴關係。” (財聯社AI daily)

阿里深夜幹了件大事，成本暴降90%！

32B尺寸比肩235B性能，兩大新模型已開源。智東西9月12日報導，今天凌晨，阿里通義實驗室正式發佈下一代基礎模型架構Qwen3-Next，並訓練了基於該架構的Qwen3-Next-80B-A3B-Base模型，該模型擁有800億個參數，僅啟動30億個參數。Base模型在Qwen3預訓練資料的子集上訓練，包含15T tokens訓練資料，僅需Qwen3-32B 9.3%的GPU計算資源，針對超過32k的上下文，推理吞吐量可達到Qwen3-32B的10倍以上。同時，基於Base模型，阿里開源了Qwen3-Next-80B-A3B的指令模型（Instruct）和思維模型（Thinking），模型支援原生262144個token上下文長度，可擴展至1010000個token。其中，Qwen3-Next-80B-A3B-Instruct僅支援指令（非思考）模式，其輸出中不生成<think></think>塊；Qwen3-Next-80B-A3B-Thinking僅支援思考模式，為了強制模型進行思考，默認聊天範本自動包含<think>。指令模型的性能表現與參數規模更大的Qwen3-235B-A22B-Instruct-2507相當，思維模型優於Google閉源模型Gemini-2.5-Flash-Thinking。▲指令模型測試基準▲思維模型測試基準在架構升級方面，相比阿里4月底的Qwen3 MoE模型，新增了混合注意力機制、高稀疏度MoE結構、一系列訓練穩定友好的最佳化，以及提升推理效率的多Token預測（MTP）機制等。新模型已在魔搭社區和Hugging Face開源，開發者也可通過Qwen Chat或阿里雲百煉、NVIDIA API Catalog體驗Qwen3-Next。開發者在Qwen的X評論區稱讚其新增的多Token預測（MTP）機制，稱這是最令人印象深刻的部分。Qwen Chat地址：https://chat.qwen.aiHugging Face地址：https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d魔搭社區：https://modelscope.cn/collections/Qwen3-Next-c314f23bd0264a阿里雲百煉：https://bailian.console.aliyun.com/?tab=model#/model-market/detail/qwen3?modelGroup=qwen301.指令模型接近235B旗艦模型思維模型超Gemini-2.5總的來看在性能方面，指令模型接近阿里參數規模235B的旗艦模型，思維模型表現優於Gemini-2.5-Flash-Thinking。其基座模型為Qwen3-Next-80B-A3B-Base，僅使用1/10的Non-Embedding啟動參數，在大多數基準測試中，性能表現與Qwen3-32B-Base相近。但其總訓練成本為Qwen3-32B-Base的10%不到。得益於其新的混合模型架構，Qwen3-Next在推理效率方面，與Qwen3-32B相比，Qwen3-Next-80B-A3B在預填充（prefill）階段，在4k tokens的上下文長度下，吞吐量接近前者的7倍，當上下文長度超過32k時，吞吐量提升達到10倍以上。在解碼（decode）階段，該模型在4k上下文下實現近4倍的吞吐量提升，在超過32k的長上下文場景中能保持10倍以上的吞吐優勢。具體來看，其指令模型表現優於Qwen3-30B-A3B-Instruct-2507和Qwen3-32B-Non-thinking，並取得了幾乎與參數規模更大的Qwen3-235B-A22B-Instruct-2507模型相近的結果。只有在面向大模型的綜合性評測基準、高難度數學推理基準AIME25中，指令模型的表現略遜色於Qwen3-235B-A22B-Instruct-2507，在程式設計、複雜問答與長對話的評測中表現更好。Qwen3-Next-80B-A3B-Instruct在RULER上所有長度的表現明顯優於層數相同、注意力層數更多的Qwen3-30B-A3B-Instruct-2507，甚至在256k範圍內都超過了層數更多的Qwen3-235B-A22B-Instruct-2507。思維模型的表現優於預訓練成本更高的Qwen3-30B-A3B-Thinking-2507、Qwen3-32B-thinking，全面超過Google的閉源模型Gemini-2.5-Flash-Thinking，並在部分指標上接近阿里最新旗艦模型Qwen3-235B-A22B-Thinking-2507。02.混合注意力、MoE、穩定最佳化多Token預測加持研究人員在部落格中提到，Qwen3-Next是針對大模型在上下文長度和總參數兩方面不斷擴展的未來趨勢而設計。Qwen3-Next採用的是Qwen3 36T預訓練語料的均勻採樣子集，包含15T tokens的訓練資料，其訓練所消耗的GPU Hours不到Qwen3-30A-3B的80%；與Qwen3-32B相比，僅需9.3%的GPU計算資源，即可實現更優的模型性能。這一模型結構相較其4月底推出的Qwen3的MoE模型，新增了多種新技術並進行了核心改進，包括混合注意力機制、高稀疏度MoE結構、一系列訓練穩定友好的最佳化，以及提升推理效率的多Token預測（MTP）機制等。混合注意力機制：用Gated DeltaNet（線性注意力）和Gated Attention（門控注意力）的組合替換標準注意力，實現超長上下文長度的有效上下文建模。研究人員發現Gated DeltaNet相比常用的滑動窗口注意力（Sliding Window Attention）和Mamba2有更強的上下文學習能力, 並在3:1的混合比例下，即75%層使用Gated DeltaNet，25%層保留標準注意力，能一致超過超越單一架構，實現性能與效率的雙重最佳化。同時在保留的標準注意力中，研究人員進一步引入多項增強設計，包括沿用先前工作的輸出門控機制，緩解注意力中的低秩問題，將單個注意力頭維度從128擴展至256，僅對注意力頭前25%的位置維度加入旋轉位置編碼，提高長度外推效果。高稀疏度混合專家（MoE）：在MoE層中實現極低的啟動比率，大幅減少每個token的FLOPS，同時保留模型容量。研究人員的實驗表明，在使用全域負載平衡後，當啟動專家固定時，持續增加專家總參數可帶來訓練loss的穩定下降。此前，Qwen3系列的MoE專家啟動比約為1比16，Qwen3-Next實現了1比50的啟動比。穩定性最佳化：包括零中心化和權重衰減LayerNorm等技術，以及其他增強穩定性以實現魯棒的預訓練和後訓練。研究人員發現，注意力輸出門控機制能消除注意力池與極大啟動等現象，保證模型各部分的數值穩定。多Token預測（MTP）：提升預訓練模型性能並加速推理，Qwen3-Next特別最佳化了MTP多步推理性能，通過訓練推理一致的多步訓練，進一步提高了實用場景下的投機採樣（Speculative Decoding）接受率。03.結語：3B啟動參數對標旗艦模型！阿里憑架構創新為模型降本提速Qwen3-Next的突破點在於同時實現了大規模參數容量、低啟動開銷、長上下文處理與平行推理加速。此外結合注意力機制、MoE設計等方面的多項架構創新，阿里通義此次實現僅啟動3B參數模型就能對標規模更大模型的性能，使得模型在性能與效率之間找到更佳平衡點，同時為降低模型訓練、推理成本提供了有效路徑。研究人員在部落格提到，未來他們將持續最佳化這一架構並開發Qwen3.5。與此同時近期阿里通義已經推出數個不同領域的模型，如超兆參數的Qwen3-Max-Preview、文生圖及編輯模型Qwen-Image-edit、語音識別模型Qwen3-ASR-Flash等。隨著其多領域模型的持續落地與開源，阿里通義在開源社區的技術影響力正逐步增強。 (智東西)