#Qwen | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#Qwen

千問3.5是阿里AI的「大一統」時刻

2026年2月5日，春節前夕，阿里巴巴集團內部完成了一項看似低調卻意義深遠的調整：將旗下AI的總稱和核心品牌統一為「千問」。直到2月16日的大年三十，阿里發布了最新的開源模型千問3.5。用一款模型整合了原生多模態，在視覺理解、複雜推理、Agent智能體等核心能力維度全面整合到統一的預訓練架構中。Qwen3.5-Plus總參數3970億，但推理時僅啟動170億，以不到5%的參數撬動了全部智能。在多項基準測試中表現媲美GPT-5.2、Gemini-3-pro等閉源第一梯隊模型，甚至超越了自家上一代兆參數的Qwen3-Max。用更小的模型，跑出了更強的性能。而成本不升反降，API價格僅為同等效能Gemini 3 Pro的1/18，部署顯存佔用相比上一代降低60%，推理效率大幅提升，最大推理吞吐量可提升至19倍。你會發現這不只是一次品牌的統一，更是組織的統一、架構的統一，最終指向AI策略的統一。當「千問」成為一個貫穿技術、產品與商業的統一符號，當Qwen3.5用「一款模型打天下」的策略在春節檔炸場，它不再只是又一次榜單刷新，而是阿里AI戰略從分散走向協同、從單點突破走向系統作戰的集中呈現。Qwen3.5憑什麼再掀巨浪？Qwen3.5的出現意味著，企業可以用過去幾分之一的成本，部署性能頂級的AI系統，參考R1曾經幹的事，用更小的參數規模、更低的部署成本獲得更強的智能表現。但這並非一夜之間的靈光乍現，而是Qwen系列一以貫之的戰略延續：從Qwen1.5到Qwen2.5，再到今天的Qwen3.5，阿里巴巴的優化方向從來不是“如何把模型做得更大”，而是“如何用更小的模型，做出頂尖的性能”。早在Qwen1.5時代，阿里就推出了從0.5B到110B的完整參數譜系，在千億級車型上驗證了規模與效率的平衡之道。 Qwen2.5延續這一思路，72B模型以不到Llama3 405B五分之一的參數規模實現性能超越，而1.5B量級的小模型在數學推理和編程等領域同樣展現出驚人的能力密度。這種「以小勝大」的能力，不是偶然的某一次爆發，而是貫穿每一代產品的穩定輸出。正是這種貫穿每一代的戰略定力，讓Qwen3.5的突破有了更深層的意義：它不只是又一次刷新榜單，而是將「以小胜大」的能力從單一的語言智能，拓展到了更廣闊的多模態世界。目前產業多模態模型多走「拼裝」路線，語言模型外掛視覺模組，常導致視覺增強而語言「降智」。而Qwen3.5選擇了一條更深入，也更複雜的道路，從預訓練第一天起就在海量的文字與視覺混合資料上聯合學習，讓視覺與語言在統一參數空間深度融合，從而讓模型真正具備跨模態直覺理解力，能像素級定位圖像、理解2小時操控視頻時序、將手繪草圖轉體代碼，甚至作為視覺智能前端代碼，甚至作為視覺智能手機前端時序、將手繪草圖轉體代碼，甚至作為視覺智能前端代碼，甚至作為視覺智能手機前端。在複雜推理與Agent能力上，Qwen3.5透過混合注意力機制、極致稀疏MoE架構、原生多Token預測及注意力門控機制等核心技術協同作用，實現動態分配計算資源、以不到5%激活參數調動397B總參數知識儲備，推理速度翻倍的同時確保訓練穩定可靠。下面這個案例，是簡單幾步在OpenClaw裡配置了Qwen3.5，讓它進行搜索過去一個月內發布的新AI模型，將信息匯總成一份報告，並最終自動將生成PDF文件直接在聊天窗口中發送回給我。從搜尋、整合資訊到排版產生文件，再到跨平台發送，最終輸出的報告不僅列出了模型，還包含了「SWE-Bench」基準測試比較表，顯示了各模型在解決軟體工程問題上的表現。4000 億參數超越兆參數，API 價格僅為同等性能Gemini 3 Pro 的1/18……這些數字單獨看是產品迭代，放在一起看，則意味著一個轉折點的到來：頂級AI能力不再是高算力、高成本的閉環遊戲，而是變成個人開發者、創業團隊、中小企業也能觸及的基礎能力。一個統一的阿里在全球所有模型廠商裡，阿里都是一個特殊的存在。大多數AI公司要麼專注模型研發，要麼深耕晶片設計，要麼依托雲基礎設施，但極少有廠商能將這三者同時握在手中，並讓它們在一個統一的戰略目標下協同運轉。但阿里做到了。Qwen3.5的背後，站著整個阿里雲的技術體系。 Qwen3.5的「極致性價比」並非孤立的技術成果，而是模式、晶片與雲協同創新的產物。在模型層面，千問大模型團隊持續迭代，從Qwen2.5到Qwen3再到Qwen3.5，每一代都在關鍵能力維度上突破開源模型的天花板，穩定輸出天花板級產品。在晶片層面，平頭哥自研的「真武」晶片針對MoE架構模型做了大量最佳化，滿足千問大模型對大規模運算的需求，讓晶片與模型共同設計，發揮極致算力潛力。更重要的是，阿里雲提供從訓練到推理的全鏈路優化，例如透過設計精巧的FP8/FP32精度應用策略，激活內存減少約50%，訓練提速10%，且這套方案被統一部署到強化學習訓練和推理的全流程中，全面降低了多模態模型擴展的成本和復雜度。在智能體訓練上，團隊也特別建構了一套大規模強化學習框架，涵蓋純文字、多模態和多輪對話等各種場景，整體效率提升3到5倍，讓模型能在海量真實場景中反覆實戰、持續進化。這種模型、晶片和雲端的軟硬體緊密耦合，最終實現了「1+1+1>3」的效果，不僅能更好發揮晶片的算力潛力，提升集群的算力效率，還能有效提升模型訓練與推理的效率。得益於此，Qwen3.5的API價格進一步探底，而開源協議Apache 2.0的完全開放，讓全球開發者得以零門檻使用、研究甚至二次開發世界頂級的多模態AI能力。放眼全球，有能力將這三者深度耦合的科技公司屈指可數，而阿里是其中之一，也是唯一走通開源路線的那個。這種協同創新的成果，正以驚人的速度轉化為生態效應。截至目前，千問模型的開源數量已超400個，衍生模型突破20萬個，下載量超10億次。在中國企業級大模型呼叫市場中，千問位居第一，並成為阿里雲新增需求的主要驅動力，帶動運算、儲存及資料庫等基礎資源消耗的成長。根據Omdia數據，2025年上半年，中國AI雲整體市場規模達223億元，阿里雲佔比35.8%，超過第二到第四名總和；阿里雲在中國雲市場的整體份額也從33%提升至36%，領先優勢持續擴大。這些數字背後是一個正在加速成型的正循環：開源吸引開發者，開發者催生應用，應用反哺雲和晶片業務，業務收益再投入下一代模型研發。而當技術本身夠高效，成本就不再是需要刻意壓縮的東西，它自然就低了。 Qwen3.5讓“最強”和“最便宜”，同時出現在了一個模型上。回看過去幾十年的科技產業史，Linux定義了伺服器時代，Android定義了行動時代，它們的共同點是開源、免費、無所不在，最終成為整個產業的預設底層。而它們的背後，都站著一個能夠調動全端資源、維持策略定力的推手。今天的阿里，正在扮演這個角色。當組織統一、策略統一、技術協同成為常態，「千問」就不再只是一個模型系列的名稱，而是AI時代基礎設施的代名詞。 (矽星人Pro)

一場春節突襲，阿里改寫了AI戰局

2026 年2 月初，在春節這個中國網路最喧鬧的牌桌上，阿里的位置一度顯得有些尷尬。對手們手裡都握著確定的籌碼。字節跳動拿下了央視春晚的獨家合作；騰訊元寶重啟了經典的紅包方案。相較之下，阿里沒有春晚的頂級曝光，也缺乏微信這種天然的裂變土壤。但當新年的鐘聲敲響，阿里卻在B 端與C 端同時完成了反超。在B 端，是技術成本的重塑。除夕當天，Qwen 3.5 突襲發布。這不僅僅是一次版本更新，而是一次對推理成本的激進下探——Qwen 3.5-Plus 將總參數3970 億的模型激活降至170 億，其API 價格僅為0.8 元/百萬Token。在同等效能下，此成本僅為Google Gemini 3 Pro 的1/18。這對任何想把AI 規模化嵌入業務流程的公司來說，都是難以忽視的價格因素。阿里正試圖用極致的性價比，為AI 的大規模商業化設定新的起跑線。在C 端，是關於「入口」的邏輯轉換。在底層能力的支撐下，千問App 繞開了傳統的紅包大戰，轉而上線「春節30 億免單」計畫。它設定了一個新規則：使用者必須對AI 發出指令去「辦事」。隨之而來的，是一條近乎垂直的成長曲線。 2月17日凌晨數據顯示，春節活動期間，全國超過1.3億人第一次體驗AI購物，說了50億次“千問幫我”，千問一躍成為國民級AI助理。不到3個月，千問DAU飆升至7352萬，與豆包形成雙雄爭霸的格局。這場春節混戰，阿里做對了什麼？春節混戰的“珍珠港時刻”2026 年的農曆新年，註定要被載入中國網路史冊。如果說2014 年的微信紅包是行動支付領域的“珍珠港事件”，那麼今年這場圍繞AI 入口展開的春節大戰，則是一場波及更廣的系統性洗牌。其深遠影響，正超越前者的範疇。硝煙在春節前夕已瀰漫。 1 月底開始，各路玩家悉數入場，現金激勵與流量紅利交織，試圖利用各自的慣性將用戶導入新的AI 生態。巨頭們慷慨解囊，迅速拉升了市場的參與熱度。阿里旗下的「千問」採取了更激進的策略：豪擲30 億元，推出「請全國人民吃喝玩樂」活動。在用戶熱情遠超預期的情況下，再透過第二波免等加碼，把實際投入拉到了「遠超30億」。這種「用AI 購物辦事」的玩法瞬間引爆全網，消費者們爭相參與「1 分錢讓AI 幫點奶茶」的狂歡。即便活動口令一度遭遇微信封禁，但「AI 真正能辦事」的種子已經釘進了日常消費場景。與往年爭奪支付入口或短視頻長度不同，2026 年這場戰役的核心是「習慣重塑」。巨頭們將紅包與AI 對話、任務、服務深度綁定，本質上是一場針對AI 工具使用習慣的大規模推廣。在這場洗牌中，阿里千問成了率先搶下旗幟的玩家。QuestMobile 最新數據顯示，春節戰役後，千問的DAU（日活躍用戶數）飆升至7352 萬，遠超騰訊元寶的1828 萬，並直逼領跑者豆包的7871 萬。這種爆發力，就像AI 時代的「珍珠港突襲」。春節之所以重要，是因為它疊加了中國網路最後的大規模流量紅利、最豐富的場景和最強的心智擴大機。在支付時代，它改寫過格局；在AI 時代，它正在被用來改寫「誰掌握下一代超級入口」的起跑線。春節前，中國AI 市場的C 端戰局仍處於大廠與新創公司交疊的混戰期。但這一仗打完，市場的頭部效應開始劇烈收攏。千問在極短的時間窗口內，將豆包追到幾乎相同的量級，同時與其他玩家拉開了一個量級差。中國AI 應用的競爭，正從「群雄逐鹿」加速進入「千豆爭霸」。阿里的領先，並非單純依靠「鈔能力」。2014 年，微信紅包被稱為“珍珠港襲擊”，不是因為它發了多少錢，而是它在春節窗口，第一次將“發紅包” 搬到了移動支付上，從此改變了轉帳習慣。這次千問的邏輯異曲同工。它不僅贏得了龐大的用戶基數，更贏得了「習慣」——培養了用戶「有事找AI」的全新心智。當其他玩家更多是贏得了一場活動時，千問已經買斷了未來幾年超級入口的關鍵位置。這標誌著AI 競爭的維度，已從模型層面的智慧比拼，拉升到了「智慧+ 落地」的全連結競爭。2014年，微信在春節完成了「從現金到手機」的遷移；2026年，千問正在完成「從找App到找AI」的遷移。全端能力：從“智力溢出”到“行為重塑”千問在春節期間的爆發，看似是一場由超30億預算驅動的閃電戰，其實是阿里長達十年技術佈點與二十年生態資產的一次集中兌現。在這狂飆增長背後，底牌只有四個字：全棧能力。三年前，當阿里開始研發千問大模型時，市場並不看好。彼時矽谷定義了生成式AI 的敘事，國內大廠普遍處於一種既焦慮又迷惘的追趕中。千問在初期走了一條略顯孤單的開源路線，在開發者社群口碑極佳，但在C 端應用上，阿里卻一度顯得遲緩。這種節奏上的滯後，源自於阿里內部對AI 發展策略的共識，即CEO 吳泳銘在雲棲大會上提出的「三階段」理論。在邁向ASI（超級人工智慧的路上），第一階段是“智能湧現”，即AI 透過海量知識學習具備泛化智力；第二階段是“自主行動”，即AI 掌握工具使用和編程能力以實現“輔助人”；第三階段則是“自我迭代”。依照這個理論，第一階段應死磕模型性能。模型智慧決定了應用的天花板，如果智力基座不穩，C 端的繁榮無非是沙灘上的堡壘。在阿里看來，只有當「智慧湧現」跨越臨界點，第二階段的「自主行動」才有真正的商業邏輯。這解釋了為什麼阿里在C 端推進上曾一度顯得「遲緩」。這種遲緩，本質上是在等待「智力溢出」的那一刻。死磕第一階段的成果，是阿里建構了全球規模最大的開源大模型生態。自2023 年開源至今，千問已累計發布超400 款車型，實現了從端側0.5B 到雲端480B 的全尺寸覆蓋。目前，千問衍生模型數超20 萬，累計下載量突破10 億次。這種「AI 時代的Android」策略，讓千問成了全球AI 產業的基座標準。當Meta 新模型參考Qwen 架構，DeepSeek 蒸餾選擇Qwen 內核，甚至新加坡國家AI 計劃也全面轉向Qwen 時，阿里已經完成了從參與者向定義者的轉變。除夕當天，千問3.5 突襲式發表。全新一代大款千問Qwen3.5-Plus，效能媲美Gemini 3 Pro，登頂全球最強開源模型。千問3.5實現了底層模型架構的全面革新，此次發布的Qwen3.5-Plus版本總參數為3970億，激活僅170億，以小胜大，性能超過兆參數的Qwen3-Max模型，部署顯存佔用降低60%，推理效率大幅提升，最大推理吞吐量可提升至19倍。模型性能直接決定了App 的「天花板」。能力大幅增強的千問3.5，將進一步開啟千問App在工作與生活中幫人辦事的想像空間。更現實的商業底色在於，阿里掌握了核心算力的定價權。 2026 年1 月，隨著平頭哥傳出計畫上市的消息，「通雲哥」（通義實驗室+ 阿里雲+ 平頭哥）的黃金三角組合正式合圍。阿里巴巴成為中國唯一實現「自研晶片+ 雲端平台+ 大模型」全端垂直整合的巨頭。只有垂直整合才能帶來極致優化，自研晶片「真武」可以針對Qwen 的MoE 架構客製化設計，並由雲端平台進行資源調度。這次Qwen 3.5-Plus 的API 價格也壓到了每百萬Token 0.8 元，僅為Gemini 3 Pro 的1/18。對C 端App 來說，只有成本夠低，阿里才敢在後台讓AI 「多算幾次」以確保準確性，未來才能比1.3 億人更多的瞬時湧入而不至於讓算力宕機或成本失控。大模型C 端戰爭的終局，終究要回到物理世界的履約能力。1 月15 日，千問App 率先上線AI 購物Agent，2 月6 日開啟30 億免單，阿里透過「點奶茶」這類高頻場景，將AI 強行推入實操鏈路。綜觀全球科技大廠，博弈的格局清晰可見：OpenAI有頂尖模型但缺乏強大的應用生態和履約體系；Google雖有生態，但在電商、本地生活等物理世界的履約能力上相比阿里有差距；亞馬遜雲服務強大，但其大模型尚未展現出同等級的競爭力。這種「模型+算力+生態+履約」四合一的全端能力，在全球範圍內都是罕見的，這為阿里贏得了定義「AI+商業」範式的機會。免單活動上線首日，千問9 小時訂單量突破1000 萬，這背後是淘寶、菜鳥、餓了麼積累了二十年的毛細血管。這種全端能力的支撐，讓千問的爆發不再只是一個流量奇蹟。阿里正試圖告訴市場：AI 的盡頭不是虛擬的對話框，而是真實的人間煙火。路徑分野：被重塑的終局2026 年的春節，被產業視為中國AI 產業的分水嶺。在此之前，大模型的競爭焦點主要停留在參數規模和榜單排名。但這個春節過後，競爭開始從「生成答案」轉向「生成行動」。大年初一凌晨，千問發布的數據展示了這場轉向的規模：活動期間，全國超過1.3 億人嘗試了AI 購物，50 億次指令被輸入到千問後台。這不僅是一次行銷上的拉新，更是一次國民級AI 助理的壓力測試。這場戰役也清楚地劃出了中美AI 發展的不同路徑。以OpenAI 為代表的美國頭部公司，目前更多地在驗證Scaling Law的極限，試圖透過算力和演算法的暴力堆砌去突破通用人工智慧的邊界。而中國公司則憑藉龐大的應用場景，走上了一條「應用反哺技術」的道路。這種差異本質上是由商業基因決定的。對阿里而言，那1.2 億筆訂單不僅是商業收益，更是海量的、來自真實世界的「對齊數據」。在實驗室裡，研究員很難模擬出使用者在點一杯奶茶時，如何處理「去冰、三分糖、不加珍珠」這種瑣碎且帶有具體約束的指令。而正是這些真實場景的反覆摩擦，讓千問在處理複雜意圖、執行多步驟規劃時，獲得了比競對更快的進化速度。這種進化不是推演出來的，而是磨出來的。春節的硝煙終將散去，但這場「技術灰階測試」留下的心智印記很難磨滅。正如2014 年紅包大戰之後，人們再也回不去現金支付時代，「有事找AI」的習慣一旦養成，商業邏輯就會發生重構。對所有玩家而言，真正的考驗在於：當補貼熱潮退潮，如何憑藉產品本身的能力留住用戶。這場C 端戰爭才剛開始。但在這個春天，阿里已經成功把中國AI戰爭拉進了它最熟悉的領域──那個由物流、交易、支付和供應鏈所建構的現實世界。 (虎嗅APP)

神仙打架！阿里字節同日發佈AI生圖新品：Seedream 5.0 vs Qwen-Image-2.0

不同的技術路線和市場定位，阿里巴巴側重於模型架構的統一與性能提升，字節跳動則聚焦智能理解和知識驅動。圖片來源：AI生成中國兩大科技巨頭阿里巴巴和字節跳動今日分別發佈了各自最新的AI圖像生成模型——字節跳動發佈了主打智能理解和高解析度輸出的Seedream 5.0，阿里巴巴則推出了集圖像生成與編輯於一體的Qwen-Image-2.0。這兩款模型均在今日正式上線，阿里巴巴通過阿里雲百煉平台開放API邀測，使用者可通過Qwen Chat免費體驗；字節跳動則將Seedream 5.0整合於旗下剪映、CapCut、小雲雀等應用，並提供限時免費使用，未來計畫在美國市場開放。阿里巴巴Qwen-Image-2.0的核心創新在於首次將圖像生成與編輯功能統一到單一模型架構中，顯著提升了性能和靈活性。該模型支援長達1000 token的複雜文字輸入，能夠生成高達2K解析度的圖像，適合專業PPT、海報、多格漫畫等複雜場景。Qwen-Image-2.0尤其在中文文字渲染方面表現卓越，能夠準確生成多種字型和複雜文字內容，如《蘭亭集序》全文配圖。AI Arena評測資料顯示，Qwen-Image-2.0在文字生成圖像任務中以1029分位列全球第三，圖像編輯能力得分1034，排名第二，接近頂尖水平。相比之下，字節跳動的Seedream 5.0則強調智能水平的提升，增強了對提示詞的理解能力，支援檢索生圖、多步邏輯推理和聯網知識整合，適合複雜知識驅動的任務，如生成詳細步驟說明圖。此外，Seedream 5.0支援2K及4K解析度輸出，細節紋理和照明效果更為精細，新增了精準編輯功能。該模型主要對標Nano Banana Pro，突出低成本優勢，目前使用者可免費使用20次，未來將逐步開放更多地區。儘管在藝術設計感方面略遜於競爭對手，但其在實用性和智能推理方面表現突出。從技術參數來看，Qwen-Image-2.0的長文字輸入能力（1K token）遠超行業平均，極大拓展了模型對複雜指令的理解和執行能力，尤其適合需要精細文字排版和多元素組合的專業應用。Seedream 5.0則通過多步邏輯推理和聯網知識整合，提升了模型對複雜任務的適應性，尤其在生成步驟說明圖等知識密集型場景中表現優異。此外，Seedream 5.0支援4K解析度輸出，滿足更高端視覺需求。在使用體驗方面，Qwen-Image-2.0通過阿里雲百煉平台和Qwen Chat提供開放體驗，使用者反饋其生成圖像細膩，文字渲染精準，編輯功能靈活多樣，能夠實現九宮格自拍、多風格轉換等多樣化創作。Seedream 5.0則依託字節跳動生態，深度整合剪映、CapCut等視訊及內容創作工具，使用者可便捷呼叫模型完成高品質圖像生成和精準編輯，尤其適合內容創作者和知識工作者。兩款模型的發佈反映了中國AI圖像生成領域的多元化發展趨勢。阿里巴巴側重於模型架構的統一與性能提升，強調中文文字渲染和多場景應用，推動AI圖像生成的實用化和普及化。字節跳動則聚焦智能理解和知識驅動，強化模型的推理能力和高解析度輸出，滿足更複雜的專業需求和內容創作場景。未來，隨著AI圖像生成技術的不斷演進，模型的多模態融合能力、長文字理解深度以及高解析度細節表現將成為競爭關鍵。阿里巴巴和字節跳動的這兩款模型分別代表了不同的技術路線和市場策略，預計將在專業設計、內容創作、教育培訓等多個領域展開激烈競爭。同時，隨著API和應用的開放，更多開發者和使用者將參與到AI圖像生成生態中，推動技術的快速迭代和應用創新。綜合來看，Qwen-Image-2.0以其統一架構和卓越的中文文字渲染能力，在專業圖像生成與編輯領域具備明顯優勢；而Seedream 5.0憑藉智能推理和高解析度支援，在知識密集型和高端視覺需求場景中表現突出。兩者的差異化發展不僅豐富了市場選擇，也促進了中國AI圖像生成技術的整體提升和生態繁榮。 (鈦媒體AGI)

阿里新一代模型Qwen3.5曝光

2月9日，在全球最大AI開源社區HuggingFace的開放原始碼專案頁面中，最新出現Qwen3.5併入Transformers的新PR（提交程式碼合併申請）。業內猜測阿里千問新一代基座模型Qwen3.5發佈在即。記者瞭解到，千問3.5採用了全新的混合注意力機制，並且極有可能是原生可實現視覺理解的VLM類模型，Qwen3.5或將開源至少2B的密集模型和35B-A3B的MoE模型。 (第一財經)

DeepSeek衝擊一年，中國大模型超1500種

DeepSeek在2025年1月給市場帶來衝擊。自那一年之後，中國的AI不斷增加。在美國企業的全球大語言模型排名中，Qwen（千問）、Kimi、MiniMax等中國AI上榜。美國的高科技出口管制是否失去意義？1月2日上市的中國GPU廠商壁仞科技中國新興AI（人工智慧）DeepSeek在2025年1月給市場帶來衝擊。自那一年之後，中國的AI企業不斷增加。不是追隨美國，而是為尋求不同的最佳解決方案走自主路線。其中頗受好評的阿里巴巴集團的股價約1年間上漲了9成。美國的高科技出口管制是否失去意義？2025年1月27日，在蘋果的免費APP下載排行榜上，DeepSeek超過了美國OpenAI的ChatGPT，躍居首位。對於評審前的論文，DeepSeek以有限的計算資源和低成本顯示出很高的推理性能。由於市場擔心不再需要最尖端半導體，2025年1月27日美國輝達的股價一度比上一個交易日下跌18%。提高DeepSeek評價的是大語言模型（LLM）的性能。在美國Artificial Analysis公佈的全球LLM排名中，在Google的Gemini等美國企業佔據前列的背景下，DeepSeek排在第10位。據稱DeepSeek的數學推理能力和性價比均受到好評。在排行榜中，月之暗面（Moonshot AI）開發的Kimi和MiniMax等中國AI緊隨其後。新華社報導稱，中國迄今為止發佈的LLM達到1509種，按國家來看排名第一。在中國AI中，最近一年評價提高的是阿里巴巴的AI模型Qwen（千問）。中國大陸媒體引用美國AI開發平台Hugging Face的資料報導稱，截至2026年1月千問系列的累計下載量超過7億次，成為平台上下載量最多的開源AI。阿里巴巴的股價較2025年1月底上漲約9成，總市值增加約1.5兆港元。除了千問的性能之外，在競爭激烈的中國AI開發中，阿里巴巴還掌握了無論誰勝出都需要的基礎設施，這一點也提高了的評價。美國摩根士丹利認為，阿里巴巴的雲服務在2026年度的收益將同比增長超過35%，2027年度有可能加速至40%。中國企業的戰鬥方式與美國企業不同的情況也很明顯。美國AI以最尖端圖形處理器（GPU）和巨額投資為前提，而中國則以效率化、輕量化為核心確保競爭力。面對尋求提高計算和推理能力的美國企業，中國政府呼籲在各行各業廣泛應用AI，並積極推動其在社會各領域的落地。香港一家亞洲股票基金的營運負責人表示，“雖然不確定能否超越美國的科技水平，但中國正以在受限環境下的強大實裝能力作為武器，開始形成獨特的投資機會”。事實上，中國新興AI企業正在跨越驗證階段，進入產業化和資本回收階段。2025年年底以來，從計算資源到應用，中國大陸的相關企業紛紛在香港上市，包括GPU廠商上海壁仞科技、AI企業MiniMax Group Inc.和北京智譜華章科技、AI製藥企業英矽智能等。那麼美國的高科技出口管制是否不再有意義？答案為一半肯定，一半否定。有報導稱，沒有輝達最先進的半導體，DeepSeek的新模型就無法開發，出口管制的威脅仍未完全消除。另一方面，1月14日有消息稱智譜發佈了在華為提供的平台上開發的國產圖片生成式AI。從獲取資料到學習的全部過程都自主完成，是僅使用中國國產半導體學習的首個最先進的多模態（能橫向處理文字和圖像等不同資料）模型。智譜的股價1月14日在香港市場一度上漲22%。對純中國產AI的評估才剛剛開始，2026年中國AI股的狂熱似乎仍將持續。 (日經中文網)

矽谷開始反向借鑑中國AI

如何讓AI不再只是聰明的“玩具”？誰能想到，作為全球科技風向標的矽谷巨頭們，如今也得向中國AI的技術文件“取經”呢？在全球開源社區GitHub平台上，阿里千問（Qwen）、DeepSeek等中國開放原始碼專案的關注度持續走高，Meta、愛彼迎（Airbnb）等矽谷大廠，也紛紛將中國AI的技術架構納入研發視野。“矽谷輸出、全球承接”，過去數十年形成的這種單向技術流動格局，正發生逆轉。據第三方機構統計，過去一年，80%的全球AI開源初創企業採用了中國模型；阿里千問衍生模型長期位居頭部；DeepSeek位列全球主流模型第9名。這場始於程式碼共享的產業重構，重塑了全球AI競爭的底層邏輯，並推動行業從技術壟斷走向多元協同。告別了狂熱比拚參數規模的“軍備競賽”，中國科技企業走出了一條風格鮮明的差異化道路——依託開源與生態，追求落地和務實。如阿里巴巴集團副總裁、阿里千問C端事業群總裁吳嘉近期所言，AI在擁有超強大腦之後，現在要開始長出能觸達真實世界的手和腳，在生活中實實在在地替使用者“幹活”。千問上線“辦事”功能，就是這一理念的實證。靠著阿里全生態的加持，它不止停留在對話層面，而是“一說需求就落地”，有效破解了AI落地難的痛點。這種“實用為王”的創新邏輯，不僅吸引了矽谷巨頭的注意，也標誌著全球科技圈進入多元共生、互相成就的新階段。產業變局背後，我們更想追問：中國AI實現原創性突破的核心密碼是什麼？AI時代，一款真正“好用”的智能助手，究竟要具備那些關鍵特質？在解決本土產業痛點的過程中，中國AI企業積累了那些獨特優勢？如何讓AI擺脫“玩具屬性”，成為真正能落地幹活的得力幫手？01 告別“參數競賽”，聚焦“能力密度”三年前，全球科技界都在比拚一個數字：模型參數，中國企業一度被迫跟隨這場“燒錢”遊戲。據第三方測算，一次完整的GPT-4對話消耗的算力成本，相當於普通搜尋引擎查詢的10倍以上，這也使得大模型技術難以真正落地到普通使用者場景中。直到2025年，Nature子刊發表《Densing Law of LLMs》（大語言模型的密度定律）一文。該研究提出的“能力密度”概念，顛覆了傳統評價體系，標誌著大模型發展從拼“規模”正式轉向拼“效率”，這一趨勢與中國AI企業的探索不謀而合。來源：AI生成中國AI企業率先跳出規模競賽。他們不再追求單一模型的極致性能，而是聚焦“能力密度”與“性價比”，建構能讓普通人用起來的技術方案。以千問為例，通過建構從2B到2C、從基礎模型到專業領域的完整開源矩陣，它不再是一個孤立的模型，而是一整套可擴展、可定製化的解決方案。中國的開源生態呈現出更強的工程化特徵和商業化友好設計，也讓“能力密度”優勢轉化為全球生態影響力。例如，千問的開源協議允許商業使用而不收取授權費，初創企業能以極低成本獲得高品質的AI能力。這種“程式碼+工具鏈+生態”的系統性開放，讓中國開源模型在全球市場快速崛起。2025年初，矽谷一家風投機構調研顯示，超過60%的受訪初創企業表示，他們的產品開發基於或借鑑了中國開源模型。而到2025年年底，高盛與OpenRouter的聯合統計顯示，這一比例已攀升至80%。中國開源模型的全球下載量佔比達到17.1%，首次超越美國的15.8%，在非洲、中東、拉丁美洲等新興市場的採用率更是快速上升。“中國開源模型大幅降低AI開發成本”已成業界共識，部分初創企業能將相關成本降至原閉源方案的10%~20%。如今，#ChineseAI、#Qwen3Coder等話題在海外社交媒體熱度飆升，德國開發者感嘆其為“程式設計界的iPhone時刻”，全球開發者踴躍分享用中國開源模型5分鐘搭建網站、1小時開發AI搜尋工具的案例。據第三方統計，截至2025年年底，千問衍生模型數量破18萬，居全球第一。02 應用突圍：從“玩具”到“助理”的進化當開源模型成為全球技術共享的載體，AI應用賽道也迎來爆發。據AI Agents Directory 2025年4月統計，全球已上線AI Agent達1211個，2025年全年新增產品數量呈爆發式增長。但多數產品受制於基模能力、功能邊界或生態支撐，難以突破“娛樂玩具”的定位。去年底，有媒體統計稱，大多數通用型應用的使用者7日留存率普遍低於15%。“聊得爽、用不上”已成為行業普遍痛點，一款真正好用的AI Agent，究竟該具備那些特質？如何讓AI從螢幕裡的“文字顧問”，變成能落地辦事的“執行夥伴”？在吳嘉看來，數字世界裡，AI辦事的突破，離不開三個核心能力的提升：一是AI Coding，讓AI能精準呼叫各類服務介面；二是全模態理解，能讀懂使用者的文字、語音、圖片需求，甚至推理出隱性需求；三是超長上下文處理，輕鬆應對複雜任務。知名商業顧問劉潤在深度體驗千問“辦事”功能後，從使用者視角給出了他的“評測”答案。在他看來，過去絕大多數AI助手都停留在“推理層”，只能提供方案卻無法落地執行，本質上是“聰明的陪聊”；而千問“辦事”功能的核心突破，在於打通了“推理-執行”的閉環，成為“能幹的助理”。他先嘗試了一個簡單需求：“下午犯困，點個美式咖啡當下午茶。”千問立刻呼叫淘寶閃購的地址資訊，為他篩選出多款咖啡，清晰標註單價、距離、配送時間，還自動匹配了優惠紅包，全程無需跳出App，只需點選“選它”就能直達付款頁面，輕鬆完成下單。接著，他測試了更複雜的民生服務需求：“我要去上海工作了，幫我把社保從杭州轉過去。”千問隨即聯動支付寶服務，先明確辦理條件——杭州停保、上海參保、不滿50歲等，再推薦“支付寶”“隨申辦”線上快速辦理通道，不僅詳細說明辦理流程和注意事項，還直接提供辦事入口，一點就能直達操作頁面。更讓其驚豔的是千問App在複雜行程規劃上的表現。他計畫出差到長沙，並向千問發出指令：找一家不排隊的茶顏悅色，一家最火的中式點心店，一家本地人排隊的湘菜館，再定一間離三個地方都近的酒店。他原本以為千問會扔來一段乾巴巴的文字攻略，但等了兩三分鐘之後，千問展示了一份完整報告，其中包括高德地圖的路線、去程的機票，並可跳轉到飛豬購票窗口。接著是茶顏悅色的導航、酒店的預訂連結，以及返程的機票。來源：視訊截圖他感慨：“這那裡還是一個聊天工具，這就像是一個帶著工具箱的AI助理。”而這種真正“辦事幹活”的能力，正是AI從工具進化到助理的關鍵。他也借此對比了近日引發熱議的Manus和豆包手機，雖然它們都被視為“AI助理”，但二者與千問的差距，恰恰藏在權限的邊界裡。Manus基於大模型層的權限，本質還是個內建的AI大模型App，它可以提供資訊，但沒有打開App的權限。豆包手機使用的則是手機作業系統層的權限，本質是讓AI模擬人的手指來操作，但它也天然被攔在了許多超級App門外。第三種便是千問，它不需要模擬人的手指，直接可以調動高德規劃路線、調動飛豬搜尋機票，它使用的是App等級的權限，相當於拿著一張跨應用的最高通行證。千問App不光擁有“最高通行證”，還有一個“最強大腦”。他又特意給千問出了一道更高階的題：“幫我復盤過去雙11玩法和行銷策略。”指令發出後，千問就展示了它的“多模態理解力”，梳理了雙11的規則、玩法、行銷節奏等複雜；接著又展示了它的“結構化交付能力”。最終，它呈現的是一份邏輯嚴密、詳細具體的分析報告，同時還附上整理好的表格文件——整個任務只用了不到1分鐘。來源：千問操作介面截圖由此可以看出，相比於Manus更擅長在模型層、公域資訊層做閉環任務，千問可以做到其他AI助手難以完成的調動App、支付下單等動作。據瞭解，千問App自2025年11月上線以來，公測23天月活使用者即突破3000萬，30天月活破4000萬，2025年12月以149.03%的月活增速登頂全球AI應用增速榜。截至2026年1月15日，千問C端月活使用者已正式突破1億，在學生和白領群體中形成“現象級”傳播。吳嘉透露，今年春節後，千問App將開放第三方接入。03 產業基因：生於本土，長於實踐吳嘉在1月15日召開的千問App發佈會上強調：千問的獨特優勢在於“最強模型與最豐富生態的結合”。來源：受訪者一個“集大成者”的千問，又是如何生長起來的？其根植於中國特有的產業土壤、多元場景、工程化積累，以及中國AI創業者的務實導向。首先，中國擁有全球最為多元的消費場景和商業生態，一個能在中國市場良好運行的AI模型，需要具備處理複雜場景和邊緣案例的強大能力，中國的AI技術也由此鍛鍊出了更強的實用性與適配能力。據瞭解，千問的訓練資料覆蓋了阿里生態內超10億使用者的真實互動場景，包括購物、出行、支付、辦公等200多個細分領域，僅本地生活場景就包含超1000萬商家的服務資料。這種海量且多元的資料積累，讓千問能精準理解“加辣少鹽”“就近停車”“周末親子游小眾目的地”等具象化、個性化需求。其次，中國科技企業擁有在大規模使用者、複雜系統中生長出的強大工程化能力。以千問的AI購物功能為例，其背後是一套完整的交易保障系統，包括異常檢測、風險控制和使用者體驗最佳化等多個模組。這些都源自中國電商平台在長期營運和極端場景下積累的豐富經驗。不同於矽谷常見的“技術尋找問題”模式，中國AI企業更多採用“問題驅動技術”路徑。北京大學電腦科學技術系教授、北京智源人工智慧研究院理事長黃鐵軍在2025年中關村論壇期間接受採訪時指出，中國AI發展始終以解決實際問題為導向。這種思考方式，使中國科技產品更注重易用性和實用性。而阿里在B端積累的技術能力和生態價值也將在C端得到釋放。千問不僅整合了淘寶、支付寶、飛豬等C端生態資源，更將阿里雲在工業網際網路、金融科技、智慧政務等領域的B端能力下沉，形成“B端能力支撐C端體驗，C端場景反哺B端最佳化”的正向循環。“我們的目標是，大部分生活辦事場景，只用千問App就夠了。”吳嘉在前述發佈會上稱，“現階段，我們沒有商業化考量，推薦商品會基於價格最優、送達最快等綜合因素，優先關注使用者滿意度和產品能力。”吳嘉還表示，“我們不追逐短期流量規模。在智力時代，AI產品的關鍵是過沒過智能門檻，能不能像人一樣服務、執行，有沒有高精準率和滿意度。我們會一步步邁進，把千問App打造成最強大的人類AI助手，真正讓AI幫助到每一個人。”04 未來：開放、共生與差異化立足長遠來看，阿里和千問的創新意義更在於：伴隨中國AI的崛起，技術從矽谷流向中國的單向模式正被打破。這種逆轉不僅體現在開源模型的全球擴散，更延伸至技術策略、思維方式與投資邏輯的全面重構。資料正在印證這一趨勢：Hugging Face 2025年度報告等第三方機構資料顯示，千問、DeepSeek等中國模型的開發者社區活躍度呈現爆發式增長，年增速預估超300%，貢獻者覆蓋全球120多個國家與地區，其中矽谷開發者貢獻佔比達27%，意味著中國技術正成為全球創新的“基礎設施”。這種反向借鑑不僅體現在技術策略上，也深刻影響了矽谷的思維方式。過去矽谷企業更傾向於“技術驅動創新”，先突破前沿參數再尋找應用場景；而如今，越來越多企業開始關注如何將AI技術與具體場景深度結合，而非僅僅追求技術參數的領先。矽谷知名科技分析師本·湯普森在其多篇專欄中指出，AI需回歸商業實用價值。這種思維轉變最直接的體現，是矽谷科技巨頭的業務調整：Google將AI團隊與搜尋、雲服務場景深度整合，2025年推出的“AI+企業協作”方案，被外界視為直接借鑑中國AI“生態聯動”的落地模式。全球AI產業發展更加多元和開放的今天，中國和矽谷的AI發展路徑已呈現出既競爭又互補的格局。中國AI的“勝負手”在於應用落地和生態建構，這種差異化，為全球AI創新提供了更多可能。未來，兩地的AI發展和互動或將更加緊密。AI的全球故事正翻開新的一頁。這一頁上，矽谷與中國互為鏡鑑，也將共赴未來。 (中國企業家雜誌)

DeepSeek等8大產品都是意外?! 改變世界的項目們，最初都沒被“當個事兒辦”

這些改變世界的產品，最初居然都是不被當回事兒的支線項目（side project）？！包括但不限於：DeepSeek：幻方量化的支線項目Qwen：阿里的支線項目Claude Code：Anthropic的支線項目ChatGPT：OpenAI的的支線項目PyTorch：Meta的支線項目Gmail：Google的支線項目Twitter（現𝕏）：Odeo的支線項目Slack：Tiny Speck的支線項目就說例舉的這8個項目裡面，你日常會用幾個吧（doge臉等答案）～反正，隨便單獨拎那一個出來，都會讓人小小詫異一下：這居然也能是個支線項目？不過我們先來界定一下，什麼叫做“支線項目”。簡單來說，就是非主線、非KPI驅動、最初非戰略立項。這些項目成立之初並不重要，更不是公司翻身的戰略方案。所以失敗也好，和主線方向衝突也罷，都沒有太大關係。但——用熱烈討論的網友的話來說：沒有項目經理、銷售、GTMs、合規、股東，支線項目總是魔法生效的地方。從國內到矽谷，side project神話屢見不鮮廢話不多說，先來看國內做副業做得比主業還家喻戶曉的幻方量化。也就是DeepSeek背後的母公司。幻方確實很技術范兒——在幻方量化內部，長期存在大量圍繞算力、模型和工程效率的技術研究。但幻方並不是一家專門的AI Lab，所以上述這些研究首先服務於量化交易本身。更多時候，AI的作用都是輔助金融市場的分析研究，妥妥的支線工具屬性。所以，DeepSeek並不是在聚光燈下誕生的項目，是沿著內部技術演進自然延伸出來的結果。這一點非常關鍵。這種狀態，恰恰讓它能夠繞開很多創業項目必經的約束，比如節奏、敘事、融資節點、對外承諾……總之就是技術可以先跑在需求前面。更別提做量化起家的幻方，完全不缺卡了。畢竟這個時代算力為王，誰能擁有更豐富的GPU叢集，誰就佔據資源優勢，而幻方量化顯然將這點做到了極致。同時長期深耕金融專業場景，也讓它擁有得天獨厚的資料優勢，在研發通用智能時也會更傾向於注重模型推理和數學能力。長期高強度的演算法投入，加上頂尖的人才儲備，幻方量化能打造出爆款AI，可謂天時地利人和。而同屬國內開源大模型第一梯隊的Qwen其實也是支線項目。通義千問技術負責人林俊暘在𝕏上公開：Qwen was a side project。作為成熟的老牌網際網路公司，阿里早期在大模型上的戰略定位更多的還是面向行業ToB使用者，大模型的商業化交付才是絕對主線。Qwen則堅定走上了一條開源道路。而且據林俊暘所說，side project能夠提高成功機率。一是因為沒有過度的決策參與，把自主權交還給真正寫模型的人。二是微觀管理少，更大的試錯空間換來更快的迭代速度。簡單來說，在Qwen的早期發展中，阿里不是完全不管，也不是嚴加看管，而是找到了一條折中的道路。即儘可能給予研究團隊空間，以支線任務的形式“放養”，在證明其價值後，再逐步融入主線資源。再看矽谷，同樣的典型案例有Claude Code。最初，它不過是工程師Boris Cherny的一個Claude實驗性工程：通過連接AppleScript，它能告訴使用者正在聽什麼音樂，還能切換在播的音樂。有用肯定是有用，但聽起來有點平平無奇（？某次和產品經理交流後，Cherny意識到，或許可以給終端來點和系統檔案互動的工具，比如讀檔案、寫檔案，還有運行批處理命令什麼的。Anyway，Claude Code就這樣在相當偶然的情況下誕生了。初露苗頭時，它只是一個員工基於自家大模型手搓的side project。但正式面市後，隨即產生了暴風式傳播效應，並成為Anthropic的當家產品之一。Boris Cherny在𝕏上記錄道：一年前，Claude在生成bash命令時難以避免轉義錯誤。而且它一次只能工作幾秒或幾分鐘。快進到今天。在過去的三十天裡，我提交了259個PR——497次提交，加入了40000行程式碼，刪除了38000行程式碼。每一行程式碼都是由Claude Code+Opus4.5編寫的。Claude持續運行數分鐘、數小時甚至數天。軟體工程的範式正在改變。誰也沒想到，當初一個並未委以重任的支線項目，現在已經成了一股繞不開的力量，推著我們走進程式設計新時期。支線項目說不定會出現更多“逆襲”故事AI加速進入軟體工程流程之後，試錯的成本被明顯拉低了。過去需要團隊協作和資源協調才能完成的探索，現在能由個人更輕鬆、更迅速地來完成初步驗證。從這個角度來想的話，其實真的不用把“探索”當作正經必須立項的行為了。因為你每天就干自己的活，都有可能探索個新思路或者新方法出來。許多支線項目都是在這種條件下出現——從解決一個具體問題開始，通過真實使用不斷修正方向，然後逐漸茁壯成長，最終成為一根根台柱子。現在，AI能很好地縮短從想法到驗證的距離。像Claude Code這樣的項目，並不是一開始就奔著“核心工具”去，而是在不斷使用中積累成熟度，最終進入真實生產流程。當試錯足夠便宜，能否被迅速使用和反饋就更加重要，小項目的價值也隨之改變。就說是不是直接放大了個人探索的價值吧！不過，AI雖然提升了執行效率，卻未必同步提升戰略判斷的精準性。在技術環境變化時，主線項目更容易被原有判斷束縛，而且老話說什麼來著，船大難掉頭。這只是某一側重點下的對比結果，我們絕對不是在說抨擊主線項目，或者說主線項目就會因此失去意義。只是在當下，有些東西發生了變化。支線項目探索的成本更低，反饋更快，也為主線在方向被驗證後承接規模化任務打下了堅實基礎。這種變化還在進行中，其最終形態並不清晰。不過可以看到一個清晰的趨勢——在AI時代，一些關乎未來方向的早期訊號，或許會越來越多地出現在那些一開始並不被當成正事兒的項目裡。One More ThingBTW，並不是所有的支線項目變成主項目後，都能很快拿到一個好的結果的。Be like：(量子位)

祖克柏的天價AI賭局：重金、內耗與“套殼”Qwen背後的戰略迷失

馬克·祖克柏煲了一鍋南瓜湯，親自送到一位AI研究員家門口，這是Meta為搶奪人才使出的非常規手段之一。然而，這道湯並未化解Meta在AI戰場上的苦澀。“我們每個人都很努力，但整個方向太分散了，像是在賭那條路能跑通。”一位Meta員工如此評價公司的AI戰略。2025年，本該靠Llama 4再次登上AI巔峰的Meta，卻急轉直下，陷入前所未有的混亂。曾經的開源旗手，如今被曝出依賴阿里巴巴的Qwen模型來訓練其新一代閉源模型“Avocado”。而祖克柏為重金招聘的AI人才開出的千萬美元年薪，似乎也未能買通一條通往AI頂峰的捷徑。01 戰略搖擺，從開源信仰到閉源捷徑祖克柏在2024年還慷慨陳詞：“開源AI會讓整個行業受益。”他承諾將Meta打造為“AI時代的Android系統”。然而，還不到一年時間，Meta的戰略已經發生180度大轉彎。Llama 4的失敗是Meta開源戰略的滑鐵盧。2025年4月發佈後，這款被寄予厚望的模型市場反響平平，甚至被曝出在LMArena榜單排名存在“作弊嫌疑”。這一挫敗讓祖克柏對開源路線的熱情急劇降溫。曾經大力推廣的開源Llama模型，在10月的財報會議上只被輕描淡寫地提了一次。內部指令明確要求：“少談開源，少提Llama。”Avocado將成為Meta首個完全閉源的旗艦模型，讓外部開發者無法再像以前那樣隨意修改和使用。更令人意外的是，這款閉源模型的訓練過程中，竟然使用了包括阿里巴巴Qwen在內的多個第三方模型。02 天價薪酬，人才爭奪的非理性繁榮面對困境，祖克柏的選擇是——用錢砸出一條路。Meta為AI頂尖人才開出了令人瞠目結舌的天價薪酬包。普通AI研究員年薪已達18萬-50萬美元，而頂級人才的薪酬則飆升至200萬-1000萬美元以上。少數“欽點”的頂級專家甚至能拿到四年2.5億美元的超級合約。祖克柏不僅親自上陣發Offer，還採取了各種非常規招募手段。OpenAI的一位首席研究官爆料：“我團隊的一位核心研究員告訴我，祖克柏帶著自己煮的南瓜湯出現在他家門口。”28歲的Scale AI創始人Alexandr Wang被任命為公司首席AI官。這位閉源路線的堅定擁護者，成為Meta AI戰略轉向的關鍵人物。然而，這種“花錢買人才”的策略也帶來了內部矛盾。新組建的TBD實驗室團隊被安排在祖克柏辦公桌附近集中辦公，方便他隨時瞭解進展。但據報導，Alexandr Wang有時會對這種“事無鉅細”的關心感到頗為不耐煩。03 內亂與分歧，路線之爭下的組織混亂Meta的AI部門正陷入“雄心勃勃但混亂不堪”的境地。公司內部對於AI發展方向存在深刻的分歧，各部門之間存在相互衝突的願景。以新任首席AI官Alexandr Wang和首席產品官Chris Cox為代表的兩大陣營，展開了激烈的“路線之爭”。 Wang和他的TBD實驗室雄心萬丈，誓要打造“如神一般的AI超級智能”。而Meta老臣們則更希望將AI的即時價值聚焦於最佳化Facebook、Instagram的資訊流和廣告業務。資源分配的傾斜引發了內部的劇烈震盪。知情人士透露，原本分配給虛擬現實/增強現實部門的預算被削減高達20億美元，這些資金直接轉入Wang領導的AI團隊。負責社交媒體排序演算法的員工提出了尖銳質疑：為什麼公司新增的算力資源不優先投入到能立竿見影產生收入的現有業務改進上，而非押注於短期內尚無盈利模式的AI模型訓練？04 為何重金難鑄頂級模型Meta投入巨資卻難以打造出頂級AI模型的原因已經浮出水面。戰略方向的頻繁搖擺是首要障礙。從開源到閉源，從Llama到Avocado，Meta的AI路線來回搖擺，讓員工無所適從。這種戰略上的不連貫性必然影響技術積累的連續性。內部組織架構混亂也制約了研發效率。在重組過程中，公司流失了數十名高級AI研究人員。被譽為“AI教父”的Yann LeCun也因對資源分配及開源戰略重視不足感到不滿而選擇離開。盲目追逐熱點而非夯實基礎同樣是問題所在。Avocado模型被曝延期且“套殼”Qwen，反映出Meta在技術積累上的不足。當競爭對手專注於核心技術突破時，Meta似乎更傾向於尋找捷徑。更重要的是，超級智能的宏大目標與商業變現的現實壓力之間存在難以調和的矛盾。祖克柏已承諾投入6000億美元建設資料中心等基礎設施，但投資者對持續至2026年的巨額投入能否轉化為可觀利潤仍存疑慮。05 行業反思與未來走向Meta的困境折射出整個AI行業面臨的挑戰。當大模型發展遭遇瓶頸時，系統創新比簡單的算力堆砌更為關鍵。當前AI訓練成本正以驚人的速度增長，這種模式在長期運行中可能面臨能耗與訓練效率的挑戰。大規模演算法創新或將成為破解之道。中國在開源領域的崛起已經改變全球AI格局。Qwen等模型被Meta採用，表明開源世界的重心正在向東方傾斜。這也反映出祖克柏對中國AI態度的轉變。業內人士指出，AI競賽不是純技術比拚，而是路線、文化、組織與資本的全面戰爭。 Meta的案例表明，僅靠重金招聘人才而不解決內部根本問題，難以在長期競爭中取勝。牆上的程式碼可以複製，但創新的土壤無法用金錢直接購買。當亞歷山大王和他的TBD實驗室沉浸在“超級智能”的遠大願景時，Google的Gemini 3和OpenAI的GPT-5已在穩步迭代。黃仁勳在11月的財報會上列舉了幾乎所有大模型，卻唯獨沒有提到Meta的Llama。在AI這場持久戰中，真正的突破不是靠重金挖角或套殼捷徑，而是需要長期堅持的戰略定力、健康的組織文化以及對技術創新的專注。 (AI炫科技)