#林俊暘
猛料,GoogleDeepMind公然要挖林俊暘,演都不演了
挖人如同打臉,Google殺人誅心。這兩天,網際網路行業和AI圈被同一條消息刷了屏:阿里千問大模型的核心負責人林俊暘突然發文告別。這條消息如同一塊巨石投入本就波濤洶湧的湖面。直到今天,阿里官方確認了林俊暘已離職的消息。圖源:微博作為阿里的戰略核心,千問(Qwen)團隊的人事變動,絕不僅僅是一個人的去留問題。它背後牽扯的,是一家巨頭在AI狂飆時代的技術路線選擇、組織架構調整,以及那場關於“技術策略”與“商業變現”的殘酷博弈。而更令人意外的是,就在同一天,GoogleDeepMind的相關負責人突然在社交平台上向Qwen團隊拋出了橄欖枝。那個夜晚發生了什麼?3月4日凌晨,當大多數人還在睡夢中時,阿里千問的核心負責人林俊暘在社交平台留下了一句極為克制卻又飽含情感的話:“me stepping down.bye my beloved qwen.”(我卸任了,再見了,我親愛的千問)。短短幾個詞,瞬間引爆了科技圈。圖源:X林俊暘,這個名字在業內代表著什麼?他是1993年出生的技術天才,北大碩士畢業,2019年以應屆生身份加入阿里達摩院。在短短幾年內,他一路晉陞為阿里最年輕的P10級技術負責人,親歷並主導了千問從0到1的全過程。在過去的幾年裡,林俊暘帶領團隊打了一場又一場硬仗。2023年,通義千問正式發佈;此後,團隊以令人炫目的速度推出了從0.5B到110B的系列模型,在開源社區Hugging Face上霸榜數月。正是因為他,Qwen系列成為了全球開發者心中“最能打”的中國開源模型之一,衍生模型數量突破20萬,下載量超10億次。然而,誰都沒想到,在阿里AI戰略被提升至最高優先順序、在馬雲剛剛現身談AI、在品牌剛剛統一為“千問”的節骨眼上,他竟然選擇了離開。緊隨其後的是連鎖反應。Qwen後訓練負責人郁博文、核心貢獻者李凱新等多名技術骨幹,也相繼傳出了離職的消息。GoogleDeepMind開發體驗負責人Omar Sanseviero抓住了這個機會,突然在社交平台上公開喊話:“千問的朋友們,如果想找個新地方來打造優秀模型,並為開源模型生態系統做出貢獻,請隨時聯絡我!我們的路線圖中有很多令人興奮的事情。”圖源:X這則喊話,禮貌、精準,且殺傷力極強。它不僅瞄準了剛剛失去領軍人物的Qwen團隊,更直接指向了“開源模型生態”——這恰恰是林俊暘和Qwen團隊最引以為傲的陣地。而且Omar Sanseviero本人曾是Hugging Face的開源生態負責人,江湖綽號“首席羊駝官”(Chief Llama Officer),對開源社區的運作模式熟稔於心。由他來“接客”,DeepMind顯然是做足了功課。有人說阿里的一個時代結束了。不,或許只是一個階段結束了。但在結束的廢墟上,新的獵手已經舉起了火把。為什麼在鮮花著錦之時轉身離去?對於林俊暘的離開,很多人的第一反應是“宮斗”或“內卷”。但根據多方資訊梳理,林俊暘的離開,更像是一場關於“未來怎麼走”的理念分歧,以及由此引發的權責重構。阿里內部人士透露,實際情況並沒有外界傳言的那麼狗血。隨著千問從一個小小的技術項目被提升為集團的頂層戰略,阿里認為需要招攬更多的全球技術大牛來提升“人才密度”。在這個過程中,林俊暘的權責範圍面臨調整——可能會從原先的垂直整合型負責人,變成負責其中一部分環節。這種變化,他無法接受,因而提出了辭職。簡單來說,過去林俊暘帶領的Qwen團隊更像是一個“特種部隊”:預訓練、後訓練、多模態、Infra全鏈路閉環,人少但戰鬥力極強,適合快速迭代、沖榜造勢。這是典型的“創業團隊”打法,極具理想主義色彩;而隨著集團戰略轉向,阿里希望將Qwen團隊按功能拆分成預訓練、後訓練、視覺理解等多個模組,與通義實驗室的其他團隊(如通義萬相)合併工作。這是“正規軍”的整編打法,更適合大規模協同作戰和商業化的深度落地。雖然在管理上,這種組織重構更利於資源統籌,但對於一個習慣了掌控全域的技術負責人來說,無疑是一種巨大的心理落差。圖源:微博更深層次的矛盾,或許在於“技術”與“商業化”的左右互搏。知名經濟學者盤和林對此分析得頗為透徹:“阿里需要千問快速商業化。今年AI行業有個問題,大量的基礎設施投入無法回收。但千問團隊之前的調性,是服務好使用者,做好開源。”開源,意味著免費、分享、普惠,追求的是技術影響力和社區口碑;商業化,意味著變現、收入、利潤,追求的是財務報表和市場佔有率。兩者並非天然對立,但在資源有限、競爭白熱化的當下,取捨在所難免。艾媒諮詢CEO張毅指出,阿里當前或是在“戰略收縮開源,聚焦高價值的商業閉環”。其實,在不少業內人士看來,此次事件發生的真正導火線,更有可能是新模型表現不佳。雖然Qwen3.5的小模型(如0.5B、4B等)在開發者社區好評如潮,甚至獲得了馬斯克的點贊;但在衡量大模型綜合能力的權威盲測榜單LMArena上,千問的旗艦模型Qwen3.5-397B排名並不理想,僅列第18位,與之前Qwen3-Max Preview的前三位置相去甚遠。圖源:LMArena當旗艦模型表現不及預期,當內部評價出現分歧,當組織架構的調整似乎在印證“不信任”,離開或許成為了一種必然。3月4日下午,通義實驗室緊急召開了全員大會。阿里高層反覆強調:“Qwen沒有收縮,這是一次團隊擴張。”並承認“新人引入肯定會帶來陣型變化,我們可能沒處理好”。這句話的潛台詞是:公司要長大,隊伍要整編,在這個過程中,總會有人走散。人才爭奪戰背後,AI進入“體系對抗”時代進入2026年,AI行業徒步踏進深水區,全球AI人才爭奪戰也逼近極致白熱化。領英發佈的《2026全球勞動力市場洞察報告》顯示,AI工程人才是全球流動最活躍的群體,其跨國流動的意願是普通人才的8倍。國內的資料同樣驚人,獵聘報告指出,2026年開工首周,要求會AI工具的職位同比增長超過200%。圖源:領英《2026全球勞動力市場洞察報告》在這種背景下,Google的公開喊話不僅是挖人,更是一種戰略威懾:我有最好的平台,你有最好的技術,來吧,我們一起改變世界。值得注意的是,DeepMind近期不僅招技術人才,還在公開招聘“首席經濟學家”。這說明頂級的AI實驗室已經開始思考AGI(通用人工智慧)時代的資源分配、經濟模型與社會治理問題。他們需要的不僅僅是寫程式碼的工程師,更是能夠建構未來世界規則的跨學科大腦。此舉,也代表著AI競爭開始從“單點突破”轉向“體系對抗”。正如阿里近期提出的“通雲哥”黃金三角概念——通義實驗室、阿里雲、平頭哥。未來的競爭,不再是一個模型跑分有多高,而是算力供給、模型能力與系統工程的協同作戰。林俊暘時代的Qwen,像是銳利的“矛尖”,鋒利無比,專打技術高地。而現在的阿里,需要的是“矛、盾、戰車、糧草”齊備的集團軍。從“比模型”轉向“拼體系”,用“模型+生態+AI Infra”爭奪下一代平台入口。這也是為什麼阿里會引入具有Gemini背景的周浩來接管後訓練團隊,為什麼要把團隊拆解重組。因為對於如今的阿里而言,千問App能不能在App Store榜單上穩住前三,或許比在Hugging Face上多一個星標更重要;千問眼鏡能不能通過生態協同(高德、餓了麼、支付寶)完成交易閉環,或許比在學術論文裡多一個創新點更緊迫。最後劉峰想說,這更像是技術理想主義與商業現實主義的一次正面碰撞。我們無意評判誰對誰錯。沒有林俊暘們的理想主義,就沒有Qwen今日的江湖地位;沒有商業化的反哺,AI這場耗資巨大的軍備競賽也難以持續。對於阿里而言,陣痛在所難免。但對於整個行業而言,這或許是一次必要的清醒。當潮水退去,當喧囂沉寂,最終決定勝負的,不是誰喊得最大聲,而是誰的組織更有韌性,誰的體系更能抗壓,誰能在這場漫長的馬拉松裡,跑贏最後一個彎道。3月的杭州,春寒料峭。雲谷學校的走廊裡,馬雲關於AI的講話餘音尚在;西溪園區的燈火下,新的千問團隊正在重組。再見了,林俊暘時代的Qwen。你好啊,那個必須直面商業世界所有殘酷與複雜的,全新的阿里AI。 (科技頭版)
阿里深夜開源80B程式設計模型!專攻智能體,周靖人、林俊暘最新成果發佈
個人電腦也能跑出頂級程式設計智能體?今日凌晨,阿里開源了一款小型混合專家模型Qwen3-Coder-Next,專為程式設計智能體(Agent)和本地開發打造。該模型總參數80B,啟動參數僅3B,在權威基準SWE-Bench Verified上實現了超70%的問題解決率,性能媲美啟動參數規模大10-20倍的稠密模型。Qwen3-Coder-Next的主要增強功能如下:1、高效MoE架構:僅需啟動3B參數,可達到與啟動參數數量高出10-20倍的模型相當的性能,包括37B啟動參數的DeepSeek-V3.2、32B啟動參數的Kimi K2.5等,降低視訊記憶體與算力需求。2、更強智能體能力:擅長長段推理、複雜工具使用以及從執行失敗中恢復,在動態程式設計任務中性能強大。3、與真實世界的IDE多樣化整合:其256k的上下文長度,加上對各種腳手架範本的適應性,使其能夠與OpenClaw、Qwen Code、Claude Code、Web Dev、Browser use、Cline等不同的CLI/IDE平台無縫整合,支援多樣化的開發環境。Qwen3-Coder-Next在實際開發中能理解需求、編寫程式碼,還能與環境互動、完成任務,可以在沒有人工干預的情況下生成可玩的網頁遊戲,部署服務並自動測試。阿里在程式設計智能體上進展不斷。就在昨日,阿里雲CTO周靖人、阿里千問大模型技術負責人林俊暘署名的論文在Arxiv平台上發表,為推進下一代程式設計Agent的發展提供了新資源和可靠方法。簡單來說,他們提出了一個可擴展的高效框架SWE-Universe,用於從GitHub拉取請求自動建構真實世界的軟體工程(SWE)可驗證環境。利用一個建構Agent,團隊將真實世界的多語言SWE環境的數量擴展到接近百萬級(807693個)。最後,團隊將該技術應用於Qwen3-Max-Thinking,並在SWE-Bench Verified測試中取得了75.3%的高分。▲論文截圖回到本次面向產業推出的新模型來看,團隊已正式開源Qwen3-Coder-Next(Base)與Qwen3-Coder-Next(Instruct)兩個版本,支援研究、評測及商業應用多種場景。Qwen3-Coder-Next一經發佈引起了廣泛關注,有網友在社交平台X上稱這一模型“尺寸完美”,也有網友表示自己等便攜版的Qwen3-Coder已經很久了。▲社交平台X網友對Qwen3-Coder-Next模型的部分評論01.實測看齊10-20倍啟動參數模型趕超DeepSeek-V3.2儘管啟動參數規模很小,Qwen3-Coder-Next在多項智能體評測上仍能匹敵或超過若干更大的開源模型。該模型在SWE-Bench、TerminalBench 2.0和Aider等多個主流程式設計智能體基準上的表現如下。▲Qwen3-Coder-Next實測表現使用SWE-Agent框架時,Qwen3-Coder-Next在SWE-Bench Verified上達到70%以上,超過了DeepSeek-V3.2,接近GLM-4.7、MiniMax M2.1。在多語言設定以及更具挑戰的SWE-Bench-Pro基準上,Qwen3-Coder-Next同樣超過了DeepSeek-V3.2,還較大幅度領先於GLM-4.7、MiniMax M2.1。在效率方面,Qwen3-Coder-Next與同類模型在SWE-Bench-Pro基準上進行對比分析,每次推理僅啟動3B參數,卻能達到與啟動參數量達其10-20倍的模型相當的基準性能,包括37B啟動參數的DeepSeek-V3.2、32B啟動參數的GLM-4.7、32B啟動參數的Kimi K2.5等。雖然專有的全注意力模型在絕對性能上仍保持領先優勢,但Qwen3-Coder-Next在面向低成本智能體部署的應用場景中,仍能在效率與性能之間取得更優的帕累托權衡。▲Qwen3-Coder-Next實測表現02.創新智能體訓練配方:強化智能體訓練的訊號Qwen3-Coder-Next模型基於Qwen3-Next-80B-A3B-Base建構,採用混合注意力與MoE的新架構;通過大規模可執行任務合成、環境互動與強化學習進行智能體訓練,在降低推理成本的同時,提升程式設計與智能體能力。Qwen3-Coder-Next並不只依賴參數規模擴張,而是將重點放在擴展智能體訓練訊號(agentic training signals)上。團隊使用大規模的可驗證程式設計任務與可執行環境進行訓練,讓模型能夠直接從環境反饋中學習,而非僅依賴靜態文字。訓練過程主要包括:1、持續預訓練:在以程式碼與智能體為中心的大規模資料上進行。2、監督微調:基於高品質的智能體互動軌跡,最佳化模型的行為。3、領域專家訓練:針對軟體工程、問答、Web/UX等特定領域,精細化專家能力。4、專家知識蒸餾:最終將27個專家的能力融合至一個輕量的、可部署的單一模型。這套“配方”的核心目標,是教會模型長時程推理、熟練使用工具,以及從執行錯誤中有效恢復——這些正是實用程式設計智能體所需的核心能力。03.多樣化整合下游應用無人工干預完成遊戲生成部署Qwen3-Coder-Next的價值還體現在於其低部署門檻與應用體驗。得益於僅3B的啟動參數,開發者可靈活將其整合至多種場景:作為本地IDE外掛,實現自動修復與程式碼生成;建構命令列智能體(CLI Agent),通過自然語言操作終端、管理項目;部署於企業內部網路環境,打造私有化、高響應的程式設計輔助系統。“小啟動、快響應、強能力”為程式設計智能體的規模化落地提供了更具可行性的路徑。該模型可整合到多種下游應用中,下文展示其在OpenClaw、Qwen Code、Claude Code、Web Dev、Browser use、Cline等場景中的示例。1、Web Dev:建立聊天介面(Creating a Chat Interface)2、CLI:桌面清理(Desktop Cleanup)3、OpenClaw:建立聊天介面(Creating a Chat Interface)4、Browser Use Agent:在亞馬遜上搜尋商品(Searching for a Product on Amazon)5、coder.qwen.ai:開發一個五子棋遊戲(Building a Gomoku Game)04.結語:研發落地雙投入阿里加碼程式設計智能體程式設計智能體正成為阿里千問團隊的強攻領域。Qwen3-Coder-Next在程式設計智能體基準上表現強勁,展現了技術在實用場景中的應用價值。而周靖人、林俊暘署名的新論文則代表了其程式設計智能體新的前沿進展,形成了研發和落地兩條路快步走的趨勢。展望未來,團隊認為強大的智能體能力,如自主使用工具、應對難題、管理複雜任務,是更好程式設計智能體的關鍵。接下來團隊計畫提升模型的推理與決策能力、支援更多工,並根據使用反饋快速迭代更新。 (智東西)