離開阿里兩個月後,千問前負責人林俊暘被曝出已開啟創業。
5月13日,據36氪旗下《智能湧現》報導,林俊暘近期開啟創業,方向包括世界模型和具身大腦。目前,林俊暘已經招募數名字節、騰訊和海外背景的成員,並以約20億美元(約合136億元人民幣)的估值開啟融資,接觸基金包括紅杉中國、高榕創投等。
有分析認為,此次林俊暘開啟自主創業,在無營收、無產品的情況下,純靠團隊和創業方向,便被估值百億元,這在國內非常罕見,反映出資本對中國AI頂尖人才的極度樂觀。
3月4日,林俊暘在社交媒體公開宣佈自己從千問卸任。同日,千問後訓練負責人郁博文、千問3.5/VL/Coder核心貢獻者李凱新也透露了自己離職的消息。
阿里集團CEO吳泳銘3月5日在內部郵件中回應稱,公司已決定批准林俊暘的辭職,感謝林俊暘過去在崗位上的付出。阿里雲CTO、通義實驗室負責人周靖人繼續帶領通義實驗室推進後續工作。同時公司將成立基礎模型支援小組,協調集團資源支援基礎模型建設。”
據阿里內部人士透露,林俊暘離職與千問的整體戰略轉變相關,公司認為需要招攬更多技術人才,這在一定程度上涉及林俊暘原有權責範圍的調整。經過多輪溝通後,林俊暘選擇不接受,因此主動提出辭職。
針對千問模型核心團隊集體離職”“開源策略調整”等討論,阿里集團在3月5日晚間表示,目前千問模型團隊穩定,沒有出現“集體離職”的情況,所有產品與服務運行正常。千問會堅持開源策略。基礎模型團隊從未被設定DAU等商業化KPI,Qwen大模型的目標是不斷追求模型智能上限,實現AGI。
趁著千問團隊人員變動之際,Google“隔空喊話”挖人。3月5日下午,GoogleDeepMind開發團隊相關負責人Omar Sanseviero在社交平台喊話千問團隊:“如果您想找個新地方來建構優秀的模型,並為開放模型生態系統做出貢獻,請聯絡我們!我們的發展路線圖上有很多令人興奮的內容,未來還有很多工作要做。”
辭職後,林俊暘沒有立即公開自己的創業規劃,而是繼續鑽研技術。3月26日,他在社交平台發佈離職後的首篇長文,分享自己的技術思考,聚焦大模型技術發展及對AI下一階段的預判。他判斷,“智能體思維”才是AI下一階段的核心方向,模型不再侷限於內部靜態推理,為了行動而思考,在與環境互動的過程中,並根據來自世界的反饋持續更新計畫。
公開資料顯示,林俊暘出生於1993年,碩士畢業於北京大學外國語學院,2019年加入阿里達摩院擔任高級演算法工程師,2020年,“通義千問”正式立項,林俊暘作為核心架構師,主導了OFA、Chinese CLIP等多模態基礎框架研發。2022年,他被正式任命為通義千問系列大模型的技術負責人。
在擔任通義千問技術負責人期間,林俊暘帶領團隊取得了一系列成果,並成為了阿里最年輕的P10級技術專家。2023年4月,他推動通義千問大模型正式發佈,其架構整合了此前積累的多模態技術成果。2024年8月,通義千問前負責人周暢離職後,林俊暘全面負責Qwen全端研發與開源戰略,推出了7B、14B、72B等不同參數規模的版本。截至他離職前,Qwen系列全球下載量已超6億次,衍生模型超20萬個。
此次林俊暘創業,引發大量關注。作為“技術大牛”的他,能否轉型為成功創業者和企業管理者,還有待觀察。 (介面新聞)
