職場Bonus獨家獲悉,阿里達摩院中的司羅、徐盈輝均已離職,這也是繼去年M6大模型帶頭人楊紅霞之後,另兩個大模型主力團隊的負責人的離開。伴隨而來的,是三個核心團隊的“新血”負責人:黃非、趙德麗和周暢。在2022年達摩院一系列的人事變動後,職場Bonus追踪並繪製出新的達摩院及其中大模型主力團隊的人才地圖。
“通義”,阿里大模型的集大成之作,一號位為周靖人,目前在阿里的位置與騰訊的張正友對標。作為達摩院現任副院長,周靖人負責大AI領域的研究,分管機器智能、智能計算、XR、城市大腦實驗室。
在ChatGPT持續引爆熱點、用戶量飛漲的大背景下,國內各大廠對大模型成果的期待鎖定在直接對標的生成式AI上,對自然語言處理、圖像、計算能力的發展訴求最為飢渴。對應地,周靖人所帶領的機器智能研究院中的“語言技術實驗室”、“視覺智能實驗室”,和數據計算研究院中的“智能計算實驗室”為當前沖向該目標的三大主力團隊。
據職場Bonus了解,語言技術實驗室在三個團隊中的人員佔大頭,也是阿里NLP研發的核心團隊。該實驗室為阿里提供包括NLP基礎技術、對話技術、機器翻譯、應用算法等技術,已在阿里經濟體內實現萬億級的日調用。
前任實驗室負責人司羅曾是為阿里對外背書AI能力的重要人物,甚至在不久前還出現在各媒體盤點國內大廠AI實力的名單中。司羅被稱為最早一批“學術轉向工業”的AI科學家之一,自2014年起帶領阿里NLP團隊取得多項重要成果。在學術領域,他是美國普渡大學計算機系的終身教授,並先後獲得美國國家科學基金會成就獎、雅虎、谷歌研究獎、ACM2019傑出科學家等。在阿里,司羅的多重職銜中還包含一項:阿里巴巴副總裁。
與司羅類似背景的AI華人大牛,離職大廠的去向無非有三:創業,回院校,跳入另一家大廠。有業內知情人士向職場Bonus否定了司羅離開阿里後的去向為創業。
現任帶領該團隊的黃非畢業於卡耐基梅隆大學計算機學院,曾任職於IBM、Facebook,在自然語言處理和人工智能的頂級會議和期刊發表文章40餘篇,獲美國專利十餘項,兼備學術能力和公司技術管理經驗。加入阿里後,他領導過AliNLP的基礎技術研發和業務落地,雲小蜜對話技術和多模態翻譯技術,並支持集團內外的國際化業務需求。目前,其帶領團隊的主要分支包括文本視覺理解理解、翻譯算法、多語言NLP應用、智能對話與服務技術、自然語言基礎技術、應用算法等。
此外,該團隊還有一條產品負責人劉建榮帶領的職能線,預計會在阿里將大模型能力向生成式AI產品轉化的過程中發揮重要作用。
對於達摩院中的視覺團隊來說,最早的領導者可以追溯到已調任高德的任小楓。已離職的徐盈輝,加入阿里前的學術和工作背景並非來自北美或國內,而是在日本:博士畢業於日本國立豐橋技術科學大學,曾任理光日本中央研究所研究。在阿里搜索事業部、菜鳥人工智能部均有任職記錄。
我們注意到,目前領導視覺團隊的趙德麗,在過往公開信息中顯示其職銜為基礎視覺實驗室負責人,而非“視覺智能實驗室負責人”,暫不確定是否實驗室名稱隨方向和定位發生微調。
趙德麗畢業於上海交通大學。曾供職於HTC、小米、微軟亞洲研究院、港中文大學多媒體實驗室,和黃非一樣,他在加入阿里前便積累了算法學術研究和團隊管理相平衡的經驗。對於算法技術從業者而言,德麗履歷含金量的再加分之處在於其對機器視覺和機器學習的基礎算法研究經驗。當前,德麗的主攻方向在生成模型、多模態學習,和預訓練基礎模型上。
趙德麗目前職級為P9,帶領的團隊包含模型優化、視頻AI、生成模型、表徵學習等方向。
值得一提的是,達摩院在以色列也曾有視覺技術相關的人才儲備(比如前Visualead的首席技術官Itamar Friedman等),該團隊如今的人員保留情況及與國內團隊的配合程度同樣令人好奇。
我們將視線轉到智能計算實驗室。
若將自然語言(NLP)和視覺技術(CV)簡單比作大廠沖向“類ChatGPT”產品的左右雙輪,那麼智能計算實驗室裡倒騰的“通義”大模型,則是關乎該目標實現速度和效果品質的底盤。
職場Bonus從多位信源處了解到,楊紅霞離職後,智能計算實驗室名義上的團隊負責人是周靖人本人(參考達摩院官網),但實際在帶項目的人是周暢——外界倒是對這位年輕、低調的90後所知甚少。
周暢(花名:鐘煌)於2012年本科畢業於復旦計算機科學與技術專業,2017年博士畢業於北京大學計算機軟件與理論專業,通過校招加入阿里巴巴(難怪企業忠誠度buff疊滿),主攻推薦系統、多模態基礎模型,擅長領域包括深度學習、圖挖掘和分佈式計算,自2014年以來在KDD、NeurIPS、ICML、ACL、AAAI等發表學術文章十餘篇。領導過的項目包括大眾熟悉的手機淘寶購物車/下單後推薦系統,分佈式圖神經網絡學習框架AliGraph的算法部分,以及當下的阿里多模態通用型模型M6、M6-OFA及相關AIaaS服務。
職場Bonus從接觸過周暢的從業者口中了解到,“他很想做成通用型更強的大模型,而不是垂直於單一領域和場景”,這一點也正是阿里打造大模型時的理念。
阿里習慣“開放”姿態和“做大、做平台”,想要完成通用大模型基座的建造是件需要“超大力出奇蹟”的事。“這週二騰訊雲在後廠村辦了一場活動,阿里雲則會在本週五於杭州舉辦媒體交流會。”這場戰役中,大廠公關團隊和技術團隊一樣有壓力。
對於阿里來說利好的是,在近兩年大廠裁員和AI的波谷接連出現前,這裡曾是華人AI大牛流向的重要一極。人才高地的達摩院對於趨勢的出現有較早的預判和準備。為了直觀看見阿里在這場前沿技術追逐戰中的蓄力和演變,我們趕在阿里的媒體交流會前,站在第三方視角梳理了一下阿里大模型能力的關鍵時間節點。
這張圖的階段性終點線,對標的或許正是已形成“雲-企業軟件-AI計算”的高增長曲線和“降低算力成本-提高計算效率”高利潤商業模式的美國三大雲廠。
這個三月,達摩院裡開會的次數特別多。
在OpenAI的GPT-4、百度的“文心一言”接連出牌的這一周,時間和速度的壓力與上市大廠們的股價發生了關聯——對於手中持有公司股票的P7級及以上員工來說,成果好壞關乎年薪的增值或縮水;對於正在找工作的AI技術人才來說,能做出傑出產品的大牛將成為AI席捲全行業的浪潮下,科技大廠內更受歡迎的金牌招聘官。(職場Bonus)