阿里AI戰局再落一子:頂尖科學家許主洪轉崗,執掌多模態互動模型

在吳泳銘“AI驅動”的核心戰略下,阿里正進一步將頂尖人才向AI基礎模型研發的核心戰場集結,而多模態互動則被視為下一階段AI突破的關鍵隘口。

正值全球科技巨頭在人工智慧領域展開激烈軍備競賽之際,阿里巴巴內部的排兵佈陣再次出現關鍵變動。

硬AI獲悉,近期備受矚目的AI頂尖科學家、阿里集團副總裁許主洪(Steven Hoi)已從智能資訊事業群首席科學家的職位上,轉崗至阿里集團的核心AI研發機構——通義實驗室。

阿里方面向硬AI證實了這一消息,並表示許主洪將負責多模態互動模型方向的研究,後續向通義實驗室負責人、阿里雲CTO周靖人匯報。

這一內部調動釋放出重要訊號:在吳泳銘“AI驅動”的核心戰略下,阿里正進一步將頂尖人才向AI基礎模型研發的核心戰場集結,而多模態互動則被視為下一階段AI突破的關鍵隘口。

對於許主洪而言,這次轉崗意味著他將從更貼近C端應用的“前線陣地”轉向更為核心和底層的“研發心臟”。

時間拉回至今年2月,這位在學術界和工業界均享有盛譽的AI大牛(IEEE Fellow、史丹佛大學評選的“全球前1%的AI科學家”)正式加盟阿里,在當時引發了業內不小的轟動。他最初的落腳點是智能資訊事業群,一個囊括了夸克、UC瀏覽器、書旗小說等億級使用者產品的業務叢集,直接向“85後”總裁吳嘉匯報。

彼時,業界的普遍解讀是,阿里意圖明顯——借助許主洪在多模態基礎模型及Agents領域的深厚積累,快速提升C端產品與AI結合的應用能力,打造出能與使用者直接對話的“超級應用”。這也符合阿里在AI C端應用上“軟硬一體”的生態構想,即整合“通義”APP、夸克、天貓精靈等核心業務,搶佔AI應用賽道先機。

然而,僅僅半年多後,許主洪便調離了這個被視為阿里AI應用重要出口的事業群,轉而投身於更為基礎和前沿的通義實驗室。這一變化背後,是阿里對AI戰略優先順序的再聚焦。

一位接近阿里的人士向硬AI分析稱:“這可以看作是阿里集中優勢兵力,全力攻堅核心基礎模型能力的體現。應用創新固然重要,但基礎模型的持續領先才是決定未來戰局的關鍵。讓最頂尖的科學家回到最核心的研發崗位,是確保技術引擎持續強大的必然選擇。”

01. 阿里“亮劍”多模態互動

許主洪的新戰場——通義實驗室,是阿里“通義”系列大模型的“孵化器”,由阿里雲CTO周靖人親自掛帥。周靖人同樣是AI領域的重量級人物,擁有哥倫比亞大學電腦博士學位,曾任微軟研發合夥人,是阿里雲巨量資料平台和人工智慧研究的靈魂人物。

在周靖人的帶領下,通義實驗室已經建構了包括語言、視覺、語音等在內的“全尺寸”和“全模態”模型矩陣,其開源模型在全球範圍內獲得了巨大的影響力。

而許主洪此次負責的“多模態互動模型”,正是當前全球大模型研發的前沿陣地。所謂多模態,即讓AI能夠像人一樣,同時理解和處理文字、圖像、音訊、視訊等多種資訊形式,並以更自然、更智能的方式與人類進行互動。這被認為是AI從“能聽會說”邁向“能看會想”的關鍵一步,也是通往通用人工智慧(AGI)的必經之路。

無論是Google的Gemini、OpenAI的GPT-4o,還是阿里自身發佈的Qwen-VL、Qwen-Audio等模型,都已展現出強大的多模態能力。而許主洪在加入阿里之前,其研究便長期聚焦於此,尤其以“多模態預訓練”領域的突破性研究聞名。他提出的低成本預訓練策略,曾深刻影響全球大模型的研發處理程序。

此次履新,意味著阿里將整合許主洪在多模態領域的學術遠見和工業界經驗,與通義實驗室現有的工程和研發能力相結合,意圖在多模態這一核心賽道上建立起更強的技術壁壘。其未來的研究成果,不僅將為夸克、淘寶等前端應用提供更強大的AI能力支援,更有可能催生出全新的互動範式和產品形態,例如更智能的個人助理、更沉浸的AI硬體等。

02. “巨頭”的邏輯:人才、資源與戰略定力

許主洪的轉崗,是阿里AI戰略在“聚光燈”下的又一次微調,也折射出當前AI巨頭競爭的普遍邏輯。

首先,頂尖人才的流向即是戰略方向的指針。從吳泳銘親自兼任阿里雲CEO,到此次將許主洪這樣的戰略級科學家部署到基礎模型研發的一線,都顯示出阿里最高層對底層技術掌控力的極度重視。

其次,資源正以前所未有的力度向核心模型集中。知情人士透露,此次調整是“正常的集團內部轉崗”,其背後邏輯是“集中資源投入基礎模型能力建設”。這意味著,相較於在應用層面的多點開花,阿里當前更傾向於將寶貴的研發資源和人才投入到底層模型的“深井”中,以求獲得更具顛覆性的技術突破。

最後,這體現了巨頭在喧囂的AI浪潮中尋求戰略定力。AI應用的商業化路徑仍在探索之中,但基礎模型的代際競爭卻已白熱化。在這樣的背景下,是否選擇長期投入、夯實技術根基,考驗著每一家公司的戰略遠見與決心。 (硬AI)