阿里AI戰局再落一子：頂尖科學家許主洪轉崗，執掌多模態互動模型

2025/09/30

•

在吳泳銘“AI驅動”的核心戰略下，阿里正進一步將頂尖人才向AI基礎模型研發的核心戰場集結，而多模態互動則被視為下一階段AI突破的關鍵隘口。

正值全球科技巨頭在人工智慧領域展開激烈軍備競賽之際，阿里巴巴內部的排兵佈陣再次出現關鍵變動。

硬AI獲悉，近期備受矚目的AI頂尖科學家、阿里集團副總裁許主洪（Steven Hoi）已從智能資訊事業群首席科學家的職位上，轉崗至阿里集團的核心AI研發機構——通義實驗室。

阿里方面向硬AI證實了這一消息，並表示許主洪將負責多模態互動模型方向的研究，後續向通義實驗室負責人、阿里雲CTO周靖人匯報。

這一內部調動釋放出重要訊號：在吳泳銘“AI驅動”的核心戰略下，阿里正進一步將頂尖人才向AI基礎模型研發的核心戰場集結，而多模態互動則被視為下一階段AI突破的關鍵隘口。

對於許主洪而言，這次轉崗意味著他將從更貼近C端應用的“前線陣地”轉向更為核心和底層的“研發心臟”。

時間拉回至今年2月，這位在學術界和工業界均享有盛譽的AI大牛（IEEE Fellow、史丹佛大學評選的“全球前1%的AI科學家”）正式加盟阿里，在當時引發了業內不小的轟動。他最初的落腳點是智能資訊事業群，一個囊括了夸克、UC瀏覽器、書旗小說等億級使用者產品的業務叢集，直接向“85後”總裁吳嘉匯報。

彼時，業界的普遍解讀是，阿里意圖明顯——借助許主洪在多模態基礎模型及Agents領域的深厚積累，快速提升C端產品與AI結合的應用能力，打造出能與使用者直接對話的“超級應用”。這也符合阿里在AI C端應用上“軟硬一體”的生態構想，即整合“通義”APP、夸克、天貓精靈等核心業務，搶佔AI應用賽道先機。

然而，僅僅半年多後，許主洪便調離了這個被視為阿里AI應用重要出口的事業群，轉而投身於更為基礎和前沿的通義實驗室。這一變化背後，是阿里對AI戰略優先順序的再聚焦。

一位接近阿里的人士向硬AI分析稱：“這可以看作是阿里集中優勢兵力，全力攻堅核心基礎模型能力的體現。應用創新固然重要，但基礎模型的持續領先才是決定未來戰局的關鍵。讓最頂尖的科學家回到最核心的研發崗位，是確保技術引擎持續強大的必然選擇。”

01. 阿里“亮劍”多模態互動

許主洪的新戰場——通義實驗室，是阿里“通義”系列大模型的“孵化器”，由阿里雲CTO周靖人親自掛帥。周靖人同樣是AI領域的重量級人物，擁有哥倫比亞大學電腦博士學位，曾任微軟研發合夥人，是阿里雲巨量資料平台和人工智慧研究的靈魂人物。

在周靖人的帶領下，通義實驗室已經建構了包括語言、視覺、語音等在內的“全尺寸”和“全模態”模型矩陣，其開源模型在全球範圍內獲得了巨大的影響力。

而許主洪此次負責的“多模態互動模型”，正是當前全球大模型研發的前沿陣地。所謂多模態，即讓AI能夠像人一樣，同時理解和處理文字、圖像、音訊、視訊等多種資訊形式，並以更自然、更智能的方式與人類進行互動。這被認為是AI從“能聽會說”邁向“能看會想”的關鍵一步，也是通往通用人工智慧（AGI）的必經之路。

無論是Google的Gemini、OpenAI的GPT-4o，還是阿里自身發佈的Qwen-VL、Qwen-Audio等模型，都已展現出強大的多模態能力。而許主洪在加入阿里之前，其研究便長期聚焦於此，尤其以“多模態預訓練”領域的突破性研究聞名。他提出的低成本預訓練策略，曾深刻影響全球大模型的研發處理程序。

此次履新，意味著阿里將整合許主洪在多模態領域的學術遠見和工業界經驗，與通義實驗室現有的工程和研發能力相結合，意圖在多模態這一核心賽道上建立起更強的技術壁壘。其未來的研究成果，不僅將為夸克、淘寶等前端應用提供更強大的AI能力支援，更有可能催生出全新的互動範式和產品形態，例如更智能的個人助理、更沉浸的AI硬體等。

02. “巨頭”的邏輯：人才、資源與戰略定力

許主洪的轉崗，是阿里AI戰略在“聚光燈”下的又一次微調，也折射出當前AI巨頭競爭的普遍邏輯。

首先，頂尖人才的流向即是戰略方向的指針。從吳泳銘親自兼任阿里雲CEO，到此次將許主洪這樣的戰略級科學家部署到基礎模型研發的一線，都顯示出阿里最高層對底層技術掌控力的極度重視。

其次，資源正以前所未有的力度向核心模型集中。知情人士透露，此次調整是“正常的集團內部轉崗”，其背後邏輯是“集中資源投入基礎模型能力建設”。這意味著，相較於在應用層面的多點開花，阿里當前更傾向於將寶貴的研發資源和人才投入到底層模型的“深井”中，以求獲得更具顛覆性的技術突破。

最後，這體現了巨頭在喧囂的AI浪潮中尋求戰略定力。AI應用的商業化路徑仍在探索之中，但基礎模型的代際競爭卻已白熱化。在這樣的背景下，是否選擇長期投入、夯實技術根基，考驗著每一家公司的戰略遠見與決心。 (硬AI)

科技