阿里下場,具身智能迎來超級玩家!

通義團隊已建立機器人和具身智能的小組。多模態基礎模型正轉變為基礎智能體(agents),而這些智能體將從虛擬世界走向物理世界。

阿里通義千問大語言模型負責人林俊暘昨日在社交媒體上發文表示,已在通義團隊內部建立機器人和具身智能的小組。

在2025雲棲大會上,阿里雲與輝達在物理AI領域達成合作。而此次阿里組建機器人和具身智能的團隊,標誌著阿里通義大模型正式涉足具身智能大腦領域。

▍通義大模型走向物理AI

林俊暘提及建立機器人和具身智能團隊時表示,多模態基礎模型正轉變為基礎智能體,這些智能體可以利用工具和記憶通過強化學習進行長時序(long-horizon)推理,而它們絕對應該從虛擬世界走向物理世界。

據瞭解,林俊暘畢業於北京大學,其研究興趣集中於大規模語言模型和多模態大模型。他曾在阿里達摩院負責打造超大規模多模態預訓練模型M6,通用統一多模態預訓練模型OFA,中文預訓練模型Chinese CLIP等。目前是阿里通義千問的技術負責人。

“多模態基礎模型如果僅用於視訊生成,仍停留在相對初級的階段。視訊生成只能證明AI對物理世界的理解能力,更關鍵的在於控制能力。阿里從純軟體AI應用轉向開發能夠控制智能終端與機器人的‘大腦’,實質上是在重新定義勞動力,這其中蘊含著巨大的市場空間。”快思慢想研究院院長田豐表示。

他進一步指出,阿里當前採取的策略是:在軟體層面自研“大腦”,在硬體層面則通過投資整機廠商進行佈局

9月8日,阿里雲領投了機器人初創公司自變數機器人1.4億美元的A+輪融資。此前,阿里還投資了法奧意威、星動紀元、逐際動力、宇樹科技等多家機器人企業。

“要實現從通用人工智慧(AGI)到超級人工智慧(ASI)的跨越,關鍵在於是否具備足夠強大的‘大腦’,能夠處理跨工業、農業、服務業等多領域的複雜任務,並達到人類水平。眼下整機技術路徑尚未收斂,硬體形態仍處於發散階段,因此通過投資參與是更為靈活和高效的方式。”田豐稱。

▍不止阿里,大廠紛紛入局

阿里的此番入局並不意外。當前,全球巨頭都在下場具身智能,物理AI成為新戰場。

在今年6月的年度股東大會上,輝達 CEO黃仁勳曾提到:“人工智慧和機器人技術是最大的兩個增長機會,代表著數兆美元等級的增長機會。”

9月雲棲大會期間,阿里雲就與輝達在物理AI領域達成合作。阿里雲人工智慧平台 PAI 將整合輝達Physical AI軟體棧,將為企業使用者提供資料預處理、模擬資料生成、模型訓練評估、機器人強化學習、模擬測試等全鏈路平台服務,進一步縮短具身智能、輔助駕駛等應用的開發周期。

除了阿里外,京東、騰訊等網際網路廠商也在瞄準具身智能的大腦。

京東已經發佈附身智能品牌JoyInside,為機器人、機器狗和AI玩具等提供機器人的“大腦”能力,並與數十家主流機器人品牌達成合作,包括陪伴類的Fuzozo芙崽、火火兔;教育領域的元蘿蔔AI、心大陸、Folotoy、嚕咔博士;產業領域的眾擎、雲深處、魔法原子等。

騰訊Robotics X實驗室與福田實驗室聯合發佈具身智能開放平台 Tairos “鈦螺絲”。據騰訊首席科學家張正友介紹,Tairos 具身智能平台希望為機器人本體與應用開發商補齊關鍵軟體能力,就像為各類機器人裝上“大腦”,讓機器人具備感知世界、規劃任務以及自主決策等能力,從被動執行指令的機械體進化為主動適應現實世界的智能生命體。

▍具身智能“大腦”邁入發展深水區

具體來看,不少大廠選擇從自身業務場景切入,落地具身智能技術。

“例如在倉儲、物流、服務業等場景中,讓具身智能‘大腦’達到解決專業任務的水平是具有可行性的。像順豐、美團等企業,都在朝這一方向積極佈局。它們在提升自身生產效率之後,再進一步通過生態合作將技術擴展至更多元的應用場景。”田豐提到。

田豐還特別指出,阿里巴巴具備將自身業務與平頭哥晶片技術融合的潛力。“在最佳化機器人大腦的基礎上,與平頭哥進行協同,推動雲端AI晶片逐步向智能終端落地,無論是機器人晶片還是自動駕駛晶片,都將為大模型的規模化推廣提供硬體支撐。未來,更有機會建構起機器人領域的‘AppStore’應用生態圈。”

不過,具身智能的大腦仍處於探索階段。宇樹科技創始人王興興曾多次表示,當前硬體的性能其實足夠支撐應用,核心瓶頸在於AI模型本身的能力不足,導致硬體潛力無法被充分釋放。此外,他對於當前熱門的VLA模型也持保留態度,認為其模型架構仍需進一步的迭代升級。

談及大廠紛紛入局具身智能大模型所帶來的影響,田豐指出,當前機器人大腦的發展仍需聚焦於專業場景的突破。在他看來,專業場景下的應用仍存在明顯不足,更不必說實現通用場景的覆蓋。

“物理AI對可靠性、精確性、速度要求更高。在物理環境中,一旦決策失誤,整條生產線上的太陽能板或鋰電池都可能受到影響,帶來巨大的試錯成本,遠高於軟體AI的容錯空間。目前我們需要彌補的短板非常多,包括物理環境中的任務流程設計、業務深層知識以及行業經驗等,這些方面都尚未被充分挖掘和理解。”

田豐相信,未來具身智能的“大腦”將邁入發展的深水區。“從資料、邏輯再到決策,整個業務流的思維鏈條將被拆解得極為細緻,我們必須釐清其中每一個環節的因果依賴關係。” (財聯社AI daily)