7月27日,騰訊 Robotics X 實驗室與福田實驗室聯合發佈具身智能開放平台 Tairos “鈦螺絲” ,騰訊首席科學家、Robotics X 實驗室主任、福田實驗室主任張正友在會上作了《未來已來,從神話巨人到具身智能》的主題演講,闡述了為何推出具身智能平台、新平台“鈦螺絲”的目標和使命以及具身智能行業發展的現狀和未來發展趨勢。Tairos平台可在官網申請試用【點選文末閱讀原文直達】https://tairos.tencent.com/以下是演講全文。各位嘉賓,上午好!今天我想和大家分享《未來已來,從神話巨人到具身智能》。正如大家最近感受到的,“具身智能”正成為全球科技競爭的高地。我研究人工智慧和機器人技術已四十年,見證了人工智慧和機器人這些年的不斷進化。然而當我們回溯歷史,這項技術的夢想,遠比我們想像的更古老。早在2700年前的古希臘,人類已經有了具身智能構想的萌芽Talos 。Talos是由工匠之神打造的青銅巨人,他不是一個簡單的機械工具,而是已經擁有了自主意識。Talos被送給了克里特用來巡視、守衛領土,是最早的安保機器人。Talos雖然存在在神話中,卻體現了人類對擁有機械智能體的渴望。這種渴望,從青銅鍛造爐延續到今天的實驗室。2018年初,騰訊創始人馬化騰做出了一個重要決定——成立騰訊Robotics X實驗室。這張圖的時間軸濃縮了我們實驗室七年來的前沿探索足跡。從2018年平衡自行車的動態控制,到2021年Max實現腿輪一體化的四足機器狗,再到2023年靈巧手操作和栩栩如生的運動步態,再到去年下半年的養老機器人原型小五——我們覆蓋了操作、運動、感知、智能、硬體設計等機器人核心技術堆疊。通過這一系列的探索,讓我們成為國內少有的具備全端機器人技術能力的團隊。我們深刻理解機器人硬體與具身智能的共生關係。 軟硬一體不是簡單拼裝,而是從感測器到大小腦再到執行器的系統級融合創新。這種系統級融合創新的理念,就體現在上圖左邊的 SLAP 框架裡。這是我早在2018年,也是在世界人工智慧大會提出的,希望為“具身智能”描繪一個清晰的技術藍圖。經過了這些年的持續探索和實踐,騰訊Robotics X實驗室的同事們不斷打磨這個框架,現在已經進化形成了一個更完整、也更強大的核心技術體系,我們稱之為 “SLAP³”體系。這裡面核心是三個緊密結合的大模型 :首先是規劃大模型,相當於人的左腦。讓機器人能理解複雜目標是什麼,然後拆解成一個個可執行的策略步驟。比如陪行動不便的老人散步,需要先去拿輪椅,把老人抱到輪椅上,然後推輪椅。接著是感知大模型,相當於人的右腦。它的作用就是讓機器人真正瞭解自己所處的環境。比如說輪椅在什麼地方。還有就是感知行動聯合大模型,相當於人的小腦。這個模型打通了從“看見”到“做到”的關鍵環節。比如在一個狹窄的過道里,推輪椅要安全避開其他行人和障礙物。這種架構的優勢在於它層次化、模組化,同時又能聯合最佳化。不同功能的大模型可以相對獨立地發展和更新,同時又能高效地協同工作、互相增強。這是逐步將具身智能推向現實世界通用應用的關鍵路徑——因為真正的智慧型手機器人,不僅要理解我們的世界,更要能在這個世界裡安全、穩定且高效地完成任務。具身智能技術在不斷迭代,國內外的新成果、新突破不斷湧現,我判斷未來還將在五個方向上持續發展,我們根據首字母總結為IDEAS:I 是 IPhD, 虛實整合世界。數字世界和真實世界正在深度融合,真實世界的資訊被反映在虛擬世界中,經過運算,又返回到真實世界中,並對真實世界產生影響,這種結合越來越緊密。D 是 Democratization,技術門檻降低。人和機器的互動從過去的機器語言,到高級程式語言,再到現在用我們人類自己的自然語言。這使得與機器打交道的門檻大大降低,男女老少都能輕鬆參與。E 是 Evolving intelligence,智能演進。AI迎來爆發,未來智能、本體、環境三者之間的一體化互動將更加緊密,並不斷演進提升,使AI更加通用和可靠,加速推動產業創新和個人效率。A 是Agentization,智能體化。AI系統從被動演進到主動互動智能體,具備感知、規劃、行動和學習能力。而且智能體將不再孤獨,多智能體的互動協作將湧現出集體智能。S 是Sensing multimodalization,感知多模態化。感知技術從單一視覺,變成視覺、觸覺、力覺多模態融合,甚至加上嗅覺和味覺,為機器人提供更多資訊。相信技術會在不遠的將來給我們帶來驚喜,騰訊Robotics X實驗室也會在這些方向上繼續探索和落地,為具身智能融入社會做出貢獻。我們剛才提到了具身智能技術的飛速演進。國內的具身智慧型手機器人產業,已經進入了一個快速的發展通道。這背後的推動力是很紮實的:首先, 政策支援力度很大,方向很明確;其次,機器人的產業鏈相當完整非常高效;再者, 應用場景無論從數量還是質量上都呈現出巨大的潛力。這使得一批優秀的機器人企業迅速湧現出來。社會各界迫切期待機器人在真實環境中能落地應用。例如,工廠車間對柔性生產、精準抓取與重複作業的需求;酒店、商場對於接待導覽服務的需求;家庭場景下對智能陪伴、安全監護、家居操控乃至適老化日常起居輔助的需求。然而,要真正滿足這些多元場景的高標準、嚴要求,使具身智能走進千家萬戶與生產服務第一線,無論是核心技術的攻關,還是工程化落地的精進,我們仍需付出巨大努力。大多數企業,在這個落地過程中都會面臨諸多的障礙。這遠不僅僅是一個演算法問題、或者一個模型能力的問題,而是一個極其複雜、環環相扣的系統工程挑戰, 需要打通基礎模型、資料採集、訓練模擬、真機偵錯、真機部署的全鏈條。每一個環節,都藏著不少"坑" 。騰訊Robotics X實驗室在深入產業實踐的過程中,在每個環節都深有體會。正是基於這些親身經歷和積累的經驗教訓,我們為每個環節都開發了相應的實用工具,致力於解決這些共性的落地難題。為此,騰訊Robotics X和福田實驗室正式推出Tairos 具身智能開放平台。這個平台核心功能非常明確: 為機器人本體開發商與應用開發商補齊關鍵的軟體能力。大家可以看到,我們一方面聯合宇樹、越疆、帕西尼、眾擎、擎朗等優秀的本體硬體夥伴,另一方面服務機器人應用生態夥伴,通過標準化平台,讓軟體能力不再成為機器人走向場景落地的瓶頸。平台能力有兩大支柱:——模型和雲服務,提供三大核心能力:規劃大模型支援複雜任務規劃,多模態感知大模型融合視覺、位置、觸覺等環境資訊,而感知-行動聯合大模型實現操作和運動能力。雲服務則覆蓋完整研發鏈條,開發者可通過雲平台完成模擬、訓練、資料管理等關鍵環節,並通過SDK/API靈活對接硬體。這些能力最終體現為四大產品特點:第一, 跨本體適配,同一套演算法可低成本遷移到不同機器人硬體本體。第二, 模組化支援 ,我們希望靈活適應不同夥伴對於具身軟體和工具的需求,到位但不越位。第三, 標準化產品 ,降低夥伴的適配成本,始終帶來SOTA的技術。第四, 追求成功率與穩定性,以真實場景落地為唯一目標,給夥伴帶來可持續的商業價值。我們和合作夥伴一起,已經將Tairos平台搭載在不同形態的機器人本體上。這裡,我們展示在工業生產、商業服務、家居生活和基本運動控制等場景中的一些落地。我們希望成為機器人廠商的合作夥伴,讓機器人企業專注自身優勢、聚焦創新,讓Tairos助力行業發展。●Tairos是開放的。我們對所有機器人本體開放合作,也對各領域模型開放演算法接入能力,讓開發者自由組合創新。●Tairos是夥伴的助力。Tairos不追求自身的商業化,但是希望為行業夥伴帶來商業機會,取得商業成功。●Tairos以落地為目標。在真實場景中產生實際價值,讓機器人服務於人。●Tairos的核心追求在於連接。實現人與機器的自然互動,實現機器與機器的協同工作。●Tairos肩負責任,在產業和技術上,為機器人的發展和融入社會做出貢獻。這五個定位驅動Tairos成為夥伴的“技術槓桿”。我們期待與所有探索者攜手,讓具身智慧型手機器人走出神話,走進每個需要智慧的角落,做機器人行業的“鈦螺絲”。唐代的智通大師留給我們四句偈語:“三身元我體,四智本心明。身智融無礙,應物任隨形。” 這描繪的,恰恰是我們對理想具身智能的追求。在過去,機器人和AI常常是割裂的:我們強行把缺乏世界認知的AI塞進機器軀殼。結果往往是笨拙和不自然。但未來,技術與認知的進步正推動我們從“割裂的拼接”走向“有機的融合”——智能不再是塞進去的,而是在與環境的持續、閉環互動中真實湧現出來的。它意味著具身智能需具備強大的泛化能力 —— 這個“身”與“智”要能動態、協同地進化, 無縫地適應多變的環境,實現身、智、環境的圓融統一。它不再被束縛於單一功能或固定環境,而是能在工業、家庭、醫療等多種場景中理解開放任務,成為真正意義上的通才。非常幸運,我們正親眼見證著這個 “身智融無礙”的未來在展開,融合演進,未來已來! (騰訊科技)