#靈巧
多指靈巧手為什麼這麼難?機器人靈巧操作的瓶頸與未來趨勢
讓機器人像人一樣完成抓取、旋擰、撥動、操作工具,始終是機器人領域最核心、也最困難的目標之一。過去多年,機器人操作能力已經從早期依賴預程式設計的機械程式設計,發展到引入視覺反饋的閉環控制,再進一步邁向強調多模態感知、決策與執行閉環的具身智能階段。與此同時,末端執行器也從簡單夾爪演進到多指靈巧手,硬體能力持續提升。但真正的人形化靈巧操作仍遠未成熟,尤其在多指靈巧手上,資料採集、技能學習與真實世界泛化仍面臨諸多瓶頸。本文系統梳理了機器人操作的發展脈絡、當前挑戰,以及靈巧操作在資料採集與學習框架上的最新進展。圖1 末端執行器與機械臂硬體演進圖圖1 展示了機器人操作硬體從“簡單”走向“靈巧”、從“剛性”走向“柔順”的整體演進路徑。圖中上半部分對應末端執行器的演化:最早是結構簡單、任務單一的平行夾爪,隨後發展出兩指、三指夾持器,以及 Pisa/IIT Soft Hand這類欠驅動軟手;再往上,則進入Shadow Hand、Allegro Hand、Hannes Hand 等多指靈巧手與擬人手階段,同時軟體手也逐漸成熟。下半部分對應機械臂本體的演化:從傳統工業機械臂,發展到能夠與人協作、適應非結構化環境的協作機械臂,再到可連續變形的連續體機械臂,以及基於柔性材料建構的軟體機械臂。這張圖要表達的是,機器人操作硬體的發展並不是單一路線推進,而是末端執行器與機械臂兩條路線同時升級。前者不斷提升手部的抓取與操作自由度,後者則持續增強本體的環境適應性與互動能力;兩者共同推動了機器人操作能力從“能抓取”向“會操作”演進,也為後續更複雜的靈巧操作學習奠定了硬體基礎。本文基於 2507.11840v2,進行學習復盤,僅供學習交流參考。可加入知識星球閱讀全文(方式見文末)。圖2 機器人操作發展的三階段圖2 展示了機器人操作的發展脈絡,大體可分為三個階段:機械程式設計、閉環控制和具身智能。第一階段的特點是預程式設計控制,機器人主要運行在結構化環境中,缺乏即時反饋,依賴人工預先設定動作與流程,因此更適合重複性強、變化較少的任務。第二階段進入閉環控制,機器人開始引入視覺等反饋資訊,能夠在半結構化環境中根據感知結果修正動作,但整體仍較依賴精確建模與控制框架。第三階段則邁向具身智能,核心特徵是多模態感測融合與更強的自適應能力,機器人不再只執行既定程序,而是嘗試在非結構化環境中完成更複雜的互動與操作任務。整體來看,機器人操作能力正沿著從“無反饋”到“有反饋”、從“預設執行”到“自適應決策”的方向持續演進。圖3 真實物理世界中的操作挑戰圖3 主要說明,隨著機器人逐步走出結構化工廠環境,機器人操作所面對的對象正在從傳統剛性工件轉向更複雜、也更難感知和建模的物體。例如,線纜屬於線狀對象,玻璃屬於透明對象,布料屬於柔軟對象,醫療場景中的人體組織則屬於可變形對象。這些對像在接觸、形變和狀態估計上都比傳統剛體更複雜。與此同時,機器人操作類型也在不斷擴展,除了基礎的抓取—放置操作之外,還包括依賴單點接觸實現複雜運動的單點接觸滑動操作、推拉操作、僅依靠單手完成物體旋轉的手內操作,以及開關閥門、抓取物體、使用工具等更豐富的靈巧操作。複雜對象與多樣任務的疊加,使機器人在與物理世界互動時面臨建模困難、不確定性高、擾動大和感知能力受限等挑戰。表I 靈巧操作的資料採集範式表I 對靈巧運算元據採集範式做了系統梳理,整體可分為三類:模擬平台、人類示教和遙操作示教。其中,模擬平台側重於以大規模、低成本方式生成訓練資料,代表性工作包括 GraspM³、RoboGen、DexGraspNet、GRPtopia,能夠提供百萬級抓取軌跡、多類別物體資料以及多樣化任務與場景,但這類資料仍面臨從模擬走向真實世界的遷移問題。人類示教部分則更強調從真實人類操作中獲取先驗,Videodex、VTDexManip、ActionSense 等方法開始引入視覺、動作、觸覺、本體感覺、肌電與眼動等資訊,使資料更加貼近日常任務與真實互動過程。遙操作示教方面,Open-TeleVision、GR00T、DexCap、Mobile ALOHA、π0等系統展示了當前主流採集路徑,即通過 VR、動捕手套、多攝影機或全身遙作業系統將人的動作對應到機器人上。整體來看,這張表反映出靈巧運算元據採集正從單一模態、單一場景走向更大規模、更多模態和更複雜任務,但高品質多指靈巧手資料仍然稀缺,且現有遙作業系統普遍缺少力反饋,這也是後續學習框架受限的重要原因。圖4 Human-to-Robot Gap 手部對比圖圖4 主要說明,人手與現有多指靈巧手之間仍然存在明顯的 Human-to-Robot gap。圖中對比了人手、Allegro Hand 和 Shadow Hand三種形態,可以直觀看到,當前機器人手在手指尺寸、結構佈局和驅動整合方式上都與人手有較大差異。比如,Allegro Hand 只有四根手指,且單指尺寸明顯大於人類手指;而 Shadow Hand雖然手指更接近人手的細長形態,但其背後配有較大的驅動盒,會對整個手部的可達空間和臂手系統整合帶來負面影響。論文正文進一步指出,受限於當前機電系統在驅動—傳動效率、能量密度和有限空間內實現高自由度等方面的能力,機器人手仍難以達到人手的形態與功能水平。正因為這種結構與尺度上的差異,人類示教資料很難直接無縫遷移到機器人系統上,這也構成了靈巧操作學習中的一個關鍵瓶頸。表II 靈巧操作技能的學習框架表II 對靈巧操作技能的學習框架做了系統梳理,整體可分為兩大類:模仿學習和強化學習。其中,模仿學習部分既包括 DMP、SEDS、ProMP、TPGMM、KMP 這類基於軌跡表示與運動建模的方法,也包括行為克隆、逆強化學習、GAIL、AIRL 等框架。表中可以看到,這一方向正逐步從單純復現示教軌跡,轉向結合視覺、觸覺、本體感覺、力資訊的多模態學習,例如 DIME、DIH-Tele、ViTacFormer、DexForce、DexSkills等方法都在嘗試把人類示教與機器人手部動作、觸覺特徵或接觸力資訊結合起來。強化學習部分則覆蓋了Bi-DexHands、Unidexgrasp++、Tactile-AIRL、DexTouch、VTAO-BiManip、DAPG、DexH2R、LEGION等代表性方法,重點體現出幾個趨勢:一是借助高保真模擬平台和大規模任務集提升訓練效率,二是將視覺—觸覺聯合感知引入策略學習,三是通過少量人類示教、動作重新導向、語言嵌入和終身學習增強策略的泛化與遷移能力。整體來看,這張表反映出靈巧操作學習正從單一模態、單一任務,走向多模態融合與更強泛化能力。圖5 挑戰與新趨勢總圖圖5 是全文對靈巧操作學習瓶頸與未來方向的集中總結。作者將當前挑戰概括為三點:第一,多指靈巧手高品質資料集不足。模擬資料存在 Sim-to-Real gap,人類示教資料又面臨 Human-to-Robot gap;同時,現有大多數資料集仍圍繞簡單夾爪建構,而基於多指靈巧手的高品質資料稀缺,現有遙操作採集系統還普遍存在僅依賴視覺反饋、缺少力覺/觸覺資訊、時延較高等問題。第二,靜態學習框架魯棒性不足。當前基於強化學習或模仿學習的框架難以在學習過程中動態調整技能,也難把人類糾錯與偏好有效納入閉環,因此一旦面對新環境或新任務,性能容易明顯下降。第三,端到端學習框架泛化能力不足,不僅可解釋性弱,也難以處理長時序、多階段任務。基於這些問題,提出三條新趨勢:建構高自由度、力—觸覺緊耦合的敏捷遙作業系統,引入基於人類剛度意圖反饋的技能遷移與持續進化機制,以及發展融合多模態感知與層級決策的混合智能框架。 (AI工業)
機器人——靈巧手感測系統及零部件
01先搞懂:靈巧手就像 “迷你人體手”,3 部分缺一不可你用手抓杯子、擰瓶蓋,靠的是 “皮膚感知輕重、骨頭支撐動作、外套保護手”—— 機器人靈巧手也一樣!它核心就 3 個部分:感測系統(相當於人的感官)結構件(相當於人的骨架關節)外殼(相當於人的皮膚外套)這三部分湊一起,才能讓靈巧手不 “瞎抓”、不 “散架”、不怕壞,今天咱們用 “嘮家常” 的方式,把這三部分講明白!02感測系統:靈巧手的 “觸覺 + 眼睛”,讓它知道 “抓的是啥、用多大力”你閉著眼睛也能摸出手裡是蘋果還是橙子,靠的是皮膚和神經 —— 感測系統就是靈巧手的 “神經和觸覺”,幫它 “感知世界”,主要干兩件事:1. 摸出 “輕重軟硬”,不捏碎東西比如抓雞蛋,靈巧手得知道 “勁大了會碎”,這就靠壓力感測器和力矩感測器:壓力感測器像 “電子皮膚”,貼在手指上,一碰到雞蛋就知道 “那個位置受力了、受力多大”,就像你手摸雞蛋能感覺 “殼很薄”;力矩感測器更厲害,能算清 “六個方向的力”,比如抓雞蛋時,既能感知 “雞蛋有多重”(向下的力),又能知道 “會不會滑掉”(左右的力),避免手一歪雞蛋摔了。2. 看清 “在那、是啥樣”,不抓空你抓杯子前得先看到杯子在那,靈巧手靠光學感測器和磁感感測器:光學感測器像 “小手電筒”,發射光碰到物體反射回來,就能算出 “杯子在桌子左邊還是右邊、是圓的還是方的”,不會伸手抓空;磁感感測器藏在關節裡,就像你知道 “手指彎了 90 度”,它能精準告訴靈巧手 “關節轉了多少度”,比如擰瓶蓋時,知道 “轉半圈夠了”,不會多轉擰壞。簡單說,沒有感測系統,靈巧手就是 “瞎使勁”—— 要麼捏碎雞蛋,要麼抓不到杯子!03結構件:靈巧手的 “骨頭 + 肌腱”,撐住動作還傳勁你能彎手指、握拳,靠的是骨頭和肌腱 —— 結構件就是靈巧手的 “骨架”,負責 “撐起來” 和 “傳動力”,主要有三類:1. 傳動件:像 “肌腱”,把勁傳到指尖比如電機轉起來,得把 “轉勁” 變成 “手指彎的勁”,就靠這三種:腱繩:跟你手上的肌腱一樣,用細繩子繞過 “小滑輪”,一拉繩子手指就彎,輕便靈活,適合抓輕東西;連桿:像摺紙一樣,用小桿桿串起來,一推一拉手指就動,能扛勁,抓重點的零件也不怕;齒輪:就像玩具車的齒輪,咬合著轉,轉多少圈手指動多少,穩當耐用,適合反覆做一個動作。2. 關節件:像 “指關節”,讓手指能彎能轉靈巧手的手指也有關節,就是一個個帶軸承的小軸,能繞著轉,還不會 “轉過頭”—— 比如手指最多彎 90 度,關節就有 “限位”,不會彎到斷,跟你手指不會向後彎一樣。3. 支撐件:像 “手掌骨頭”,把零件固定住靈巧手內部有電機、感測器、電線,得有個 “架子” 把它們裝起來,這就是支撐件。用的材料又輕又結實(比如鋁合金、碳纖維),不然手指太重了彎不動,還得留好 “電線通道”,不然線纏在一起就壞了。簡單說,結構件要是不好,靈巧手要麼 “散架”,要麼 “動不了”—— 就像人骨頭斷了沒法握拳一樣。04外殼:靈巧手的 “皮膚 + 外套”,保護還防滑你手上的皮膚能保護肉,戴手套能防滑 —— 外殼就是靈巧手的 “保護殼 + 手套”,作用可不小:1. 保護內部零件:防摔防髒靈巧手內部的電機、感測器都很 “嬌貴”,外殼能擋住灰塵、水漬,還能防碰撞 —— 比如不小心碰到桌子,外殼先 “扛一下”,內部零件就不會壞,跟你戴手套搬東西不會磨到手一樣。2. 幫著抓穩東西:防滑貼合外殼的形狀和材質都有講究:手指部分會做成 “弧形”,剛好貼住杯子、球這些圓東西,不會滑;表面會用橡膠或者刻上小紋路,增加摩擦力,抓玻璃杯子也不怕滑掉,就像你手上有紋路能抓穩東西。3. 輕便好看:不添負擔外殼不會做太重,不然手指動起來費勁,顏色也會跟機器人搭配 —— 家用機器人的靈巧手可能是白色的,看著親切;工業用的可能是深色的,耐髒。簡單說,沒有外殼,靈巧手內部零件容易壞,抓東西也老滑,跟你沒皮膚保護手、沒手套抓不住滑東西一樣。05總結:3 部分配合好,靈巧手才好用其實靈巧手一點都不複雜:感測系統 “感知”,告訴結構件 “咋動、用多大力”;結構件 “執行”,在外殼保護下完成抓握;外殼 “保護 + 輔助”,讓整個過程穩當順暢。現在的靈巧手能抓雞蛋不碎、擰瓶蓋不傷瓶,就是這三部分 “配合得好”。未來說不定還能彈琴、畫畫,跟人手一樣靈活! (迪普戰略研究所)
15秒售罄!突然火了,樣機都賣完了!網友:急需!
爬樓「神器」產品開賣上架僅15秒就宣告售罄!不少網友驚呼:未來已來!售價2500元幾百台現貨“秒空”“市場的火爆程度遠超我們的預期,連樣機都賣完了。”最近,杭州程天科技發展有限公司(以下簡稱「程天科技」)在購物平台上架了一款售價2,500元的消費級外骨骼機器人,面向個人用戶銷售。這次的「秒空」外骨骼助行器。程天科技創始人張繼宇表示,本來抱著試一試的心態,準備了幾百台現貨,沒想到“秒空”,“現在還有幾百人正在排隊預訂下一批。”在這波認購大軍中,既有幫家中老人購買的中青年,也有因為運動傷害導致膝關節或髖關節疼痛的年輕人,還有不少感覺自己體能下降但又熱愛旅遊的退休中老年人群。張繼宇也表示,工作日常有人在公司門口詢問能不能試用外骨骼,一天下來問的人有十幾個。據介紹,如果走一萬步,這款外骨骼助行器可以幫助穿戴者節省約百分之十幾的體力,助力可以達到十幾扭力,相當於抵消兩大瓶可樂的重量。有穿戴者表示,“穿上之後感覺有點像踩了彈簧,走路爬樓都會感覺省力一些。不過,距離變身'鋼鐵俠',在台階上瞬間健步如飛,還有一定的進步空間。”網友評論:「急需」!「登山神器」已出圈今年春節期間,由泰山文旅集團和深圳市肯綮科技有限公司共同開發的登山輔助機器人首次在泰山景區內試用。登山輔助機器人是一款針對幫助遊客攀登泰山的外骨骼機器人同時也可廣泛應用於登山、健身、跑步日常行走、上樓等生活和工作領域。機器人自重僅1.8kg,完全不會造成使用者額外負擔。近日,某旅遊網聯合科技企業推出智慧助行外骨骼設備,首批已在廬山等景區投入使用,計畫年內擴展至全國25家山嶽型景區。該設備透過馬達驅動髖關節輔助發力,最高可降低30%登山體能消耗,延長遊覽時間為1.5小時,被遊客稱為「登山動力裝甲」。近期,在多個景區已出現類似產品的身影。靈巧手也要來了機器人領域最近可是相當熱鬧!除了外骨骼,還有靈巧手、電子皮膚等一系列新產品走進視野。4月1日,宇樹科技更新視頻,發布Unitree Dex5靈巧手。性能上,此靈巧手具備單手20自由度(16主動+4被動),能柔順絲滑反向驅動(直接本體力控),以及單手94個靈敏接點。招商證券指出,靈巧手為人形機器人與外界互動的重要媒介,是機器人功能性的直接體現,其價值量佔比高,預計特斯拉Optimus靈巧手價值量佔14.0%。從人類演化來看,手將是科技突破的關鍵一步,也將加速通用機器人「ChatGPT時刻」到來。 (金華晚報)