“一台人形機器人每小時大約要走 5,000 步。每一步都會向腿部執行器傳遞相當於體重 2–3 倍的衝擊——這種力如果只是偶爾出現並沒有問題,但如果連續數千次、毫不停歇地重複,就會變成破壞性的載荷。正是這種無情的工作循環,導致大多數執行器在人形機器人中失效,也解釋了為什麼最終收斂到了相同的工程解法。
關鍵在於,由於這種衝擊發生得比任何感測器閉環都更快(亞毫秒級),執行器必須在機械上具備‘讓步’的能力(可反驅性,back-drivability),以吸收這部分能量。如果執行器在機械上是自鎖的——比如大多數工業絲槓——那麼減速箱就會被迫吸收 100% 的衝擊能量,從而導致立即發生剪下失效。”
—— Robbie Dickson,Firgelli Automations
目錄
01. 行走問題:為什麼人形機器人會損壞執行器
02. 質量懲罰螺旋
03. 收斂解法:為什麼每個主要玩家都選擇了同一條路徑
04. 減速比的權衡
05. 機器人腿部內部的熱現實
06. 控制架構:從 PWM 到力矩控制
07. 柔順性與串聯彈性
08. 感測與反饋
09. 為什麼傳統工業執行器會失效
10. 總決策矩陣:將技術與任務匹配
11. 人形機器人關節執行器的設計要求
12. 未來:人工肌肉及更多方向
參考資料與延伸閱讀
關於作者
01 行走問題:為什麼人形機器人會損壞執行器
疲勞的數學:為什麼是 5,000 步?
我們說一台人形機器人每小時大約走 5,000 步,並不是把它作為理論最大值,而是作為商業可行性的基線。雖然人類快走時的步頻約為每分鐘 120 步,但倉儲機器人瞄準的是一種可持續、審慎的步速,大約為每秒 1.4 步(每分鐘 84 步),以在速度與穩定性之間取得平衡。
這個計算揭示了工程挑戰的嚴峻程度:
84 步/分鐘 × 60 分鐘 ≈ 每小時 5,040 次衝擊
在一個 8 小時班次中,這會累計超過 40,000 次載荷循環。僅僅運行一個月,人形機器人的腿部就要承受大約一百萬次循環——這條疲勞時間線,把標準工業磨損中需要數年才會出現的情況,壓縮到了短短幾周之內。
但頻率只是問題的一半。另一半是載荷的幅值。這 5,000 步中的每一步,都會把相當於體重 2–3 倍的衝擊沿著腿部執行器向上傳遞。這些力如果只是偶爾出現並沒有問題,但如果連續數千次、毫不停歇地重複,就會變成破壞性載荷。正是這種無情的工作循環,導致大多數執行器在人形機器人中失效,也解釋了為什麼最終倖存下來的方案都收斂到了相同的工程解法。
關鍵在於,由於這種衝擊發生得比任何感測器閉環都更快(亞毫秒級),執行器必須在機械上具備“讓步”的能力(可反驅性,back-drivability),以吸收這部分能量。如果執行器在機械上是自鎖的——比如大多數工業絲槓——那麼減速箱就會被迫瞬間吸收 100% 的衝擊能量,從而導致立即發生剪下失效。
運輸成本:真正重要的效率指標
工程師使用運輸成本(Cost of Transport,CoT)來衡量運動效率——它是一個無量綱比值,用於表示在一定距離內移動一定重量所消耗的能量:
`CoT = 能量 /(重量 × 距離)`
這裡隱藏著一個根本性挑戰:輪式車輛的 CoT 值可以做到 0.01–0.05,而雙足機器人通常落在 0.2 到 0.5 之間。這意味著它們差了 10 到 50 倍。
對於執行器設計來說,這意味著每一克質量都會直接增加 CoT。機器人每走一步,都必須抬起並加速這部分質量。更重的執行器不只是增加重量——它們還會放大運動的能耗。一個能夠產生 10,000N、但重量為 5kg 的執行器,在人形機器人的腿部中往往毫無用處。一個能夠以 800g 重量產生 4,000N 的執行器,則可能改變整個行業。
靜態力與動態衝擊
舉起一個重量和接住一個正在下落的重量之間,存在一個關鍵差異。工業執行器通常按照靜態或准靜態載荷來標定——也就是緩慢施加的力,機械系統有充足時間來分散應力。
行走完全不是這種情況。在步態的腳跟著地階段,一個 70kg 的人形機器人會在大約 50–100 毫秒內承受 1,400–2,100N 的力。
目錄額定值:假設的是穩定提升。
現實情況:每小時 5,000 次接住一個正在下落的重量。
一個額定靜載為 5,000N 的滾珠絲槓,在反覆承受 2,000N 動態衝擊時,往往會發生災難性失效,因為內部滾珠軸承可能會在衝擊載荷下使滾道產生布氏壓痕(brinell,即凹陷)。
行走步態中顯示衝擊載荷的地面反作用力曲線
力矩與力:架構決策
在我們能夠明確執行器要求之前,必須先回答一個基本設計問題:這個關節是由旋轉執行器驅動,還是由線性執行器驅動?
對於人形機器人的主要關節——髖、膝、踝、肩、肘——旋轉執行器佔據主導地位。這類執行器通常將無刷電機與稀土磁體結合,用於實現高功率旋轉輸出。執行器直接輸出力矩。一個 70kg 人形機器人的髖關節,在爬樓梯或從深蹲姿態起身時,可能需要 100–150 Nm 的峰值力矩。這裡的關鍵指標是力矩密度(Nm/kg),設計挑戰集中在管理反射慣量,以及通過齒輪傳動鏈維持可反驅性。
線性執行器承擔的是另一類角色——用於更小的次級運動,在這些運動中,緊湊封裝比高力矩更重要。手指驅動是最清晰的例子:微型線性執行器可以安裝在前臂內部,通過肌腱或連桿驅動每根手指。頭部平移/俯仰機構和軀幹關節也是其他候選場景。在這裡,輸出的是力,而要讓一個關節旋轉,這個力必須通過一個力臂發揮作用——也就是執行器作用線到轉軸之間的垂直距離:
`τ = F × d`
其中,τ 是關節力矩(Nm),F 是執行器力(N),d 是執行器作用線到關節轉軸之間的垂直距離(m)。
Tesla Optimus、Figure、Agility Digit、Unitree 和 Boston Dynamics 都在主要腿部與手臂關節上使用旋轉執行器。它們之間的差異在於具體的減速箱拓撲、滾柱絲槓設計和控制架構,而不在於是否為主要關節選擇線性而不是旋轉方案。
展示人形機器人上旋轉執行器與線性執行器應用的示意圖
真正的指標:比力矩與比推力
考慮到質量懲罰,人形機器人執行器的關鍵性能指標是單位質量輸出。對於驅動主要關節的旋轉執行器,這個指標是比力矩(Specific Torque,Nm/kg)。對於次級應用中的線性執行器,這個指標是比推力(Specific Force,N/kg)。
- 比力矩 = 峰值力矩輸出(Nm)/ 執行器質量(kg)
- 比推力 = 峰值力輸出(N)/ 執行器質量(kg)
要讓人形機器人的腿部執行器具備可行性,比力矩通常需要超過 10 Nm/kg,而線性執行器的比推力應超過 4,000 N/kg。大多數工業執行器都遠低於這些門檻——因此會立即被排除在嚴肅考慮之外。
行走的物理規律形成了一道篩選器,只有某些機械設計才能通過這道篩選器。這道篩選器,以及無法通過它時產生的一連串後果,就是我們所說的質量懲罰螺旋。
02 質量懲罰螺旋
質量懲罰是人形機器人執行器設計中最無情的約束——它同樣適用於旋轉系統和線性系統,儘管在兩者中的表現方式不同。
當一個執行器過重時,機器人並不只是多背了一些額外重量。它會進入一個復合循環,把最初的問題不斷放大。這不是線性關係,而是指數關係。
“指數級”計算(示例推演)
設想一名設計師選擇了一個更便宜但更重的執行器,用在踝關節上,而這個執行器超重了 200g。
- 第 1 步(踝關節):腳部增加 +200g。
- 第 2 步(膝關節):膝關節執行器現在必須在一個槓桿臂(小腿)的末端抬起這 200g。為了應對增加的力矩,膝關節執行器必須放大規格,增加 +350g。
- 第 3 步(髖關節):髖關節執行器現在既要抬起更重的腳部(+200g),又要抬起更重的膝關節(+350g)。它必須放大規格,增加 +600g。
- 第 4 步(電池):為了給這些更大的電機供電,電池包增加 +150g。
結果:一個在元件層面 200g 的錯誤,變成了系統層面 1.3kg 的懲罰。機器人現在更慢、效率更低,也更容易受到衝擊損傷。
一個圓形示意圖,展示人形機器人設計中的“質量懲罰反饋回路”,說明一個執行器中微小的重量增加,如何通過更重的肢體、更大的電機和更大的電池層層放大,最終形成顯著的總質量懲罰。
懲罰如何不同:旋轉與線性
1. 旋轉執行器(“反射慣量”陷阱)
對於主要關節(髖、膝、踝、肩、肘)上的旋轉執行器,質量會通過反射慣量(Reflected Inertia)扼殺性能。反射慣量指的是,當外力(比如地面)試圖移動關節時,關節所感受到的阻力。
輸出端反射電機慣量的公式為:
`Joutput = Jrotor ×(減速比)²`
注意這裡的平方。一個 100:1 的減速箱並不只是把力矩放大 100 倍;它還會把輸出端看到的電機自身慣量放大 10,000 倍。
這意味著,當機器人的腳接觸地面時,地面會試圖反向驅動電機。在高減速比下,腿部會“感覺到”電機正在旋轉的轉子彷彿比實際重了 10,000 倍。這會產生很高的機械阻抗——腿部表現得像一塊堅硬的磚,而不是一根彈簧,把衝擊載荷直接傳遞到齒輪齒面,並導致剪下失效。
這就是為什麼現代人形機器人努力採用低減速比(6:1 到 30:1)的準直驅(Quasi-Direct Drive,QDD)執行器,而不是高減速比工業減速箱。更低的減速比意味著更低的反射慣量、更好的可反驅性,以及能夠在衝擊下優雅“讓步”的執行器。
2. 線性執行器(“質量分佈”陷阱)
對於用於次級應用的線性執行器(手指、頭部定位、軀幹關節,以及在某些設計中的踝關節),懲罰更多體現在質量分佈上,而不是反射慣量上。
一個放在前臂中用於驅動手指肌腱的重型線性執行器,會把手臂的質心向遠端移動(朝向手部)。前臂中每增加一克重量,都會被整條手臂這個槓桿放大——肩部和肘部旋轉執行器現在必須輸出更多力矩,才能移動手臂。
近端驅動(Proximal Actuation)原則在這裡適用:把重型部件儘可能安裝在靠近身體中心的位置。一個重型執行器放在軀幹裡是可控的;一個重型執行器放在手裡則是一場災難。這也是為什麼手指驅動通常使用安裝在前臂中的小型輕量化微型線性執行器,並通過肌腱或連桿把力傳遞到手指。
級聯失效
剛進入人形機器人設計的團隊,經常會犯一個致命錯誤:根據靜態載荷計算,再加上一個“安全係數”來選擇執行器。
- 他們計算靜態保持力矩。
- 他們加入 2× 安全裕度。
- 他們選擇一個重型工業執行器來匹配。
結果就是,機器人太重,無法進行動態行走。它像是在空氣中“涉水”前進,僅僅為了支撐自己的肢體就在燃燒電池。這個項目要麼接受糟糕的性能,要麼從零開始重做。
打破循環:目標規格
逃離這個螺旋的唯一辦法,就是從第 1 天開始嚴格執行密度目標:
- 旋轉執行器(主要關節):目標比力矩 >10 Nm/kg
- 線性執行器(次級運動):目標比推力 >4,000 N/kg
不存在“以後再升級”這回事。質量預算是由執行器決定的。如果在執行器層面選錯了,那麼其他地方再怎麼最佳化,也救不了這個設計。
03 收斂解法:分體式架構
當 Tesla、Figure 和 Apptronik 等公司專注於打造高負載通用人形機器人時,它們各自獨立地走向了同一種執行器架構。類人力量與耐久性的約束,迫使設計者走向一種戰略性分工:對於主要執行旋轉運動的關節,使用旋轉執行器;對於必須吸收重衝擊載荷並舉起顯著重量的關節,使用線性執行器。
這並不是唯一可行的架構。Unitree 的 H1 和 G1 在膝關節與髖關節上使用高力矩旋轉電機,優先考慮速度和動態跳躍,而不是靜態多載舉升。Agility 的 Digit 使用帶彈簧和繩索傳動的串聯彈性執行器(Series Elastic Actuators)——這是一種不同的方法,我們將在第 VII 節中展開。Boston Dynamics 的電動 Atlas 則代表了另一種變化。
但對於那些被設計來與人類協同工作、搬運負載並在工業環境中運行的人形機器人來說,旋轉-線性分工已經成為主導模式。要理解為什麼,需要先理解每種執行器類型內部到底有什麼。
旋轉執行器內部:應變波齒輪
對於那些主要執行旋轉運動的關節——肩部、手腕、髖部旋轉——現代旋轉執行器圍繞應變波齒輪(Strain Wave Gearing,通常也被品牌名“Harmonic Drive”稱為諧波減速器)建構,並與高密度無框電機配合使用。
不同於標準齒輪依靠剛性齒與剛性齒齧合,應變波齒輪依靠金屬的彈性變形(彎曲)來傳遞運動。它是精密機器人行業的標準方案,因為它極其緊湊、輕量,並且能夠實現零背隙。
三個組成部件
一個應變波齒輪只由三個部件組成:
- 波發生器(輸入端):一個與電機軸相連的橢圓形(卵圓形)塞體。
- 柔輪(輸出端):一個帶有外緣齒的薄壁柔性金屬杯。由於它很薄,因此能夠貼合其內部橢圓塞體的形狀。它的齒數略少於外圈——通常少兩個齒。
- 剛輪(固定端):一個內側帶齒的剛性外環。
一張技術爆炸圖,展示高精度機器人執行器中使用的應變波齒輪(通常稱為諧波減速器)的三個核心部件。圖中展示了橢圓形波發生器(輸入端)、柔性金屬柔輪杯(輸出端)以及固定剛性剛輪環的裝配順序。
它如何工作
- 變形:橢圓形波發生器將柔性柔輪向外撐開,迫使其齒在橢圓的兩個長軸端與外部剛輪齧合。
- 旋轉:隨著波發生器旋轉,齧合的“波”會沿圓周傳播。
- 減速:由於柔輪的齒數少於外圈,因此它不會在輸入端每轉一圈時完成一整圈旋轉。相反,它會沿著與輸入方向相反的方向緩慢“爬行”。
結果是:電機高速旋轉,但齒輪輸出端以較低速度旋轉,同時實現巨大的力矩放大——單級傳動中通常可以達到 50:1 到 100:1。
為什麼人形機器人使用應變波齒輪
- 零背隙:在普通齒輪中,齒與齒之間存在微小間隙(松曠)。在機器人中,這會導致抖動和不精確的運動。而在應變波齒輪中,柔性金屬被預緊並緊貼外環,從而形成零游隙。這讓機器人的運動更加平滑和精確。
- 高力矩密度:相對於其小尺寸和輕重量,它可以產生巨大的旋轉力——這對於保持肢體質量較低至關重要。
- 單級減速:它能在單級中實現高減速比,使執行器保持扁平、緊湊,形狀像冰球一樣。
效率權衡:金屬的彎曲會產生內部的分子摩擦,從而產生熱量。應變波齒輪的效率低於行星齒輪箱——這是熱管理中的一個關鍵因素,我們將在第 V 節中討論。
應變波齒輪 vs. 標準行星齒輪
線性執行器內部:行星滾柱絲槓
對於那些必須吸收重衝擊載荷的關節——膝、肘、踝——面向負載用途設計的人形機器人會使用圍繞行星滾柱絲槓建構的線性執行器。這些執行器輸出推拉運動(線性輸出),而不是旋轉運動,類似於你的股四頭肌伸展膝蓋的方式。
線上性執行器內部:
- 無框力矩電機:定子保持固定,而轉子驅動螺母旋轉。
- 反置式行星滾柱絲槓:帶螺紋的滾柱在旋轉螺母內部環繞運行。當螺母旋轉時,中央絲槓軸被迫以線性方式伸出或縮回。
結果就是一個圓柱形管狀結構(在 Tesla 原型機上通常為金色陽極氧化外觀),絲槓軸從一端伸出。電機殼體保持靜止,而軸發生移動。
一張剖檢視,展示人形機器人線性執行器中使用的反置式行星滾柱絲槓機構。圖中顯示一個金色圓柱形外殼,其中包括固定的電機定子、旋轉的內部螺母,以及迫使中央絲槓軸線性伸出的帶螺紋滾柱。箭頭表示從旋轉運動到線性運動的轉換。
為什麼是滾柱絲槓,而不是滾珠絲槓?
滾珠絲槓在工業機械中無處不在——數控機床、注塑成型、精密定位系統都會使用它。為什麼人形機器人不使用它們?答案在於接觸幾何,以及這種幾何形態如何應對衝擊載荷。
滾珠絲槓使用球形滾珠在溝槽中滾動。每個滾珠都與滾道形成點接觸——這是一個極小的接觸斑點,會集中赫茲應力。
滾柱絲槓使用帶螺紋的滾柱,沿著自身長度形成線接觸。這會把載荷分佈到大得多的表面積上——通常比同等尺寸滾珠絲槓的接觸面積大 10–15 倍。
一張技術圖,對比執行器中的接觸力學。左側:一個滾珠絲槓,顯示球形滾珠與一個小的紅色“高應力”點接觸。右側:一個行星滾柱絲槓,顯示帶螺紋滾柱與一條較長的黃色“分佈式應力”線接觸。該圖說明了為什麼滾柱絲槓相比滾珠絲槓具有更高承載能力和更強抗衝擊能力。
布氏壓痕問題
當人形機器人的腳撞擊地面時,這種衝擊會通過踝關節和膝關節執行器向上傳遞。這是一種衝擊載荷——一個突然而來的力峰值,遠遠超過靜態額定值。
在衝擊載荷下的滾珠絲槓中,每個滾珠與滾道之間的點接觸會經歷極高的赫茲應力。如果這種應力超過材料的屈服強度,滾珠就會在滾道上製造一個微小的永久凹痕。這被稱為布氏壓痕(Brinelling)。
一個凹痕本身幾乎無法察覺。但一台人形機器人每小時要走 5,000 步。每一步都會增加更多微觀損傷。經過數天或數周後,滾道會變得粗糙,背隙會增加,效率會下降,最終絲槓會徹底失效。
滾柱絲槓能夠存活下來,是因為線接觸即使在反覆衝擊載荷下,也能將峰值赫茲應力保持在屈服閾值以下。同樣的衝擊載荷,可能在幾周內摧毀滾珠絲槓,卻能被滾柱絲槓吸收數年。
“一個額定壽命為 1,000 萬次循環的滾珠絲槓,在行走衝擊載荷下可能只運行 100,000 次循環就會失效。這個額定值假設的是平滑、單向的受力條件——而這些條件在人形機器人腿部中從不存在。”
戰略性分工:讓執行器匹配應用
沒有那一種執行器類型能夠適用於所有地方。每個關節的物理特性決定了選擇:
應變波齒輪擅長實現零背隙旋轉,但其柔性金屬部件在反覆衝擊載荷下可能發生疲勞,並且較低效率會產生熱量。行星滾柱絲槓擅長以高力密度吸收線性衝擊,但不能高效地產生旋轉。
對於那些被設計來舉升、搬運和工作的機器人來說,收斂解法就是:在每一種執行器最擅長的地方使用它。這就是為什麼 Tesla、Figure 和 Apptronik 的機器人在“皮膚之下”看起來很相似。當負載能力是優先事項時,物理規律給替代架構留下的空間非常有限。
04 減速比的權衡
機器人學中的根本悲劇在於:電機和生物肢體想要的是相反的東西。高效率電機最舒服的工作狀態,是以 3,000+ RPM 的轉速高速旋轉,並輸出較低力矩。而一個人類膝蓋在上樓梯時,大約以 30 RPM 運轉,同時需要巨大力矩。
為了跨越這 100 倍的差距,工程師會使用齒輪減速。但齒輪傳動並不是免費的午餐。它會引入一種懲罰,而且這種懲罰不是線性增長,而是指數級增長:反射慣量。
N² 陷阱:反射慣量
如果你給一台電機加上一個 100:1 的減速箱(N=100),你會把輸出力矩放大 100 倍。這是好消息。
壞消息是,慣量——也就是抵抗速度變化的能力——會按照減速比的平方(N²)放大。
`Jreflected = Jmotor × N²`
對於一個 100:1 的減速箱來說,電機自身慣量對於輸出軸來說,會顯得重了 10,000 倍。
為什麼這對行走很重要
當機器人的腳踩到一個意外障礙物——一塊石頭、台階邊緣、地板上的電纜——腿部需要瞬間讓步,以吸收衝擊。如果減速比過高,電機的反射慣量就會大到讓腿部無法足夠快速地加速躲開。
腿部表現得像一根堅硬的鋼桿,而不是有彈性的肌肉。衝擊力會急劇飆升,而且齒輪齒常常會被剪斷。
這就是為什麼反射慣量方程可以說是執行器設計中最重要的公式。它決定了你的機器人是優雅地行走,還是在第一次接觸真實世界時就爆裂失效。
透明性光譜
這會形成一個基於“透明性”的設計光譜——也就是電機能夠多好地通過齒輪“感知”來自環境的力,以及環境能夠多容易地反向帶動電機。
你可以把它想像成一道防火牆:高減速比會在兩個方向上阻斷資訊。電機感受不到世界,世界也無法帶動電機。這保護了電機,但也讓控制系統變得“失明”。
一張示意圖,展示反射慣量方程()。圖中顯示一個小型電機輸入經過減速箱後,在輸出軸上形成大幅增加的等效質量,展示了力矩與靈活性之間的權衡。
兩種相互競爭的方案
1. 準直接驅動(Quasi-Direct Drive, QDD)——“獵豹”路線
- 採用者:Unitree(H1、G1)、MIT Mini Cheetah、動態跳躍機器人。
- 策略:使用一種大型、扁平的“煎餅形”電機,並搭配非常低的減速比(6:1 到 10:1)。
- 優勢:機器人天然具有“彈性”。你可以抓住它的肢體並自由移動——電機會以極小阻力隨之轉動。機器人可以僅通過監測電機電流來檢測地面接觸,不需要昂貴的力感測器。由於低反射慣量允許快速加速,衝擊也能被吸收。
- 取捨:由於減速機構提供的機械優勢很少,電機必須在物理尺寸上做得很大、很重,才能產生足夠的扭矩。它在保持靜態姿態時會消耗巨大的電流,比如靜止站立或抱住一個箱子,並產生大量熱量。
2. 高減速執行器(High-Reduction Actuators)——“搬運工”路線
- 採用者:Tesla Optimus、Figure、Apptronik Apollo、工業型人形機器人。
- 策略:使用更小、更高速的電機,並搭配高減速比(50:1 到 160:1),例如應變波齒輪(Strain Wave Gears,也就是 Harmonic Drives)或行星滾柱絲槓(Planetary Roller Screws)。
- 優勢:在緊湊、輕量化的封裝中實現巨大的力量。機器人可以搬起重箱子、負載爬樓梯,並且在不讓電機繞組過熱的情況下保持位置。維持靜態姿態所需的電流更少。
- 取捨:執行器在機械上是“不透明”的。由於齒輪的摩擦和慣量,電機無法透過傳動機構感知來自環境的力。為了實現柔順性,這類機器人需要在輸出軸上配置專用扭矩感測器(應變片),並配合複雜的軟體來模擬 QDD 機器人“天然免費”獲得的彈性感。
QDD 與高減速:取捨總結
甜點區困境
設計者一直在尋找“黃金減速比”——對於通用人形機器人來說,通常在 30:1 到 50:1 之間——在這個區間內,執行器既足夠強,可以舉起有效載荷,又足夠透明,可以安全行走。
- 過低(<10:1):機器人敏捷但力量弱。僅僅是站立不動也會過熱,因為電機必須直接輸出全部扭矩。
- 過高(>100:1):機器人強壯但危險。它無法感知衝擊,運動僵硬,並且齒輪會在衝擊載荷下把自己磨壞。
- 甜點區(30:1–50:1):有足夠的扭矩放大能力,可以搬運有用負載;同時反射慣量又足夠低,可以保留一定柔順性,並在衝擊中存活下來。
可反驅性:安全性測試
一個簡單測試就能揭示某個執行器處在這條光譜的那個位置:你能不能抓住機器人的手並移動它?
- 高齒輪比:不能。關節感覺像被鎖住。斷電時,機器人會保持原位。系統需要力感測器來檢測你的觸碰。
- 低齒輪比:可以。關節可以自由移動。你推動時,電機會反向旋轉。機器人本質上“知道”你在那裡,因為它能感受到電流變化。
這個差異對安全性極其重要。一個可反驅的機器人絆倒時,會塌縮並吸收跌倒衝擊。一個不可反驅的機器人絆倒時,會像倒下的雕像一樣砸向地面,或者砸向附近的人。
“齒輪比的決策會迴響在機器人行為的每一個方面——它如何行走,如何跌倒,摸起來是什麼感覺,以及最終會產生多少熱量。最後一點將把我們帶到下一個關鍵約束:熱管理。”
05 機器人腿部內部的熱現實
如果說齒輪傳動和慣量定義了機器人如何運動,那麼熱力學則定義了它能工作多久。人形機器人規格參數中一個骯髒的秘密,是“峰值扭矩”和“連續扭矩”之間存在巨大差距。一個機器人也許被標稱為可以舉起 50kg,但從熱角度看,它也許只能維持這個負載 15 秒,之後執行器就會把自己烤壞。
這不是一個小的工程細節——它是區分實驗室演示和商業產品的關鍵因素。
“零轉速”問題
這一熱挑戰源於生物體和機電系統之間的一個根本差異。
- 當你鎖住膝蓋站立時,你的骨骼支撐了體重。你的肌肉只做很少的功。你的代謝成本接近於零。
- 當機器人彎曲膝蓋站立時,電機必須持續對抗重力。它沒有可以鎖定承力的骨骼結構。對於電機來說,保持靜態負載——也就是堵轉扭矩(stall torque)——是最嚴苛的狀態。
電機讓電流(I)通過銅繞組,以產生磁力。即使電機沒有旋轉,電流仍然會遇到電阻(R)。能量無處可去,只能轉化為熱,遵循焦耳熱定律:
`Pheat = I² × R`
由於熱量與電流的平方成正比,負載增加 2 倍,會導致發熱量增加 4 倍。
在深蹲姿態下——也就是人形機器人從地面搬起箱子時採取的姿態——膝關節執行器不像電機,更像烤面包機。它們在機械功為零的情況下產生最大熱量。
電機發熱量與速度關係圖。在零轉速(堵轉)時,所有電能都會轉化為熱量,為機器人製造出一種“烤面包機模式”。
熱懸崖:峰值扭矩 vs. 連續扭矩
這種物理規律製造了工程師所說的“熱懸崖”(Thermal Cliff)——也就是執行器短時間能做到的事情,與它能夠無限期持續做到的事情之間的巨大分界。
兩種扭矩額定值
- 峰值扭矩:電機在磁場飽和之前所能施加的最大力。這是行銷材料裡出現的數字。它只能維持幾秒鐘。
- 連續扭矩:電機在不熔化繞組絕緣層、不使永磁體退磁的前提下,可以無限期持續輸出的最大力。這才是工程現實。
在典型的風冷執行器中,連續扭矩通常只有峰值扭矩的 25%–30%。
想想這意味著什麼:如果一個機器人從深蹲狀態站起來需要 100 Nm 扭矩(峰值),但它只能連續維持 30 Nm,那麼它僅僅是在重力環境中存在,就必然會過熱。機器人可以在 30 秒視訊中展示令人印象深刻的動作,但它無法工作一個 8 小時班次。
熱失控
I²R 公式中隱藏著一個陷阱。銅的電阻會隨溫度升高而增加——大約每升高 1 攝氏度增加 0.4%。
隨著電機升溫:
- 電阻(R)增加;
- 在相同電流下,`Pheat = I²R` 會產生更多熱量;
- 溫度進一步升高;
- 電阻再次增加。
這個正反饋循環被稱為熱失控(thermal runaway)。如果沒有主動冷卻,最終會出現兩種結果之一:控制系統檢測到溫度並關閉電機(熱降額 / 熱限功率),或者繞組絕緣失效,電機被毀壞。
密封外殼問題
工業電機會用氣流解決這個問題。風扇讓空氣吹過帶散熱鰭片的外殼,把熱量帶走。有些電機甚至會針對特定氣流速度給出額定參數。
人形機器人執行器沒有這種奢侈條件。
電機被密封在結構外殼內部——也就是肢體本身內部。沒有空間放風扇。沒有外部氣流。執行器被放在一小團靜止空氣中,外面包著鋁和塑料,只能依靠傳導來散熱。
這被稱為全封閉非通風(Totally Enclosed Non-Ventilated, TENV)配置。它的熱路徑如下:
`銅繞組 → 定子疊片 → 電機外殼 → 肢體結構 →(最終)環境空氣`
這條鏈路上的每一個介面都會增加熱阻。通過強制風冷可以在毫秒級逃逸的熱量,在這裡需要數分鐘才能通過固體金屬傳匯出去。外殼變成了一座熱監獄。
機器人執行器橫截面圖,展示由於高熱阻,熱量被困在肢體結構內部,也就是所謂“熱監獄”。
示例計算:達到熱極限所需時間
考慮一個膝關節執行器,它在彎曲姿態下支撐 20kg 負載:
- 所需保持扭矩:80 Nm
- 電機連續額定值:25 Nm(在 25°C 環境溫度、帶冷卻條件下)
- 實際運行條件:腿部內部 40°C,無氣流
- 降額後的連續能力:約 18 Nm
- 80 Nm 所需電流:連續額定電流的 4.4 倍
- 發熱量:4.4² = 正常熱負載的 19 倍
結果:電機會在不到 2 分鐘內達到熱極限。機器人要麼必須站直,降低扭矩需求;要麼進入熱降額狀態。
這就是為什麼演示視訊中會展示機器人舉起重物幾秒鐘,然後鏡頭切走。熱現實遠沒有峰值能力看起來那麼令人印象深刻。
縮小差距:液冷
這個熱瓶頸解釋了為什麼 Tesla、Figure 以及其他正在開發商業化人形機器人的廠商,正在轉向液冷執行器。
通過讓介電油或水-乙二醇混合液流經加工在電機外殼中的通道——在某些設計中,甚至直接流過定子繞組——工程師可以以比單純空氣對流快 10 倍的速度帶走熱量。
這種“血管系統”使電機能夠在更高的連續電流下運行,把連續扭矩額定值從峰值扭矩的 25%–30%,提高到潛在的 60%–70%。
液冷的取捨
- 增加複雜度:泵、儲液罐、軟管、密封件、換熱器——這些都是潛在故障點。
- 重量懲罰:冷卻系統本身會增加質量,部分抵消小型電機帶來的好處。
- 洩漏風險:之所以選擇介電流體,正是因為它們即使洩漏也不會導致電子元件短路,但洩漏仍然會造成故障。
- 維護:流體會劣化,密封件會磨損,泵會失效——液冷會把機器人從一種密封電器,變成一個需要定期維護的系統。
儘管存在這些挑戰,但對於面向商業部署的人形機器人來說,液冷正在變得必不可少。一個倉儲機器人如果每工作 10 分鐘就必須“休息一下”來冷卻膝蓋,那麼在經濟上是沒有用的。
商業現實
人形機器人競賽的贏家,很可能會是最能解決 I²R 問題的公司。峰值扭矩能打動投資人。連續扭矩——也就是不發熱過載、可以全天工作的能力——才是產品成立的關鍵。
為什麼執行器設計決定機器人外觀
這種熱現實解釋了許多看似隨意的設計選擇:
- 鋁製外殼:高導熱性可以把熱量擴散到更大的表面積。
- 裸露金屬表面:機器人在需要輻射散熱的地方不會噴漆。
- 通風槽:即使是很小的開口,也能允許對流氣流通過。
- 粗壯的肢體輪廓:更多質量可以作為熱儲層,吸收熱衝擊。
- 可見管路:在關節之間運行的液冷管線。
每一台人形機器人,本質上都是一個恰好會走路的熱管理系統。電機只是熱源。其他一切——結構、外殼、冷卻系統——都是為了防止它們把自己毀掉而存在。
“規格表是在 25°C 環境溫度和自由對流條件下給電機標定的。在機器人腿內部,這兩個條件你都沒有。熱懸崖就是行銷遇上物理的地方——而物理永遠會贏。”
06 控制架構:從 PWM 到力矩控制
如果你推一下一台標準工業機械臂,它給人的感覺就像一堵磚牆。機械臂會剛性鎖住自己的關節,以維持空間中的某個特定坐標。如果你推得更用力,電機會更用力地反推回來。如果它正在運動時你站到它前面,它會為了到達目標位置而把你的手臂撞斷。
這就是位置控制(Position Control),而它可以說是打造有用人形機器人的最大單一障礙。
為了在真實世界中生存——在不平整地面上行走、吸收衝擊、安全地與人類互動——機器人必須具備“柔順性”。它必須向意外外力讓步,並即時適應。要做到這一點,就必須放棄簡單的位置指令,進入複雜得多的力矩控制世界。
工業遺留問題:為什麼位置控制會失敗
工業機器人是為受控環境設計的:工廠地面、毫米級精度夾具、封閉工作單元,並且執行階段絕對沒有人靠近。它們的控制哲學反映了這一點:
- 指令:“移動到位置 X、Y、Z”
- 反饋:編碼器讀取當前位置
- 響應:施加達到目標所需的任何力矩
這種方式在銲接汽車車身或把元件放到電路板上時非常出色。但對於必須在草地上行走、與人握手,或者在被絆倒時接住自己的機器人來說,它會災難性失敗。
位置控制把環境視為需要克服的障礙。力矩控制把環境視為需要響應的資訊。
電機的作業系統:磁場定向控制(FOC)
在廉價的愛好級舵機中,控製器會傳送一個“笨”的電壓脈衝(PWM)來讓電機旋轉。脈衝寬度決定平均電壓,而平均電壓大致決定速度。控製器並不知道電機實際上正在產生多大的力。
現代人形機器人執行器使用磁場定向控制(Field Oriented Control,FOC)——這是一套直接運行在電機驅動晶片上的數學框架,每秒執行 20,000 次。
磁場定向控制(FOC)把混亂的交流電流分解為可控向量(d 軸和 q 軸),從而實現精確力矩調節。
FOC 做了什麼
FOC 使用數學變換(Clarke 變換和 Park 變換),把無刷電機內部混亂的三相交流電流分解為兩個清晰、可控的向量:
- d 軸(直軸):產生磁通但不產生力矩的電流。它會被最小化——本質上它是浪費。
- q 軸(交軸):產生力矩的電流。這才是控製器真正發出指令的對象。
通過直接控制 q 軸電流,FOC 允許機器人指定一個具體的力,而不是指定位置或速度。
位置控制 vs. 力矩控制
位置控制:“移動到 30 度,不管需要多大力。”
力矩控制(通過 FOC):“施加 10 Nm 的阻力,不管這會把你帶到什麼位置。”
這種區別是後續一切能力的前提。沒有精確的力矩控制,機器人無法平衡,無法優雅地吸收衝擊,也無法安全地與人類互動。
虛擬肌肉:阻抗控制
人類並不會有意識地控制關節角度。我們控制的是肌肉張力——也就是肢體感覺有多僵硬或多放鬆。當你接住一個球時,你不會計算肘部應該處在精確的角度;你會讓手臂變軟,以吸收衝擊。
機器人可以用阻抗控制(Impedance Control)來模擬這一點。由於機器人沒有真正的肌腱,它會在軟體中創造“虛擬彈簧”。
控製器會即時運行一個物理方程:
`τ = K(qdes − q) + D(q̇des − q̇)`
其中:
- τ = 傳送給電機的力矩指令
- K = 剛度(關節抵抗位移的強度)
- D = 阻尼(關節抵抗速度的程度——就像在水中運動)
- qdes = 期望位置
- q = 實際位置
- q̇ = 速度(點號表示變化率)
可變剛度的魔力
阻抗控制的強大之處在於,可以動態調整 K 和 D:
- 高 K(剛性):關節強烈抵抗運動。在腳接觸地面並需要支撐體重時使用。
- 低 K(柔軟):關節容易向外力讓步。在腿部擺動經過空中時,或吸收意外衝擊時使用。
- 高 D(高阻尼):運動緩慢且受控,就像穿過蜂蜜。適合精確放置。
- 低 D(低阻尼):運動快速且有彈性。適合快速行走或奔跑。
通過每秒數百次地調節這些參數,人形機器人可以在腳落地時讓腿變得像岩石一樣堅硬,然後又能瞬間變軟以吸收踉蹌。機器人實際上是在用數學“幻覺”出類似生物肌肉的性質。
阻抗控制可視化,展示剛度和阻尼
時間機器:模型預測控制(MPC)
僅僅反應是不夠的。如果機器人等到開始摔倒後才糾正自己,那已經太晚了。等感測器檢測到摔倒、處理資料並行出糾正指令時,質心已經移動到了可恢復點之外。
最先進的人形機器人用模型預測控制(Model Predictive Control,MPC)來解決這個問題。這個演算法並不只是對當前狀態做出響應——它會運行物理模擬,預測機器人在未來 10–20 個時間步中的狀態。
控製器會持續詢問:“如果我現在給踝關節施加 5 Nm 的力矩,500 毫秒後我的質心會在那裡?”
然後它會求解一個最佳化問題:找到所有關節上的一系列力矩,使預測質心在整個預測時域內保持在支撐多邊形內(也就是由雙腳圍成的區域)。
這項計算每秒運行數百次。機器人實際上是在“看見未來”,並在摔倒真正開始之前進行微調。
用通俗語言解釋 MPC
- 測量當前狀態(關節位置、速度、身體姿態)
- 使用機器人的數學模型,把物理過程向前模擬到未來
- 最佳化,找到能夠實現目標(行走、平衡)且滿足約束(關節極限、力矩極限、摩擦)的控制輸入
- 只執行第一個控制動作
- 在下一個時間步用新的感測器資料重複整個過程
這種“滾動時域”方法會持續重新規劃,使 MPC 對擾動和模型誤差具有魯棒性。
頻率之戰:速度就是生存
所有這些數學運算——讀取感測器、計算 FOC 向量、運行阻抗方程、求解 MPC 最佳化——都必須以極高速度發生。控制系統以巢狀循環的層級形式運行,每一層都以不同頻率運行:
人形機器人控制環層級示意圖
一台人形機器人本質上是一台分佈式超級電腦,每個關節都運行自己的高速控制環,同時與中央大腦協調。僅僅電機驅動器本身,就在以每秒 20,000 次的頻率求解複雜向量數學——而且是每台電機都如此。
對感測器的依賴
這一整套控制架構都依賴精準、快速的感測器反饋:
- 每個關節上的編碼器用於測量位置和速度
- 軀幹中的 IMU(慣性測量單元)用於測量身體姿態和加速度
- 每個電機驅動器中的電流感測器用於測量(並由此推斷)力矩
- 力/力矩感測器(在高減速比執行器中)直接測量輸出力
- 腳部接觸感測器用於檢測接地時機
如果任何感測器失效、滯後或提供噪聲資料,控制環都會退化。一個 IMU 出故障的人形機器人,不是走得差一點——而是會立刻摔倒。
“人形機器人是一台運行在不穩定邊緣的即時物理模擬器。優雅行走和災難性摔倒之間的差異,是以毫秒和毫牛為單位衡量的。這就是為什麼控制架構不是事後補充——它是其他一切建立其上的基礎。”
07 VII. 柔順性與串聯彈性:“讓步”的物理學
用僵硬的手臂接住一顆板球,會很疼。用同一隻手臂在接球時向後收回——把衝擊吸收在更長距離上——就不會疼。能量是相同的;柔順性改變了一切。
這一原則區分了像機器一樣運動的機器人,和像生物一樣運動的機器人。它也代表了人形機器人領域最有趣的設計爭論之一:柔順性應該建構在硬體中,還是在軟體中模擬?
剛性悖論
傳統工業機器人被設計為無限剛性。當發出位置指令時,控製器會施加達到目標所需的任何力矩。如果機器人撞到牆,它要麼會試圖穿牆而過,要麼會在嘗試過程中燒燬電機。
這在工廠中行得通。環境被精確建模。夾具精度達到毫米的幾分之一。人類被隔離在安全圍欄之後。
真實世界沒有這樣的保證。地面不平。物體出現在意想不到的位置。人會走進機器人的路徑。為了生存——也為了避免傷害他人——人形機器人必須“讓步”,而不是對抗。
這種屬性被稱為柔順性(compliance):也就是向外力讓步,而不是剛性抵抗外力的能力。
硬體解法:串聯彈性執行器(SEA)
增加柔順性的最直接方法,是把它建構到執行器本身之中。串聯彈性執行器(Series Elastic Actuator,SEA)會在電機與關節輸出之間放置一個物理彈簧。
- 剛性執行器:電機 → 減速箱 → 關節
- 串聯彈性執行器:電機 → 減速箱 → 彈簧 → 關節
這個彈簧——通常是扭簧或一組板簧——會從根本上改變執行器的行為。
串聯彈性執行器示意圖,展示電機、減速箱、彈簧和關節輸出的順序
測量的魔力
彈簧不只是吸收衝擊——它還充當內建力感測器。
通過測量彈簧的形變數(也就是電機位置與關節位置之間的差異),你就能精準知道正在施加多大的力矩。這就是簡單的胡克定律:
`τ = k × Δθ`
其中,τ 是力矩,k 是彈簧常數,Δθ 是角位移。
這消除了對昂貴應變片力矩感測器的需求。兩個編碼器(一個在電機上,一個在關節上)加上對彈簧常數的瞭解,基本上就能免費獲得準確的力測量。
串聯彈性的好處
- 抗衝擊能力:當機器人絆倒或撞上障礙物時,彈簧會首先壓縮,在一段時間內吸收能量。齒輪齒永遠不會承受那種會將其擊碎的瞬時峰值力。
- 力限制:彈簧會從物理上限制能夠傳遞到環境中的力。剛性執行器可能會壓碎物體;SEA 則內建了一個上限。
- 穩定的力控制:通過彈簧控制力,本質上是穩定的。很小的位置誤差不會導致巨大的力峰值。
- 能量儲存:彈簧會在衝擊過程中儲存機械能,並在蹬地時釋放出來——這就是“跟腱效應”。
能量效率:彈簧高蹺效應
人類是極其高效的行走者,而我們的肌腱在其中功不可沒。當你的腳撞擊地面時,跟腱會被拉伸,儲存彈性勢能。在蹬地階段,這部分能量會釋放出來,不需要額外肌肉努力就能推動你向前。
研究表明,在奔跑中,肌腱可能貢獻高達 50% 的機械功。從非常真實的意義上說,我們就是被肉包裹起來的彈簧高蹺。
剛性機器人無法利用這種效應。每一步都要求電機:
- 讓擺動腿減速(把動能以熱量形式浪費掉)
- 在支撐相中支撐體重(在零速度下消耗電流)
- 為蹬地加速(從電池中汲取更多電流)
帶有 SEA 的柔順機器人表現得像彈簧高蹺。衝擊能量壓縮彈簧;儲存的能量在蹬地過程中釋放。電機與彈簧協同工作,而不是獨自完成所有工作。
機器人腿部能量回收循環示意圖,展示類似彈簧高蹺的衝擊、中支撐和蹬地階段
這對電池續航的影響非常顯著。一台通過彈性儲存回收 30% 動能的人形機器人,可以在同一塊電池上按比例運行更長時間——或者在相同執行階段間下使用更小、更輕的電池。
核心爭論:物理柔順性 vs. 虛擬柔順性
這裡存在現代人形機器人領域最活躍的設計爭論之一。第 VI 節介紹了阻抗控制——用軟體讓電機表現得像彈簧。如果我們能夠模擬柔順性,為什麼還要加入物理彈簧?
物理柔順性(SEA)
- 使用者:Agility Digit、早期 Boston Dynamics Atlas、研究平台。
- 優點:
- 完美的能量儲存與釋放(彈簧幾乎沒有損耗)
- 無限的衝擊保護(由物理而不是軟體限制峰值力)
- 天然安全——即使電腦崩潰,柔順性依然存在
- 通過形變測量免費獲得力感知
- 缺點:
- 頻寬有限——彈簧具有共振頻率,被激勵時會“振鈴”
- 剛度固定(除非使用可變剛度機構,但這會增加複雜度)
- 難以模擬:振盪彈簧很難在 AI 訓練引擎中建模(“模擬到現實”差距)
- 增加額外重量和機械複雜度
虛擬柔順性(本體感知 / QDD)
- 使用者:Tesla Optimus、Unitree H1/G1、MIT Mini Cheetah。
- 注意:這種方法依賴低減速比執行器(QDD),它們天然可反驅。你無法用高減速比工業齒輪有效實現這一點,因為摩擦會掩蓋力的訊號。
- 優點:
- 剛度可以通過程式碼瞬間調節——在毫秒內從堅硬如岩石變成柔軟如枕頭
- 易於模擬:剛性連桿在計算上成本較低,可以加速 AI 訓練
- 機械設計更簡單(不需要封裝彈簧)
- 快速運動時具有更高控制頻寬
- 缺點:
- 需要消耗大量電流來“保持”柔軟位置(電機必須主動抵抗)
- 衝擊載荷會直接傳遞到減速箱(沒有物理緩衝)
- 需要極高速控制環,在損傷發生前做出反應
物理柔順性 vs. 虛擬柔順性:權衡
兩種方法都沒有絕對優勢。選擇取決於機器人的預期使用場景。Agility Digit 面向動態運動和包裹配送而設計,因此使用 SEA 來最大化能量效率。Tesla Optimus 面向工業操作和通用任務而設計,因此使用虛擬柔順性,以優先考慮製造簡單性和 AI 訓練速度。
安全性:人的因素
柔順性不只是關於效率和衝擊生存能力——它從根本上關乎人類安全。
設想一個場景:一個正在擺動手臂的機器人撞到了人類工人。
- 剛性機器人:編碼器檢測到位置誤差。控製器增加電流來糾正誤差。手臂更用力地推向人類,可能造成嚴重傷害,直到誤差被消除或電機故障停機。
- 柔順機器人:彈簧(或虛擬彈簧)立即發生偏轉。偏轉被檢測為外力。控製器識別出碰撞,並命令手臂後退。人類感受到的是一種“海綿感”的撞擊,而不是壓碎性的力量。
這種差異解釋了為什麼工廠中的協作機器人(“cobots”)普遍採用某種形式的柔順性,也解釋了為什麼打算與人一起工作的人形機器人必須做到同樣一點。
繪製控制頻寬與柔順性的圖表,展示剛性執行器、SEA 和 QDD 之間的權衡
“進化花了數百萬年才完善肌腱。我們只有幾十年。工程師正在爭論物理彈簧與虛擬彈簧,而不是簡單複製生物學,這一事實本身就說明了這個問題有多難,也說明仍然有多大的創新空間。”
08 感測與反饋:神經系統
一個既看不見又沒有觸覺的機器人,是危險的機器人。無論執行器多麼強大,AI 多麼智能,如果沒有持續、高速的資料流來確認身體到底在做什麼,人形機器人就無法單腳平衡,也無法剝開一顆葡萄。
在工業機器人中,感測通常僅限於關節編碼器:“我現在在 90 度。”在人形機器人中,感測是生死攸關的:“我正在以每秒 2.3 度的速度向前跌倒,我的左腳正在打滑,而我對這個箱子的抓握正在鬆開。”
為了達到這種感知水平,人形機器人需要一種多模態感測器融合方法,模擬人類神經系統:本體感知(Proprioception,內部狀態)和外感知(Exteroception,外部世界)。
本體感知:知道你在那裡
本體感知是身體感知自身在空間中位置的能力。閉上眼睛摸自己的鼻子。你之所以能做到,是因為肌肉和肌腱中的感測器會告訴大腦手臂到底在那裡,而不需要視覺。機器人通過三類主要感測器系統來實現這一點。
1. 高解析度編碼器
人形機器人中的每個關節通常都包含兩個編碼器:一個位於電機軸上(在減速箱之前),一個位於輸出端(在減速箱之後)。這種雙編碼器配置對於高級控制至關重要。
- 電機編碼器:測量用於 FOC 電流環的轉子位置和速度(見第 VI 節)。以極高解析度運行——通常為 16 位或更高——以實現平滑的力矩控制。
- 輸出編碼器:測量對運動學和任務執行真正重要的實際關節角度。
這兩個讀數之間的差值揭示了傳動系統的形變——無論它是 SEA 中的柔順元件,還是應變波齒輪中的固有柔性。這種形變是進行力矩估計和阻抗控制所需的原始資料。
絕對式 vs. 增量式編碼器
- 增量式:從一個參考點開始計數脈衝。如果斷電,位置就會丟失。啟動時需要“回零”。
- 絕對式:上電後立即知道精確位置。對於可能在任意姿態下斷電的人形機器人來說,這是必不可少的。
大多數人形機器人在輸出側使用絕對式編碼器,以消除啟動時危險的“我在那裡?”時刻。
2. 前庭系統:IMU
埋在機器人軀幹中——通常在骨盆或胸部——的是慣性測量單元(Inertial Measurement Unit,IMU)。這是機器人的內耳。
IMU 使用刻蝕在矽片上的微型振動結構(MEMS 技術),測量:
- 三個軸向上的線性加速度(包括重力)
- 三個軸向上的角速度(旋轉速率)
IMU 是“那邊是下方”的唯一真實來源。沒有它,機器人就沒有重力或垂直方向的概念。它可能已經傾斜了 30 度,卻毫無察覺。
挑戰在於:IMU 會漂移。感測器中的微小偏置會隨時間累積。每秒幾分之一度聽起來微不足道,但行走一分鐘後,機器人可能會以為“下方”與真實方向偏差了 10 度。如果不加校正,它會不斷傾斜直到摔倒——而在整個過程中,它都以為自己站得很直。
這就是為什麼感測器融合(下文會討論)必不可少。IMU 提供快速、響應靈敏的姿態資料;其他感測器提供校正,防止漂移持續累積。
3. 力矩感測器
知道自己在那裡還不夠;你還必須知道自己正在用多大力。力矩感測使力控制、碰撞檢測和安全人機互動成為可能。
存在三種方法:
- 應變片感測器:貼上在傳動鏈中受彎元件上的精密電阻元件。直接測量機械應變。精準但昂貴、脆弱,並且需要仔細校準。
- SEA 形變:如第 VII 節所述,通過編碼器測量彈簧形變,可以在串聯彈性執行器中“免費”獲得力矩測量。
- 基於電流的估計:在 QDD 系統中,電機力矩與電流成正比(`τ = Kt × I`)。通過測量電流,可以估算力矩。快速且便宜,但忽略摩擦和慣性效應——在低速下精度較差。
高減速比執行器(例如 Tesla Optimus 中的執行器)通常需要專用應變片力矩感測器,因為減速箱摩擦會使基於電流的估計不可靠。QDD 系統(例如 Unitree)通常可以僅依靠電流感測。
外感知:感知世界
本體感知告訴機器人關於自身的資訊。外感知告訴它關於環境的資訊——它站在什麼上、握著什麼、什麼東西即將撞到它。
足部接觸感測器
精準知道腳何時、何處接觸地面,對於行走至關重要。可選方案包括:
- 二值接觸開關:簡單檢測“腳落地/腳抬起”。快速、便宜,但沒有力的大小資訊。
- 力敏電阻(FSRs):提供粗略的力大小。成本低,但精度和耐久性有限。
- 多軸力/力矩感測器:安裝在踝關節處,測量全部六個力與力矩份量(Fx、Fy、Fz、Tx、Ty、Tz)。支援精確的壓力中心跟蹤。昂貴且複雜。
壓力中心(Centre of Pressure,CoP)——也就是地面反作用力有效作用的點——對於平衡控制至關重要。如果 CoP 漂移到腳掌邊緣,機器人就快要傾倒了。多軸足部感測器可以直接提供這些資料。
觸覺感測:觸摸革命
雖然視覺(相機、LiDAR)對導航至關重要,但對於靈巧操作來說,它太慢了。當你扣襯衫紐扣時,你並不會盯著自己的手指看——你是通過感覺來感知紐扣。人形機器人目前正在經歷一場觸覺感測革命。
機器人觸覺的挑戰
製造機器人“皮膚”是出了名的困難。它必須具備:
- 敏感性:能夠檢測輕至 0.1N 的力(約等於一枚小硬幣的重量)。
- 魯棒性:能夠承受衝擊、磨損,以及抓握尖銳物體。
- 高解析度:能夠區分信用卡邊緣和桌面平面。
- 柔性:能夠包覆彎曲的指尖和可變形的掌面。
- 可負擔性:能夠擴展到兩隻手上的數百個感測點。
新興技術終於開始滿足這些要求:
- 電容式皮膚:類似智慧型手機觸控式螢幕,通過電容變化檢測接近和輕觸。可以以可負擔成本覆蓋大面積區域。
- 光學觸覺感測器(例如 GelSight):一台相機觀察柔軟、不透明橡膠指尖的內部。當手指按壓物體時,橡膠會變形,相機會以高解析度捕捉表面紋理的壓痕。這使機器人能夠“讀取”盲文、在微秒級檢測滑移,或者感知成熟番茄與未成熟番茄之間的差異。
- 磁性觸覺陣列:嵌入軟皮膚中的磁體會在壓力下發生位置偏移。霍爾效應感測器檢測這種位移,並推斷力分佈。
一張光學觸覺感測器(如 GelSight)在機器人指尖內部的剖面圖。圖中顯示,手指內部的相機和 LED 會在柔軟彈性體皮膚按壓物體時,捕捉其高解析度變形,從而實現精確的紋理和形狀識別。
感測器融合:理解噪聲
感測器的問題在於,它們都會“撒謊”。編碼器有量化噪聲。IMU 會隨時間漂移。相機會受到運動模糊影響。力感測器會受溫度影響。沒有任何單一感測器能夠提供絕對真實值。
為了建構一幅連貫的現實圖景,機器人會使用感測器融合——一種數學演算法,將多個有噪聲、甚至相互矛盾的訊號組合成對真實狀態的單一最佳估計。
最常見的方法是卡爾曼濾波器(Kalman Filter),或它的非線性變體:擴展卡爾曼濾波器、無跡卡爾曼濾波器。該演算法維護一個關於機器人狀態的統計模型,並在新的感測器資料到來時持續更新它。
感測器融合實戰
“IMU 說我正以 5°/s 的速度向前傾斜。但腿部編碼器顯示我的雙腳平放在地面上,足部力感測器顯示重量分佈均勻。相機看到地平線是水平的。因此,IMU 很可能正在經歷線性加速度(向前行走),而不是傾斜。我的最佳估計是:我保持直立,並以 0.8 m/s² 向前加速。”
這種推理每秒發生數百次,並會根據每個感測器的已知精度和當前可靠性,自動為其分配權重。
卡爾曼濾波器實際上就是機器人的潛意識——持續從嘈雜、混亂的感官世界中“幻覺”出一個乾淨、穩定的現實。當它工作正常時,機器人會平穩、自信地運動。當它失敗時(感測器掉線、意外擾動、模型不匹配),機器人就會踉蹌或摔倒。
延遲預算
每個感測器都會引入延遲——也就是物理事件發生與控制系統得知該事件之間的時間差。這種延遲會直接限制機器人響應的速度。
注意這個層級:最快的感測器輸入最內層控制環;最慢的感測器為高層規劃提供資訊。一個以 30 Hz 運行、延遲 50 ms 的相機,對於平衡控制毫無用處,但對於決定穿過那扇門則完全足夠。
這就是為什麼機器人不能簡單地“用 AI 視覺處理一切”。等到一幀相機圖像被捕獲、傳輸、由神經網路處理並轉換為電機指令時,一個正在摔倒的機器人早已撞到地面。平衡需要亞毫秒級響應,而這種響應只有本體感知感測器才能提供。
“一台擁有完美執行器但感測糟糕的人形機器人,就像一個被矇住眼睛、又被摘掉內耳的舉重運動員。如果你不知道那邊是上方、自己站在什麼上面,或者是否即將摔倒,那麼所有力量都毫無用處。”
09 為什麼傳統工業執行器會失效:“平方律”陷阱
人形機器人領域最常見的問題是:“為什麼不能直接購買高品質工業伺服電機,然後把它們組裝起來?”
畢竟,Fanuc、KUKA 和 ABB 等公司已經花了 50 年完善機器人執行器。它們的產品精確、可靠,而且隨處可買。早期人形機器人嘗試——包括 Honda 最初的 ASIMO 原型——實際上就採用了這種方法。它們實現了行走,但速度慢、動作僵硬,而且效率極低。
原因在於,一個被固定在地板上的機器人,與一個漂浮在世界中的機器人之間,存在根本差異。
玻璃下巴:無法承受衝擊
工業執行器是為剛性和位置精度而設計的。為了實現亞角分級精度,它們使用高減速比減速箱——通常是 100:1 到 160:1 的諧波減速器或行星系統。這些齒輪是精密工程的傑作,但它們有一個致命弱點:一副“玻璃下巴”。
由於它們被設計為最大限度剛性,因此完全沒有吸收衝擊的能力。當工廠機械臂撞上夾具時(這在設計良好的工作單元中本不應該發生),衝擊能量沒有任何去處,只能直接進入齒輪齒面。結果通常是瞬時剪下失效。
人形機器人的整個存在,就是一連串連續碰撞。每一步都是一次衝擊。腳跟著地會產生一道衝擊波,沿著踝、膝和髖向上傳遞。如果執行器不能“讓步”——如果它們無法反驅來吸收衝擊——減速箱會在運行數小時內自我摧毀。
對於行走這種混亂現實而言,工業執行器實在太脆了。
反射慣量的“平方律”
更深層的物理問題是反射慣量——當外力試圖加速關節時,關節所感受到的阻力。
在任何帶齒輪系統中,從輸出端看,旋轉電機轉子的慣量都會乘以減速比(N)的平方:
`Jreflected = Jrotor × N²`
這個方程是人形機器人敏捷性的敵人。考慮兩種實現 100 Nm 關節力矩的方法:
實踐中的平方律
對於相同輸出力矩,工業執行器具有高出 100 倍的反射慣量。這種差異不是漸進式的——而是變革性的。
高反射慣量會造成三個級聯問題:
- 它不安全:如果機器人擺動手臂並接觸到人,高反射慣量會像大錘一樣作用。電機在物理上無法足夠快速地減速來防止傷害。10,000 倍等效質量的動量必須去往某個地方。
- 它感知麻木:機器人無法感知很小的力——例如握手或輕推——因為巨大的慣量掩蓋了這些力。等到力大到能夠穿過慣量被檢測出來時,它已經大到足以造成傷害。
- 它浪費能量:機器人把大部分電池電量用於對抗自身內部慣量,而不是讓肢體在世界中運動。每一次加速和減速(也就是每一步)都必須克服這種寄生負載。
一張對比圖,展示機器人學中的“反射慣量平方律”。左側是高減速比工業執行器(),慣量被放大 10,000 倍,用一個鐵砧表示(危險)。右側是低減速比人形機器人執行器(),慣量被最小化(安全),用一根羽毛表示。
摩擦牆
高減速比工業減速箱還會引入第三個問題:摩擦。具體來說,是靜摩擦——從靜止開始啟動運動所需的力,也稱為“粘滯摩擦”(stiction)。
在精密諧波減速器或高減速比行星減速箱中,克服靜摩擦可能需要 1–2 Nm 的力矩,隨後才會發生任何運動。對於位置控制工業機器人來說,這無關緊要。控製器只需施加足夠力矩讓它移動,而高減速比意味著很小的電機力矩也能輕鬆變成很大的輸出力矩。
但對於一個試圖保持平衡的力矩控制人形機器人來說,靜摩擦是致命的。
考慮平衡問題:機器人檢測到自己略微向左傾斜。控製器向踝關節發出一個小的糾正力矩——也許是 0.5 Nm。但減速箱有 1.5 Nm 的靜摩擦。這個指令完全被摩擦吸收。關節沒有移動。機器人繼續傾斜。
控製器檢測到傾斜加劇,於是增加指令:1 Nm,然後 2 Nm,再到 3 Nm。仍然沒有反應——機器人被“卡”在摩擦屏障的錯誤一側。然後突然,在 3.2 Nm 時,靜摩擦被突破。關節在累積指令一次性釋放時猛烈抽動。
這種“靜摩擦-滑移”現象讓平滑、類似生物的平衡變得不可能。機器人不是滑順移動,而是突然抽動。它不是成比例響應,而是以劇烈爆發形式響應。再多的軟體調參,也無法完全彌補一個與控制系統對抗的硬體。
靜摩擦問題的可視化
想像你試圖在手掌上平衡一根掃帚,但你的肘關節生鏽了。你能看到掃帚在傾斜,大腦發出糾正指令,但手臂不會移動,直到你施加足夠大的力突破鏽蝕。然後它突然抽動。掃帚掉了。
這就是高摩擦減速箱對平衡控製器造成的影響。平衡的物理要求連續、微小的調節。靜摩擦把連續變成離散,而離散就意味著摔倒。
工作循環不匹配
工業執行器是按照工業工作循環標定的:移動、停止、等待、重複。銲接機器人可能每分鐘執行 20 次運動,每次銲接之間有休息時間。熱負載是間歇性的。
行走是連續的。人形機器人每分鐘走 80–100 步,而每一步都需要力矩。沒有休息時間。電機會在負載下持續高溫運行,而且這些負載超過了工業製造商假定的“連續”額定條件。
一個額定連續力矩為 10 Nm 的工業執行器,其額定值可能基於 30% 工作循環、70% 休息時間。把它放進人形機器人腿裡,它會在幾分鐘內過熱,因為行走實際上是 100% 工作循環(如第 V 節所討論)。
總結:為什麼定製執行器存在
這就是為什麼每一家嚴肅的人形機器人公司——Tesla、Figure、Unitree、Agility、Boston Dynamics——都會設計和製造定製執行器,而不是購買現成工業部件:
工業機器人和人形機器人表面上看起來相似——兩者都有軸關節、電機和控製器。但它們在根本不同的物理體系下運行。行走、平衡以及與人類安全互動的約束,要求執行器架構具備工業自動化從未需要發展的能力。
“你無法從貨架上買到一台人形機器人,因為那隻貨架本來就是為另一個物理問題打造的。工業執行器最佳化的是受控環境中的精度和重複性。人形機器人執行器最佳化的是混亂環境中的柔順性和生存能力。這些目標從根本上是對立的。”
10 總決策矩陣:將技術與任務匹配
我們已經討論了衝擊的物理、反射慣量的數學,以及彈性的機械學。但工程是妥協的藝術。沒有“完美”的執行器——只有適合特定任務畫像的正確執行器。
一台被設計來後空翻的機器人,與一台被設計來在安靜公寓中疊衣服的機器人,其需求完全不同。下面的矩陣把機械、經濟和營運約束綜合為一個戰略檢視。
“沒有免費午餐”評分卡
這張表從五個此前尚未列表化的關鍵商業維度,對主流人形機器人執行器技術進行評級:衝擊生存能力、聲學表現、規模化製造成本、AI 可訓練性,以及真實世界部署案例。
關於滾柱絲槓的說明:雖然由於精密製造要求,滾柱絲槓傳統上成本很高,但 Tesla 正在通過垂直整合和規模化積極推動這種技術商品化,可能會改變整個行業的成本方程。
為什麼“可模擬性”很重要
傳統執行器對比通常忽略了一個維度:在這種硬體上訓練 AI 有多容易?
現代人形機器人控制越來越依賴強化學習——先在模擬中訓練神經網路,再部署到真實硬體上。這要求執行器具備精準的物理模型。
- 剛性執行器(諧波減速器、滾柱絲槓)易於模擬。力輸入後,運動輸出可預測。
- 柔順執行器(SEA、QDD)會引入動力學——彈簧振盪,阻尼隨溫度變化,摩擦是非線性的。模擬到現實遷移(“sim-to-real”)會變得困難得多。
液壓系統出了名地難以精準模擬。流體可壓縮性、閥門動力學和熱效應共同構成建模噩夢。
這就是 Tesla 選擇剛性、高減速比執行器的一個隱藏原因:它們更容易模擬,從而加速 AI 開發。
三種人形機器人“物種”
基於上述約束,三種不同的“人形機器人物種”已經進化出來,每一種都針對不同生態位進行了最佳化:
物種 A:工廠工人
- 任務:舉起重箱子,連續工作 8 小時以上,精確放置。
- 執行器選擇:行星滾柱絲槓(線性)+ 諧波減速器(旋轉)
- 原因:用於舉升的最大力密度。用於精確放置的剛性。用於連續工作的熱耐久性。噪聲無關緊要——工廠本來就很吵。剛性動力學簡化 AI 訓練。
- 案例:Tesla Optimus、Figure 02、Apptronik Apollo
物種 B:敏捷快遞員
- 任務:快速移動,穿越不平整地形,承受摔倒,最大化電池續航。
- 執行器選擇:串聯彈性執行器(SEA)或準直驅(QDD)
- 原因:通過彈性儲存實現能量效率(“彈簧高蹺”效應)。具備抗衝擊能力,因為摔倒不可避免。低反射慣量有助於動態恢復。速度比負載更重要。
- 案例:Agility Digit、Unitree G1/H1
物種 C:家庭助手
- 任務:在家庭中安全運行,安靜到幾乎無聲,對消費者來說價格可承受。
- 執行器選擇:低減速比諧波減速器或 QDD
- 原因:必須足夠安靜,能夠在夜晚客廳中運行。必須足夠便宜,達到消費者價格點。不需要舉起 20kg——大多數家庭任務涉及的是輕物體。通過柔順性保證安全至關重要。
- 案例:1X Neo、Ubtech Walker
收斂問題
這三種物種最終會不會收斂成一種“通用”人形機器人?短期內大機率不會。
本文一直討論的物理約束,並不是可以通過軟體最佳化掉的問題。它們是根本性權衡:
- 高減速比 = 高力,但高反射慣量
- 低減速比 = 低反射慣量,但低力密度
- 物理彈簧 = 能量儲存,但頻寬有限
- 沒有彈簧 = 高頻寬,但浪費能量
每一種應用都將繼續要求自己的最佳化解法。所謂“通用”人形機器人,實際上是針對某個特定通用使用場景最佳化的人形機器人——這也是為什麼 Tesla 的工廠工人與 Agility 的快遞員看起來不同。
一張雷達圖,對比三種主流人形機器人執行器架構——滾柱絲槓(Tesla)、串聯彈性(Agility)和準直驅(Unitree)——在五個關鍵維度上的表現:力密度、速度、抗衝擊能力、能量效率和可負擔性。
“問題不是‘那種執行器最好?’問題是‘最適合什麼?’一個為工廠最佳化的快遞機器人會又慢又貴。一個為家庭最佳化的工廠機器人會又吵又危險。物理規律迫使專業化發生——至少在有人發明出一種能夠打破我們所討論權衡的執行器之前。那才會是真正的革命。”
11 人形機器人關節執行器的設計要求
如果我們把前十節的經驗提煉成一份面向人形機器人執行器的“需求建議書”(Request for Proposal),它會是什麼樣子?那些硬指標能夠把一個愛好級舵機與一個商業人形機器人關節區分開來?
對於一台標準 70kg 通用人形機器人而言,主要腿部關節(髖、膝、踝)的執行器要求,會收斂到一組嚴苛的性能指標上。只要一個執行器無法滿足其中任意一項標準,最終很可能得到的是一台無法動態行走、幾分鐘內過熱,或者第一次接觸真實世界就損壞的機器人。
1. 力矩密度:>15 Nm/kg 門檻
第一道篩選器是比力矩。如第 II 節(質量懲罰螺旋)所確立的,重型執行器會通過復合效應摧毀系統效率。
- 最低可行:>15 Nm/kg(峰值)
- 具備競爭力:>25 Nm/kg(峰值)
- 當前先進水平:>35 Nm/kg(峰值)
工業伺服執行器通常只能達到 5–10 Nm/kg。人形機器人執行器必須剝離每一克不必要的殼體,使用與減速箱直接整合的無框電機,並圍繞質量預算最佳化每一個元件。
經驗法則是:如果執行器重 2kg,它必須至少產生 30 Nm 的峰值力矩,才能在質量懲罰計算中“為自己的上車買單”。
2. 可反驅性:<1 Nm 門檻
執行器不能成為外力的“黑洞”。當力施加到輸出端時(例如地面對腳的反作用力),這個力必須以最小損失通過傳動系統反向傳播到電機。
- 要求:反驅關節所需力矩 <1 Nm
- 理想值:<0.5 Nm
為什麼這很重要:如果減速箱需要 5 Nm 才能克服內部摩擦,那麼機器人對低於 5 Nm 的任何接觸力都是完全失明的。溫和的人機互動會變得不可能。檢測地面接觸會變得不可靠。機器人無法“感知”世界。
這一要求實際上會把蝸輪蝸桿、高減速比行星減速箱,以及大多數工業諧波減速器排除在腿部關節候選之外。
3. 峰值-連續比:熱現實
行走是一種脈衝式活動。在蹬地的瞬間,支撐腿需要巨大力矩,隨後在擺動相中力矩接近為零。然而,保持深蹲、搬運箱子或爬樓梯,則需要持續的高力矩。
- 目標比例:3:1 或更好(峰值 : 連續)
- 示例:一個膝關節執行器可能需要 150 Nm 來完成跳躍(峰值),但必須能夠無限期維持 50 Nm,才能保持負載深蹲姿態(連續)
如第 V 節(熱現實)所討論的,熱管理較差的執行器通常只能達到 2:1 的比例。這會迫使設計者做出痛苦選擇:要麼機器人對於動態動作來說太弱(峰值規格不足),要麼在持續任務中因熱設計不足而過熱。
液冷可以把這個比例推向 2:1,甚至 1.5:1,從而大幅改善可用性能包絡。
4. 頻寬:思考的速度
為了單腳保持平衡,機器人必須每秒做出數百次微調。執行器快速改變力矩輸出的能力——也就是它的頻寬——決定了這些修正是否能及時到達。
- 電流環(FOC):>20 kHz 更新頻率
- 力矩控制頻寬:>50–100 Hz(-3dB 點)
- 延遲(指令到力矩):<1 ms
如果執行器有 100 ms 的延遲,那麼在任何修正產生效果之前,機器人的質心已經遠遠越過可恢復點。機器人不是踉蹌一下——而是會摔倒。
實現高頻寬需要:
- 低電機電感:允許電流快速變化
- 高母線電壓:48V–100V 系統是標準;更高電壓可以實現更快的電流變化率(di/dt)
- 最小機械柔順性:彈簧和背隙會降低有效頻寬
- 快速通訊:使用 EtherCAT 或 CAN-FD,而不是傳統序列協議
5. 反射慣量:安全上限
如第 IV 節和第 IX 節所確立的,反射慣量決定了機器人周圍是否安全,以及它是否能夠對擾動作出反應。
- 減速比:根據關節和架構不同,為 6:1 到 50:1
- 反射慣量目標:關節輸出端 <0.1 kg·m²
反射慣量計算式(`Jreflected = Jrotor × N²`)意味著,電機選擇和減速比必須協同最佳化。一個低慣量轉子配合中等減速比,往往優於一個高慣量轉子配合極低減速比。
6. 衝擊額定值:在真實世界中存活
執行器在每小時行走中會經曆數千次衝擊事件。它必須在不產生累積損傷的情況下存活下來。
- 衝擊額定值:>50g,11ms 半正弦(或等效條件)
- 循環衝擊壽命:在額定動態載荷下 >1,000 萬次循環
- 傳動類型:對於衝擊應用,優先選擇線接觸(滾柱絲槓),而不是點接觸(滾珠絲槓)
“智能關節”範式
現代人形機器人執行器設計中最大的轉變之一,或許是整合化。由獨立電機、減速箱、編碼器和電機驅動器通過電纜連接起來的時代已經結束。
現代人形機器人執行器是“一體化”整合單元:
- 電機驅動 PCB:圓形,直接安裝在電機背板上
- 編碼器:整合到殼體中(電機側和輸出側)
- 力矩感測:內建於傳動系統中,或通過電流推斷
- 熱監測:熱敏電阻嵌入繞組中
- 通訊:單一連接器同時傳輸電源 + 資料(EtherCAT/CAN)
這種整合減少了“線束噩夢”——這是機器人中的一個主要故障點,電纜會疲勞,連接器會腐蝕,電磁干擾會破壞訊號。一個現代人形機器人關節只需要兩根線纜:直流電源母線和通訊線。
一張現代整合人形機器人執行器的爆炸圖,展示驅動 PCB、高解析度絕對式編碼器、無框力矩電機、低減速比應變波齒輪和輸出交叉滾子軸承的同心巢狀結構。這種緊湊架構對於在機器人關節中實現高力矩密度(>15 Nm/kg)至關重要。
規格表:70kg 人形機器人的膝關節
如果你正在為一台 70kg 通用人形機器人指定膝關節執行器,下面就是當前先進設計正在收斂的基準畫像:
擴展到其他關節
上面的膝關節規格代表了最嚴苛的關節。其他關節可以相應縮放:
- 髖關節(屈曲/伸展):類似膝關節——高力矩、高衝擊。由於力臂更長,峰值力矩要求通常略高(180–220 Nm)。
- 髖關節(旋轉):力矩較低(50–80 Nm 峰值),但需要 360° 旋轉能力。典型方案是帶諧波減速器的旋轉執行器。
- 踝關節:衝擊極高(第一個接觸地面的點)。峰值力矩 100–150 Nm。可反驅性對平衡至關重要。
- 肩關節:中等力矩(60–100 Nm 峰值),但必須持續支撐手臂重量。熱耐久性很重要。
- 肘關節:較低力矩(40–80 Nm 峰值),但經常在手臂完全伸展時搬運負載(力臂較大)。
- 手腕:低力矩(10–30 Nm 峰值),但需要高精度和多個自由度。緊湊封裝至關重要。
“這些規格並不是願景式目標——它們是一台能夠動態行走、連續工作並在真實世界部署中存活的人形機器人的最低可行要求。任何一個參數差出兩倍,機器人要麼無法完成任務,要麼會在嘗試中自我毀滅。”
12 未來:人工肌肉及更遠方向
儘管前十一節討論了令人難以置信的工程設計,但當前每一台商業人形機器人都有一個骯髒的小秘密:它們都是由石頭構成的。
電機是由鐵、銅和稀土磁體組成的高密度硬塊。它們剛性、沉重,並通過旋轉產生運動。相比之下,生物體是柔軟、濕潤的,並通過線性收縮產生運動。要用電機讓機器人像人一樣運動,就必須在每一個環節與物理規律對抗——加入複雜減速箱,把旋轉轉換為線性運動;用複雜軟體模擬生物學免費獲得的柔順性;並用主動冷卻來管理肌肉根本不會產生的熱量。
我們正在接近一個可以稱為“電磁平台期”的階段。工程師可以最佳化銅填充率、改進磁體等級,並完善製造公差,但我們正在漸近接近磁通所能實現的極限。機器人學的下一場革命,不會來自更好的齒輪——而會來自模仿生物學基本物理機制的執行器。
為什麼我們想要人工肌肉
人工肌肉的吸引力並不是美學上的——而是物理上的。生物肌肉提供了一些電磁執行器很難匹配的特性:
- 內在柔順性:肌肉天然柔軟且有彈性。它們能夠無損吸收衝擊、安全地與人互動,並儲存彈性能量——這一切都不需要軟體或額外機械元件。
- 線性運動:肌肉直接收縮和伸展。不需要旋轉到線性的轉換。不需要減速箱。沒有背隙。沒有被 N² 放大的反射慣量。
- 可變剛度:生物肌肉可以通過共同收縮瞬間改變剛度。人類手臂可以隨著一個念頭放鬆(低剛度)或繃緊(高剛度)。電機需要複雜機構才能實現同樣效果。
- 分佈式驅動:肌肉分佈在全身,靠近它們驅動的關節。電機往往是集中的質量塊,會造成本文反覆討論的慣量問題。
- 靜音運行:肌肉不會發出尖嘯、嗡鳴或咔嗒聲。對於在家庭、醫院和辦公室中運行的機器人來說,這一點極其重要。
競爭者:超越電機
有幾種技術正在競爭,以取代電機-減速箱範式。這些“人工肌肉”承諾高力、低慣量和內在柔順性。每一種都有令人信服的優勢——也都有致命缺陷,使它們至今未能進入商業人形機器人。
1. HASEL 執行器(液壓放大自癒合靜電執行器)
HASEL 執行器是柔軟、充滿油液的囊袋,兩側帶有柔性電極。當施加高電壓時,靜電吸引會把電極拉合在一起,擠壓介電流體,使囊袋收縮或改變形狀——非常類似肌纖維。
- 優勢:響應快速(高頻寬),天然柔軟且安全,如果介質擊穿則具備“自癒合”能力(液體會填補任何間隙),並且可以根據幾何形狀實現線性和旋轉運動。
- 缺點:需要極高電壓(5–10 kV),這會帶來安全風險、電磁干擾遮蔽挑戰,以及複雜驅動電子。行程長度有限。循環載荷下的長期可靠性,在商業規模上仍未得到證明。
2. 氣動人工肌肉(McKibben 肌肉)
這是一個簡單而優雅的概念:一根橡膠管位於編織網狀外殼內部。當橡膠管充入壓縮空氣時,它會徑向膨脹。編織網限制這種膨脹,並將其轉換為縱向收縮——就像肌肉變短一樣。
- 優勢:極高的力重比(執行器本身非常輕)。天然安全(只是空氣)。收縮時功率密度非常高。天然柔順。
- 缺點:需要壓縮機、壓力儲罐和閥系統。執行器本身很輕,但氣動基礎設施沉重、嘈雜且效率低。由於空氣可壓縮,控制困難。不適合精密定位。
3. 扭繩執行器(TSA)
這是一種優雅而簡單的機構:兩根連接負載的繩子,由一個小電機擰在一起。隨著它們扭轉,它們會縮短,並以巨大的機械優勢拉動負載。
- 優勢:表現得像一種無限可變傳動。一個小電機可以舉起其正常能力 100 倍的負載。極其輕量。結構簡單。
- 缺點:在循環載荷下,繩子會磨損和疲勞。高度非線性的力-位移關係使控制變得困難。行程有限。存在滯回(解扭路徑與扭轉路徑不同)。
4. 介電彈性體執行器(DEA)
一層薄彈性體膜被夾在柔性電極之間。施加高電壓時,電極會相互吸引,擠壓彈性體並使其面積擴張——這種面積擴張可以轉換為線性運動或彎曲運動。
- 優勢:應變非常高(在某些構型中 >100%)。靜音。輕量。可以製造成複雜形狀。
- 缺點:需要千伏級驅動電壓。容易發生介電擊穿(災難性失效)。輸出力較低。對濕度和溫度敏感。
5. 形狀記憶合金(SMA)
某些金屬合金(尤其是鎳鈦諾 Nitinol)可以“記住”一種形狀。當被加熱時,它們會以相當大的力回到這種形狀。當冷卻後,它們又可以再次變形。
- 優勢:極高的力密度。靜音。結構簡單(只是一根線)。
- 缺點:慢得令人痛苦——響應時間受加熱和冷卻速率限制。效率極低(大部分能量變成廢熱)。由於熱疲勞,循環壽命有限。難以精確控制。
一張分屏對比圖,展示機器人學中的“生物學差距”。左側是傳統剛性電機與減速箱執行器。右側是柔軟、柔順的 HASEL 人工肌肉束。中央圖表突出顯示機器人驅動中剛度與多功能性之間的權衡。
肌肉評分卡:為什麼我們還沒到那一步
如果人工肌肉如此有前景,為什麼不是每一台人形機器人都在使用它們?因為雖然電機沉重且需要減速箱,但它們有一個壓倒性優勢:它們很容易控制。
施加電流,就得到力矩。兩者之間的關係是線性且可預測的。電機控制理論是一個已經被幾十年工業驗證解決的問題。
人工肌肉的行為類似生物肌肉:它們是非線性的,存在滯回現象(其行為取決於歷史狀態,而不只是當前狀態),會疲勞,並且對溫度和濕度敏感。控制它們需要複雜的自適應演算法,而目前可靠實現這些演算法,比圍繞電機侷限性進行工程設計更難。
混合過渡方案:可變剛度執行器
在未來十年內,我們不太可能看到一台完全由人工肌肉驅動的人形機器人實現商業部署。控制問題太難,可靠性太不確定,製造基礎設施也並不存在。
我們將會看到的是生物混合設計——將電磁電機與能夠提供類肌肉特性的機構結合起來的執行器。
我們已經討論過串聯彈性執行器(SEA),它通過增加一個物理彈簧來提供柔順性和能量儲存。下一步演進是可變剛度執行器(Variable Stiffness Actuators,VSA)——這類系統可以在運行中以機械方式改變自身彈簧剛度。
想像一隻機器人手臂:
- 與人握手時柔軟(低剛度,安全互動)
- 搬運易碎物體時中等剛度(足夠柔順,可以吸收碰撞)
- 擰螺絲或踢球時剛性很高(最大化力傳遞)
VSA 通過巧妙的機械佈置實現這一點——帶可調預緊力的並聯彈簧、拮抗式電機對,或者改變等效彈簧常數的槓桿機構。它們會增加複雜度和質量,但也架起了電機剛性與肌肉適應性之間的橋樑。
長遠視角
最終,人工肌肉會成熟。HASEL 執行器會找到安全的高電壓方案。介電彈性體會變得更加魯棒。我們尚未想像到的新材料會從實驗室中出現。
當那一天到來時,人形機器人行業將經歷一次轉型,其意義會像 Boston Dynamics 用新 Atlas 推動從液壓轉向電機那樣重大。機器人會變得更輕、更安靜、更安全,也會以當前電磁技術根本無法實現的方式變得更有能力。
但這個未來是以幾十年為尺度衡量的,而不是幾年。眼下,建構人形機器人的工程師必須掌握本文所描述的電機、減速箱、熱管理和控制系統的物理規律。
電機仍然是王者。但這位王者正緊張地注視著自己的王座。
“生物學在執行器設計上已經領先了 5 億年。我們使用電磁學只有大約 150 年。我們甚至已經開始討論用人工肌肉取代電機,這本身就證明了工程學已經走了多遠——也證明它還有多遠要走。”
參考資料與必讀書目
人形機器人處在機械工程、電氣工程、控制理論和生物力學的交匯點。沒有任何一本單一教材能夠覆蓋完整技術堆疊。對於希望更深入理解本文所討論的物理規律和設計原則的工程師,我們整理了一份帶註釋的閱讀清單——它不是枯燥的參考文獻,而是一套課程。
每一條推薦都包含它為什麼重要,以及你能從中獲得什麼。
基礎執行器設計
- “Actuator Design for High Force Proprioception in Dynamic Legged Locomotion” Seok, Wang, Otten, Lang, Kim — MIT,2012
為什麼閱讀:這是改變一切的論文。它從數學上證明了為什麼低減速比、高氣隙半徑電機(準直驅)在動態腿式機器人中優於高減速比工業執行器。關於反射慣量、可反驅性和力控制頻寬的分析,為 MIT Cheetah 奠定了藍圖——也可以說為此後的每一台 Unitree、小米和研究型四足機器人奠定了藍圖。如果你唯讀一篇關於執行器設計的論文,就讀這一篇。 - “Series Elastic Actuators” Pratt & Williamson — MIT,1995
為什麼閱讀:這是 SEA 概念的原始定義。Pratt 和 Williamson 解釋了在電機與負載之間放置彈簧所帶來的穩定性收益、彈簧形變的力感知優勢,以及能量儲存潛力。這篇論文是 Agility Digit、NASA Valkyrie,以及每一台使用物理柔順性的機器人的思想基礎。作為一篇 30 年前的學術論文,它讀起來出人意料地清晰。 - “Design Principles for Highly Efficient Quadrupeds and Implementation on the MIT Cheetah Robot” Seok 等 — MIT,2015
為什麼閱讀:這是 QDD 原則的實際落地。它覆蓋電機選擇、熱管理、腿部設計,以及建構完整系統時出現的整合挑戰。它彌合了理論執行器物理與真實可工作硬體之間的鴻溝。
行走的物理學
- “Legged Robots That Balance” Marc Raibert — MIT Press,1986
為什麼閱讀:在創辦 Boston Dynamics 之前,Marc Raibert 寫下了關於動態平衡的權威著作。硬體已經過時(液壓跳躍機器),但控制原則——對稱性、落腳點、能量注入——是永恆的。這些思想至今仍支配著 Atlas 的運動方式。對於理解為什麼人形機器人控制從根本上不同於工業機器人控制,這是必不可少的背景。 - “Principles of Animal Locomotion” R. McNeill Alexander — Princeton University Press,2003
為什麼閱讀:要打造人形機器人,你必須理解人類。Alexander 是現代生物力學之父。這本書解釋了彈簧載入倒立擺(Spring-Loaded Inverted Pendulum,SLIP)模型、行走與奔跑的能量學,以及為什麼肌腱如此重要。每一台高效腿式機器人,在某種層面上都在試圖模仿這裡描述的物理規律。 - “Efficient Bipedal Robots Based on Passive-Dynamic Walkers” Collins, Ruina, Tedrake, Wisse — Science,2005
為什麼閱讀:這篇論文展示了,如果設計正確,行走可以極其高效。Cornell Ranger 機器人使用極少驅動,實現了可與人類相當的運輸成本。對於理解人形機器人應該瞄準的效率目標,以及為什麼大多數機器人遠遠達不到這一點,這是必讀材料。
人形機器人的控制理論
- “Dynamic Walking on Stepping Stones with Gait Library and Control Barrier Functions” Nguyen 等 — Caltech/Michigan,2020
為什麼閱讀:這是一個現代案例,展示模型預測控制(MPC)和基於最佳化的方法如何讓機器人在複雜地形上實現動態行走。它代表了把理論控制與物理硬體連接起來的當前先進水平。 - “Learning Agile and Dynamic Motor Skills for Legged Robots” Hwangbo 等 — ETH Zürich(RSL),Science Robotics,2019
為什麼閱讀:這是使用強化學習在模擬中訓練腿式機器人控製器,並隨後部署到真實硬體(ANYmal)上的突破性論文。這種“模擬到現實”方法如今已經成為行業標準,包括 Tesla 和 Figure。理解其原理,對於現代人形機器人開發至關重要。 - “Impedance Control: An Approach to Manipulation” Neville Hogan — MIT,1985
為什麼閱讀:這是阻抗控制的基礎論文——也就是機器人應該控制力與位置之間的關係,而不是只控制其中之一。它很密集,但必不可少。每一次柔順的人形機器人互動,都可以追溯到這篇論文中的思想。
機械部件
- SKF / Rollvis 行星滾柱絲槓技術文件可從製造商網站獲取
為什麼閱讀:這是 Tesla 和 Figure 線上性執行器中使用的滾柱絲槓背後的工程規格。它包括載荷額定值、壽命計算,以及解釋為什麼滾柱絲槓能夠承受會摧毀滾珠絲槓的衝擊的接觸力學。 - Harmonic Drive / 應變波齒輪技術手冊 Harmonic Drive LLC / Harmonic Drive AG
為什麼閱讀:理解應變波齒輪的真實規格、限制和選型標準。它包括力矩額定值、剛度曲線,以及——關鍵在於——決定密封殼體中熱性能的效率和摩擦資料。
研究實驗室與行業資源
對於追蹤人形機器人快速發展的工程師來說,以下機構發佈了最相關的公開研究:
- MIT Biomimetic Robotics Lab:電機設計、QDD 執行器、動態運動控制。Cheetah 系列和 QDD 理念的誕生地。
- ETH Zürich Robotic Systems Lab(RSL):面向運動控制的強化學習、模擬到現實遷移、ANYmal 四足機器人。AI 控制方法的領先來源。
- IHMC Robotics:先進人形機器人控制,覆蓋液壓和電動平台。大量關於 Atlas 和 Valkyrie 的工作。關於全身控制的公開材料非常優秀。
- Agility Robotics:商業化 SEA 實現、Digit 人形機器人。其公開工作涉及串聯彈性在實踐中的應用,以及真實世界部署挑戰。
- UC Berkeley Hybrid Robotics Lab:Cassie 雙足機器人、先進 MPC 和混合系統控制。強烈聚焦行走和奔跑的數學。
- Italian Institute of Technology(IIT):可變剛度執行器、iCub 人形機器人。在仿生驅動和應用於人形機器人的軟體機器人方向上具有開創性工作。
保持更新
人形機器人發展的速度快於學術出版。要追蹤即時進展:
- IEEE Transactions on Robotics 和 ICRA/IROS 會議:學術基準。
- arXiv Robotics(cs.RO):預印本論文通常會比正式發表早數月出現在這裡。
- 公司工程部落格:Tesla AI Day 演示、Agility Robotics 技術文章,以及 Boston Dynamics 公開論文,能夠直接洞察商業開發進展。
- YouTube 拆解:拆解和分析商業機器人的頻道,往往比官方規格更能揭示執行器設計。
“這個領域發展很快,但物理規律不會改變。掌握基礎——反射慣量、熱極限、柔順性、控制頻寬——你就能理解每一台新出現的機器人,不管它是誰造的,也不管它伴隨著怎樣的行銷說法。”
(AI工業)
