特斯拉機器人Optimus「進廠打工」:它學會了糾正自己的錯誤


來源:特斯拉


FSD加持AI決策力。

5月5日,特斯拉在X帳號上分享了Optimus(擎天柱)人形機器人的最新進展,Optimus的能力全面升級。

影片中,Optimus利用端對端神經網路執行基本工廠任務,包括對4680型電池單體精確地分類並插入托盤,並且走路速度大幅提升,較去年12月時速度提高30%以上,目前約為0.6米/秒。此外,特斯拉也特別強調了機器人的自主性,Optimus甚至能在工作中修正自己的錯誤。

特斯拉機器人團隊工程米蘭·科瓦奇(Milan Kovac)對全新升級的Optimus進行了詳細說明:


  1. 特斯拉開發並部署了一個神經網絡,讓Optimus機器人執行更實用的任務,例如從傳送帶上撿起4,680型電池,並準確地將它們放置在電池托盤中。
  2. 這個神經網路完全是端到端運作的,利用機器人本身的2D攝影機以及觸覺和壓力感測器的數據,直接產生控制關節的序列。網路完全在機器人的全自動駕駛(FSD)控制器上運行,由機器人的電池供電。
  3. Optimus的設計能透過單一神經網路執行多種任務。在訓練過程中,特斯拉引入了大量不同的數據。
  4. Optimus目前還不夠完善,反應速度較慢,但其成功率正逐漸提高。特斯拉也正在訓練Optimus如何從失敗中恢復,目前已觀察到Optimus能自行修正錯誤。
  5. 特斯拉已在一家工廠部署了多個Optimus機器人,它們每天在真實的生產環境中接受測試並不斷改進。目前Optimus也能在辦公室進行長時間的行走而不跌倒。
  6. 特斯拉正在進一步研究如何提高機器人的移動速度,讓它能適應更複雜的地形,而這些進展都未影響其類人特性。同時特斯拉也致力於提高整個機器人隊伍的可複製性,訓練神經網路處理動態校準和機器人間的微小差異。


自從2021年Optimus首次亮相後,三年來特斯拉每隔幾個月就會分享Optimus的更新,主要是為了展示其步行速度和執行任務時精準度的進程。特斯拉之前也曾展示過機器人折疊衣服、自主分類物體以及執行瑜珈等體能動作的能力。特斯拉的CEO馬斯克(Elon Musk)在去年12月也表示,這些「鋼鐵大漢」一年內就能掌s握穿針引線。

4月23日,在特斯拉2024年第一季財報電話會議中,馬斯克強調Optimus已經在執行工廠任務,並預計在未來幾年內將更廣泛地使用。預計今年底,Optimus將在工廠中執行一系列工作任務。而到2025年底,「機器人將對外銷售」。

對於價格,馬斯克在3月說過:“Optimus的價格最終將低於25000美元或30000美元,他預計其生產成本將比汽車一半的成本還低。”


1.更靈活的手部

英偉達資深研究科學家Jim Fan稱讚這次Optimus升級是令人矚目的更新。他表示:“從視頻中我們得以一窺他們收集人類數據的場景,這也是Optimus的一大優勢。”

要建立起這樣一個有效率的資料收集流程,需要哪些關鍵要素?

首先是Optimus機器人的手部。它的手部是最先進的五指靈巧機器人手之一,具有觸覺感應功能,能夠感知和處理各種物體。

與許多手部僅有6到7個自由度(即可獨立移動的關節數量)的競品相比,Optimus擁有11個自由度,大大提高了靈活性和操作精度。手部的高自由度也讓Optimus能夠執行更複雜的任務。


升級後的Optimus在進行電池分類,來源:特斯拉


同時Optimus的穩健性足以應對頻繁的物體交互,減少了常規維護的需要。特斯拉對機器人的前庭系統、腳部運動軌跡和地面接觸邏輯進行了改進。同時升級了其運動規劃器,增加了輕微的軀幹和手臂擺動,以及縮短了機器人的循環延遲時間。透過這些技術提升,Optimus在運動時的穩定性和自信度都有了顯著的整體提升。

其次是Optimus使用的遠端操作軟體。操作員透過戴上VR眼鏡和手套來控制機器人,實現了極低延遲的精確控制。這種設定的複雜性在於同時要處理大量的即時視訊串流和控制訊號,確保操作者的動作能即時準確地反映在機器人上。即使是極小的延遲也會顯著影響操作的直覺和效率,所以它對減少人機互動中的延遲至關重要。

需要強調的是,Optimus在其控制系統中使用了特斯拉的全自動駕駛(FSD)控制器。 FSD提供了進階的視覺處理能力和即時決策功能,能讓機器人在沒有人類直接監督的情況下,自主完成複雜任務。

FSD的關鍵在於其先進的神經網絡,這些網絡能夠從汽車的攝影機和感測器中收集數據,並將其轉化為駕駛指令,如轉向、加速和煞車。

特斯拉在FSD系統中使用端到端神經網絡,從資料輸入到駕駛決策的整個過程都是自動完成的,不需要人工編寫的程式碼介入。這種系統不僅能夠減少對硬編碼規則的依賴,而且能夠透過不斷學習和適應來改進其性能。

而在FSD系統中使用端對端AI的主要原因之一是其能夠顯著提高決策的速度和精確度。這種技術透過直接從實際駕駛數據中學習,可以更準確地模擬和預測人類駕駛行為,從而在各種駕駛環境中實現更安全和更有效的駕駛。

由此可見,特斯拉在機器人上使用FSD技術,主要是為了借助其強大的資料處理和AI決策能力,使機器人在執行任務時更加獨立和有效。利用FSD在處理高速、高精度資料流方面的能力,以實現更流暢且精確的機器人動作控制。

而且FSD在汽車自動駕駛中已經得到了廣泛的應用和驗證,它的高效能運算能力,完全可以有效支援Optimus機器人的複雜數據處理和即時決策需求。

此外,Optimus的作業系統不僅包括先進的硬體,還涉及複雜的營運管理。一個規模龐大的機器人群體需要多個機器人同時運行以並行收集數據,此外還需要訓練有素的人類承包商全天候輪班操作,以及隨時待命的維修團隊以確保系統的持續高效運作。 Optimus機器人的多樣化應用場景從影片中也可以看出,無論是在工廠環境中移動電池,還是在家庭環境中處理洗衣和整理日常物品,Optimus都顯示出了極高的適應性和功能性。


升級後Optimus在特斯拉辦公室行走,來源:特斯拉


這種廣泛的技術整合不僅展示了Optimus作為先進機器人平台的能力,也引出了關於人形機器人技術未來發展的重要問題:在面對有限的預算和資源,特斯拉如何選擇能夠最大化技能遷移和泛化能力的任務?

雖然遠端操作為解決人形機器人問題提供了一種可能的路徑,但這種方法的可擴展性受限。未來還需要探索如何在保持操作精度和低延遲的同時,進一步提升機器人的自主性和泛用性。機器學習演算法、增強感知系統以及機器人的物理設計都還需要進一步優化。


2.備受爭議的“擎天柱”

自2021年8月,首次在特斯拉AI DAY公開展示概念機Tesla Bot起,Optimus機器人計畫可謂是毀譽參半,許多人只當他是馬斯克拉投資的噱頭。


2021年特斯拉公佈的Optimus原型機,資料來源:特斯拉


首次亮相時有機器人專家指出,Optimus機器人顯示的移動能力有限,與波士頓動力等公司的現有人形機器人相比有較大差距

NASA旗下靈巧機器人團隊的負責人肖恩・阿茲米(Shaun Azimi)指出,汽車的自動駕駛並沒有人們想像得那麼簡單,對於人形機器人而言,挑戰更大。他強調,在出現意外情況時,機器人的靈活應對能力尤其關鍵。

同時,美國亞利桑那州立大學的人類系統工程學教授南希·庫克(Nancy Cooke)提到,要證明機器人的成功,馬斯克需要展示機器人能夠執行多樣化且非具體指令的行為。僅僅讓機器人走動和跳舞,並不能充分展現其能力。

但在一系列的爭議中,Optimus也在逐步前進:


  • 2022年2月,特斯拉推出了人形機器人原型機,標誌著從概念走向現實的重要步驟。到了2022年4月,原型機完成了第一次步態行走。
  • 同年9月的第二屆AI DAY上,Optimus首次公開示範了直立行走、搬運和灑水等動作。
  • 2023年2月,在Investor Day上透過影片展示了Optimus自由行走和擰螺絲等簡單工作。
  • 2023年5月的股東大會,馬斯克展示了Optimus的行走、揮手和搖擺動作,並分享了其在汽車工廠的應用影片。
  • 同年9月,特斯拉在社群平台發布了展示Optimus自我校準、多工處理、姿態控制及自平衡能力的影片。
  • 2023年底的12月,發布了Optimus Gen-2視頻,展示了更靈活的行走和更精細的動作,如二指拿雞蛋和左右手轉移動作,展示了先進的運動和質心控制能力。


特斯拉Optimus的發展節點,來源:Medium


Optimus Gen2機器人相較於其前一代,在多個方面有顯著提升。 Optimus Gen2採用了特斯拉自主設計的致動器和感測器。其中機器人的脖子增加到了2個自由度,使頭部運動更加自然;行走速度提高了30%;機器人的重量相比上一代減輕了10公斤。

Optimus Gen2也增加了腳力和扭矩感應功能,配備了鉸接式的腳趾部分,更好地模仿了人類腳部的幾何形狀,這樣的設計提升了機器人在各種地面上的穩定性和適應性。最引人注目還是上文提到的,這一代機器人的雙手擁有了11個自由度。

三年來,特斯拉Optimus人形機器人實現了從概念雛型到技術突破的蛻變。它在行走速度、自主性和穩定性上的提升,預示著人形機器人將更加靈活、高效,以便進入更多行業提升生產效率,並改善人類的生活品質。

一個更智慧、更人性化的機器人時代,或許很快就會到來。 (甲子光年)