人工智慧正在推動機器人技術的變革性變化。我們認為,人形機器人的發展機會將遠大於自動駕駛汽車,並且其採用速度更快,將吸引更多的資本投入,特斯拉正處於這一主題的中心。投資者可能需要在他們的Excel模型中新增標籤頁。
以下是我們最新BluePaper的摘錄:《人形機器人:體現式AI的投資影響》
“爸爸,老虎寶寶通過觀察它們的媽媽狩獵來學習!”我9歲的兒子在家庭晚餐上宣佈,“它們在草地上撲躍,然後捕捉小鹿等小獵物來練習。”
多年來,機器學習僅限於自我強化的軟體演算法。大型語言模型(LLMs)和生成式AI(GenAl)的進步使得機器人學習領域取得了巨大飛躍,通過自然語言、模仿和模擬加速了物理機器的學習。
GenAl正在改變機器人“學習”的方式,讓它們有機會在物理和虛擬世界中觀察並模仿行為,通過自然語言連接,並在資料中心進行迭代。就像大型語言模型(LLM)幫助推動ChatGPT能力不斷提升一樣,多模態模型(MMM)正在推動機器人技術的創新。AI演算法可以通過自動化重複任務、增強資料分析和預測能力、實現虛擬模擬,以及最佳化設計和測試流程,顯著縮短研發周期。作為一個“AI相鄰”領域,人形硬體開發現在可以直接從增加的資本形成和對機器人主題的研發投資中獲益。
AI躍入物理/原子世界。AI無處不在。AI在聆聽你。AI看到你的臉和身體。AI知道你現在在那裡。AI可以讀書。AI可以寫作。AI可以交談。AI可以製作戴著小牛仔帽的貓咪打卡納斯塔牌的圖片。但除了運行大量演算法和啟動一些開關之外,AI很少實際移動。在自然界中,“運動能力”是指生物體能夠獨立地利用自身能量移動。根據化石記錄,地球上最早的運動能力追溯到前寒武紀時期的細菌鞭毛(一種形狀像紡錘體的結構)。而現在,移動裝置和機器人之間的界限正在逐漸變得模糊和不明顯。
為什麼要用人形機器人?許多閱讀這份報告的投資者會問“為什麼我們需要人形機器人?”而且我們也有充分的理由讓機器人採取許多高度專業化的形態(機械臂、蛇形機器人、機器狗、機械塵等儘可能多的形態)。然而,許多機器人和AI專家表示,對於人形機器人的最強論點是,在一個已經為人類建立的世界中,為準備人形機器人的環境已經“就緒”。
輝達首席執行官黃仁勳最近表示:“適應世界的最簡單機器人是人形機器人,因為我們為自己建造了這個世界。我們也有訓練這些機器人的最多資料,因為我們擁有相同的體型。”此外,想想人類能夠用我們的雙手或使用工具執行的眾多工,以及為人類手和手指設計的眾多機器。
機器人看起來像人,因為……最重要的原因是,我們為自己建造了這個世界,因此工廠的工作站、工廠的生產線實際上是為人們建立的。——黃仁勳
界定TAM。截至2023年11月,美國勞動力約為1.62億人。以平均薪資為59,428美元來計算,美國勞動市場每年價值接近10兆美元。根據Statista的資料,全球約有34億人就業。假設每個工人年薪9千美元,全球勞動市場的價值大約為30兆美元(約佔全球GDP的30%)。
我們預測,到2040年,“理論上的30兆美元”中的人形機器人(累計/應用基數)將達到800萬單位(影響工資3570億美元),到2050年將達到6300萬單位(影響工資3兆美元)。儘管我們的分析目前沒有考慮人形機器人應用基數超過現有人類勞動力的情況,但在某些情況下,這項技術的經濟效益可能使這成為現實。
在最近的年度股東大會上,特斯拉CEO埃隆·馬斯克表示他相信,人形機器人的數量最終將至少是人類的兩倍甚至更多:“我認為人形機器人與人類的比例至少將是二比一,大概是這樣。肯定至少是一比一。也就是說,可能會有大約100億個人形機器人。也許,可能是200億甚至300億。”
2040年代就有十億個人形機器人嗎?根據他的帖子來看,馬斯克近幾個月來一直專注於Optimus(帕洛阿爾托工程中心)。特斯拉首次展示其人形機器人Optimus是在2022年9月30日。這個雙足機器人包括28個執行器,分為兩類:
1) 旋轉執行器,包括諧波減速器、球軸承和感測器,用於肩部和肘部等旋轉動作;
2) 直線執行器,包括行星滾輪、球軸承和感測器,用於類似人類肌肉的直線運動。雙手共有十二個執行器。許多更多的細節仍然保留在公司內部。
今年一月,馬斯克表示,他預計到2040年代將有超過10億個人形機器人在運行。在特斯拉2024年6月13日的年度股東大會上,他預計明年特斯拉至少將有1000個Optimus機器人開始工作,“事情將會從那裡迅速擴展。”在同一次會議上,他還認為人形機器人最終將超過人類數量,“可能會達到200億或更多”(未分享時間表)。
一個動態且迅速變化的競爭環境。除了特斯拉,數十家初創公司和成熟企業都在GenAl 2022/2023年的快速增長推動下,參與了人形機器人的開發。我們注意到,即使在NVIDIA 2024年3月的主題演講之前,關於公司對物理AI機器人的意圖已經不言自明,AI機器人一直是Morgan Stanley TMT會議上的一個重複主題。經過多次起伏,一系列風險投資者和公司正在押注於體現式AI的前景。
今年,人形機器人初創公司Figure AI和Agility Robotics分別在私募輪獲得了26億美元和12億美元的估值,更廣泛的主題吸引了包括OpenAI、軟銀、老虎環球、亞馬遜、NVIDIA和微軟等主要投資者。此外,從汽車到消費電子等行業的主要上市公司也在積極參與人形機器人的開發,同時有些公司正在與人形機器人初創企業合作,探索潛在的未來用例。
機器人學正經歷“ChatGPT時刻”。根據GoogleDeepMind的高級機器人學總監文森特·范霍克的說法,專家們將兩年前稱為“美好的舊時光”。LLM和GenAl突然將機器人學從孤立的“機器人島”牢固地帶入了“AI飛輪”。LLM和GenAl科學長期以來被視為與機器人學(執行機構)完全不同的世界。現在這些世界正在碰撞,影響深遠。
我們以前也見過這樣的情況。1821年,邁克爾·法拉第通過懸掛在磁鐵上方的電線中通電……觀察電線的旋轉。這不僅標誌著電能如何產生機械運動(第一個電動機)的發明,還將看似無關的兩個科學領域——電和磁——聯絡了起來。阿爾伯特·愛因斯坦發現了物質和光之間以前從未設想的聯絡(e=mc^2)。我們可能正處於揭開生成式AI與機器人學關係的邊緣嗎?
網路化集體機器人學習。想像一下,一個人形機器人站在廚房的中島前,島上有一個小盤子,盤子上放著一個洋蔥旁邊是一個削皮刀。現在想像一個大倉庫,有1000個人形機器人,每個機器人都站在一個帶有同樣設定的廚房島旁。隨著每次試錯的積累,整個群體以任何時間點最佳機器人的速度集體學習。
這種網路化集體的聚合學習“快速提升”,實現了團體學習的加速。當物理練習完成,表現最好的機器人比其他999個剝洋蔥做得更好後,最佳實踐可以通過在模擬的“全息宇宙”中數億次試驗中的數字孿生體進一步分享和改進。
你今天見過或與機器人互動了嗎?你們中的一些人可能見過。但大多數在2024年夏天閱讀這篇文章的人可能沒有。這個頗具懷舊色彩的人類技術歷史時期正在迅速過去。持續的LLM/Gen AI革命正處於早期階段,滲透到機器人學領域。
長期以來,LLM和機器人學被視為兩個截然不同的科學領域。但LLM的進步加速在機器人的訓練和學習上可能有更多的重疊。無論是“汽車形狀”的機器人還是人形機器人,AI大腦正在尋找它的機器人“身體”。
人形機器人與自動駕駛汽車。自動駕駛車輛(AVs)是相對簡單的機器人。簡單的意思是,機器人計程車只有三個主要的執行輸出:(1)方向盤,(2)加速踏板角度和(3)剎車踏板。然而,操作領域極其複雜——公共道路上充滿了不可預測的元素。
我們相信,由於AVs操作環境的可變性(現實世界)和相應的安全含義(人類乘客、行人)與人形機器人的形態相比,人形機器人的商業化時間將會更快實現,後者可以在地理圍欄區域(倉庫/工廠封閉工作單元)中學習。儘管人形機器人有更多的物理輸出,但自動駕駛車輛面臨的困難操作領域、安全問題和監管審查推遲了它們的採用曲線。
人形機器人採用的關鍵驅動因素:人形機器人的故事涉及對三個主要領域的瞭解:AI、機器人和人。在不同階段,AI的進步(多模態模型、神經網路訓練、計算)可能比機器人學的物理科學(例如,光學、執行機構、電池製造)發展更快,後者可能沿著潛在的非線性改進自己的路徑前進。同時,各行業和地區的勞動力因素的多個驅動因素將顯著決定經濟回報期、採用率和社會接受度。
儘管高級人形機器人的開發仍處於初期階段,我們相信,在過去幾年中,鄰近領域的進步,即1) GenAI,2) 執行器和機械,以及3) 電池儲存,已被證明是人形機器人開發的重要貢獻者。這三個領域的進一步進展將是實現人形機器人商業化的關鍵。
還必須考慮一些限制因素。人形機器人的大規模商業化必須克服一系列技術挑戰以及廣泛的社會/政策/安全障礙。在技術方面,建立能夠駕馭人類環境的細微複雜性的人形機器人,可能需要持續的生成式AI進展,以及努力將這些先進模型專門為人形機器人量身定製。
此外,進一步完善精密執行器、感測器和電池容量對於提高人形機器人可執行任務的範圍至關重要。儘管現代機器人學已發展數十年,生成式Al模型的突然和快速崛起可能會創造出“心理”能力超過物理能力的情況,從而開啟一系列潛在的硬體瓶頸問題,隨著人形機器人變得越來越“聰明”,這些問題將需要解決。社會/政策/安全方面的考慮與自動駕駛車輛(AV)的相關性幫助我們理解人形機器人可能面臨的障礙範圍。
然而,我們相信,相對於公共街道,使用數字孿生體或在封閉的地理圍欄工作單元中培訓人形機器人,為人形機器人在處理潛在安全規定方面提供了相對優勢。
利用摩根士丹利亞洲工業區的優勢,從中國工業(盛中)到日本工業(江麗莎)和中國汽車供應商(王雪莉),我們深入瞭解人形機器人的內部運作,分析元件成本和未來成本降低的潛力。
根據我們的估計,建構人形機器人的成本可能根據組態和下游應用而變化,從1萬美元到30萬美元不等。例如,根據主要元件供應商的價格報價和專有分析,我們估計特斯拉Optimus Gen2的當前BOM為每單位50-60k美元(不包括軟體)。
然而,在規模效應的幫助下,引入AI演算法顯著縮短研發周期,並使用來自中國的成本效益高的元件,我們看到實現馬斯克目標的Optimus售價約為2萬美元的顯著成本降低的機會。
(大師小站)