摩根士丹利-機器人行業深度報告(第二卷:如何訓練你的機器人)

摩根士丹利最新報告《機器人年鑑:第二卷:如何訓練你的機器人》指出,人工智慧驅動的機器人正在經歷從工廠車間向更廣闊應用場景的歷史性躍遷,訓練焦點從“認知智能”轉向“物理智能”,這一轉變將引爆邊緣計算的新一輪軍備競賽。12月14日,摩根士丹利全球具身智能團隊發佈《機器人年鑑·第二卷:如何訓練你的機器人》,提出機器人產業正在發生“雙重逃逸”:一是物理空間上從工廠流水線逃逸到家庭、農場、城市、海洋乃至太空;二是技術範式上從以“大腦”為核心的通用大模型逃逸到以“身體”為核心的物理動作控制。報告認為,這場逃逸將直接重塑全球算力地圖,邊緣推理晶片、模擬引擎、機器人感測器三大賽道將成為未來十年最硬核的投資主線。

一、機器人“逃離工廠”:從結構化牢籠到非結構化世界

傳統工業機器人被鎖死在“結構化牢籠”裡:任務單一(重複裝配)、環境可控(固定產線)、無需感知與學習能力。大摩用一幅對比圖揭示變化:Pre-AI時代的機器人被安全圍欄包圍,警告牌寫著“嚴禁進入”;Post-AI時代的機器人已出現在農場、公寓、火星地表。報告以“抓取冰箱中的瓶子”作為經典案例:人類0.5秒完成的動作,對機器人卻是一場多變數耦合的噩夢——手指微弧度調整、腕部扭矩控制、重心即時補償、濕度對摩擦係數的擾動、冰箱內其他物體的碰撞規避。大摩強調,物理世界的“難”是字面意義上的硬:它要求機器人具備毫秒級感知-決策-執行閉環,而非傳統工廠的預設程序。

二、訓練範式革命:從“大腦”最佳化到“身體”控制

報告把AI訓練拆成兩條賽道:一條是LLM/VLM為代表的“認知賽道”,訓練的是文字與圖像的抽象關係;另一條是VLA(Vision-Language-Action)為代表的“物理賽道”,訓練的是像素到關節扭矩的對應。大摩指出,Moravec悖論在此顯靈——對人類而言“走路比微積分簡單”,對AI卻恰恰相反。為了獲取物理資料,產業界已形成三條技術路線:

遠端操作(Teleoperation):人類穿戴動捕裝置“手把手”教機器人,資料質量高但規模受限,特斯拉2023年曾為Optimus大量招聘“機器人操作員”,時薪48美元。

模擬訓練(Simulation):NVIDIA Omniverse、Google DeepMind MuJoCo、Unreal Engine建構高保真數字孿生,可在虛擬世界模擬暴雨、地震、零重力等極端場景,配合強化學習實現“無限試錯”。

視訊學習(Video):從YouTube、TikTok等公開視訊中提取人類動作,Meta V-JEPA 2、Google Genie 3等“世界模型”可預測物體運動軌跡,實現“零樣本”遷移。大摩認為,三種方式將長期並存,但模擬+視訊的佔比會快速上升,到2030年或佔訓練資料總量的80%。

三、邊緣算力需求爆發:即時推理與分散式運算

當機器人走出工廠,雲端延遲成為致命短板。大摩提出“邊緣計算雙輪驅動”模型:

專用邊緣晶片普及:NVIDIA Jetson Thor(Blackwell架構)以3500美元套件價提供2070 FP4 TFLOPS算力,功耗僅130W,已被波士頓動力、Figure、Agility等頭部企業採用。報告測算,單台人形機器人需2顆Jetson Thor,自動駕駛汽車需2顆DRIVE Thor,家用機器人則需1顆Jetson Orin Nano。

分佈式推理網路:特斯拉提出“機器人即算力節點”構想——若全球部署1億台機器人,每台2500 TFLOPS,50%利用率下可貢獻125000 ExaFLOPS,相當於700萬顆B200 GPU。這種“去中心化雲”不僅降低資料中心依賴,還能通過車-機-無人機協同實現“群體智能”。大摩預測,到2030年全球機器人邊緣算力需求將達697 ExaFLOPS(B200當量),2050年進一步攀升至14000 ExaFLOPS,對應市場規模超1600億美元。

三、投資地圖:三條主線與三大風險

報告在最後一章給出“具身智能投資九宮格”:

上游:感測器(索尼IMX、Velodyne雷射雷達)、稀土磁材(MP Materials、Lynas)

中游:邊緣晶片(NVIDIA、高通、Ambarella)、模擬引擎(Unity、Epic Games)

下游:機器人本體(特斯拉Optimus、Figure 01、1X NEO)

三大風險同步升溫:

資料瓶頸:物理資料無法像文字那樣“一鍵爬蟲”,真實世界採樣成本高昂。

稀土卡脖子:一台人形機器人需2-4kg釹鐵硼磁材,中國控制全球90%精煉產能,地緣政治溢價將持續放大。

模擬到現實的“Reality Gap”:虛擬環境再逼真,也無法100%復現摩擦、形變、光線散射等微觀物理現象。

摩根士丹利在結尾引用卡爾·薩根1995年的警告:“文明處於教育與災難的競賽之中”。報告認為,具身智能的爆發正是美國重奪製造業主導權的歷史窗口——誰能率先解決“物理資料-邊緣算力-稀土材料”的三重約束,誰就能定義下一個五十年的全球產業秩序。機器人正在逃離工廠,而投資者需要逃離“純軟體”的舒適區,迎接一個軟硬一體、邊緣即中心的新世界。










(TOP行業報告)