華爾街巨頭:超6億台人形機器人將落地!
隨著人形機器人賽道的火爆,多家知名投資機構放出對行業未來十年的市場預測,總體而言都非常樂觀。
例如摩根士丹利認為未來將會有8百萬台人形機器人,市場規模達到4千億美元;
高盛的分析師則指出,人形機器人的市場規模預計將在2035年最高達到380億美元,比之前的預測增長六倍多。與此同時,對人形出貨量的預測達到了140萬台。
近期,花旗銀行與頭部人形企業Sanctuary AI 、Google、普渡科技、牛津大學等機構聯合推出一份針對具身智能賽道的最新研究報告《AI機器人崛起:具身智能即將到來》。
通過訪談多名企業高管,他們將人形機器人的落地場景分為7個,仔細剖析了目前的落地狀況,同時提出了人形行業實現商業化面臨的九個挑戰。
此外,他們還放出迄今為止——或許除了馬斯克以外——最樂觀的市場預測:
2030年,全球人形機器人台數將突破1百萬台;2035年,台數將達到1300萬台,市場規模將達到2090億美元;2050年,全球將有6.48億台人形機器人,並且人形機器人市場規模將達到7兆美元,復合年均增長率達到60.7%。
如果將所有具身智慧型手機器人加在一起,花旗銀行認為屆時市場保有量將超過40億台。
護理將成為人形機器人最大市場
花旗銀行將人形機器人落地的場景分為七種,認為這些將是未來20年間,人形企業主要發力的方向,分別是:家庭服務、工業、建造業、零售行業、快遞配送、酒店配送、專業照護。
從經濟因素與技術因素出發,工業領域將是人形機器人的首個重要應用領域:
經濟方面,美國在工業領域的勞動力缺乏問題嚴重。9月份的美國統計資料表明,勞動力缺口約為100萬個,尤其在汽車行業、工業製造與物流缺口更大,因此人形機器人取代人力的機會比較大。
如果按照馬斯克對人形機器人的售價(15000-30000美元)估算,對比美國最低工資(7.25美元/小時)、加州最低工資(16美元/小時)、工廠工人平均工資(28美元/小時)與護士平均工資(41美元/小時),人形機器人最快能在3.8周內即可回本。
技術方面,工業領域提供了更為封閉的工作空間,機器人可以在這些空間內安全運作。
花旗銀行指出,雖然目前AI驅動的人形機器人在受控環境中的表現優異,但它們在複雜和動態環境中的運行是不可預測的,這就會引發安全問題,換句話說,它們暫時“還沒有安全執行真實世界任務的能力”。
儘管工業是人形首個落地場景已經成為共識,但從長期來看,花旗認為家庭服務肯定是前景最廣闊的賽道。
到2050年,家用的人形機器人將達到4.1億台,約為工業領域的三倍。雖然其他五個應用場景也會有顯著增長,但這些細分賽道的保有量遠遠小於家庭和工業領域。
花旗銀行表示,與許多人想像的不同,人形機器人在家庭並非主要用於日常家務,而將主要用於照護老年人或病弱者。隨著人口老齡化以及護理和社會工作者的短缺,家庭護理的需求將劇增,因此他們預計大部分家庭人形機器人的需求來自老年人家庭。
花旗銀行還預測,到2050年,發達地區、欠發達地區和最不發達地區在工業領域的滲透率分別為30%、20%和10%,他們預計家庭領域的滲透率分別為22%、11%和5%。
令人驚訝的是,花旗稱,雖然發達地區的採用率預計會更高,但考慮到欠發達地區龐大的人口和勞動力市場,它們到2050年將在全球市場中佔據重要份額,欠發達地區將佔據人形機器人市場的三分之二。
什麼是這波人形狂潮的助推器?
未來再美好,我們還是要回到現實中冷靜分析行業的現狀。花旗銀行隨後整理了目前人形機器人行業的利多與面臨的挑戰。
“機器人並不新鮮,但現在人工智慧的發展可能是最重要的(推動因素)。”
花旗銀行認為,推動人形機器人加速的關鍵因素,正是多模態AI的革命性進展。強化學習在生成式AI的成功,讓行業對具身大模型充滿信心,隨著像OpenAI的GPT-4和Google的Gemini等多模態大模型的帶動,多模態大模型開始突飛猛進。
AI在文字理解、語音識別與機器視覺上的進步,讓載入了大模型的機器人與真實世界的互動成為可能。
例如,語音識別是多模態AI的關鍵組成部分,尤其是對於需要與人類直觀互動的人形機器人而言。2017年,微軟的語音識別系統達到了5.1%的單詞錯誤率,已經與人類相差無幾。OpenAI在2023年底發佈的Whisper Large-v2模型,多種語言的單詞錯誤率都能控制在5%以內。
機器人資料的暴增,是推動人形機器人行業狂飆的另一個重要因素。之前,人形機器人行業發展的一個重大挑戰是缺乏足夠的高品質資料來訓練。
隨著AI能力的快速提升,人形企業能夠使用各種來源的資料進行訓練,包括用網際網路上人類執行日常任務的視訊直接訓練機器人。
但花旗銀行認為,由於其驚人的進步速度,合成資料將是未來人形機器人訓練資料的主要來源。目前,最新的模擬工具能夠讓資料訓練速度飆升,據估算,比當前行業常用的方法快了100倍。
根據他們的預測,到2030年,合成資料預計將在AI模型中完全取代真實資料。
另一個利多因素是人形機器人的硬體進步飛速。以臂與手為例,過去,機器人的手臂和手只能執行簡單、重複的任務,但最近的突破開始縮小這一差距,使機器人更接近實現類人靈活性,人形機器人的自由度就是一個能夠展現進步速度的指標。
早期的機器人手臂通常只有3-4個自由度,這大大限制了它們的運動範圍和靈活性。以特斯拉的人形機器人Optimus為代表的企業,開始“卷”自由度,甚至逼近人類的手部靈活度。目前Optimus的手部擁有11個自由度,特斯拉計畫將這一數字增加到22個自由度。
與自由度同步發展的,還有靈巧手的觸覺敏感度。這方面的進展提升了人形機器人執行精細任務的能力。根據Touch Lab的研究,他們的能夠將機器人抓手的靈敏度提升多達50%,使機器人能夠像人類手一樣小心地處理易碎物品。
最大挑戰:資料、資料、還是資料
曆數了推動人形機器人發展的動能之後,花旗銀行也盤點了九個人形機器人要起飛面臨的最大挑戰,分別是:
1、人形機器人還是雛形,還處於原型、試點或初期生產階段,需要大量研究與資料;
2、人形機器人的能力尚未在現實驗證;
3、人形機器人的成本太高;
4、人形機器人表現不如專用機器人;
5、供應鏈還未發育;
6、人形機器人維護成本和更換周期不明;
7、開發、生產和維護的人才嚴重缺乏;
8、行業目前非常需要資本輸血;
9、地緣政治導致的保護主義和安全問題。
其中,資料問題還是受訪的多名人形機器人高管都普遍認同的關鍵問題,他們指出,目前資料收集的狀態呈現出一個“先有雞還是先有蛋”的困境:行業需要更多人形機器人在現實世界中收集資料,但只有更多的資料才能讓人形機器人在現實世界中安全運行。
花旗指出,自動駕駛是機器人資料困境的最好示例。由於駕駛道路是複雜、高動態的環境,自動駕駛車輛必須基於數百萬英里的駕駛資料進行訓練,以應對它們可能在道路上遇到的各種情景。
如果不允許更多自動駕駛汽車在道路上行駛,就很難收集到必要的資料來訓練它們。如果沒有足夠的訓練,自動駕駛車輛可能無法達到足夠的技術水平,無法安全大規模部署。
但與自動駕駛不同的是,人形機器人要收集的資料更多樣,體量也更大,因此收集現實世界的資料通常需要大量的資金,同時需要數年時間,並需要大量人力資源投入,這對於初創企業而言是難以承受的成本。
中美間的較量
花旗銀行在整篇報告中,反覆強調了中國在人形機器人領域上的領先地位,並明顯流露出對美國將會在這場競賽中落後的擔憂。
根據報告梳理的資料,中國在工業機器人領域、人形機器人創新專利數以及供應鏈成本方面,都處於領先地位,因此中國人形機器人行業的研發與生產,相對世界其他地區更為先進。
花旗更憂心忡忡地指出,由於在政策方面,中國政府準備打造世界級的機器人生態系統,按照電動汽車的經驗,“如果使用補貼政策,或者在長期內接受低回報率,這可能會影響人形機器人行業的經濟模式。”
翻譯成大白話,就是中國可能會在人形機器人領域,復刻在電動車的成功經驗:利用原本積累的研發資源,再加上政策支援與補貼,成為全球霸主。
但相比電動汽車,人形機器人是一個更關鍵的行業,它們的落地甚至可能永遠改變人類歷史。
看來,即使在最理想主義的人形機器人賽道,依然會被中美交鋒的現實政治所形塑。 (高工人形機器人)