機器人產業專題報告:人形機器人與科技新革命

1.人形機器人:具備現實意義的顛覆性產品,可望開啟下一個十年產業大周期

回首21 世紀,人類數次以顛覆性技術的極致,給世界以仰望的震撼,智慧型手機、新能源車都是人類直面嚴峻現實後的堅定回答,而人形機器人則有望成為下一個顛覆性產品。 21 世紀的第一個十年,從手機到智慧型手機:智慧型手機是一部改變了人類生活方式的劃時代產品。 1. 智慧型手機改變了我們的通訊方式:傳統的手機只能用來打電話和發短信,而智慧型手機不僅擁有更強大的通訊功能,還可以透過社群媒體、即時通訊軟體等與全球各地的人們保持聯繫。 2. 智慧型手機成為了我們的娛樂工具:智慧型手機一機在手,無論是拍照、聽音樂或玩遊戲,都可以輕鬆實現。 3. 智慧型手機也成為了我們獲取資訊的利器:我們不僅可以透過書籍、報紙、電視等管道來獲取最新的資訊,也可以透過智慧型手機隨時隨地連接網路即時獲取各種資訊。不僅可以瀏覽新聞、閱讀電子書,還可以透過搜尋引擎找到任何我們感興趣的內容。這大大提高了我們獲取資訊的便利性和效率。智慧型手機達到了全球互聯,有效破除了資訊壁壘,知識智慧實現全球即時共振,激發並加快了全人類的科技革新。


21 世紀的第二個十年,從燃油車到新能源汽車:人類在發展過程中主要面對的矛盾就是有限資源與無限需求矛盾,而能源問題則是人類社會面臨的重大問題之一。第一次能源革命是需求驅動。人類歷史上第一次重大能源技術創新與「火」有關,大概在40萬年前,人類掌握了火的使用,以人工取火取代了自然取火。以「火」的使用為標誌事件,人類可以透過燃燒木材、秸稈等柴薪來利用儲存在有機物中累積的太陽能,自此開啟了植物能源時代。植物能源時代對能源的利用僅侷限在取暖和烹飪等用途,18 世紀中葉,英國工業革命的興起加速了人類對能源的需求。傳統的生質能源難以滿足工業化生產的需求,因此需要尋找新的能源來源。第二次能源革命是能源供給危機驅動。第二次能源革命始於18世紀的英國,以蒸汽機的發明和應用為標誌事件,人類開啟了化石能源時代的第一個階段——煤炭時代。人類對能源的利用此時從地表轉向地下,煤炭成為了主要的能源來源。英國煤炭資源豐富,因此成為了工業革命的中心。其他國家也開始大規模開採煤炭。蒸汽機的發明使得煤炭等化石能源可以轉化為動力,推動了工業革命的發展。

19 世紀下半期,電力和內燃機的發明為標誌事件,開啟了化石能源時代的第二階段—石油時代。內燃機的發明與應用引發了對石油的需求,與煤炭相比,同質量同體積的石油產生的能量是煤炭的2 倍,且石油相比於煤炭極易氣化可以實現連續化燃燒。石油資源的開發,尤其是汽車的生產使用,使得液體能源的需求進一步加強,液體能源逐步接替固體煤炭成為主要能源。此後,電力的發明改變了人類利用能源的方式,開發了化石能源的延伸使用,生產出了二次能源。總的來說, 第二次能源革命是一個由傳統的生物質能源轉型為化石能源的過程,這個過程使得工業化生產得到了更好的滿足,也推動了人類社會的現代化。第三次能源革命是環境氣候問題驅動。使用了200 多年的化石能源不僅面臨策略性枯竭,也為環境帶來了較多的負面影響。隨著1970 年代,石油價格暴漲,能源安全和供應穩定性問題成為各國政府和能源公司面臨的重要挑戰。石油價格的暴漲是由於1973年以色列與埃及、敘利亞等阿拉伯國家發生衝突,石油輸出國組織(OPEC)的石油輸出國對西方國家實施了石油禁運,導致石油價格大幅上漲。這場危機引起了全球對能源供應安全性和多元化的關注。在此背景之下,新能源汽車逐漸嶄露頭角,以其清潔、高效、智慧的特徵吸引了消費者的關注,並引領著汽車技術的創新和發展。生命傳承生生不息,新能源車的問世是人類應對能源危機的綠色答案。

21 世紀的第三個十年,從機器人到人形機器人:當前,快速的人口老化是世界百年未有之大變局,而人形機器人正是最適解。人口老化是平均壽命不斷延長、出生率和死亡率持續走低等多方面因素綜合作用的結果,具有普遍性、必然性。從人口老化的過程來看,自19 世紀60 年代法國最早步入老化以來,已開發國家一直領先老化進程。自六、七十年代以來,已開發國家已全部進入老化行列,一些發展中國家也陸續走向人口老化。目前,除非洲國家以外的幾乎所有國家,都在經歷老化的過程。歐洲是人口老化情況最為嚴峻的地區,預測顯示,2050 年歐盟65 歲及以上人口比例將達到28.5%,其中,義大利和德國將上升至33.8%和29.4%,法國為25.6%。在亞洲,日本和韓國的老化問題也日益嚴重。根據聯合國預測,到2099 年,全球192 個國家和地區的人口結構都將變成老年型。人口老化對許多國家的經濟社會發展帶來極大影響,引發財政失衡、勞動力短缺等問題,一些國家的高福利制度也受到考驗。我國自1999年進入人口老齡化社會以來,老年人口的數量和人口老齡化的程度一直在快速發展, “七普”數據顯示,我國60 歲以上人口2.64 億,佔18.7%,其中65 歲以上人口1.9 億,佔13.5%。預計到2048 年前後將超越已開發國家人口老化的平均水平,跨入全球人口老化水平最高的國家行列。從老年人口的特徵來看,我國人口老化有與其他國家共性的趨勢,如家庭小型化、高齡少子化等;也有許多獨特性,如老年人口基數大、在全球佔比高,人口老化的速度快、區域不平衡,高齡老人和失能老人多,空巢化和獨居化加劇,等等。作為世界上老年人口最多的國家,我國積極應對人口老化工作具有重要意義,不僅直接關係我國自身的改革發展穩定大局, 也是解決全球老齡問題的關鍵,事關人類發展。


我們又一次站在了人類歷史發展的重要節點上。面對人口老化難題,結合當前最前沿的AI、通訊、硬體等技術,高智慧化的人形機器人可以成為一種有效的輔助工具,來幫助照顧、陪伴老年人以及補充勞動力缺口等等,這是人形機器人問世的現實意義。人形機器人是跨時代的產品,可望開啟下一個十年產業大周期。從全球範圍來看,人形機器人已有商業應用場景預期落地,例如巡邏、物流倉儲;商業化進程領先的人形機器人產品則有EVE 和Digit。在政策、資本以及技術多維度賦能下,人形機器人市場的潛力可望被加速釋放。未來的商業應用場景可望滲透進入服務業、製造業等領域。馬斯克曾表示其設計特斯拉機器人的遠景目標是讓其服務千家萬戶例如煮飯、修剪草坪、照顧老人等。目前較有潛力的人形機器人發展方向主要面向製造業、航太探索、生活服務業、大專院校科研等,預計2025年人形機器人將可望實現製造業場景應用的突破,小批量應用於電子、汽車等生產與環境。根據2023 年5 月GGII 發布的報告預測,預計到2026 年全球人形機器人在服務機器人中的滲透率可望達到3.5%,市場規模超20 億美元,到2030 年全球市場規模預計將突破200 億美元。參考中國服務機器人市場約佔全球市場25%的數值測算,2030 年中國人形機器人市場規模將達50 億美元。

長期看,人形機器人或可達到數十億量級的規模。 2024 年1 月,馬斯克在社群媒體上,同意了人工智慧研究實驗室Midjourney 創辦人戴維·霍爾茨的預測。霍爾茨曾預測,到2040 年代,地球上將有10 億個個人形機器人,到2060 年代,整個太陽系將有1,000 億個(其中大部分是外星)機器人。 2023 年11 月,Figure 創辦人Brett Adcock 曾在訪談中表示,在接下來的幾十年裡,我們真正面臨的挑戰將是如何擴大人形機器人的生產規模,以及如何將足夠數量的人形機器人供應到市場。長期來看,每個人、每個家庭都會想要一個人形機器人,就像現在的汽車或手機一樣。而且在勞動市場上也會有數十億個人形機器人,去做那些對人類來說危險、單調、無聊的工作。人形機器人也將應用於航空事業,例如在太空中建立人類居住點、照顧老人等各類工作場景。如果給我們足夠長的時間去進行大規模製造,我們可以製造出數十億個人形機器人。 2024年,我們迎來人形機器人商業化元年。人形機器人是人類科技的另一個極限挑戰,也是人類未來文明走向的另一個探索。


2.海外巨頭引領,國產跟進,商業奇點已來

2.1 特斯拉和達等海外巨頭引領人形機器人

每次科技革命必將催生偉大的企業。 2007 年蘋果發表初代iPhone 智慧型手機後,市值大幅成長, 2007 年1 月3 日到2024 年3 月12 日期間市值翻了35 倍。而2016 年特斯拉發表model 3 後, 市值也有所上漲,2016 年2 月1 日到2024 年3 月12 日期間市值翻了22 倍。

從銷售數據來看,全球智慧型手機銷售自2009 年開始一路上漲,到2018 年見頂,市場趨於飽和。而全球新能源車銷售自2020 年開始激增,電池能量密度的改善帶來電車續航力的提升功不可沒,現新能源汽車銷售仍處在上升區間。

正如蘋果之於智慧型手機,特斯拉之於新能源車,人形機器人時代的偉大企業正呱呱落地。海外看,特斯拉人形機器人進展迅速,在兩年不到的時間內實現了快速迭代,完成了開發平台建造、Optimus 產品亮相以及電機扭矩控制、環境探測與記憶、雙手複雜任務等能力的實現。 2021年首屆特斯拉AI DAY上其執行長馬斯克首次公佈特斯拉機器人Tesla Optimus概念圖。 2022 年特斯拉AI DAY 上特斯拉公佈了Optimus 原型機的首秀,實現了自主行走,轉身,揮手等動作。 2023 年5 月的股東大會提到特斯拉自研超算Dojo 為Optimus 提供算力支持,可加速訓練速度並降低訓練成本,加速人形機器人的產業化落地。截至2023 年8 月,至少有五個特斯拉Optimus 機器人原型已經建成並能夠行走,使用的馬達、控制器和電子設備均由特斯拉設計和製造。馬斯克預計Optimus 將大規模量產至「百萬」量級,預計其單一成本或將低於2 萬美元。

輝達下場開發自有大模型,成立GEAR:打造虛擬與現實世界中的全能智能體。 2024 年2 月23 日,輝達成立新的研究部門-“GEAR”,全稱為通用具身智能體研究(Generalist Embodied Agent Research)。這個新部門由AI 高級研究科學家, AI 代理計劃的負責人jim fan 和Yuke Zhu 教授領導。 2024 年將是機器人技術之年、遊戲AI 之年、機器人模擬技術之年。輝達堅信,在未來,每個能夠移動的機器都將實現自主化,機器人和類比智能體將會像iPhone 一樣無所不在。 GEAR 研究團隊專注於四大關鍵領域:1. 多模態基礎模型:開發基於大規模互聯網資料來源訓練的LLMs(大型語言模型),用於規劃與推理,視覺-語言模型以及世界模型,旨在打通不同模態資訊間的壁壘;2. 通用型機器人研究:研發能夠適應複雜環境、實現穩健移動與靈巧操作的機器人模型與系統, 以提升其在各類實際場景下的普適性與效能3 . 虛擬世界中的基礎智能體:創建能夠在多種遊戲與模擬環境中自主探索並持續自我提升能力的大型動作模型,為虛擬世界的智能交互設定新標準4. 模擬與合成數據技術:構建大規模學習所需的模擬基礎設施及合成資料流水線,為智能體的學習過程提供強力支援。

美國人形機器人新創公司Figure AI 於今年2 月29 日宣布,獲得了微軟、輝達、OpenAI 以及亞馬遜創辦人貝佐斯等投資人約6.75 億美元的新一輪融資。這是該公司繼去年上半年獲得首輪7,000 萬美元外部融資後宣布的最新融資動態,這也使得該公司的估值達到26 億美元左右。 Figure AI 表示,將利用這筆新的融資資金加速其人形機器人的開發,以投入商業用途。 Figure AI 已成為馬斯克的人形機器人之外最受投資人關注的AI 新創公司之一。英特爾的創投基金以及「木頭姐姐」Cathie Wood 的Ark Invest、Align Ventures 和現有投資者Parkway Venture Capital 也參與了Figure AI 的投資。

Figure AI 成立於2022 年,該公司已經開發了一款名為Figure 01 的通用機器人,其外觀和動作與人類相似,目標是能夠用來執行替代人類的危險或者無聊的工作,例如在製造、運輸和物流、倉儲和零售等行業。這些領域被認為是「勞動力短缺最為嚴重的領域」。 Figure AI 也表示,將與OpenAI 合作,為人形機器人開發下一代人工智慧模型,最終目標是讓Figure 01 能夠自主執行「日常任務」。而要實現這一目標,需要開發更強大的人工智慧系統。此外,Figure AI 將使用微軟的Azure 雲端服務進行人工智慧基礎架構、培訓和儲存等方面的部署。根據今年2 月27 號Figure AI 發布的一段視頻,Figure 01 通過繩索連接,用兩條腿行走,它的手有五根手指,可以執行類似拿起一個塑料板條箱的任務,然後再走幾步,將箱子放在輸送帶上。今年1 月18 日,Figure AI 曾公佈,將把Figure 01 送入寶馬位於美國南萊納州的斯巴達堡工廠做試點“實習”,主要代替人類工作者從事一些較危險的任務。

1X Technologies 成立於2014 年,是一家位於挪威的專注於開發具有高度靈活性和可擴展性的人形機器人製造商,其主要有兩款人形機器人產品:EVE 和NEO。

EVE 是1X 的旗艦產品,已達成商業化,用於保全。 2020 年,1X 發布了EVE 輪式人形機器人, 身高186 厘米,體重86 公斤,最高時速為14.4 公里每小時,擁有15 公斤承載及6 小時的續航力。 EVE 配備攝影機和感測器,可感知周圍環境並與之互動。 EVE 的移動性、靈巧性和平衡性使其能夠駕馭複雜的環境並有效地操縱物體,主要應用於物流、零售和守衛巡邏。 2022 年, 1X 首次達成商業合作,簽署了至少140 台EVE 機器人的分銷合同,為美國商業場所提供安保服務;而在公司網站上顯示,其還為醫院等機構提供了約250 EVE 台機器人,用於商業建築的夜間警衛。 NEO 為公司新一代產品,還在研發中,特色為輕量化和無齒輪設計。根據1X 官網,NEO 身高167 厘米,體重30 公斤,步行速度為4 公里每小時,跑步速度為12 公里每小時,擁有20kg 的承載能力及2-4 小時的續航力。 NEO 將採用「無齒輪」設計理念,採用自研的無齒輪電機,大大降低整機重量,並提高敏捷性。作為通用人形機器人,NEO 可以處理物流、製造、操作機械等工業任務,同時提供清潔、整理家務以及日常陪伴等生活服務。

1X 獲OpenAI 融資支持,達成合作推動雙向賦能。 2023 年3 月,1X 獲得了一輪由OpenAI 創業基金領投的2,350 萬美元融資,成為了OpenAI 投資的第一家硬體公司。同時,雙方將在AI 技術與機器人雙向融合方面達成合作,一方面,1X 的機器人為OpenAI 的AI 系統提供了絕佳的物理測試環境,從而增強其泛化能力和穩健性;另一方面, OpenAI的技術將全面提升機器人的智慧程度, 透過大模型的應用,有望創造出真正的“Robot GPT”,使1X機器人的學習理解能力更上一階。

2.2 國產人形機器人也正迎來商業奇點

2024年政府工作報告提出“加快發展新質生產力”,全國兩會特別節目《中國向新而行》走進相關公司,報道人形機器人成發展新質生產力熱門領域。人形機器人具備AI+高端製造雙屬性,可望開拓高端製造新模式、新業態,提升我國科技及製造業綜合實力。長期來看,在我國人口紅利減退、勞動成本上升、各行業加速推進人工替代的時代背景下,人形機器人必定不會只限於一個特定領域,而是應用於製造業、社會服務、家庭服務、養老等的眾多場景,相較於傳統機器人具備對綜合性任務的兼容度。

2023 年國內藍圖開啟,人形機器人可望成為顛覆性產品。 2023 年11 月2 日,工信部印發《人形機器人創新發展指導意見》,明確指出:人形機器人整合人工智慧、高階製造、新材料等先進技術,可望成為繼電腦、智慧型手機、新能源汽車後的顛覆性產品,將深刻改變人類生產生活方式, 重塑全球產業發展格局。

技術可重複使用,華為、比亞迪、寧德時代、小鵬等紛紛佈局,2023年國內車企入局機器人趨勢漸顯。 2023 年10 月24 日,小鵬發表了首款人形機器PX5。何小鵬認為:自動駕駛本質上是機器人科學,智慧汽車公司最終也會和機器人公司在科技、產品、生態等等方面融合。小鵬現在做的,就是先將機器人感知、互動系統,同小鵬汽車已經累積的XNGP、XOS 拉通,在底層的操作系統、 感知能力等實現一定程度的核心技術復用。


身為新興產業的戰略領導者和門戶看守者,國內人形機器人企業正在茁壯成長,未來或出現蘋果、 特斯拉這般帶動整條產業鏈一同成長的龍頭企業,中國也正迎來國產人形機器人的商業奇點。優必選科技成立於2012年3 月,總部位於深圳,從伺服舵機研發起步,逐步推出了消費級人形機器人、教育智慧程式設計機器人、商用服務機器人、智慧巡檢機器人等產品。 2023 年12 月29 日,優必選在香港交易所主機板掛牌上市,成為中國「人形機器人第一股」。

優必選是國內最早開始研究人形機器人的企業之一,於2016 年開始研發人形機器人Walker 系列, 2018 年成功推出第一代大型雙足仿人服務機器人Walker,成為中國首家實現人形機器人商業化的企業。隨後,該產品經歷了幾次重要的技術迭代,在2019 年推出第二代Walker,並在春節晚會上進行了表演。 2021 年推出了Walker X,機器人身高130cm,體重63kg,擁有41 個高性能伺服關節構成的靈巧四肢,並搭載了多維力覺、多目立體視覺、全向聽覺和慣性、測距等全方位的感知系統,行走速度提升到3km/h。擁有複雜地形自適應平穩快速行走、動態足腿控制自平衡抗干擾、 自主操作家電、全身柔順控制、U-SLAM 視覺導航、多模態情感互動、智慧家庭控制6 大特性。優必選伺服驅動器技術領先。優必選成功開發了機器人作業系統應用框架(ROSA),是全球少數完成小扭矩到大扭矩(扭矩從0.2N·m 到200N·m)伺服驅動器批量生產的公司之一。

傅利葉智能成立於15 年,總部位於上海張江機器人谷,是國內復健醫療機器人領域的領導企業, 迄今已成功推出了30 多個系列產品,並服務於全球2,000 多家醫療機構。傅立葉智慧早期專注於醫療復健外骨骼機器人,並實現了規模化應用,同時將其在醫療復健機器人取得的商業成果與科技累積轉向通用人形機器人。該公司在2019 年啟動通用人形機器人項目, 2023 年7 月發布首款通用雙足機器人產品GR-1,​​並於9 月開啟預售,商業化進展快速。 GR-1 身高165cm,體重55kg,全身自由度54 個,採用一體化自研關節模組作為致動器,以及直腿行走方案,模擬人類直膝行走的自然步態,其步速可達5km/ h,具備快速行走、敏捷避障、穩健上下坡、抗衝擊幹擾等功能,預計將應用於在工業、復健、居家、科研等多種應用場景。

智元機器人成立於2023 年2 月,創始團隊包括華為「天才少年」稚暉君、彭志輝等業界資深人士,擁有較強的技術背景與產業資源。創立僅半年,智元機器人就於2023 年8 月發布了人形機器人遠徵A1,A1 身高175cm,體重55kg,全身49+個自由度,步行速度可達7km/h,整機承重80kg,單臂最大負載5kg。膝蓋採用反關節設計,膝蓋向後彎曲可以有更大的空間,以應對更多的任務場景。 A1 上搭載的Power Flow 關節馬達為自研開發,使用了準直驅關節方案,實現了低齒槽轉矩設計, 搭配10 速比以內的高力矩透明度行星減速器、共扼同軸雙編碼器、一體液冷循環散熱系統以及自研的向量控制驅動器,峰值扭力超過350N·M,而重量僅1.6kg。搭載RGBD 相機、雷射雷達,IMU 以及麥克風陣列。靈巧手指尖整合了基於視覺的指間感測器,可以分辨被操做物體的顏色、形狀甚至材質,並且基於演算法可以實現近似壓力感測器的效果。同時遠徵A1 搭載了TeraFlops 的高算力晶片,具備多模態感知、少樣本學習、任務閉環等能力。遠徵A1 預計於24 年商業化落地,售價將控制在20 萬元以內,將首先應用於3C 製造, 汽車製造等領域,隨後逐步走向家庭,協助工人、科研人員和家庭成員完成各種任務。

伴隨全球和國產人形機器人的亮相,全球共振下人形機器人的商業奇點已然來臨。

3.小市值公司可望成長為大市值巨頭,國產廠商或將迎來高光時刻

國內頂樓設計明確發展目標,2025 年整機批量生產,2027 年要形成安全可靠的產業鏈供應鏈系統。工信部印發《人形機器人創新發展指導意見》明確指出發展目標:1)到2025 年,人形機器人創新體系初步建立,「大腦、小腦、肢體」等一批關鍵技術取得突破, 確保核心部組件安全有效供給。整機產品達到國際先進水平,並實現大量生產,在特種、製造、 民生服務等場景中得到示範應用,探索形成有效的治理機制和手段。培育2-3 家全球影響力的生態型企業及一群專精特新中小企業,打造2-3 個產業發展集聚區,孕育開拓一批新業務、新模式、 新業態。 2)到2027 年,人形機器人技術創新能力大幅提升,形成安全可靠的產業鏈供應鏈體系,建構具有國際競爭力的產業生態,綜合實力達到世界先進水準。產業加速實現規模化發展,應用情境更豐富,相關產品深度融入實體經濟,成為重要的經濟成長新引擎。

軟體決定人形機器人高度,演算法需與硬體配對。人形機器人本質是AI 系統落地物理世界的最佳載體,演算法是核心,需與硬體配對。機器人的輸出包含了虛擬與物理兩種能力。雖然人形機器人從本體硬體上看,存在抗壓硬度與靈敏度不足的問題,但更核心問題在於是演算法對運動能力的控制, 包括本體平衡、行走的步態、手部抓取等規劃與控制。這需要成熟的感知系統基礎、強大的演算法分解任務和規劃動作、大模型不斷模擬訓練以及超強的算力支撐,同時要求演算法與硬體相符。這要求機器人企業需自研演算法,並持續更新迭代。

硬體方面看,人形機器人產業鏈主要包括上游的核心零件,例如無框力矩馬達、空心杯馬達、 感測器、專用晶片等;中游為機器人本體製造,包括設計、製造、測試三大環節;下游為人形機器人應用領域,包括工業製造、倉儲物流、醫療服務、商業服務、家庭使用等。

根據Tesla AI Day 的預測數據,以特斯拉Optimus 為例,2023 年人形機器人核心零件價值量排名前三的是無框力矩馬達、減速器和力感測器; 2030 年無框力矩馬達價值量佔比下降,力傳感器、減速器價值量佔比上升,且力傳感器將超過減速器,排名第二,三者合計佔比仍超過50%。

從單機價值量佔比來看,無框力矩馬達、減速器和力感測器價值量佔比較高;從降本空間來看, 空心杯馬達、無框力矩馬達等降本空間較大;而從國產替代空間來看,行星滾柱螺桿、空心杯馬達、慣導imu 等國產化率較低,國產替代空間大。


高頻政策強調下人形機器人發展可望加速,技術升級、產品發表及產業鏈驗證可望持續出現,機器換人和國產替代趨勢下的機器人產業鏈機會值得期待。從細分零件來看,人形機器人執行器關鍵零件如絲槓、減速器、馬達等高端領域的產品國產化率較低,特別是行星滾柱螺桿、空心杯馬達、六維力矩感測器等產品在下游市場規模不算太大的背景下,先前國內大規模佈局的企業較少,規模化效應不足。面對2030 年全球上千億元的人形機器人大賽道,無論公司體量幾何, 一旦抓住機遇,其市值必將乘風而起,得到巨大提升。

4. AI 革命賦能人形機器人,具身智能是終極目標

4.1 大模型帶來人形通用機器人曙光,為人形機器人提供“大腦”

人形機器人是軟硬體能力高整合的實體,商業化的核心突破點在於「AI 大腦」。可以說,目前的AI 大腦在邏輯思維和行為智慧決策層面還需要一段成長空間,其驅動力很大程度上來自於演算法的升級與高水準的智慧化。具身智慧是人形機器人想要實現的最終方向。具身智能是指一種智慧系統或機器能夠透過感知和互動與環境(物理世界)產生即時互動的能力。具身智能包括三個模組:具身感知(Perception)、具身想像(Imagination)和具身執行(Execution),AI+機器人正是「具身智能」當前的落點。在機器人領域,有一個「莫拉維克悖論」——人類所獨有的高階智慧能力只需要非常少的計算能力,但無意識的技能和直覺(如辨識人臉、舉起鉛筆、在房間內走動、轉筆等能力)卻需要極大的運算能力,即越簡單的事情越難,越難的事情越簡單。具身智慧機器人未來要能像人一樣與環境互動、感知、決策、完成任務,其感知層和認知層的能力是非常高的。顯然,當下的人形機器人距離這狀態還有非常巨大的差距。人形機器人感測器數量、類別、執行機構複雜度遠高於工業機器人,對控制器即時算力、整合度要求極高。

大模型為人形機器人的發展帶來了新的突破。以往由於演算法模型的限制,機器人難以實現通用化能力,只能透過對於某一個特定領域訓練對應的基礎模型,達到能夠滿足特定用途的機器人AI 演算法,例如工廠車間大量採用的機器人手臂、家用掃地機器人等。軟體層面的限制限制了機器人的應用場景狹窄、可通用性較差,無法充分發揮硬體層面的效能。而大模型的出現,補全了讓機器人能力實現躍升的技術基礎。大模型的向量應用提供了大腦給機器人,使機器人具備更高的事物處理能力。大模型的Chat 應用把自然語言理解提供給了機器人,機器人首次可以用接近人的語言水平,和真實人類聊天,進行基於自然語言的互動。此外,大模型的程式輔助可以肉眼可見的減少軟體工程師的工作量,產出軟體的成本會逐年下降。大模型的泛化能力讓研究者看到人形通用機器人的曙光。以往的AI 模型訓練完成後,就只能用於其設計出來的場景中,難以進行拓展,無法實現通用性。而大模型具備強大的泛化能力,讓人形機器人離通用這一目標更進一步。泛化(Generalization)可以理解為一種遷移學習的能力,把從過去的經驗中學習到的表示、知識和策略應用到新的領域。人類就具有「舉一反三」的能力, 學習一個新概念後立即就能理解它在其他情況下的相關用法。以往的AI 泛化能力很低,應用場景比較局限,泛化能力的出現讓大模型能夠在沒有被訓練過的場景中也能表現出色,是AI 實現通用性的基礎。人形機器人所面臨的應用場景與人類的日常生活接近,需要面對多種多樣、不重複、 沒見過的任務,模型的泛化能力就成為了其能否真正實現通用的核心要素。

多模態資料包含更多信息,端到端的演算法訓練框架提升模型泛化能力。圖像、視訊等多模態的數據擁有比文字要多許多的信息,採用多模態數據的大模型有助於實現更高細粒度的語義理解、 對話意圖識別以及更精確的情感分析。綜合使用多種資料模式的信息,可以顯著提升模型的效能。因此,端到端的訓練方式會在機器人模型領域有更多優勢。傳統的AI 模型訓練需要經歷對原始資料的特徵工程或資料處理階段,而端對端訓練是指直接以原始資料作為輸入,輸出最終結果的方法。端到端的訓練框架透過縮減人工預處理和後續處理,盡可能使模型從原始的多模態資料輸入到最終輸出,給模型更多可以根據資料自動調節的空間,增加模型的整體契合度,提升其泛化能力。特斯拉的FSD 演算法就是純端到端的自動駕駛演算法,並將這樣的訓練思維也延續到了其人形機器人Optimus 上,特斯拉表示Optimus 的神經網路訓練是“完全端到端的”,即可實現視訊訊號輸入,控制訊號輸出。

Figure 01 和OpenAI 結合,人形機器人和人類自然交流曙光初現。 3 月13 日,Figure 發布了一條旗下最新機器人產品Figure 01 的演示視頻,視頻中,工作人員向機器人詢問“我能吃點東西嗎”,機器人遲疑了幾秒,然後熟練地將蘋果遞給了工作人員。除此之外,Figure 01 也充分展現了和人類以及環境互動的能力。它會說會看,還能給人類遞食物、撿垃圾、收拾碗筷等。影片本身沒有經過任何倍速,就已經達到了比較流暢的機器人展示效果。 Figure 01 借助了OpenAI 的模型能力,為它提供高級的視覺和語言智能,也讓人們看到了未來人形機器人和人類自然交流的曙光。

OpenAI 為Figure 01 提供關鍵的語言辨識、計畫和任務執行能力。 Figure01 的關鍵在於軟體,而軟體中讓人驚豔的能力又主要來自OpenAI。 Figure AI 用機器人攝影機收集的視訊訊息,加上麥克風捕捉的語音中的文字轉錄到由OpenAI 提供的多模態大模型中,OpenAI 的大模型作為大腦, 提供視覺推理和語言理解(其中可能包括Sora和GPT-4 的能力);Figure01 神經網路作為小腦, 根據OpenAI 的大模型的判斷做出一系列快速、低階、靈巧的機器人動作。

目前人形機器人智慧等級基本上處於L3 級。根據2022 年國家機器人檢測與評定中心等單位共同發布的機器人智慧等級劃分標準,以解放人體、自主完成任務為目標,綜合考量機器人的感知、認知、決策與執行能力,將機器人的智慧程度劃分為L1(基礎型)、L2(半交互型)、L3(交互型)、L4(自主型)、L5(自適應型)等5 個等級。現階段看,由大模型作為核心「大腦」的Figure 01、Tesla Optimus 等通用人形機器人基本上已經能實現較為自然的人機交互,無需任何控制裝置,僅用自然語言發出指令即可實現指令下達,整體基本上達到L3 級水平,但距離真正類人的交互還有一段距離。

4.2 達發表全球首款人形機器人基礎模型,下一個成長點

3 月19 日的GTC 大會上,輝達發布了全球首款人形機器人通用基礎模型Project GR00T,旨在進一步推動其在機器人和具身智慧方面的突破。輝達的2023 年的快速成長主要來自GPU 與算力,而其下一個成長點則可能體現在對機器人開發的賦能上。基於GR00T人形器人基礎模型, 可以實現透過語言、視訊和人類演示,來理解自然語言,模仿人類動作,進而快速學習協調性、 靈活性以及其他的技能,進而能夠融入現實世界並與人類互動。輝達建構了包括AI、Omniverse、ISAAC 三大平台,三大平台均與機器人產業高度關聯。其中AI 主要對應DGX 系列產品,用於訓練和推理人工智慧系統;Omniverse 主要對應OVX 系列產品,用於驅動數位孿生的計算系統;ISAAC Robotic 平台對應AGX 系列,用於驅動人工智慧機器人的模擬、訓練和推理。

輝達升級了ISSAC平台,讓開發者利用該平台模擬機器人學習技能、與實體世界模擬互動。現在的ISSAC 平台旨在為開發者建構一套全面的端對端解決方案,以支援人工智慧機器人的開發、 模擬測試與部署工作,可支援數千台機器人同步進行訓練和模擬操作。 ISAAC Lab 整合了用於輔助提升機械手臂的靈敏度與精確度的加速庫平台ISAAC MANIPULATOR,以及用於提升服務機器人感知能力的ISAAC PERCEPTOR 軟體庫,有超過130 萬機器人的開發者在使用輝達的機器人平台。目前輝達已攜手比亞迪,開始在基於ISAAC 平台的基礎上進行倉庫自動化機器人的研發合作。

在輝達的推動下,通用人形機器人可望更快進入引入工業和消費應用領域。輝達大力推動機器人產業發展,在機器人模擬、訓練、開發生態上有完整佈局,在輝達強大的GPU算力、完善的AI 軟體服務、Omniverse 數位孿生模擬、ISSAC 機器人開發平台的持續發力下,通用人形機器人有望以更快的速度向前發展,並期待其在工業級和消費級領域的快速落地。

5.科技奇點或將成為風險

從複製到人形機器人,人類對於生命起源奧秘的追問從未止步。但是,克隆技術帶來了對人類倫理道德的巨大衝擊。高智慧化的人形機器人克服了倫理問題,然而在人類取得這一進步的同時, 也將面臨科技奇點帶來的風險。人類祖先發現,最茁壯的植株的種子所種植的穀物也更優良。這是人類開始按照人的意圖控制生命的開端,這也是克隆技術最終目標的最初體現。 1952 年,克隆蝌蚪。小小的蝌蚪改寫了生物技術發展史,成為世界上第一種被複製的動物。美國科學家羅伯特·布里格斯和托瑪斯·金用一隻蝌蚪的細胞創造了與原版完全一樣的複製品。 1972 年,基因複製。克隆技術精細到以單一基因複製為單位。科學家將某種特定基因單離出來, 將它與某有機體(最初是一種酵母)結合,有機體將新基因融入自己的DNA 結構後再繁殖,產生出理想基因的複製品。 1978 年,第一例試管嬰兒出生。整個世界吵嚷著想要目睹人類第一個體外受精嬰兒路易斯的「廬山真面目」。英國醫生用丈夫的精子在一個試管內使卵子受精,然後將胚胎植入健康母親的子宮內。

1996 年,世界第一例從成年動物細胞克隆出的哺乳動物綿羊多利誕生。這個秘密直到1997 年2 月才向世人公佈。蘇格蘭胚胎學家伊恩·威爾姆特和同事用一隻成年母羊乳房內取出的細胞克隆出多利。 1998 年,克隆批量化。美國夏威夷大學的科學家用成年細胞克隆出50 多隻老鼠,並接著培育出3 代遺傳特徵完全一致的實驗鼠。同時,其它幾個私立研究機構也用不同的方法成功克隆出小牛。其中最引人注目的是,日本人用一顆成年母牛的細胞培育出8 隻遺傳特徵完全一樣的小牛, 成功率高達80%。 2000 年,人類近親被複製。美國俄勒岡的研究者用與克隆多利羊截然不同的方法克隆出猴子,科學家將一個僅包含8 個細胞的早期胚胎分裂為4 份,再將它們分別培育出新胚胎,惟一成活的只有Tetra。與多利不同的是,tetra 既有母親也有父親,但它只是人工4 胞胎中的一個。此外,幫助培育出多利羊的生物技術公司宣布克隆出5 隻小豬仔。該公司宣稱,克隆豬終將成為人類移植器官的「加工廠」。 2001 年,克隆人出現。當年3 月,美國生殖科學家帕納伊奧提斯·扎沃斯和一個國際研究小組宣布,數百對夫婦已自願報名參加培育克隆嬰孩的實驗。該小組宣稱最快至2003年便可幫助不孕夫婦培育克隆嬰兒。當年1 月,英國成為全球第一個有效地使人類胚胎合法化的國家。政府通過一項具爭議性的法案,目的在於允許對人類胚胎內的根細胞進行科學實驗。該法案要求克隆體必須在誕生後14 日內被毀滅。培育克隆嬰兒仍屬非法行為。展望未來,當人工智慧的智慧超越人類的智慧,我們將迎來人形機器人的科技奇點,而這或將成為人形機器人產業的風險。

回望智慧型手機與新能源汽車的發展歷史,他們都受制於技術邊界。無論是智慧型手機還是新能源汽車,其世代的更新都與科技的發展密切相關。具體而言,每一代智慧型手機的推出都伴隨著處理器、 儲存、相機和螢幕等關鍵技術的突破,而電池、馬達及電控系統技術則決定了新能源汽車的核心性能。

作為下一個顛覆性產品,人形機器人兼具AI+高端智慧雙重屬性,技術邊界即將被突破。 2022 年底,ChatGPT 橫空出世,迅即以席捲之勢,在全球掀起驚濤駭浪,標誌著人工智慧技術達到一個嶄新的高度。 ChatGPT 是由美國人工智慧研究實驗室OpenAI 研發的聊天機器人程式。 ChatGPT 在推出5 天后,註冊用戶數過百萬;推出後僅兩個月,就獲得1 億月活躍用戶,成為史上成長最快的消費者應用程式。 ChatGPT 猶如大航海時代的蒸汽機,或是資訊時代的作業系統,儼然比肩人類科技史上許多具有標誌意義和節點效應的重大科技進展。人類社會已進入生成式人工智慧(Generative AI)階段,正向通用人工智慧( Artificial General Intelligence, AGI)時代邁進。以ChatGPT 為代表的大模型快速迭代,人工智慧技術正以前所未有的速度大步前進。 OpenAI 執行長Sam Altman,提出了“一個新版本摩爾定律”,我們把它叫做阿爾特曼定律:“宇宙中的智慧數量將在每18 個月後翻一番。”這個新摩爾定律是新時代新興科技的普遍規律,是為「萬物摩爾定律」(Moore's Law for Everything)。萬物摩爾定律,正成為智慧時代的新引擎。


輝達(Nvidia)執行長黃仁勳早年提出取代摩爾定律的「黃氏定律」:GPU 將推動AI 性能逐年翻倍。 2023 年他更是聲稱,Nvidia 的GPU 在過去10 年中將AI 處理性能提高了不低於100 萬倍,並將在未來10 年內將再次令AI 性能強大100 萬倍。 “摩爾定律在其最好的日子裡, 可以在十年內實現100 倍的增長”,黃解釋道。 「在接下來的10 年裡,我希望透過新晶片、新互連、新系統、新作業系統、新分散式運算演算法和新AI 演算法,並與開發人員合作開發新模型,我相信我們會將人工智慧再加速一百萬倍」。

以ChatGPT 為代表的大模型技術飛速發展,從架構演進統一到訓練方式轉變,再到模型高效適配,大模型技術引起機器學習範式的一系列重要革新,為通用人工智慧發展提供了一種新的手段。由單一模態的語言大模型到語言、視覺、聽覺等多模態大模型,大模型技術融合多種模態訊息, 實現多模態感知與統一表示,也將與知識圖譜、搜尋引擎、博弈對抗、腦認知等科技融合發展, 相互促進,朝著更高智慧水準和更通用性方向發展。萬物摩爾定律,成為智慧時代的技術進步新引擎。人工智慧技術快速迭代,正以前所未有的速度大步前進。 ChatGPT 的橫空出世引發新一輪人工智慧技術競賽,另一方面,也有越來越多的聲音警告強人工智慧會為人類帶來生存風險。 2023 年3 月下旬,在GPT-4 誕生兩週之際,有1,000 多名科技界和AI 領域的重量級人物簽署公開信,其中包括特斯拉執行長馬斯克、蘋果公司聯合創始人沃茲尼亞克、Stability AI 總裁莫斯塔克、AI 企業DeepMind 的多位研究員。後來,簽名者超過了33,000 名。這封公開信的主要內容是呼籲在6 個月內暫停高級人工智慧的開發。理由是人工智慧實驗室陷入了一場失控的競賽,他們沒有辦法理解、預測或可靠地控制自己創造的大模型,人類社會對其可能造成的影響也沒有做好準備,AI 可能對社會和文明構成潛在風險。

在業界有「AI 教父」之稱的電腦科學家傑弗裡·辛頓(Geoffrey Hinton)5 月初宣布離職谷歌, 進一步加深了人們對AI 是否已經失控的擔憂。辛頓曾長期擔任Google副總裁兼工程研究員,他說離開Google「以便更自由地談論人工智慧的危險」。 「這些東西(AI)其實可以比人類變得更聰明」。 Hinton 提到他先前也和大部分人一樣,認為AI 威脅人類是很遙遠的事情,至少發生在30 年至50 年後。但近期他已經不再認為其很遙遠。 2023 年5 月30 日,超過370 名AI 專家簽署公開信《AI 風險聲明》,信中警告如果對先進人工智慧的發展監管不當,可能會對人類構成生存威脅。這項聲明只有一句話:減輕被人工智慧滅絕的風險,應該與流行病和核戰等其他大規模社會風險一樣,成為全球優先解決的事項。許多簽署者在AI 實驗室、大型科技公司擔任要職。其中包括圖靈獎得主Geoffrey Hinton、Yoshua Bengio,OpenAI 執行長Sam Altman,Google DeepMind 聯合創始人兼CEO Demis Hassabis,微軟首席技術長Kevin Scott,Google副總裁James Manyika,OpenAI 首席科學家Ilya Sutskever,GAN 之父Ian Goodfellow 等。

有學者認為:蒸氣機不會讓人類滅絕,但AI 會,因為蒸氣機沒有智慧。 2023 年10 月,眾多AI 界大佬再發公開信,聯手全力呼籲管理人工智慧風險。這封由Bengio、Hinton、姚期智(Andrew Yao)、張亞勤等知名專家簽署的聯名信,標題為:「在快速發展的時代管理人工智慧風險」。技術邊界雖會被突破,但是人形機器人將受制於政策邊界。 2024 年3 月13 日,歐盟通過了《人工智慧法案》,這是有史以​​來第一個人工智慧法律框架,它解決了人工智慧的風險,並使歐洲在全球發揮領導作用。 《人工智慧法案》是全球首個關於人工智慧的綜合法律架構。新規則的目的是透過確保人工智慧系統尊重基本權利、安全和道德原則,並解決非常強大和有影響力的人工智慧模型的風險,在歐洲及其他地區培育值得信賴的人工智慧。

該法案為人工智慧系統定義了高風險、有限風險、風險極小或無風險四個風險級別,並就應用場景、風險監測、技術透明度、生物識別等方面作出了要求,違者最多被罰公司全球收入的7%。這個法案的適用範圍雖然目前僅限於歐盟,但大型人工智慧公司為了進入歐盟市場,將會做出相應行動。此外,這部新法律預計也將作為其他區域監管政策的重要參考,在全球造成廣泛影響。(東方證券)