全球科技盛會CES2025(國際消費電子展)期間(1月7日-1月10日),晶片巨頭、AI時代“賣鏟人”和最大受益者、全球市值第二高【輝達】創始人兼CEO黃仁勳與世界首富、【特斯拉】創始人兼CEO馬斯克先後宣佈人形機器人時代即將到來!
1月7日,黃仁勳進行CES開幕主題演講,表示:“通用機器人的ChatGPT時刻即將到來;智能體AI之後,AI的下一個前沿就是物理AI”;針對人形機器人賽道,輝達推出開源、允許商用的世界基礎模型開發平台Cosmos和合成運動生成的Omnvierse Blueprint。
1月8日,同在CES2025上,馬斯克通過視訊直播方式接受行銷公司Stagwell CEO訪談,談到人形機器人Optimus,表示:Optimus是世界上最複雜的人形機器人,它的手有22個自由度,看起來和感覺都像人類的手;我們的目標是今年(2025年)生產數千台Optimus,初期將在特斯拉工廠進行測試;假設一切順利,明年(2026年)我們將實現10倍的產量,既明年目標生產5到10萬台人形機器人;然後在2027年再增加10倍,既至少50萬台。
黃仁勳和馬斯克都是人形機器人賽道擁護者且私交甚好,兩者皆在多個重大場合,表達了對人形機器人未來美好暢想;前者曾表示:“有三種機器人有望實現大規模生產,而且幾乎僅限於這三種;這三種機器人分別是:汽車、無人機和人形機器人;當然,產量最大的將是人形機器人,因為我們為自己建構了一個世界;歷史上出現過的其他類型的機器人都很難實現大規模量產。”後者曾表示:“人形機器人是當下最大的機遇,並預測未來機器人的數量將遠超人類,達到2:1至3:1的比例,將有100億個人形機器人,甚至是200億到300億個,成為人類生活中不可或缺的夥伴與助手。”
當然,兩者所代表[輝達]和[特斯拉]也的確大力佈局具身智能賽道,更是全球科技巨頭/大廠(Google、微軟、Meta、OpenAI、華為、騰訊等)入局代表。
[特斯拉]被稱為人形機器人賽道引領者,旗下人形機器人Optimus更是行業標竿;[輝達]從晶片和中介軟體層面入局,核心目的是打造底層開發生態,成為具身智能領域當之無愧最強“賣鏟人”。
近期,還有不少媒體透露輝達要入局人形機器人本體製造。
現階段,[華為]是國內入局具身智能賽道佼佼者,並有意沿襲[輝達]路線;[小鵬汽車]、[小米]作為車企,切入人形機器人本體製造,沿襲[特斯拉]路線。
2024年四季度華為持續加碼具身智能領域。
2024年11月15日,華為(深圳)全球具身智能產業創新中心宣佈正式營運,聚合華為2012先進製造實驗室、2012倫敦研究所等各部門具身智能相關能力,聚合華為具身智能產業核心資源,建設具身智能基礎實驗室;現場並與樂聚機器人、兆威機電、深圳市大族機器人、墨影科技、拓斯達、自變數機器人、禾川人形機器人等16家企業簽約合作備忘錄。
2024年12月3日,華為於2023年6月成立的機器人相關全資子公司【東莞極目機器有限公司】發生工商變更,註冊資本由8.7億元增至38.9億元,增資30.2億,華為仍舊全資參股。
有關具體緣由,小編不做解讀,說對、說錯都容易被官方投訴。
具身智能領域研究方向可粗略分為:具身智能大模型(機器人“大腦”)和人形機器人(本體+小腦)。
具身智能領域初創公司主要分三種:專注於具身智能大模型、人形機器人整機和兩者同時涉及;全球範圍內,專注於人形機器人本體初創公司最多,初步統計,人形機器人整機公司目前已超150家且持續增加中(其中國內最多,並遠超第二名是美國);具身智能大模型因涉及晶片、軟體、AI演算法,資金投入遠高於人形機器人本體,目前更多是科技大廠間博弈,初創公司數量遠低於人形機器人本體初創公司。
全球人形機器人本體公司背景可大體分為:汽車製造企業(特斯拉、小鵬等)、機器人企業(優必選、宇樹等)、科研院校孵化(銀河通用)和網際網路背景創業團隊(星塵智能、1X等),目前科研院校教授“兼職”創業佔據國內人形本體初創企業半壁江山,國外更多是網際網路背景創業團隊。
全球具身智能大模型(機器人通用“大腦”)公司背景大體可分為:科技大廠(輝達、OpenAI等)和科研院校背景創業團隊(Physical Intelligence、Skild AI等);國外科技大廠早已佈局具身智能大模型方向研究(如Google、輝達等;Google已完成多次技術迭代,從Saycan到RT-H),目前處於領先地位;國內科技大廠目前也逐步切入具身智能賽道,推出相應具身智能大模型,但目前對具身智能大模型研發投入極其有限,更多以對外投資方式入局。
現階段來看,國內相較於國外,在具身智能大模型具身智能領域的差距仍然較大,無論是大語言模型、多模態模型還是模擬器,這些關鍵技術主要掌握在OpenAI、輝達、特斯拉等海外巨頭手中;值的注意的是,國內大廠並沒有針對人形機器人推出專門大模型,可以理解為目前國內沒有一個團隊真正從機器人出發,去做適配具身智能的大模型。
目前絕大多數人形機器人本體初創企業走分層端到端大模型路線,依託科技大廠多模態通用大模型賦能,自研操作小模型;並且大多數人形本體初創公司在AI層面投入極少;隨著人形機器人前景逐漸明晰,這些有錢、有技術的科技大廠怎會甘心做供應商和投資者身份入局,親自下場造人將會是終局。 (若眾多科技巨頭入局人形機器人本體領域,對於初創公司絕對是毀滅性衝擊。)
如今,這種跡像已在國外頂尖科技大廠已開始入局人形機器人本體製造;相信國內科技大廠也會逐步跟進,比如說走在前列的華為。
接下來,小編將詳細盤點具身智能大模型領域,全球初創公司(PI、Skild AI、Covariant、有鹿機器人、X Square等)介紹及產品進展、全球科技巨頭/大廠(Google、輝達、微軟、OpenAI、特斯拉、華為、阿里、騰訊等)現階段產品進展、人形機機器人本體廠家與科技巨頭/大廠合作現狀以及科技巨頭入局人形機器人本體賽道現狀:
NVIDIA 在機器人領域的核心目標是打造底層開發生態,主要圍繞著大模型、資料、開發平台三大核心領域展開,其終極目標是借助晶片等核心產品,為打造機器人底層開發生態。
2018年,輝達推出全新硬體、軟體、虛擬世界機器人模擬器的NVIDIAIsaac,同時還推出專為機器人設計的電腦平台Jetson Xavier和相關的機器人軟體工具包,正式佈局智慧型手機器人領域;
2019-2022年,輝達從底層晶片、到計算平台、到訓練與驗證,開啟智慧型手機器人領域的全方位佈局:
2023年5月,輝達發佈全新JetsonAGXOrin 工業級模組;
2023年5月25日,輝達發佈VOYAGER智能體,這是第一個由LLM驅動的可以終身學習的智能體,為具身控制生成可執行程式碼;
2023年10月,輝達對Jetson平台上的Metropolis和Isaac框架進行有史以來規模最大的軟體擴展,用以來滿足邊緣AI的快速部署需求;與此同時,輝達還宣佈建立Jetson生成式AI實驗室;另外宣佈推出IsaacROS和IsaacSim軟體的全新版本;
2023年10月20日,輝達發佈了Eureka(Evolution-driven Universal Reward Kit for Agent)智慧型手機器人訓練工具,本質是一種由大模型驅動的演算法生成工具;
2024年2月,輝達成立通用具身智能體研究GEAR(Generalist EmbodiedAgent Research)團隊,目標是在虛擬和現實世界中建立具身智能體基礎模型,致力於實現跨多模態、多場景的智能應用;
2024年3月19日,GTC2024大會上,輝達發佈了人形機器人通用基礎模型Project GR00T、基於Thor SoC的新型人形機器人電腦Jetson Tho;對Isaac機器人平台進行了重大升級,包括生成式AI基礎模型和模擬工具、AI工作流基礎設施,新功能將在下個季度推出;
2024年7月29日,在丹佛SiGGRAPH2024大會上,輝達攜帶自家生成式AI時代的新王牌-升級版“Nvidia NIM”(Nvidia Inference Microservices)雲原生微服務亮相;Nvidia佈局的NIM生態系統已經可提供一系列預訓練的AI模型。輝達宣佈,幫助開發者在多個領域加速應用開發和部署,並且重點在不同的領域(如理解、數字人、三維開發、機器人技術和數字生物學)中提供的具體AI模型:
2024年12月3日,據台灣聯合新聞網報導,輝達已接觸多家台灣機床和關鍵零部件製造商,目標包括徵求關鍵零元件的技術與規格,並探索合作企業加入其人形機器人供應鏈的可能性。甚至有消息稱,輝達正考慮在台灣設立組裝基地。業內預計到明年,這一計畫將逐漸明朗,並啟動相關產品認證流程;未來,輝達不僅計畫打造高性能人形機器人,還將目標延伸至專業型機器人領域。
2025年1月3日,電子業巨頭鴻海集團董事長劉揚偉在接受媒體採訪時表示,鴻海正與輝達合作,採用後者的軟體技術和硬體平台,在台灣南部的高雄市研發專注於服務場景的人形機器人。
2024年6月,特斯拉2024年股東大會,馬斯克首次明確提及Optimus生產目標,計畫在2025年實現Optimus機器人的限量生產,並預測,至2025年底將有超過1000台,或者幾千台Optimus 機器人將在特斯拉工廠各個崗位工作;2024年三季度有關特斯拉Optimus都是負面消息,馬斯克也逐漸釋放一種訊號,Optimus將優先落地在ToC家庭場景,逐漸淡化Optimus優先落地在特斯拉生產車間計畫以及商業化時間。
但2024年四季度以來,特斯拉Optimus技術迭代、量產進展明顯加速;隨著本次馬斯克在CES期間最新聲明,明顯可以看到Optimus進展已高於預期。
接下來我們回顧一下特斯拉Optimus最新部分進展(2024年四季度):
2024年10月11日,Optimus在特斯拉以“We,Robot”為主題的發佈會上驚豔亮相後,就飽受質疑,海外網友一致認為大部分互動是基於teleoperation實現,舞蹈是Pre-programmed動作(小編也是其中之一,實在是太智能!)。
2024年10月17日,可能為打破外界質疑,特斯拉在X帳號上分享了Optimus(柯博文)人形機器人的最新進展,並配文“自主運行”,視訊展示其強大自主能力。
視訊中,Optimus在AI驅動下:
特斯拉同時強調:這些新技能都是由Optimus上嵌入式電腦上即時運行的單個神經網路學習到的。
2024年10月24日,特斯拉三季度財報會議上,馬斯克表示:“我們擁有最先進的人形機器人。”同時表示:我們也是唯一一家真正具備大規模生產人形機器人所有必要條件的公司,因為其他公司缺少人工智慧大腦,缺少真正實現大規模量產的能力;雖有令人印象深刻的視訊演示,但缺乏本地化的人工智慧,無法將生產規模擴大到非常高的數量。並進一步表示:我們將繼續擴大我們的人工智慧訓練能力,以滿足FSD和Optimus的需求;目前,我們並不受限於訓練算力。
2024年11月7日,馬斯克在X平台表示:“Optimus 已經在工廠裡執行一些任務,其能力範圍正在迅速擴大;迄今為止,最困難的部分是改進Optimus的設計,使其易於製造和建構複雜的供應鏈,以便能夠大批次生產。”
2024年11月20日,馬斯克邊玩遊戲邊接受採訪,涉及AGI、人形機器人Optimus、貓女機器人、自動駕駛等;談到Optimus時表示:Optimus將真正開啟下一階段的技術突破,各種皮膚隨便換(“You'll be able to skin Optimus in a white, you know, pretty much anything”)等等。
2024年11月28日,【特斯拉Optimus】在X平台官方帳號發佈旗下人形機器人Optimus接球演示視訊(遠端遙控),展示其新一代手臂和靈巧手,具備22自由度的新一代靈巧手正式上線。Optimus團隊負責人Milan Kovac進一步表示:特斯拉很快就會製造出配備新靈巧手的機器人(不禁讓人揣測:Optimus Gen3要來了?)。馬斯克隨後表示:我們只是在這裡測試驅動和感測器系統;輕鬆移動,將AI視覺與手臂驅動連接起來,實現自動抓取,將於下個季度完成。
2024年12月10月,【特斯拉】機器人團隊在X平台再次發佈旗下人形機器人Optimus最新視訊,展示其在複雜地形行走能力。
Optimus團隊負責人Milan Kovac進一步補充:Optimus並沒有使用視覺系統,完全依靠自身的平衡能力來應對複雜地形,只有其他機載感測器被一個運行在嵌入式電腦上的神經網路處理,該網路的執行階段間大約為2~3毫秒。
完全可媲美人手的靈巧手;極低的VR遠端遙控延遲(可見系統強大),非自主運行好像也沒有太大問題,同時特斯拉機器人團隊招聘C++軟體工程師負責遠端遙控系統開發,目前大多數Robotaxi後台都配備遠端遙控員,以應對特殊場景;值的注意的是,目前Optimus還沒有接入Grok大模型;如此進展,完全有理由相信特斯拉在2025年能夠將Optimus推向市場,並真正執行有用的工作。
(Robot獵場備忘錄)