宇樹科技王興興:機器人的身體比想像中重要

  • 如果智元是機器人的大腦派,宇樹科技就是身體派;
  • 宇樹科技專注做硬體本體,AI軟體的佈局相對克制,因為「太燒錢了」;
  • AGI一定是具身的智能,大語言模型有幻覺,就是因為沒有身體反饋訊號;
  • 今年年底之前,全球至少會有一家公司或者實驗室能把通用型的機器人AI模型做出來。


雖然最終產品長得都差不多,機器人——尤其是人形機器人領域正越來越分化為兩大陣營:以上海的「智元」機器人和北京的銀河通用為代表的機器人公司,被認為主要企圖是開發機器人的「大腦」;以杭州宇樹科技為代表的機器人公司,則被認為勝在機器人本體(也就是機器人的身體)。

作為宇樹科技的創始人、CEO和CTO,王興興並不反感業界對其公司「硬體很厲害」的看法。他同意AI很重要,「這一輪機器人浪潮主要就是生成式AI浪潮帶來的」。他在今年8月世界機器人大會期間接受媒體群訪時說,而且,機器人行業現階段最大的限制仍然是AI不夠而非硬體不夠——後者僅僅是個工程問題,一旦有人將適配於機器人的AI模型開發出來,為之定製10萬個機器人硬體是幾個月就能完成的事。

不過,對於機器人公司是否應該大舉投入AI研發,王興興的態度是保守的,「AI太燒錢了」他說。而且,和部分人所持的「機器人大腦更重要,身體沒那麼重要」的觀點不同,王興興認為AGI的實現離不開身體。他舉了一個與做夢有關的例子。做夢時人會突然感覺從懸崖往下掉,或者在夢裡怎麼都跑不快,他本人對這個問題的答案是「睡覺時人的大腦跟身體感知是完全斷開的」。清醒狀態下,人每跑一步都能與地面實際接觸,並得到地面的反饋,讓大腦知道一隻腳接觸到了地面,這時候它很清楚何時邁出另一隻腳,從而控制跑步速度。但在夢境中,大腦與身體斷聯,它永遠也不知道身體是否已經踩到地面。王興興認為,用「身體提供反饋訊號」這一理論很容易解釋為什麼大語言模型會有幻覺,原因很簡單,它沒有與物理世界的連接,跟人類做夢差不多。

王興興堅信,AGI的實現除了純粹的AI還需要身體,即更高級的智能必須是「具身」的,這個模型要能即時採集資料,通過身體與現實世界的接觸或「碰撞」,理解重力、摩擦力、光學等物理概念,建立真正的世界模型。身體結構限制智能水平的狀況在自然界有很多。「能說話的鸚鵡只有20萬至30萬的神經元,猴子、猩猩的神經元比它更多,但是為什麼猩猩說不了話?」王興興說,他對這個問題的理解是,鸚鵡之所以能說話是因為它很喜歡吃堅果,這個過程中喉嚨和舌頭都被訓練得非常靈活,而猩猩沒有這樣的身體條件。

在王興興看來,創造更好的身體方案是做好機器人產品的重要課題。機器人的身體不是標準化的,不是一定要有五根手指或者三根手指——殘疾人在失去手掌、只剩小臂後,依然能做非常精細的事。重要的是背後有強大的大腦可以與身體實現具身的匹配(註:人的大腦具有很強的可塑性,可以與千差萬別的身體結合起來發揮功能,而這種強大大腦的形成離不開身體的參與)。


宇樹科技機器人矩陣,後排為人形機器人,左一為H1,左二為G1;前排為機器狗,左一為Go2(消費級),左二為B2(工業級)。

相較於其他機器人公司,王興興更強調身體對於提升大腦能力、實現AGI的重要性。不過他並沒有對如何基於身體實現具身智能給出明確路徑。目前,宇樹科技已發佈3款「機器狗」,它們有著4條腿,連接4條腿的是一個扮演大腦角色的中央控製器;還有兩款人形機器人,一款成人大小,另一款看起來像個兒童,售價9.9萬元。這些人形機器人的手部採用的是三指方案而不是兩指或五指。王興興稱,宇樹科技正在嘗試將更多觸覺感測器載入到這些機器人的身體上,使它們更能「理解」抓取物體時物體會不會滑落,或者會不會把物體抓壞。

G1機器人首次將人形機器人價格做到10萬元以下。

AI方面,宇樹科技做的工作主要是通過強化學習訓練機器人掌握一些運動控制能力,尤其是在複雜地形上的適應能力和運動能力。王興興稱,今年年初,宇樹科技實現了全球第一款純電力驅動的人形機器人空翻。傳統演算法很難實現機器人的空翻,宇樹的這款機器人採用了模仿學習加強化學習演算法。

H1版本的人形機器人能原地空翻。

不過這些AI能力距離王興興希望達到的目標還有很遠。比如機器人能做的每個動作都需要單獨做訓練,它們也不能自動切換所有動作,需要人為去切換。而且,它們還不能操作相對精細化的零件,比如銲接電路、穿針引線。

王興興稱,宇樹科技並沒有在AI上激進投入,相較於自己做出機器人所需要的基礎模型,他更相信全球所有同行的共同努力。不過,他認為這一時間點不會太晚,「今年年底之前,全球至少會有一家公司或實驗室把通用型的機器人AI模型做出來」。

本文是機器人系列的第二篇,第一篇請移步:機器人系列|①智元:想讓所有機器人都接入智元的大腦

以下是我們根據媒體群訪整理的速記,內容有刪減:


從四足到雙足,底層演算法可通用

Q:近期人形機器人火熱,但早期業界普遍不看好人形機器人,宇樹在人形機器人上的發展戰略是怎樣的?

王興興:基本上還是追尋整個社會共識。2020年以前,很多投資人問我做不做人形機器人,我非常斬釘截鐵地說我們不做。早在2009年大一寒假,我就自己做過小的仿生人形機器人,做好以後遠沒有達到預期,當時全球的人形機器人控制技術不是特別理想,看不到實用價值。

2021年到2022年的時候,在馬斯克的帶領下,全球技術領域對人形機器人非常關注。2022年年底,大語言模型出來以後,AI技術發生了質變,大家看到AI賦能機器人帶來的潛力。2022年年底,我們還沒做人形機器人,已經有一些客戶找上我們想買人形機器人。所以我們覺得社會共識、熱度、客戶的期待程度已經足夠了,2023年我們正式開始做人形機器人。


Q:宇樹是做四足機器人起家的,人形機器人是四足機器人站起來嗎?

王興興:為什麼早年大家做四足機器人比較多,做人形機器人比較少,是因為和人形機器人比起來,如果用同樣的電機,四足機器人可以背更多貨,至少兩倍,負載能力更強,續航能力更強,穩定性更好,技術成熟度也會更高。

從技術或者進化的角度看,人是靈長類動物,從四條腿的動物進化過來,機器人也是一樣。過去一兩年,國內很多人形機器人公司都出來了,它們用了大量的開源四足機器人技術,包括整個控制演算法、硬體。全球很多知名學術機構都用我們的機器狗開發了開源演算法,大家可以去網上下載一些四足機器人的演算法,移植到人形機器人上都可以用。


Q:目前宇樹四足機器人進入了那些市場?人形機器人的快速發展對四足機器人來說是機遇還是挑戰?

王興興:四足機器人我們在消費端、科研教育端還有行業端都有做。去年我們的產品單價更低了,今年整個消費端的增長速度挺快,目前消費端可能佔了整個機器狗營收的1/3左右。從出貨量角度說,消費端的機器狗數量最多,它比較便宜,淘寶上就賣了不少Go2。

消費級機器狗Go2起售價9000多元。

大家可能一直覺得我們做了人形機器人,會不會四足機器人顧不過來,實際上我們整個團隊,包括四足和人形機器人,很多人員是共用的,四足機器人的硬體、電控系統、軟體、AI演算法等可以共用的地方非常多,也正好通過人形機器人把四足機器人做得更好一點,原本我們可能沒有足夠的人力把機器人的軟體做得更好,但現在為了給人形機器人做更好的軟體,會順帶把四足機器人軟體也做好。


Q:宇樹的機器狗全球銷量達到60%至70%,是怎麼做到的?現在人形機器人公司這麼多,你們在人形機器人上有沒有信心?

王興興:資料沒辦法完全統計,別人的銷量我們不太清楚,資料可能是這個等級。我們的四足機器狗最早的技術方案是我2013年提出的,2016年公司成立,差不多也是全球最早成立的做高性能四足機器人商業化的公司,我們產品的性價比在全球做得都比較領先。

目前四足機器狗對比人形機器人肯定沒有那麼卷,早些年還是有點卷。做過機器狗的公司,小公司、大公司都挺多。騰訊、小米等大公司都做過機器狗,小公司就更多了,數量上不會比人形少。當下想做機器狗的公司,還有新的冒出來。

去年下半年我們人形機器人已經向全球發貨了,今年也接了不少訂單,具體不太方便說。至少我覺得在未來的人形機器人這個蛋糕裡面切一大塊,我們還是比較有競爭力。


專注硬體,對AI投入較克制

Q:今年機器人收穫的瘋狂關注,都包含對AI可以帶來機器人進步的判斷,但忽視了機器人本身的技術進步,宇樹在機械和動力等方面的突破有那些?有人評價宇樹的硬體很厲害。

王興興:這一輪機器人浪潮主要是AI浪潮帶來的,AI大語言模型可以語音互動,但要真正解放AI的能力,還需要機器人在物理層面真的去幹活。

現階段,我一直認為機器人行業最大的限制,還是AI不太夠——AI模型、AI的訓練資料集、AI場景的落地部署,都遠遠不夠。硬體層面目前也不夠,但是它沒有理論門檻,是工程問題,把成本做得更低,外觀做得更極致,硬體功能更豐富,這個時間可以預估。如果那一天有人把AI機器人的模型做出來,找我們定製機器人,我們可以保證年底之前直接給他做10萬個人形機器人。

很多人對我們公司的印象是硬體公司,我個人還挺喜歡這個標籤。我們的機器狗目前在全球範圍內出貨量一直挺不錯,再加上我們也在硬體上做了一部分軟體,像Go2機器狗,就整合了Open AI的大語言模型介面,我們還整合了Open AI的多模態介面,你問他機器狗前面有什麼東西,它都能給你回答出來。

我們在AI方面也做了不少,機器人本身的一些運動控制的強化學習是我們自己做的,但肯定不能跟一些純AI公司去比。我們還是希望真正把產品做得更好,能在工廠、服務業、家用等場景真正產生價值,無論客戶對我們的印象是硬體還是軟體,我覺得都無所謂。


Q:宇樹和電動Atlas採用的手部方案都是三指,為什麼三指就夠用,而不是兩指或者四指?電動Atlas的頭部參照的是皮克斯的燈,宇樹G1的頭部還會有什麼新設計嗎?

王興興:人形機器人的技術方案不是特別統一,最典型的代表就是手,有些人可能喜歡用兩指,有的是三指,我們也在做五個手指的。客戶們的意見也沒有統一。

Atlas和我們公司的G1都用了三指。G1有點小,只有1.3米多一點,五個手指的手有點太大了,後來我們發現三指大部分產品都能用,從實用性角度出發,當然希望硬體越來越簡單,不要用五個手指這麼多關節。

再從使用角度出發,大家還是希望機器人的手指越簡單越好。目前來說,一個電機確實能幹活,但是如果要做更精細的事,比如說拿一個電烙鐵去銲接,或拿一雙筷子,目前只有一兩個關節的手指很難實現,但是三個手指基本夠用。

還有一個觀點,隨著AI技術的成熟,大家對硬體的需求越來越低,如果AI非常成熟,你可以認為沒有手指也能幹活。舉個例子,有一些殘疾人朋友由於不幸的原因,手掌都沒有了,只有一截小臂,但他照樣能做非常精細的事。所以說手不是一個大的限制因素。甚至我感覺,當未來AI成熟後,從垃圾堆裡找幾個關節電機,再隨便找幾個木頭,把它們拼在一起,像個人那樣搭出來,它就自己能走路甚至能幹點活,這都是有可能的。頭部的設計,目前我個人相對比較滿意,可能短時間不會改了。


Q:很多具身智能公司都會把宇樹形容成做人形機器人的身子,將自己定位於在做機器人的大腦,你認可這樣的說法嗎?

王興興:這個問題相對比較複雜,過去一年我們賣的產品比較多,也歡迎所有的客戶用我們的硬體,那怕買了我的硬體,把軟體全給刪了,也非常歡迎。我們過去有跟一些AI公司合作,當然我們也會做一些AI,如果不做AI,大家都不知道我們機器人的AI效果怎麼樣,還是要有一個初始的軟體系統。機器人本體肯定是我們的立身之本,也歡迎大模型公司跟我們合作,如果對方做得比較好,我們非常願意直接在產品上標配他們的大模型。硬體還是要為AI服務,我們要把AI做得更好一點。但說實在的,我們對AI的投入還是比較克制,確實太燒錢了。


人形機器人商業化還未成熟

Q:關於成本問題,市場對G1的價格反應很大,通過自研為什麼能夠做到這麼大幅度的降本?很多公司的觀點是現階段降本並不是最重要的,你怎麼看待降本?

王興興:我們希望有更合理的產品價格提供給客戶,產品有人買,前提是價格相對友好。我們做四足機器人做了很多年,對機械,比如關節電機的生產、整體機械結構、感測器、整個電控系統怎麼用更便宜的晶片,有比較多的經驗,我們的四足機器人和人形機器人很多設計都非常類似。

目前我們一台機器狗最便宜賣到9000多塊錢,對比一下,我們的人形機器人還是有點貴,因為目前人形機器人體量還沒有完全起來,價格定太低對公司和整個行業都不是好事,如果明年後年出貨量提升,機器人的能力也會越來越強,我覺得價格還是可以有更好的調整。

確實量大了可以降成本,這個是大家公認的。但大家公認的事,不是最有競爭的點,最大的點是在設計階段就要做降成本的準備,每個零部件要更加簡化,考慮能不能用成本更低的材料,或者本來用兩個零部件的能不能用一個零部件。要把所有零部件在生產上做到極致,管理上的事情非常多,因為每個零部件都要考慮細節,有些精度要求高的零部件都是0.01個毫米起步的考量。


Q:在四足機器人方面,宇樹有怎樣的研發計畫?未來業務是否會轉型到人形機器人賽道上?

王興興:去年我們在四足機器人投入較大,發佈了兩款四足機器人Go2和B2,相對來說,去年我們反而在人形機器人上投入較少。

工業級機器狗B2被用於消防、巡檢等場景。

產品開發都有周期,我們目前沒辦法說每年有全新的四足機器人產品推出,公司目前的精力也顧不上,但實際上我們的四足機器人Go2和B2都有一些硬體、軟體方面的升級,可能明年也會有新的四足機器人產品發佈。

我們並不是說all in人形機器人,基本上還是兩條路線並重。目前我們最主要的出貨量來源還是四足機器人,在全球範圍內,對比友商,我們的人形機器人這兩年可能賣得還不錯,實際上跟四足機器人來比,體量還是小一些。


Q:你之前提到過,會考慮在機器人上增加足夠多的觸覺感知。觸覺的重要性是什麼?瓶頸又是什麼?

王興興:觸覺非常重要,假設一個人全身的皮膚觸覺喪失了,他可能連一個東西都抓不住,或者走路感覺不到顫動。但是目前的觸覺確實非常糟糕,包括很多機械臂,基本上沒有觸覺,大家也在試著把觸覺裝上去,這樣可以更好地操作,比如說考慮物體會不會滑落,會不會把物體抓壞?目前全球都在往這方面做,特斯拉的機器人手指也在裝觸覺感測器。

觸覺感測器非常不好做,要非常小、足夠敏感,要排列很多個,還有很多線纜,因為它跟物體的接觸非常頻繁,容易壞。最大的問題不是說不能做大面積的觸覺感測器,最大的問題是它太容易壞了,比如皮膚上部署了幾百個甚至上千個觸覺感測器,萬一磕碰,損壞的機率還是非常大,靈敏度和容易損壞一直是個矛盾。


具身智能的iPhone時刻不會超過5年

Q:今年國內外很多人形機器人宣佈了「進廠打工」,雖然大多不具備實際操作能力,宇樹的人形機器人的落地現狀和未來規劃是怎樣的?

王興興:這是一個趨勢,馬斯克最早提出他的汽車工廠有人形機器人進入,這個也是目前汽車工廠比較熱衷的,我們過去幾個月跟蔚來的汽車工廠有合作,部署了人形機器人負責現場的搬運。目前還處於試點階段,我覺得還沒有形成真正的商業閉環,比如一台機器人它產生的商業價值是正向的,可能比人的成本還低,目前還沒有到這個階段。

我們公司目前主要是賣本體比較多,並不是說我們一定要做工業、做科研教育,AI公司或者個人買來玩我們也歡迎。但工業領域我們也在推進,比如我們希望去工廠幫忙做一些簡單的生產裝配和搬運,但可能推進速度沒有那麼快,效率沒有那麼高。我們對行業還是比較有耐心,不是說一定要今年或者說明年在工廠裡部署多少台,我們沒有給自己定目標,尊重整個的市場反應。等到技術和產品大家接觸到一定程度了,已經有一些更好的商業推廣的勢頭了,我們再大規模推廣。


Q:具身智能過去一年和大語言模型一樣受到了市場的高度關注,通用機器人領域什麼時候會出現iPhone時刻?

王興興:iPhone時刻我覺得還有距離,iPhone的出現並不是說有一個特別的技術突破,更多是一個綜合性的技術突破,比如說原本已經有觸控式螢幕了,有很好的CPU,還有一些圖形介面,賈伯斯最後把終極產品的構想給提出來了。

目前在具身智能或者機器人AI這個領域,我個人相對比較樂觀,我覺得在今年年底之前,全球至少有一家公司或者實驗室能把通用型的機器人AI模型做出來,但是這個時間點,我覺得可能也不是iPhone時刻,因為iPhone時刻大家還是希望是在工業或服務業真正有終端產品出現,標誌著這個行業有出貨量暴增的節點。機器人的iPhone時刻我覺得稍微時間再遠一點,可能還要3年或4年,但是我覺得不會超過5年。


公司檔案:宇樹科技


創立時間:2016年


創始人:王興興


核心產品:

人形機器人H1、G1;

消費級四輪機器人Go2、Go1、A1;

行業級四輪機器人B2、B1、Aliengo;

機械臂、激光雷達。


融資歷程:

  • 2017年1月,獲得種子輪融資,融資金額和投資方未知;
  • 2018年5月,獲得天使輪融資,融資金額未知,投資方為安創加速器、變數資本;
  • 2020年1月,獲得數千萬元人民幣Pre-A輪融資,投資方為紅杉中國種子基金、德迅投資;
  • 2020年5月,獲得Pre-A+輪融資,融資金額未知,投資方為紅杉中國種子基金、初心資本、祥峰投資中國基金;
  • 2021年7月,獲得千萬級美元A輪融資,投資方為順為資本;
  • 2022年1月,獲得B輪融資,融資金額未知,投資方為經緯創投;
  • 2022年4月,獲得B+輪融資,融資金額數億元人民幣,投資方為敦鴻資產、海克斯康、順為資本、容億投資、深創投、中網投;
  • 2024年2月,完成B2輪融資,投資方包括美團、金石投資、原始碼資本,老股東深創投、中網投、容億、敦鴻和米達鈞石跟投,融資近10億元。


估值:超過60億元


(新皮層NewNewThing)