具身智能如今已成為最火的產業之一,中國行業龍頭宇樹科技上市正在緊鑼密鼓進行,而中美科技巨頭則在水下更深處進行宏大佈局。
今年3月,在GTC 2025主題演講中,輝達CEO黃仁勳演示了挪威機器人公司1X 的NEO Gamma人形機器人。這款機器人運用了基於輝達GR00T N1模型建構的後訓練策略,並執行自主整理任務。
黃仁勳試圖以此證明,人形機器人的未來在於適應性和學習能力。換言之,機器人到底行不行,關鍵要看“大腦”能否適應環境、能否學習新知識。
黃仁勳的話很快應驗。幾個月後,全球科技巨頭在“機器人大腦”這件事上拿出了新成果。
8月,輝達推出Jetson AGX Thor,一塊能在機器人本體上同時運行多個生成式AI模型的邊緣計算平台。它被行業公認為“機器人新大腦”。
Jetson AGX Thor(以下簡稱 Thor)是面向機器人和物理裝置的新一代技術堆疊。這個全新的“機器人大腦”基於Blackwell GPU架構,峰值算力達到2070 FP4 TFLOPS,AI 性能較現有的Jetson AGX Orin模組提高多達7.5倍,同時能效提升3.5倍。
Thor最大的突破在於,它可以讓過去依賴雲端處理或多塊晶片的機器人,在單一緊湊的模組上實現即時感知和決策。
目前,亞馬遜倉儲機器人和波士頓動力等早期使用者,已經開始在自家產品上整合Thor,目標是打造出更智能、更獨立的機器人產品。
地球的另一邊,字節7月和9月先後推出自研的通用機器人模型GR-3和Robix,展示了在真實家庭場景下執行複雜任務的能力。
字節Seed團隊7月底放出一條演示視訊,一台機器人搭載了字節最新的機器人VLA成果GR-3。在演示視訊中,它完成了將衣架插入襯衫並將其掛起來的任務。
上周,Seed又掏出了最新的機器人研究成果——Robix。它和GR-3一起,組成了字節新一代機器人模型矩陣。
此時距離黃仁勳在 GTC 2025 的感慨僅過去半年時間。兩家巨頭在機器人賽道的“同頻”,也給人這樣一種印象:黃仁勳和張一鳴,這次想到一塊去了。
在Thor橫空出世前,輝達已經成為機器人賽道的領頭羊。
輝達Jetson平台在高端機器人和自主機器開發領域佔據主導地位,其生態系統中擁有超過200萬名開發人員,超過7000家公司使用上一代產品Orin系列。
今年8月,輝達宣佈Thor 正式開售。單從硬體性能和成熟度來看,它在同類產品中幾乎處於絕對領先的地位。
目前,英特爾、高通等競爭對手的邊緣AI(Edge AI,在裝置端本地運行人工智慧)產品相對落後,尚無法在單一模組中實現同等水平的整合計算。
更關鍵的是,輝達將硬體與軟體堆疊緊密繫結,並依託CUDA工具包的廣泛應用,形成了生態護城河。
Thor可以直接呼叫輝達完整的Isaac機器人軟體平台、AI模型庫和模擬工具,實現端到端的深度整合。其中包括輝達針對機器人場景的最新模型——Isaac GR00T N1,一款開源、預訓練且可定製的基礎模型。
GR00T N1採用了受人類認知啟發的雙系統架構。一個系統是“快速思考行動模型”,其行為類似於人類的反應和直覺;另一個系統是“慢思考模型”,能夠推理周圍環境和收到的指令,從而規劃行動。
GTC 2025上, 1X公司CEO Bernt Børnich表示:“在我們開發自主模型的同時,輝達的GR00T N1顯著提升了機器人的推理能力和技能。我們僅使用極少的後訓練資料,就將NEO Gamma完全部署到位。”
然而,Thor並非完美無缺。
首先是價格。Jetson AGX Thor開髮套件的售價為3499 美元,很難成為普通家用產品的選擇。
此外,Thor平台有著更高的功率要求,這意味著其適配的產品需要穩定的供電能力,例如自動駕駛汽車、工廠機器人、送貨機器人等。
在“機器人大腦”的賽道上,輝達很快有了中國競爭對手。
7月底,字節發佈全新一代機器人VLA模型GR-3。官方演示中,搭載著GR-3的機器人ByteMini將衣架插入襯衫並將其掛起來,還完成了拾取家居用品、放置在指定位置等高難度“副本”。
此外,ByteMini可以區分不同尺寸的物品,並成功執行拿起“較大的盤子”的指令。
拆解演示過程和技術報告可以發現,GR-3能夠理解複雜、抽象的語言,比如“較大的盤子”“左邊的椅子”等。
此外,GR-3少樣本適配能力較強。據外媒報導,Seed採用混合方法訓練:首先向 GR-3 輸入大量圖像和文字資料,隨後借助虛擬現實環境中的人機互動進行微調;最後再讓其學習並模仿現實世界中的機器人動作。這套訓練策略,使 GR-3 具備了在複雜且難以預測的環境中保持適應性的能力。
據瞭解,GR-3相比GR00T系列有著更大的參數規模,實際應用中表現更好。
曾在Meta就職的AI科學家Chris Paxton在一篇關於機器人領域VLA的研究中披露,字節的40億參數GR-3模型,表現似乎優於輝達GR00T,後者參數量大約 20 億。可以合理推測,一旦有足夠的資料和算力支撐,“規模定律”(scaling laws)依然有效。
GR-3讓字節在“機器人大腦”賽道有了一席之地,不過,VLA模型更多是用在執行層面,相比起“大腦”的定義,GR-3 更像是機器人肢體的“神經元”。
字節Seed團隊的最新成果,補齊了“機器人大腦”的另一塊拼圖。
上周,Seed團隊發佈最新成果 Robix,在機器人系統中負責任務規劃、推理、自然語言互動等任務。
Seed研究員董恆在個人首頁上這樣描述Robix:“這是一個集推理、規劃和自然互動於一體的統一機器人大腦,其性能優於GPT-4o和Gemini 2.5 Pro。”
不過,Robix並不是“機器人大腦”完全體。
根據Robix 的技術文件,流程中“身體動作/執行”部分通常由低層控製器模型來完成,也就是對應的VLA模型,如GR-3或類似控製器。換言之,GR-3 和 Robix 需要在驅動機器人的場景中相互配合。
Robix的這套工作邏輯,和輝達GR00T N1的雙系統模式有共通之處,一個系統負責推理,另一個系統負責執行。
在官方測試中,搭載GR-3作為控製器的Robix,通過 ByteMini 機器人完成了餐桌清理、收銀裝袋和飲料篩選的任務;與其他模型橫向對比,僅在飲料篩選項目上略微落後於 Gemini 2.5 Pro,其他項目均得分最高。
Robix和GR-3不是字節第一次在機器人VLM領域“秀肌肉”。很多人把字節看作網際網路內容公司,但在機器人領域,它其實是一位低調的“隱形巨頭”。
2023年12月,Seed團隊推出GR-1,該模型也是Seed在機器人VLA領域的前瞻性實驗。作為技術驗證產品,GR-1採用了先用大規模視訊生成式預訓練,再無縫用機器人資料微調的模式。
基於GR-1的技術積累,Seed團隊2024年推出GR-2。GR-2使用了3800萬段視訊、超500億token的資料作為預訓練的基礎,然後再用機器人軌跡做動作/視訊生成微調。它在超100個操控任務測試中的平均成功率高達97.7%。
GR-3 和 Robix,是字節在大模型時代研究領域延伸的最新一環。
《晚點LatePost》在 2023 年的報導中披露,字節的機器人探索始於 2020 年。當時張一鳴就對機器人表現出興趣,此後會不定期參與機器人項目討論。
兩年時間過去,字節已經悄悄量產了1000 台以上的機器人。這些輪式物流機器人主要用於在倉庫、產線上運輸包裹與零件,聚焦於“倉儲+自動搬運”的一體化方案,能自主學習、規劃路線、移動到目的地,服務於自家的抖音電商倉以及順豐、比亞迪等外部客戶。
不過,這些物流機器人更多是早期的技術積累。從 Robix、GR-3和ByteMini的技術發展路徑不難看出,字節致力於在具身智能領域取得領先地位。
近期,字節招聘官網湧現出一批機器人相關的崗位,其中有崗位明確提到“下一代通用機器人”。所有崗位都屬於Seed團隊,base在北京和上海。南華早報在7月的報導中披露,Seed團隊今年人數預計超過300人。
另一方面,字節在機器人產業中也積極投入。
此前,國內具身智能頭部企業宇樹科技完成C輪融資,公司估值超百億。該輪融資的金主名單中,除了阿里、騰訊系的名字,也出現了與字節淵源頗深的錦秋基金。
錦秋基金由原字節財務投資負責人楊潔2022年創立,團隊核心成員多來自字節的投資體系。其名稱“錦秋”源自張一鳴和字節的創業時的發源地——位於北京海淀區的錦秋家園。
字節正在公司內外加速佈局機器人領域。不過,目前字節的技術積累主要是模型側的“機器人大腦”層面;而輝達的最新晶片方案,似乎和字節形成優勢互補。
多年以來,字節是輝達在中國最重要的客戶之一,而黃仁勳也深知中國企業在具身智能市場的重要地位。
今年7月,他現身北京鏈博會開幕式,並在發言中表示:“AI的下一波浪潮將是機器人,未來的機器人不僅能夠推理和執行,還能真正理解物理世界。”
對黃仁勳而言,中國市場在這條路徑上具有不可替代的意義。
輝達官方部落格顯示,多家國內公司已經使用Thor,包括聯影醫療、萬集科技、優必選、銀河通用、宇樹科技、眾擎機器人和智元機器人等。不過,在這一長串名字中,尚未見到字節的身影。
輝達部落格還引述了宇樹科技CEO王興興的發言:“Jetson Thor帶來了計算能力的巨大飛躍,賦能機器人更強的敏捷性、更快的決策制定以及更高的自主水平,這對於機器人在現實世界中實現導航與互動至關重要。”
2025年1月,在CES全球消費電子展上,黃仁勳與14家合作的人形機器人公司一同登台,其中6家來自中國,包括宇樹科技和小鵬等企業。
另一方面,字節 Seed 團隊並非只聚焦機器人模型領域。
在測試 GR-3 和 Robix 的過程中,字節同步推出了ByteMini。儘管看起來更像是測試用途的實驗性產品,但瀏覽 Seed 團隊的技術報告可以發現,這款機器人的技術規格並不低,包含 22 個自由度,手腕採用球形腕設計,在狹小空間/高靈巧任務中有較高的操作能力。
可以說,ByteMini的出現,已經顯示出字節打造下一代具身智能產品的野心。而隨著輝達拿出了新一代機器人晶片方案,想到一塊去的黃仁勳和張一鳴,似乎有望在機器人領域,延續這兩家頭部企業的合作關係。 (EDA365電子論壇)