330億熱錢湧入，具身智能尚在開局

2026/05/16

•

今年4月，2026北京亦莊人形機器人半程馬拉松賽場上演了一場年度名場面：

身著紅色戰衣的人形機器人“閃電”，以50分26秒的淨用時強勢奪冠，一舉打破人類半程馬拉松紀錄；而“具身天工Ultra”則把半馬成績縮短1小時25分鐘。

這一幕看似是機器人硬體突破，但真正的行業變革藏在細節裡，對比往年就能看出天壤之別：

今年參賽的300多款人形機器人當中，數百款機器人徹底告別了去年依賴人工遙操作的運行模式，真正實現了全程自主奔跑，不再是人類操控的“提線木偶”。

表面看，是機器人的步態、平衡硬體在飛速迭代，但核心是來自飛速成熟的AI大模型感知、雲端算力。就像奪冠的“閃電”，依靠AI大腦核心演算法即時調整動態平衡，遇到路況波動、姿態偏移時無需任何人干預，就能瞬間自主修正。

很多人只盯著終端機器人卷外觀、卷硬體、卷競速資料，卻忽略了一個最殘酷的行業真相：

現在終端本體的硬體差距早已越卷越小，真正拉開行業鴻溝、決定機器人能不能規模化落地的，根本不是機身硬體，而是背後的AI雲底座。

作為機器人底層支撐，如今的AI雲，早已不是單純提供算力的“工具配角”，而是撐起整個具身智能產業的核心底座，搭建起整套資料、端雲協同等能力，從而讓機器人能自主識環境、做判斷、處理任務，也讓具身智能走出實驗室，真正落地現實場景。

顯然，AI雲廠商的技術深度與行業適配能力，正成為拉開具身智能行業差距的核心變數，也預示著行業內卷下半場已然到來。

“曾經被認為是小眾研究方向的具身機器人，如今已走出實驗室，成為一個兆等級賽道。但具身要落地，資料、模型、本體三座大山必須跨越，其中資料和模型，是AI基礎設施要解決的問題。”百度集團執行副總裁、百度智能雲事業群總裁沈抖在5月13日表示，AI雲需要幫助本體企業建構物理AI時代的 Scaling 能力。

放眼長期，具身智能賽道即將成為兆級市場：

摩根士丹利預測，到2036年，全球人形機器人採用量將達到2440萬台；到2050年，全球人形機器人保有量將達到10億台，同時全球人形機器人市場年收入將高達7.5兆美元。

顯然，未來10億台（摩根士丹利資料）機器人落地的背後，必然是海量的資料訓練、端雲協同、智能迭代需求。

可以確定的是，未來人形機器人的行業競爭，終端只是入場券，AI雲智能底座才是最終的決勝底牌。

01. 330億具身智能引爆“資本狂潮”

早在2025年3月，知名投資人、金沙江創投主管合夥人朱嘯虎公開表示，已“批次退出”其人形機器人投資。

核心原因在於，他認為當下具身智能與人形機器人項目的商業化路徑尚不清晰。

緊隨其後，經緯創投創始合夥人張穎在朋友圈發文委婉反駁：人形機器人本就是頂級大賽道，行業百花齊放，發展過程中出現適度泡沫也實屬正常。拉長時間維度來看，這條賽道一定會誕生重量級龍頭企業。

兩位頂級投資人的隔空辯論，瞬間把具身智能與人形機器人行業推上輿論焦點。

但有趣的是，這場朱張之爭，並未讓具身智能陷入融資寒冬，反而這兩年行業投融資熱度愈發高漲：

日均兩起融資、單日超4億元資金湧入，具身智能賽道已然上演“資本核爆”。

公開資料顯示，2025 年，中國具身智能和人形機器人初創公司共完成325筆風投交易，同比增長216%；投融資總額超過398億元，同比增長326%。

進入2026年初，行業更是迎來一輪超級資本熱潮。

據智能紀元AGI從多個管道不完全統計，2026年第一季度，具身智能和機器人領域披露的融資事件數量超過200個，其中包括16起單筆金額10億元及以上的融資；融資規模已超過330億元。

其中，國內數十家具身智能企業單輪融資超10億元，20余家企業估值破百億，宇樹、智元等頭部企業估值更是突破300億元。

摩根士丹利研報指出，今年全球人形機器人創投規模已超越2025年全年，規模已超過450億元，增長速度遠超市場預期。其中，中國市場貢獻了全球約46%的創投資金，成為資本角逐的核心陣地。

顯然，具身智能和人形機器人行業已經進入了一個特定的周期階段：與當年電動車、移動網際網路的崛起階段如出一轍，行業共識快速凝聚，持續吸引海量資本湧入。

02. 資料、模型和本體三大挑戰

儘管產業巨頭與頭部投資機構紛紛加速佈局入場，但朱張之爭也暴露出行業深層現狀：

賽道內企業的具身智能、人形機器人商業化閉環仍未跑通，開源資料集暫不具備落地商用價值，真實場景資料採集、VLA 模型迭代、通用場景任務落地等核心環節，仍處於早期階段，至今仍難以實現通用化、規模化商業應用。

資料、模型和本體，依然是中國具身智能從場景探索到產業落地過程中需要攀登的三座大山。

首先是資料。

星海圖創始人、CEO高繼揚在Create 2026百度AI開發者大會上表示，“具身模型之外，我們看到最主要的問題還是資料的問題。其實現在很多演算法層面的要素已經具備，而演算法+資料等於模型。”

實際上，無論是人形機器人的靈巧操作、服務機器人的場景適配，還是工業機器人的精密作業，核心能力落地，全都依賴大規模、高品質、多模態的場景化資料。

但眼下，模型、資料與實際落地之間，仍橫亙著現實鴻溝：

現有訓練資料體量不足、模態單一、質量參差，很難滿足模型複雜感知與行為學習需求；開源資料集本身規模有限，又缺少統一採集標註標準，直接制約了模型跨任務、跨場景的泛化能力；而且，真實場景資料採集成本高昂，又和模型視覺泛化需求形成矛盾，現實環境複雜多變、任務充滿不確定性；以及國內各家機構、企業資料相互割裂，缺少共建共享機制，很難搭建起規模化、標準化的行業資料底座。

業內普遍認為，當前具身智能領域正處於2.0階段，若具身智能邁向GPT-3階段，所需資料量將高達2000萬小時。

其次是模型。

VLA、VLM模型即成產品，但需要整機和實際應用結合，高品質資料稀缺下，模型框架也未收斂，而評測體系缺失、不公正情況成為行業對於具身智能模型發展的阻力。

北京大學助理教授、銀河通用機器人創始人及CTO王鶴也指出，當前人形機器人仍停留在千台級出貨規模，真實產出能力與自動駕駛百萬級車隊的資料量存在數量級差距。

最後是本體。

沈抖今年3月提到，當前具身智能與人形機器人行業雖熱度高漲，但仍存三大挑戰——本體穩定性、耐用性、靈巧性仍不足；而且，行業未形成統一技術底座，遠未迎來產業的ChatGPT爆發時刻；此外，具身智能資料未形成規模化正向循環，仍停留在實驗採集階段，沒能落地生產生活、跑通商用閉環。

正如智平方科技創始人郭彥東所言，未來機器人需要跨越的第二個關鍵門檻是走向量產——做出幾萬台、幾十萬台且保持高一致性，才是真正成功閉環與否的關鍵所在。

03. 如何破局：AI雲支撐具身智能

眼下，具身智能正從“實驗室能力驗證”，邁向“真實場景規模化落地”階段。

2026年，具身智能已經分化出兩條清晰發展主線：

1、攻堅可泛化的通用大腦與世界模型，瞄準通用 AI 方向，讓機器人真正具備物理級智能大腦；

2、加速商業化落地，從真實場景痛點切入，通過技術調優、結構適配、資料模型重構，讓產品真正貼合市場需求。

高繼揚表示，具身智能已經走到了“上半場”的結尾，正在迎來“下半場”。2026年下半年，是具身智能行業成果驗證期，能否實現真正的人工替代、產生商業價值，是所有具身智能企業的生死線。

而對於百度智能雲巨頭來說，其在具身模型訓練、算力基建、技術生態、場景落地等維度，早已形成天然底層優勢，可以幫助更多具身智能公司實現資料、模型和本體能力的升級。

首先是具身模型訓練和算力基建層面。

要想資料訓練更精準、更好用，就必須依託強大算力平台，支撐多樣化訓練範式高效運轉。

以星海圖為例。其研發的具身模型研發工作跑在百度智能雲上，後者提供高性能、穩定可靠的AI基礎設施，百度百舸AI計算平台在算力高效調度、資料高效流轉、模型訓推加速等方面的技術積累，提升模型開發效率。雙方開發團隊密切協作，對世界模型Fast-WAM的單步推理延遲進行最佳化，將進一步縮短到90毫秒以內。

百度智能雲主任架構師應茹近期對智能紀元AGI表示，百度百舸目前提供了一套完整的具身智能Workflow。

她認為，具身智能的迭代閉環遠不止”訓練一個模型”，而是從資料處理、模型訓練到模擬評估、部署推理的完整工作流，任何一個環節的低效都會拖慢整體節奏。而百舸把在LLM和多模態大模型爆發階段積累的完善AI Infra基礎設施，快速遷移和適配到具身智能領域，幫助客戶跳過底層基礎設施建設，專注演算法創新和產品落地，從而在時間窗口中贏得競爭優勢。

“這套 Workflow 的最大價值本身也是百度百舸產品的定位和核心價值。”應茹表示。

資料環節，百度智能雲整合了行業大規模無本體資料集（如RealOmni），支援客戶直接掛載使用；

而開發訓練層面則提供雲端開發機，並提供全套開源模型的加速套件，針對具身場景的多模態訓練做了深度最佳化，訓練吞吐相比開源基線提升 1~5倍；

模擬評測層面，百度智能雲預置了 Isaac Sim、ManiSkill3等主流模擬引擎，進行了深度性能調優，並沉澱了不同 GPU 平台與具身場景的適配選型建議，讓工程師專注演算法而非偵錯環境。

據悉，百度智能雲已經把VLA這種典型具身智能模型的訓練速度提高了70%，在世界模型推理上的時延降低了50%；原本按周計的訓練，現在可以按小時來訓練。

在場景應用層面，百度智能雲深耕多年，已在科研教育、康養服務、智能製造、物流能源、商業服務、生命科學等領域，沉澱了大量 AI 落地與規模化經驗。

例如，靠著百度智能雲的技術加持，北京人形的天工人形機器人，已經率先闖進電力行業，能全程自主做巡檢、干實操活兒，成為業內首款能在電力行業獨立完成作業與巡檢任務的人形機器人。

這也成為國家電網今年集中採購約8500台具身智能裝置、投入68億元佈局的重要原因，業內更預判，2026年，國內電力行業具身智能投資規模有望突破100億元。

本質上，百度智能雲並不下場做硬體本體，也不直接做終端應用，而是定位於行業技術賦能者與場景連接者，以 AI 基礎設施和產業協同平台為核心，已經助力上百家具身智能和人形機器人企業，在具身大腦、運控小腦、資料集建設、整機研發等關鍵環節完成技術突破。

Omdia《中國具身智能AI雲市場》報告顯示，百度智能雲以35%的市場份額位居中國具身智能AI雲服務市場第一。

而在我們看來，百度智能雲在具身智能領域的核心競爭優勢，在於市場地位夠強。目前，百度智能雲已支援北京、上海、浙江、四川等地的具身智能創新中心，以及智元機器人、宇樹科技等產業鏈上超過30家重點企業。據悉，採用百度智能雲異構高性價比架構方案，成功突破原有框架瓶頸，將整體訓練吞吐性能提升5倍以上。

今年人形半馬比賽中，超過六成參賽機器人採用百度智能雲技術支撐賽事與研發。

Create 2026百度AI開發者大會還同期開展了具身智能分論壇。其中，北京人形機器人創新中心與百度智能雲聯合啟動“天工開物”駭客松，建構運動控制、VLA兩類任務能力，冠軍獎勵現金5萬元以上，以及天工硬體、創新中心深度合作等，當然還有近15位具身智能企業CXO、學界專家與產業生態代表集中亮相，圍繞世界模型、具身資料、機器人訓練以及產業落地展開討論。

而星海圖GalaxeaOpenWorld開源資料集也已在百度百舸平台上線，開發者在百舸平台上即可一鍵調取用於模型訓練任務等，進一步強化百度智能雲在具身智能產業中的平台角色與生態影響力。

當前，具身智能仍處在“表面熱度拉滿、實際投入不足、落地艱難”的早期周期，除了表演展示之外，具身智能和人形機器人在工業和家庭場景的商業化遠未跑通閉環。

正如沈抖所說，具身智能的發展是一個循序漸進的過程，不會出現類似大模型那樣的爆發式“ChatGPT 時刻”。而家庭場景落地，更是具身智能商業化的終極場景，對技術能力有更高要求，落地周期十分漫長，屬於十年維度的長期目標。

對於百度智能雲而言，已形成從資料採集、訓練到應用部署的完整鏈路能力，並以“芯雲模體”全端能力築牢具身智能底座，依託百舸算力、文心大模型與資料超市，為本體廠商提供雲端大腦、訓練加速與資料閉環服務。依託算力、模型、資料、生態與場景的全端積澱，其恰好站在了“AI基礎設施+具身智能產業生態”的核心樞紐位置，成為支撐整個具身產業往前發展的底座能力。

2026年，既是具身智能與世界模型的爆發起點，也是行業商業化洗牌、優劣分化的關鍵一年。資本只是這場具身智能競賽的入場券，真正決定長期格局的，是硬核技術、落地能力，以及能否訓練出比肩GPT-5層級的通用具身智能。

在我看來，距離真正通用具身機器人落地依然還有數年時間，而對於百度這類AI雲廠商來說，他們將成為行業背後的核心賦能者，使得具身智能產業拐點將加速到來。 (智能紀元AGI)