#具身智能
里程碑!人形機器人與具身智能標委會成立,王興興彭志輝發言
據中國電子學會微信公眾號消息,12月26日,工業和資訊化部人形機器人與具身智能標準化技術委員會(以下簡稱“標委會”)成立大會在京舉行。工業和資訊化部副部長柯吉欣,全國政協常委、致公黨中央副主席、全國婦聯副主席、中國電子學會理事長徐曉蘭,工業和資訊化部總工程師、標委會主任委員謝少鋒,中國電子學會理事會黨委書記張峰,標委會委員,工業和資訊化部科技司有關負責同志,地方經信部門代表,企業、媒體等100餘人出席會議。成立大會由中國電子學會副理事長兼秘書長、總部黨委書記陳英主持。柯吉欣副部長、徐曉蘭理事長、謝少鋒總工程師、張峰書記為人形機器人與具身智能標委會揭牌柯吉欣副部長在致詞中表示,黨中央高度重視人形機器人與具身智能等未來產業發展。在各界的共同努力下,中國人形機器人與具身智能產業蓬勃發展。當前成立標委會,系統推進人形機器人與具身智能標準化工作,恰逢其時。一是精準把握產業需求,加強高品質標準供給。加強標準制定的系統性和前瞻性,加快完善標準體系。二是充分凝聚各方合力,建構協同發展生態。以標委會為平台,拓寬參與管道,建構分工明確、優勢互補的標準生態。三是前瞻佈局國際標準,提升產業競爭能力。堅持“開門做標準”,主動與國際標準體系協調對接,深化標準合作與交流互鑑,提升國內產業的國際競爭力。徐曉蘭理事長在致詞中表示,人形機器人是人工智慧、晶片、感測器、材料、軟體等諸多技術的集大成者,已成為新質生產力的典型代表。中國電子學會作為標委會秘書處單位將著力做好以下四方面工作,一是建構“敏捷迭代”的標準供給機制,堅持急用先行,穩步推進。二是強化“全鏈條”協同生態,對內打通上下游適用壁壘,對外做好跨領域協同。三是深化“應用為先”的貫標機制,堅持企業主體地位,結合真實場景,建立健全認證評估體系,推動標準落實落地。四是推動建立“主導型”標準體系,深度參與國際國家標準化活動,加強與國內外標準組織的協同聯動。魏巍司長宣讀成立工業和資訊化部人形機器人與具身智能標委會的公告,柯吉欣副部長、徐曉蘭理事長、謝少鋒總工程師、張峰書記共同為標委會揭牌。柯吉欣副部長為謝少鋒總工程師頒發標委會主任委員聘書,標委會主任委員謝少鋒總工程師為標委會副主任委員、秘書長、副秘書長頒發聘書。柯吉欣副部長為謝少鋒總工程師頒發標委會主任委員聘書標委會主任委員謝少鋒總工程師向標委會副主任委員、秘書長、副秘書長頒發聘書隨後,標委會召開了第一屆第一次全體委員會議。首先,工業和資訊化部科技司杜廣達副司長解讀推動人形機器人與具身智能創新發展的有關考慮。會議審議通過了標委會章程、秘書處工作細則、標準制修訂工作程序、下設工作組管理細則、下設工作組組成方案、2026年工作要點等。標委會副主任委員兼秘書長、中國電子學會副秘書長、北京經濟技術開發區管委會副主任(掛職)梁靚主持會議。江磊副主任委員發言熊友軍副主任委員發言王興興副主任委員發言彭志輝副主任委員發言韓震峰委員發言王仲遠委員發言焦繼超委員發言王曉剛委員發言在發言環節,人形機器人(上海)有限公司首席科學家江磊,北京人形機器人創新中心有限公司總經理熊友軍,宇樹科技股份有限公司董事長王興興,智元創新(上海)科技股份有限公司首席技術官彭志輝,應急管理部國家自然災害防治研究院有限空間應急機器人實驗室常務副主任韓震峰,北京智源人工智慧研究院院長王仲遠,深圳市優必選科技股份有限公司副總裁焦繼超,上海商湯智能科技有限公司執行董事、首席技術官王曉剛等標委會委員代表發言,大家一致表示將在標委會履職盡責,引領行業標準規範,建構產業發展基礎。謝少鋒總工程師在總結講話中表示,我們要深刻認識緊抓人形機器人發展機遇的重大意義,提高政治站位,切實加強使命感和責任感。聚焦關鍵領域、集中優勢力量,推進開源、資料、作業系統、模擬平台等實現突破,全面築牢產業發展根基。凝聚各方力量,加快推進產業規模化發展,合理配置各方力量,堅持需求導向,明確技術路線,尋求最優路徑,紮實推進各項工作。加快建構完善標準體系,以高水平標準服務產業高品質發展。加大資金政策支援,並在倫理治理、質量提升、中試驗證等方面做好相關工作,助力人形機器人加速落地。標委會將在工業和資訊化部指導下,夯實組織基礎、聚焦產業需求、加快標準供給、強化實施應用、拓展國內外協同,助力中國人形機器人與具身智能產業在規範、協作、共贏的框架下,開啟高品質發展新篇章。此前,工業和資訊化部在11月24日公示人形機器人標準化技術委員會委員名單。名單顯示,宇樹科技股份有限公司王興興、智元創新(上海)科技股份有限公司彭志輝等為副主任委員。(上海證券報)
15個未來產業新賽道全景解析
15個未來產業解析1. 引言中國工業和資訊化部發佈《國家高新區新賽道培育行動方案》(工信廳規函〔2025〕8號),旨在推動國家高新區在新一輪科技革命和產業變革中搶佔先機,培育具有國際競爭力的未來產業。該行動方案聚焦國家重大戰略需求和科技前沿領域,通過"開放式發現—高標準選拔—精準性培育"的推進機制,最終遴選出15個重點新賽道方向進行系統化培育。這15個新賽道方向包括:量子科技、腦機介面、具身智能、人工智慧大模型、高性能積體電路、第六代移動通訊(6G)、工業網際網路、基礎軟體與工業軟體、清潔氫、高端新材料、商業航天、低空經濟、生物製造、細胞與基因、高端醫療器械。本文將按照技術成熟度,將這15個新賽道分為突破期、成長期和成熟期三個層次進行解析,探討每個領域的技術特點、應用場景、政策支援及產業化前景,為理解中國未來產業發展路徑提供參考。2. 技術成熟度分層解析2.1 突破期新賽道突破期新賽道是指技術基礎尚不成熟,但具有顛覆性潛力,有望在未來5-10年內實現關鍵技術突破的領域。量子科技:量子科技是利用量子力學原理進行資訊處理、感測和計算的前沿領域。中國在量子通訊領域已取得全球領先,如"墨子號"量子科學實驗衛星和"京滬幹線"量子保密通訊骨幹網。然而在量子計算方面,雖然有阿里巴巴、百度、騰訊等企業佈局,但與美國、歐洲相比仍有差距。量子科技的關鍵應用場景包括量子計算、量子通訊和量子測量,其中量子計算有望在密碼學、新材料設計、藥物研發等領域帶來革命性突破。預計到2030年,中國將實現量子計算的初步商業化應用。報告原文閱讀>>>量子資訊技術發展與應用研究報告(2025年)腦機介面:腦機介面技術通過在人腦與外部裝置之間建立直接的資訊交換通道,實現腦與裝置的互動。目前,中國腦機介面技術已取得一定進展,如清華大學研製的無創腦機介面系統和中國科學院的侵入式腦機介面技術。主要應用場景包括醫療康復(如幫助癱瘓患者控制假肢)、人機互動和軍事應用。2025年,工信部將腦機介面列為新賽道重點培育方向,預計未來5年將迎來技術突破期,到2030年有望實現部分商業化應用。這兩個突破期新賽道的共同特點是技術壁壘高、研發周期長、投入大,需要長期穩定的政策支援和資金投入。中國在量子通訊領域已具備一定優勢,但在量子計算和腦機介面的基礎研究方面仍有提升空間。這兩個領域的技術突破將為中國在下一代資訊技術和生物技術領域贏得全球競爭主動權提供重要支撐。2.2 成長期新賽道成長期新賽道是指技術已取得初步突破,處於產業化初期,有望在未來3-5年內形成較大市場規模的領域。具身智能:具身智能是指賦予機器人或智能體物理實體和感知能力,使其能夠在真實環境中自主學習、適應和互動的技術。2025年,中國在具身智能領域已取得顯著進展,如優必選Walker S1機器人和宇樹科技的四足機器人。具身智能的主要應用場景包括工業製造、醫療健康、家庭服務和特種作業等。中國在具身智能領域的優勢在於應用場景豐富和產業鏈完備,但在核心演算法和高端感測器方面仍有差距。預計到2028年,具身智能將在特定場景實現規模化應用。人工智慧大模型:人工智慧大模型是基於海量資料訓練的深度學習模型,具有強大的自然語言處理、圖像識別和多模態理解能力。2025年,中國已湧現出文心一言、通義千問、智譜GLM等一批具有國際競爭力的大模型。大模型的應用場景幾乎涵蓋所有行業,包括智能客服、內容創作、醫療診斷、金融分析等。中國在大模型領域的優勢在於資料資源豐富和應用場景廣泛,但在基礎演算法創新和高端晶片方面存在短板。預計到2027年,大模型將實現從通用能力向專業領域的深度滲透。報告延伸閱讀:生成式人工智慧應用發展報告(2025)-中國網際網路絡資訊中心(點選下方圖片可查閱下載報告全文)高性能積體電路:高性能積體電路是支撐數字經濟發展的關鍵基礎,包括先進製程晶片、專用晶片和第三代半導體等。2025年,中國積體電路產業規模已突破兆元,但在高端晶片設計和製造方面仍面臨挑戰。高性能積體電路的主要應用場景包括高性能計算、人工智慧、5G通訊等。中國在積體電路領域的戰略是"設計引領、製造提升、封裝突破、材料配套、裝置支撐"。預計到2028年,中國將在部分關鍵領域實現技術突破。第六代移動通訊(6G):6G是繼5G之後的下一代移動通訊技術,將提供更高的速率、更低的時延和更廣的連接。2025年,中國已啟動6G技術研發試驗,預計2025-2027年完成關鍵技術研究,2028-2030年完成標準制定。6G的主要應用場景包括沉浸式體驗、智能體互動、全息通訊等。中國在6G領域的優勢在於5G技術積累和市場規模,但面臨技術路線選擇和國際標準競爭的挑戰。預計到2030年,6G將開始商用部署。報告延伸閱讀:2025年6G傳輸技術白皮書(點選下方圖片可查閱下載報告全文)這四個成長期新賽道是中國科技自立自強的關鍵領域,也是國際科技競爭的焦點。中國在這些領域既有優勢也有挑戰,需要加強基礎研究和核心技術攻關,建構自主可控的產業生態。2.3 成熟期新賽道成熟期新賽道是指技術已相對成熟,處於規模化應用階段,有望在未來1-3年內形成顯著經濟和社會效益的領域。工業網際網路:工業網際網路是新一代資訊技術與製造業深度融合的產物,通過連接工業全要素、全產業鏈、全價值鏈,實現資源最佳化配置和生產方式變革。2025年,中國工業網際網路已形成"綜合型+特色型+專業型"平台體系,連接工業裝置超過1億台。主要應用場景包括裝置預測性維護、生產過程最佳化、供應鏈協同等。中國在工業網際網路領域的優勢在於製造業基礎雄厚和應用場景豐富,但在工業軟體和高端裝備方面仍有短板。預計到2027年,工業網際網路將實現從單點應用向全鏈條整合的轉變。基礎軟體與工業軟體:基礎軟體包括作業系統、資料庫、中介軟體等,工業軟體包括CAD、CAE、CAM等研發設計軟體和MES、PLM等生產管理軟體。2025年,中國基礎軟體和工業軟體自主化率持續提升,但在高端領域仍有較大差距。主要應用場景包括智能製造、數字政府、金融科技等。中國在軟體領域的優勢在於市場規模大和開發人才豐富,但在核心演算法和底層架構方面存在不足。預計到2027年,中國基礎軟體和工業軟體將在重點行業實現規模化應用。清潔氫:清潔氫是通過可再生能源電解水或化石能源耦合碳捕集技術生產的氫氣,具有零排放、高能量密度的特點。2025年,中國氫能產業規模已突破5000億元,清潔氫佔比持續提升。主要應用場景包括氫燃料電池汽車、氫能儲能、氫能冶金等。中國在氫能領域的優勢在於可再生能源資源豐富和應用場景廣泛,但在氫能儲運和燃料電池技術方面仍有提升空間。預計到2027年,中國清潔氫將在交通和工業領域實現規模化應用。高端新材料:高端新材料是指具有特殊性能和功能的先進材料,包括先進基礎材料、關鍵戰略材料和前沿新材料。2025年,中國新材料產業規模已突破6兆元,但在高端領域仍有差距。主要應用場景包括電子資訊、航空航天、新能源等。中國在新材料領域的優勢在於產業鏈完整和市場需求旺盛,但在原始創新和高端裝備方面存在短板。預計到2027年,中國高端新材料將在關鍵領域實現國產替代。商業航天:商業航天是指由企業主導的航天活動,包括衛星製造、發射服務、空間應用等。2025年,中國商業航天產業規模已突破2兆元,湧現出一批具有國際競爭力的企業。主要應用場景包括衛星網際網路、遙感監測、太空旅遊等。中國在商業航天領域的優勢在於航天技術積累和市場需求增長,但在商業模式創新和國際合作方面仍有提升空間。預計到2027年,中國商業航天將在衛星網際網路和遙感應用領域實現規模化發展。低空經濟:低空經濟是指在低空空域開展的經濟活動,包括無人機配送、空中遊覽、應急救援等。2025年,中國低空經濟規模已突破5000億元,無人機應用領域不斷拓展。主要應用場景包括物流配送、農林植保、城市治理等。中國在低空經濟領域的優勢在於應用場景豐富和政策支援有力,但在空域管理和服務標準方面仍需完善。預計到2027年,中國低空經濟將在物流配送和城市服務領域實現規模化應用。生物製造:生物製造是利用生物系統或生物體生產化學品、材料和能源的過程,具有綠色、高效、可持續的特點。2025年,中國生物製造產業規模已突破1兆元,生物基產品種類不斷豐富。主要應用場景包括生物基化學品、生物基材料、生物燃料等。中國在生物製造領域的優勢在於生物資源豐富和產業基礎良好,但在生物合成技術方面仍有差距。預計到2027年,中國生物製造將在化工替代和材料創新領域實現突破。細胞與基因:細胞與基因技術是利用細胞和基因進行疾病治療、健康管理和生物製造的技術,包括基因治療、細胞治療、基因編輯等。2025年,中國細胞與基因治療產業規模已突破1000億元,多個產品獲批上市。主要應用場景包括腫瘤治療、遺傳病治療、組織再生等。中國在細胞與基因領域的優勢在於臨床資源豐富和應用場景廣泛,但在原創技術和高端裝備方面仍有短板。預計到2027年,中國細胞與基因技術將在腫瘤和遺傳病治療領域實現規模化應用。高端醫療器械:高端醫療器械是指具有高技術含量和高附加值的醫療裝置,包括醫學影像裝置、體外診斷裝置、微創治療裝置等。2025年,中國醫療器械產業規模已突破1.5兆元,高端產品國產化率持續提升。主要應用場景包括疾病診斷、治療和康復。中國在高端醫療器械領域的優勢在於市場規模大和產業鏈完整,但在核心技術和高端產品方面仍有差距。預計到2027年,中國高端醫療器械將在重點疾病領域實現國產替代。這九個成熟期新賽道是中國產業升級和高品質發展的重要支撐,也是培育新增長點的關鍵領域。這些領域既有技術基礎,又有市場需求,有望在短期內實現規模化發展,為經濟增長提供新動能。3. 區域佈局與協同發展15個新賽道方向在中國範圍內呈現差異化佈局。北京、上海、深圳等地在人工智慧大模型、高性能積體電路等領域具有領先優勢;安徽、陝西等地在量子科技領域具備特色;浙江、江蘇等地在工業網際網路、高端新材料等領域優勢明顯;四川、廣東等地在低空經濟領域發展迅速。這些新賽道之間存在顯著的協同效應。例如,人工智慧大模型與具身智能相結合,可提升機器人的認知和決策能力;高性能積體電路為6G通訊和人工智慧提供算力支撐;工業網際網路與高端新材料相結合,可促進製造業數位化轉型;生物製造與細胞與基因技術協同,可推動生物醫藥創新發展。通過建構跨領域、跨區域的協同創新網路,實現資源共享、優勢互補,將有助於加速新賽道的培育和發展,形成具有國際競爭力的產業叢集。4. 結論與展望《國家高新區新賽道培育行動方案》遴選出的15個重點新賽道方向,覆蓋了資訊技術、生物技術、新材料、新能源、航空航天等多個前沿領域,反映了中國面向科技前沿和國家重大需求的戰略佈局。從技術成熟度來看,這些新賽道可分為突破期、成長期和成熟期三個層次,分別代表了中國未來產業發展的不同階段和重點領域。突破期的量子科技和腦機介面有望在未來5-10年內實現關鍵技術突破;成長期的人工智慧大模型、具身智能等領域有望在未來3-5年內形成較大市場規模;成熟期的工業網際網路、高端新材料等領域有望在未來1-3年內產生顯著經濟和社會效益。從戰略意義來看,這些新賽道既是中國科技自立自強的關鍵領域,也是建構新發展格局的重要支撐。通過集中優勢資源,實施精準培育,有望在這些領域實現從跟跑到並跑甚至領跑的轉變,為中國在新一輪科技革命和產業變革中贏得主動權。未來,隨著技術不斷突破、產業生態不斷完善、應用場景不斷拓展,這些新賽道將為中國經濟高品質發展注入新動能,為人民美好生活提供新供給,為建構人類命運共同體貢獻中國智慧和中國方案。 (TOP行業報告)
中國第一具身大模型獲21億元融資,銀河通用機器人估值突破200億
美通社消息:近日,銀河通用機器人(以下簡稱"銀河通用")官宣完成新一輪超3億美元融資。本輪融資由中國移動鏈長基金領投,中金資本、中科院基金、蘇創投、央視融媒體基金、天奇股份等重量級投資平台及產業巨頭聯合注資,並同步獲得來自新加坡、中東的國際投資機構及老股東的加注。本輪融資標誌著具身智能領域單輪最大融資的誕生。銀河通用機器人累計融資額約達8億美元,估值達30億美元,這意味著本輪融資刷新了此前6月份由該公司創下的單輪融資及累計融資雙紀錄,也是目前人形機器人行業最高估值。銀河通用本輪融資所呈現出的資本結構與資金體量,彰顯著全球人形機器人行業在經歷運動性能快速發展之後,正邁進以銀河通用為代表的規模化生產力新階段。作為全球範圍內首家真正實現從"百億資料集"到"具身大模型"、再到"機器人本體"全端自研的具身智能企業,銀河通用在技術攻堅上持續取得引領性突破。其自主研發的具身智能大模型已在多工泛化操作、人形機器人全身運動控制、跨本體自主導航、靈巧手精密操作等多個方面開創全球第一,為人形機器人的規模化、高可靠落地奠定了堅實的技術基礎。銀河通用機器人緊密圍繞真實產業需求,堅持打造工業級使用標準的人形機器人,並已在工業製造、即時零售倉、智慧城市服務、醫療康養等多個領域建構成熟解決方案,並實現規模化商業落地。在技術層面,銀河通用毋庸置疑是具身大模型領域的領航者。近期,銀河通用發佈了全球首個跨本體、全域環視的導航基座大模型NavFoM,讓機器人第一次理解"移動的本質",實現在複雜場景下跟隨及自主導航兩種能力,並在業內率先突破小時級長程導航,並能實現動態避障;面對行業內長期存在的靈巧操作能力空白,銀河通用發佈靈巧手神經動力學模型DexNDM,突破傳統軌跡程式設計的技術,在行業內首次打造基於訓練的靈巧手控制演算法,使靈巧手能真正靈活應對複雜、多樣、極長、極小的物品實現手內旋轉等精密操作,擰螺絲、修桌腿樣樣精通,推動具身智能賦能兆級工業精密應用;而面向未來更豐富的社會場景,銀河通用同步展開足式機器人研究,發佈超強抗干擾的全身動作追蹤系統Any2Track,大幅提升人形機器人全身運動的學習效率,實現"追蹤任意運動、應對任意干擾",顯著提升雙足機器人在複雜場景中的穩定性與適應性。此外,銀河通用積極推動具身智能生態建設,開源發佈全球首個靈巧手功能性抓取合成巨量資料體系DexonomySim,以及全球首款全開源、多機型、跨虛實的人形機器人全身遙作業系統OpenWBT,為全球研究者與產業開發者提供關鍵基礎設施,加速具身智能在多元場景中的技術突破。在商業應用方面,銀河通用在國內率先實現人形機器人在真實應用場景長期、全自主、規模化落地。工業製造領域,獲得寧德時代、德國博世、豐田汽車、韓國現代、北汽集團、上汽集團、極氪汽車、長城汽車等國內外龍頭工業客戶達成深度合作,累計訂單達數千台。值得一提的是,今年6月,寧德時代領投銀河通用11億元融資,銀河通用也是目前唯一獲得寧德時代投資的具身智能大模型企業。Galbot G1在汽車生產線執行物料分揀偵錯工作智慧城市領域,銀河通用開創城市級具身智能解決方案"銀河太空艙",以人形機器人Galbot為核心,實現完全自主的營運與值守,打造人與機器人"零距離"互動的智慧零售與城市服務終端。該方案已在北京頤和園、王府井、成都春熙路、蘇州獅山文化廣場、杭州湖濱路步行街等全國數十個城市的核心商圈、街區、重要地標及居民社區實現常態化運行,持續為市民提供服務,成為具身智能深度賦能城市公共服務體系的全球性示範案例。全球首個面向消費者常態化經營的具身智能零售店“銀河太空艙”即時零售倉儲領域,銀河通用機器人已在數十個零售倉內規模化部署,實現完全基於具身大模型的自主揀貨、打包全流程,極大滿足夜間即時零售倉人手不足、工作人員工作負擔過重的問題。銀河通用智慧零售倉已在全國範圍內7×24 小時持續、穩定營運達1年。全球唯一實現百台機器人7×24小時營業的零售倉庫2024年底,銀河通用機器人與愛博醫療聯合推出全國首家24小時智慧醫療門店,引入銀河通用人形機器人實現全自主營運,並已在北京、上海、廣州、深圳、杭州等城市實現落地,實現具身智能即時零售的可複製、可推廣的規模化解決方案。醫療康養領域,銀河通用與宣武醫院等知名三甲醫院開展深度合作,切實推動人形機器人在病房、藥房與導診等場景落地,為老年人提供更自主、友好的服務體驗的同時,也幫助醫院切實降低醫護人員的工作強度。康養醫療領域提升照護效率和品質與此同時,銀河通用的技術實力在行業盛會與國際賽事中持續獲得驗證認可。在2025世界人形機器人運動會中,銀河通用機器人作為為數不多的全自主、零遙操的參數選手,以170分大幅領先奪得應用場景比賽世界冠軍。Galbot G1奪得世界人形機器人運動會全自主幹活賽世界冠軍本輪融資匯聚了具有深厚產業背景與全球視野的戰略投資人。以中國移動鏈長基金為代表的國內鏈主企業、產業資本在本輪中的大規模注資,不僅是對銀河通用機器人技術路徑及規模化產業化能力的高度認可,同時也為銀河通用機器人的產業化發展提供全場景賦能,為銀河通用全面打開在工業、商業、家庭的智慧化佈局注入重要動力。國際基金在本輪的加持,更進一步為銀河通用打開了全球市場佈局和合作的拓展空間。融資完成後,公司將持續加大對核心技術的投入,加速各領域解決方案的規模化落地與迭代,深化與戰略投資方的產業協同,並積極拓展全球合作網路,鞏固其作為中國具身智能領軍企業的領跑地位,推動具身智能技術真正轉化為驅動產業進步的新質生產力。 (全球企業動態)
中國人工智慧產業已入深水區,誰可落地?
一、國家開始把控准入准出近期,中國國家發改委提出建立健全具身智能行業准入和退出機制。新聞發言人李超指出,當前人形機器人產業在技術創新與市場需求的雙重驅動下實現高速增長,年增速超50%,預計2030年市場規模將達千億級。儘管產業前景廣闊,但人形機器人領域在技術路徑、商業模式及應用場景等方面仍處於探索階段。目前國內相關企業已超150家,其中超半數為初創或跨領域進入者,在激發創新活力的同時,也需警惕同質化競爭加劇、研發資源分散等潛在風險。發改委已協同多部門展開專項研究,圍繞政策引導、技術攻堅與成果轉化進行整體佈局。下一步將結合“十五五”規劃編制,從三方面推動產業規範化發展:1.建立行業標準與動態管理機制,通過准入退出制度最佳化市場環境;2.聚焦“大小腦”協同、雲端算力適配等關鍵技術攻關,破解產業鏈瓶頸;3.建設開放共享的訓練與中試平台,加速技術成果在真實場景的規模化落地。這是一個什麼訊號?它標誌著國家對AI產業,特別是像具身智能這樣與物理世界深度互動、潛在風險更高的領域,其發展思路發生了根本性轉變。過去幾年,我們享受的是先發展,後治理的紅利。各種模型、應用百花齊放,資本和創業公司狂奔,這是產業爆發初期的典型特徵。但副作用也很明顯:重複建設、資源浪費、標準缺失,以及在追求速度的同時可能忽視了安全、倫理和長期可持續性。現在,發改委的舉措表明,國家要主動引導產業從野蠻生長轉向有序競合。 准入機制不是要扼殺創新,而是要設定一個科學的、合理的門檻。這就像房地產行業的預售許可和資質管理,目的是把那些只有PPT、沒有核心技術、掛羊頭賣狗肉轉身成了AI公司的、只想賺快錢的投機者擋在門外,避免爛尾樓式的AI項目出現,保護真正投入研發、有長期主義精神的優秀企業。退出機制則更為關鍵。它意味著這個行業不再是只進不出的保險箱。對於無法達到技術標準、存在重大安全風險或經營不善的企業,將有一套清晰的路徑讓其平穩退出市場。這能形成良性的優勝劣汰,避免劣幣驅逐良幣,讓資源更有效地向頭部和實幹型企業集中。這體現了監管層的前瞻性和決心,是為產業長遠健康發展刮骨療毒。二、5G基建收官工信部宣佈提前完成十四五5G建設目標,5G基站突破470萬個,5G-A規模商用覆蓋超300個城市。5G網路,特別是向5G-A的演進,就是具身智能賴以生存的神經系統和高速公路。 具身智能體(機器人、智能汽車、AR/VR裝置等)需要與雲端大腦進行海量、即時、低延遲的資料互動。沒有5G-A提供的超高頻寬、超低時延和海量連接能力,所謂的雲-端協同、大小腦模型協同就是空中樓閣。這就好比,我們建一個智慧社區,如果網路基礎設施沒跟上,你所有的智能家居、安防機器人、無人配送都只是擺設。國家超前佈局並完成了5G這條資訊高速公路的建設,實際上是為接下來所有需要即時互動的AI應用,尤其是具身智能,掃清了最大的基礎設施障礙。 這是一盤大棋,先修路,後跑車。現在路修好了,就看各家車企(AI公司)能造出什麼樣的好車了。三、應用層百模大戰進入下半場,誰能落地?從崑崙萬維、DeepSeek、阿里、可靈、火山引擎等一系列模型更新來看,中國AI大模型領域的百模大戰已經進入了下半場。競爭焦點發生了明顯變化。上半場是軍備競賽,比拚的是模型規模、Benchmark分數、論文數量。大家的目標是有沒有、強不強。而現在,大家開始聚焦於好不好用、貴不貴、穩不穩定。DeepSeek V3.2 強調平衡推理能力與輸出長度,目標是降低計算開銷與使用者等待時間。這說明企業開始極度關注成本效益和使用者體驗,不再一味追求龐大參數帶來的邊際性能提升。可靈AI的音畫同出、阿里的Qwen-Image圖像編輯一致性、火山引擎的主體一致性,這些改進都指向一個核心:提升生成內容的可用性和實用性,讓AI真正能融入工作流,而不是只能生成一些看起來很美的Demo。階躍星辰開源GUI Agent技術意味著在特定垂直領域,大家開始從閉門造車走向共建生態。通過開源降低行業門檻,快速形成事實標準,從而加速整個應用生態的繁榮。這一切都說明,市場正在回歸理性。資本和使用者不再為華麗的PPT買單,而是要看實實在在的降本增效能力和商業化落地場景。這逼著所有AI公司必須沉下心來,深耕行業,解決真問題。四、終端入口爭奪戰白熱化字節跳動豆包團隊發佈豆包手機助手技術預覽版,並明確表示無自研手機計畫,這是一個非常高明且務實的戰略。向周鴻禕等人展示工程機,其實是一技術路演。其目的並非真要下場造手機,而是以具象化載體驗證豆包AI在端側的應用潛力,同時向產業鏈傳遞明確訊號:字節跳動的核心優勢在於AI原生互動與生態整合能力,而非硬體製造。這種亮肌肉卻不入場的姿態,既避免了與手機廠商的直接競爭,又為未來合作埋下開放介面。AI的終極戰場在終端,在離使用者最近的地方。 誰掌握了終端入口,誰就掌握了使用者資料和生態的主導權。但自研手機是一條重資產、高風險的道路,且市場格局已相對固化。字節跳動選擇與手機廠商合作,將豆包助手深度整合到手機作業系統中,這是一種借船出海的策略。它避免了與華為、小米等硬體巨頭的直接衝突,轉而利用自身在AI軟體和生態上的優勢,與硬體廠商形成互補。這類似於當年Google通過Android系統與各大手機廠商合作,最終統治了移動生態。這預示著,未來AI能力的競爭,將是軟硬一體的深度整合競爭。瞳行科技發佈的AI助盲眼鏡,即是軟硬結合解決特定場景使用者需求的典型案例。五、產業融合,AI開始啃硬骨頭美團財報顯示其核心本地商業面臨巨大壓力,而釘釘發佈荳蔻醫生超級助理...AI正在從錦上添花的工具,轉向雪中送炭的解決方案,開始深入各行各業的核心業務環節,去啃那些最硬的骨頭。美團需要AI來最佳化其龐大的即時配送網路,在激烈競爭中尋找新的效率提升和利潤空間。釘釘和壹生檢康的合作,是AI深入專業領域(醫療)的典範。它解決的不僅是效率問題,更是精準性和可追溯性的問題,這對於AI在醫療、法律、金融等高風險領域的應用至關重要。是的,AI的價值兌現,正從泛娛樂、內容生成等淺水區,大步邁向與實體經濟深度融合、解決行業核心痛點的深水區。總結與展望中國的AI產業正在國家戰略的引導下,依託領先的5G基礎設施,經歷一場從虛向實、由軟到硬、從通用到垂直的深刻變革。監管層面,正在建立秩序。基礎設施層面,5G網路準備就緒。技術層面,大模型競爭進入性價比和實用性驅動的下半場。應用層面,AI與終端硬體、垂直行業深度繫結,開始解決實際問題。對於傳統行業巨頭,不能再以觀望的心態看待AI。必須主動擁抱這場變革,思考如何將AI技術與我們的主營業務每一個環節進行深度融合的可能與可行性。未來的競爭,不僅是土地和資金、人才的競爭,更是資料、演算法和智能化水平的競爭。我們必須盡快建構起屬於自己的AI應用能力和數位化護城河,否則很可能在下一輪產業升級中被邊緣化。這場由人工智慧驅動的效率革命和產業重構,已經過了概念炒作期,進入了真刀真槍的落地攻堅階段。這是一場我們無法迴避,必須積極參與的偉大征程。 (數位化轉型戰略指南)
大摩最新閉門會:未來25年,25兆美元的財富將湧入這3大“黃金賽道”!
宏觀經濟的周期波動,疊加人工智慧的技術浪潮,我們彷彿站在一個巨大的十字路口。人人都在問:下一個能讓我們資產翻倍的黃金機會,到底在那裡?摩根士丹利內部重磅報告——《Robot on Earth》(機器人遍佈地球)。這份報告集結了摩根士丹利全球分析師團隊的心血,對未來世界的產業格局做出了極為前瞻和大膽的預測。盛運君從中挖掘出三大核心投資主線:代表未來的“具身智能”超級革命、被市場錯殺的“金融巨象”,以及公募基金行業的轉型。我們普通人,究竟該如何抓住這百年一遇的盛宴。一、未來已來——25兆美元的“具身智能”黃金賽道首先,我們得弄明白一個詞:“具身智能”(Physical AI)。說白了,就是讓AI走出電腦螢幕,擁有自己的手和腳,進入物理世界幹活。這絕不是科幻電影,而是繼網際網路之後,又一場將徹底顛覆全球生產力的史詩級革命。1、難以想像的市場規模報告用一組極具衝擊力的資料,描繪了這片藍海的廣闊。全球具身智能市場規模,將從2025年的約1000億美元,一路狂飆至2050年的25兆美元。這是什麼概念?這意味著,在未來的25年裡,這個市場將迎來整整250倍的驚人增長。打個比方,如果25年前你在一個正確的賽道投了1萬塊錢,今天它就變成了250萬。這就是時代賦予的紅利,而“具身智能”就是下一個這樣的超級坡道。2、五大核心賽道:財富的應許之地這25兆美元的宏大市場,具體由那些部分構成?報告清晰地指出了五大核心賽道,它們將是未來財富最集中的地方:人形機器人:7.5兆美元。 這就是未來的“超級工人”,將深入工廠、家庭,重塑勞動力市場。無人駕駛汽車:5.6兆美元。這不僅是交通工具,更是移動的智能空間,是出行的終極形態。服務機器人:5兆美元。從物流、倉儲到農業、建築,它們將成為各行業的得力助手。飛行器/無人機:4.7兆美元:重塑“低空經濟”的格局,物流、交通、測繪都將被改寫。家庭/工業/其他機器人:2.2兆美元。這是製造業和服務業升級的基石,也是最先落地的應用領域。3、賣鏟子的,比淘金的更賺錢面對如此巨大的浪潮,聰明的投資者不僅會關注“淘金者”(整機廠商),更會留意那些“賣鏟子”的人。報告對核心零部件未來25年的增長預測,簡直可以用“瘋狂”來形容:減速器增長590倍,電池增長1,400倍,而端側算力(讓裝置本身變聰明的晶片)的增長更是高達40,000倍!這意味著什麼?意味著投資這些核心零部件的龍頭公司,就等於抓住了整個賽道的脈搏。它們的增長確定性,甚至可能高過下游那些競爭激烈的整機品牌。一個全新的、比肩甚至超越網際網路的投資宇宙正在我們眼前徐徐展開。而在這個宇宙中,最璀璨、最核心的明星,又是什麼呢?二、兩大主戰場——得“機器人”與“自動駕駛”者得天下在25兆美元的宏大版圖中,人形機器人和自動駕駛,無疑是技術最密集、想像空間最大、競爭也最激烈的兩大主戰場。它們是兵家必爭之地,是決定未來科技格局的關鍵。1、人形機器人:具身智能的“皇冠明珠”報告毫不吝嗇地將人形機器人稱為“皇冠明珠”,並將其長期市場規模的預測,從之前的5兆美元,大幅上調至7.5兆美元。特斯拉的成本與市場的利潤:別被馬斯克“2萬美元”的口號唬住了。大摩的分析師算了一筆帳,即便到2050年,單價仍在7.5萬美元。這中間巨大的鴻溝,不是PPT,而是實實在在留給產業鏈的利潤。投資的精髓就在於找到這種“預期差”。誰能幫助特斯拉們把成本做下來,誰就是下一個“寧德時代”。中國的巨大機遇:報告對中國市場給出了“短期謹慎,長期極其樂觀”的判斷。關鍵資料是:未來中國將佔據全球30%-40%的需求,供應端的佔比甚至更高。到2050年,中國人形機器人的年銷量有望達到驚人的5000萬台,市場保有量將達到3億台。盛運君的投資技巧:基於報告對企業使用者的調研(92%認為價格不應超過20萬人民幣),我給大家一個建議:現階段投資人形機器人,不要只聽故事和概念。要重點關注那些已經找到具體應用場景(如汽車製造、物流分揀),並且在‘降本增效’上拿出實際方案的公司。2、自動駕駛與低空經濟:中國的獨特優勢如果說人形機器人是全球爭霸,那麼在自動駕駛和低空經濟領域,報告明確指出了中國的領先地位。資料上的遙遙領先:到2030年,中國L4等級自動駕駛汽車保有量將達到150萬輛,超過歐美市場的總和,在全球形成絕對的領先優勢。到2050年,這個數字將超過1.6億輛,佔據全球四分之一。(1)領先背後的三大支柱:為什麼中國能領先?大白話講就是三點:資料優勢:龐大的市場和複雜的路況,喂養出更聰明的AI。製造優勢:全球最完整、最敏捷的供應鏈網路。戰略推動優勢:“車路雲一體化”的國家級戰略,這是任何單一企業都無法比擬的。(2)投資邏輯的轉變:以華為的問界或小鵬汽車的XNGP為例,報告點明,行業的焦點將從“能不能跑”轉向“能不能掙錢”。對於自動駕駛公司,現在就要看它們的Robotaxi(無人計程車)業務能否擺脫燒錢模式,實現商業化落地。這才是股價真正的催化劑。同樣,在低空經濟領域,以億航智能和大疆為代表的中國企業,已經手握海外大單,在全球佔據龍頭地位。在這些激動人心的星辰大海之外,我們腳下的資本市場,同樣存在著被嚴重低估的傳統巨頭。它們正在悄然轉身,蘊含著巨大的價值修復機會。三、巨象轉身——被地產錯殺的中國平安,價值幾何?當所有人都盯著那些性感的科技股時,真正的聰明錢,往往在別人看不上的廢墟裡尋找鑽石。被地產泥潭拖累的中國平安,就是這樣一顆正在被市場重新擦亮的鑽石。1、直面核心擔憂:風險正在出清報告用清晰的邏輯和時間線,直面市場最大的擔憂——地產風險。風險處置從2021年就已經開始,2023年是最差的時候。報告預計,風險敞口將逐年縮小,到2027年將基本結束並轉正。盛運君的解讀是:利空出盡就是利多。當市場還在為過去的風險定價時,聰明的投資者已經看到了未來的曙光。最壞的時候,已經過去了。2、三大增長引擎:驅動巨象再次起舞平安真正的價值來源於三大確定性極強的增長引擎:居民財富增長: 保險是金融體系中“唯一提供保本收益且疊加服務的資產”。在中國家庭財富持續增長,但又普遍追求穩健的背景下,這種產品的吸引力是巨大的。養老與醫療需求 :中國“嬰兒潮”一代正步入退休年齡,他們有錢、有時間,更有對健康和養老的巨大需求。平安正在大力佈局醫療養老產業,這幾乎是未來十年最確定的增量市場。綜合金融的實力 :平安就像一個“金融超市”,能為客戶一站式提供銀行、證券、資管等所有服務。這種強大的客戶粘性和交叉銷售能力,是其他單一金融機構無法比擬的護城河。3、估值邏輯的重塑為什麼說平安被低估了?因為市場還在用老眼光看它。報告提示我們,除了看傳統的PEV(內含價值倍數),現在更應該關注PE估值。平安越來越像一家“零售公司”和“健康管理公司”,而不再是單純的投資公司。對於這種高增長、高ROE(淨資產收益率)的業務,用PE來看更合理。報告認為,它回到雙位數的PE是完全可能的。報告還給出了未來的觀察節點,如2026年“開門紅”的強勁增長、資管業務的持續改善等,都可能成為價值回歸的催化劑。平安的轉身只是一個縮影。報告揭示,整個為普通人管理財富的公募基金行業,也在經歷一場深刻的“供給側改革”,這對我們每個投資者都意義重大。四、盛運君總結——擁抱未來讓我們把核心脈絡梳理一下。這份摩根士丹利的重磅報告,為我們揭示了三大清晰的時代機遇:1、硬核科技的革命:以人形機器人和自動駕駛為代表的“具身智能”,是未來25年最宏大、最確定的增長故事。2、價值回歸的巨頭:以中國平安為代表,那些因短期因素被市場錯殺,但核心基本面正在改善的傳統龍頭,蘊含著巨大的修復空間。3、資管行業的變革:為我們普通人理財的公募基金行業正在經歷一場深刻的健康轉型,為我們提供了更好的投資工具和環境。那麼,作為普通投資者,我們該如何行動?盛運君給你三條實在的建議:對於科技股:擁抱趨勢,但保持理性。精選那些有明確商業落地場景和成本控制能力的公司,而不是盲目追逐概念。如果你看不懂個股,投資相關的行業ETF來分散風險,是一個不錯的選擇。對於價值股:在市場一片悲觀時,敢於“逆向思考”。深入研究像平安這樣,基本面正在改善、但估值仍在底部的公司,這需要耐心和獨立判斷。借助專業力量:公募基金行業的改革,對我們普通投資者是重大利多。這場變革的核心是“降費”和“利益捆綁”。過去那種靠頻繁買賣、賺取高額佣金的模式正在成為歷史。監管正在引導基金公司和我們的長期利益更加一致,這意味著我們未來更有可能以更低的成本,享受到更負責任的專業服務。更重要的是,報告的資料顯示,居民配置權益資產的比例已經從高點回落至冰點,具備了周期反彈的基礎。這意味著,在一個更健康的行業生態下,我們正站在一個潛在的增配起點上。今天我們討論的“具身智能”革命,是那條又長又濕的“雪坡”。而像中國平安這樣,在市場恐慌中被錯殺的價值巨頭,則是滾雪球過程中最堅實的“核心”。最後,一個更健康的資本市場和專業的基金管理人,則是幫助我們普通人把雪球穩穩推下去的“推手”。看懂這三者,才能真正抓住時代的紅利。 (盛運德誠投資)
清華大學,成立新研究院!
清華大學近日成立具身智能與機器人研究院,將重點突破“強健本體+智慧大腦”全端技術的“0到1”原始創新,同時建構“技術研發-中試驗證-場景應用”全鏈條轉化樞紐,加速技術成果落地。研究院掛靠科研院,由自動化系、機械系、電子系、電腦系共同建設,院長由清華大學自動化系主任張濤擔任。研究院將打造具有全球影響力的人才高地和創新策源地,強化清華大學在國家“機器人+”戰略中的核心支點地位,為中國搶佔具身智能與機器人領域賽道,培育新質生產力提供核心驅動力,為國家在新一輪科技革命和產業變革中贏得戰略主動。清華校長李路明表示,具身智能與機器人研究院的成立是該校主動服務國家戰略需求,充分發揮多學科與人才優勢,進一步完善人工智慧佈局,有組織開展前瞻性、戰略性、系統性的科技攻關的重要舉措。希望研究院充分發揮清華多學科優勢,積極探索交叉創新新範式,打造科研創新和拔尖創新人才培養重要基地。研究院還將與企業在智能算力供給、智能體研究、具身智慧型手機器人開發、前沿場景驗證、技術成果轉化等方面展開深度合作。此外,該校近日還發佈了《清華大學人工智慧教育應用指導原則》,首次系統性地對校園中的人工智慧應用提出全域性、分層級的引導與規範,劃定人工智慧教育應用“紅線”與“綠道” 。該校明確,人工智慧始終是輔助工具,師生才是教學與學習的主導者。要求師生對人工智慧使用情況及生成內容依規進行披露聲明,嚴禁學術不端。嚴禁師生使用敏感資訊、涉密資料或未授權資料訓練或驅動人工智慧模型。提醒師生警惕人工智慧“幻覺”,應通過多源驗證防範因過度依賴導致的思維惰化。清華建議教師基於教學目標自主制定人工智慧的應用方式與程度,在課程開始時向學生明確說明使用規範,並對人工智慧生成的教學內容負責。同時,教師需主動引導學生辯證認識人工智慧,培養其核心素養。該校還鼓勵學生在遵守課程規定的前提下積極探索人工智慧工具輔助學習,但嚴禁將人工智慧生成的文字、程式碼等內容直接複製或簡單轉述後作為學業成果提交。針對研究生群體,該校特別強調禁止用人工智慧代替本應由本人進行的學術訓練,嚴禁使用人工智慧實施代寫、剽竊、偽造等行為。研究生指導教師需在此過程中提供規範性指導並進行全過程監督,確保學術訓練的完整性和學位論文及實踐成果的原創性。清華線上教育中心主任王帥國表示,指導原則也為未來在學術研究、管理服務等更多場景中拓展人工智慧應用邊界、譜寫新的篇章預留了充分空間。“我們希望它不是一個‘束縛手腳’的檔案,而是一個有生命力的、能隨著技術演進不斷生長的指導體系。” (新華網)
小米打通智駕和具身大模型,然後開源了
全球首個自駕+機器人統一基座模型開源了!針對自駕與具身操作場景的知識遷移難題,小米汽車陳龍團隊提出並開源了全球首個打通這兩大領域的跨具身(X - Embodied)基座模型——MiMo-Embodied。MiMo-Embodied基於MiMo-VL架構,通過建構涵蓋通用視覺、具身任務及駕駛場景的高品質資料集,並採用包含思維鏈(CoT)和強化學習(RL)的漸進式四階段訓練策略,有效打破了室內操作與戶外駕駛之間的領域鴻溝。在實測效果上,MiMo-Embodied在自動駕駛與具身智能共計29個Benchmark上均超越了現有的專用模型及通用模型,實現了跨領域的最先進(SOTA)性能。無論是開車的環境感知、規劃,還是機器人的拿取、導航,主打一個我全都要。具身與智駕,小米全都要!在以往具身/自駕的VLM領域中,往往存在以下問題:一方面是缺乏統一的具身VLM(Unified Embodied VLM)。現有的視覺語言模型(VLMs)大多專注於單一領域(僅室內任務或僅戶外駕駛),缺乏能夠連接這兩個領域的統一模型。限制了模型在動態環境中與物理世界有效互動的能力。而這,也帶來了領域差距與遷移困難。具身智能側重於室內操作,而自動駕駛側重於戶外道路,兩者存在顯著的領域差距(Domain Gap),阻礙了能力的跨領域遷移 。另一方面則是評估體系缺失, 即缺乏全面的跨具身能力評估體系來衡量模型在兩個領域的綜合表現。為瞭解決這些挑戰, MiMo-Embodied試圖將自動駕駛和具身智能的任務合併到一個統一的VLM中,以整合模型的跨具身能力。如上圖所示,MiMo-Embodied架構由以下三個部分組成:用於編碼視覺輸入的 Vision Transformer (ViT):模型使用ViT來編碼各種類型的視覺輸入,包括單張圖像、多張圖像和視訊。這使得模型能夠提取複雜的模式和關係。一個投影器(projector): 使用多層感知機(MLP)作為投影器(Projector),將視覺Token對應到與大語言模型對齊的潛在空間。負責文字理解和推理的LLM:LLM作為核心元件,負責理解文字指令並結合視覺資訊進行推理,生成連貫且上下文相關的響應。由此,通過無縫整合視覺和文字領域,MiMo-Embodied增強了多樣化多模態推理任務和應用的潛力。接下來,為了實現跨領域的統一能力,論文提出了一套系統的資料建構和分階段訓練策略:首先在資料方面,訓練資料涵蓋了通用多模態理解、具身 AI(功能性預測、規劃、空間理解)和自動駕駛(感知、預測、規劃)三個維度的多模態資料:通用資料:基於MiMo-VL語料庫,包含圖像、視訊、長文字等,長文件和合成推理資料,確保廣泛覆蓋感知、推理和互動能力。具身智能資料:涵蓋可供性預測(Affordance Prediction)、高層任務規劃和空間理解,整合了如 PixMo-Points, RoboAfford, RoboRefIt等資料集。自動駕駛資料:涵蓋環境感知、狀態預測和駕駛規劃,整合了 CODA-LM, DriveLM, nuScenes-QA等資料集。基於上述建構的資料集,研究又開發了一種四階段訓練策略。基於MiMo-VL,研究引入了具身智能和自動駕駛方面的專門監督,最終通過思維鏈微調和強化學習實現高級推理能力 。這一策略有助於模型建立在先前獲得的能力之上,從而在具身互動和自動駕駛領域實現穩健的性能。階段1:具身智能監督微調 (Embodied AI Supervised Fine-tuning):結合通用資料和具身資料,建立核心的視覺語言理解、具身推理能力。階段2:自動駕駛監督微調 (Autonomous Driving Supervised Fine-tuning): 在階段1的基礎上,加入大量自動駕駛資料。重點訓練多視角空間推理、視訊時間一致性和複雜交通場景分析 。階段3:思維鏈推理微調 (CoT Supervised Fine-tuning): 使用包含明確推理步驟的資料進行微調。這增強了模型處理複雜多步問題的能力,例如風險評估和行為合理性解釋。階段4:強化學習微調 (RL Fine-Tuning): 使用 GRPO (Group Relative Policy Optimization) 演算法。通過針對正確性(如選擇題匹配、IoU計算)設計獎勵訊號,進一步最佳化模型的精確度和可靠性。實驗測試為了驗證MiMo-Embodied的性能,研究分別在定性和定量兩層面進行評估,定量比較涉及針對具身智能和自動駕駛的各種既定學術和行業基準的客觀評估,從而能夠與領先模型進行直接的實證比較。定性評估則展示了MiMo-Embodied在現實世界任務中的實際效能,突出了其在複雜機器人和自動駕駛場景中的部署,並提供了其將習得能力轉化為有效性能的具體證據 。基準測試上的定量比較首先,在具身能力方面,研究在三個核心領域進行了全面評估:可供性預測、任務規劃和空間理解。結果表明,MiMo-Embodied 取得了具有競爭力的結果,與通用多模態模型和專用具身模型相比,在可供性預測和空間理解方面表現出特別的優勢。其次,在自動駕駛能力方面,研究在感知能力、預測能力和規劃能力上進行了評估。包含在4種資料類型上的12個基準測試中的性能,涉及其理解複雜交通場景、預測動態道路智能體行為以及生成安全高效駕駛建議的能力。實驗結果顯示,MiMo-Embodied在所有感知基準測試、預測、規劃中均取得了強勁的性能,在全景語義理解任務中展示了最先進的結果,同時在具有挑戰性的局部感知場景中也表現出卓越的魯棒性。現實世界任務的定性評估首先,為了驗證MiMo-Embodied 在複雜互動環境中的實際效用,研究評估了其在兩個基本下游應用中的性能:具身導航和操作。在具身導航中,相較於GPT-4o、Qwen2.5-VL和RoboBrain-2.0,MiMo-Embodied展現出在多樣化家庭場景中增強的對象定位能力和一致的性能。在操作任務中,MiMo-Embodied同樣展現出強大的可供性和空間推理能力。在自動駕駛能力上,研究首先在具有挑戰性的NAVSIM上確定性能以進行標準化比較,然後在一個包含多樣化真實世界駕駛場景的大規模專有資料集上測試模型的能力。實驗結果表明MiMo-Embodied可以處理多樣化的自動駕駛情況並完成具有挑戰性的任務,包括交叉路口轉彎、彎道掉頭、跟車和變道超車。在每種情況下,模型都應感知道路上下文,整合自車狀態和導航意圖,並做出連貫的決策。此外,MiMo-Embodied在所有評估類別中始終優於基線。值得注意的是,在轉彎、繞開障礙物和變道等複雜、互動式操作中,性能提升最為顯著。在最後,論文表示還將基於MiMo-Embodied模型的能力,探索具身智能視覺-語言-動作(VLA)模型,以增強複雜環境中的互動,通過自然語言理解實現更直觀的任務執行。One more thing這篇論文的一作是郝孝帥博士。他於今年8月加入小米汽車,在陳龍博士的指導下,從事具身多模態大模型方向的研究。郝孝帥博士畢業於中國科學院大學資訊工程研究所。此前,他曾在北京智源研究院、三星、亞馬遜等機構工作。這篇論文的project leader是小米智能駕駛的首席科學家陳龍博士,他此前就職於英國AI獨角獸公司Wayve,主導新一代端到端自動駕駛VLA模型的研發。更早前,他還以研究工程師身份加入Lyft,牽頭車隊學習項目,通過大規模眾包車隊資料完成自動駕駛車輛機器學習規劃器的預訓練。論文連結: https://arxiv.org/abs/2511.16518GitHub: https://github.com/XiaomiMiMo/MiMo-EmbodiedHuggingface: https://huggingface.co/XiaomiMiMo/MiMo-Embodied-7B (量子位)