#王興
王興,重磅出手
2月5日,美團發佈公告,以7.17億美元的初始對價,收購了叮咚買菜中國業務100%股權。這是今年開年商界的第一大併購案,美團為何要大手筆拿下叮咚?幾年前,王興曾講過一句話:“戰鬥是永遠的,只是從一個戰場變成另一個戰場,從一個困難變成另一個困難,當然也從一個機會變成另一個機會。”可以說,此次併購既為持續數年的“生鮮電商混戰”按下了加速鍵,也藏著美團的戰略野心。一起來看看這一商界大事。01結構之憂:我買的到底是誰?解決方案:多重控股架構假如你是美團,決定收購叮咚。你面臨的第一個問題是:我究竟買那個叮咚?沒開玩笑,這是個實實在在的問題。要知道,叮咚是正兒八經的上市公司,除了中國業務。這兩年開啟了轟轟烈烈的出海之旅。在沙烏地阿拉伯市場已經做得有聲有色。還有系統性的計畫進軍更多市場。請問,你究竟是只買中國區業務,還是連著海外部分一起買了?其實美團想要的,只是中國區業務。用其他媒體的話說:“不想把基礎設施留給京東或其他對手,做預防性收購”。沙烏地阿拉伯那邊,美團的Keemart發展的非常不錯,市場前景也非常廣闊,還沒到要鬧收購的地步。另一方面,叮咚也未必想賣。還是用其他媒體的報導原話:叮咚創始人梁昌霖更希望只出售中國業務實體,即叮咚在國內的所有前置倉和供應鏈,同時保留2023年起步的海外業務,並帶走公司帳上現金,未來梁昌霖將帶領部分團隊繼續探索出海機會。我不想買,你也不想賣。問題來了。精準收購中國區業務,這做得到嗎?當然做得到,現代公司治理體系,早已提供了充分的工具。咱們看公告原文。根據協議,叮咚開曼有限公司同意向買方出售其在英屬維京群島註冊的全資子公司“叮咚鮮生活有限公司”(Dingdong Fresh Holding Limited,簡稱“叮咚BVI”或“目標公司”)的所有已發行股份。目標公司通過一系列全資及控股子公司,持有公司在中國境內的絕大部分業務(簡稱“本次交易”)。公司的國際業務不包含在本次交易內,將在交易交割前完成必要的重組程序後由公司保留。當我們提到“叮咚”時,其實它不止一家公司,至少有這麼4層架構:1. 主體公司:叮咚開曼有限公司(Dingdong (Cayman) Limited)它是最大的老大,是在美股上市的實體,叮咚買菜的股票程式碼DDL,指的就是它。它不在任何國家買菜,而是通過持股一層層控制子公司。2. 中間控制層:叮咚有限公司(Dingdong Fresh Holding Limited)因為註冊在英屬維京群島(BVI),所以簡稱為叮咚BVI。它是本次交易的核心,美團這7.17億美元,收購的就是它。3. 香港過橋層:叮咚香港(Dingdong Fresh (Hong Kong) Limited)它由上面那家“叮咚BVI”100%持股。外資主體為了控股國內業務,一般都要走香港作為橋樑。主要是稅收和資金進出便利性問題,具體可以自己查,不細說了。4. 國內實體:上海壹佰米網路科技有限公司(Shanghai 100Me)它由上面那家叮咚香港100%持股,是真正在上海賣菜的公司。如果你是叮咚上海的員工,可以看看勞動合同,就是和這家壹佰米網路科技有限公司簽的。這種層層巢狀的模式,被稱為“多重控股架構”。這是一種非常偉大的制度發明,它保證公司在多個國家之間經營、上市、融資、併購時,能夠根據不同國家的法規調整,保持靈活的身段。如果你看懂了這些,再看這次的收購,一下子就能明白:原本的股權結構,是“叮咚開曼→叮咚BVI→叮咚香港→壹佰米”。收購後,架構會變成“美團全資子公司→叮咚BVI→叮咚香港→壹佰米”(理論上,壹佰米甚至可以改名併入美團,但出於品牌資產角度,大機率不會)。再提醒你注意一個小細節,公告裡的那句“在交易交割前完成必要的重組程序”,意味著叮咚必須把海外業務從叮咚BVI公司的下面“拎出來”,掛到叮咚開曼的其他子公司名下。美團拿走的,只有中國業務。而原本的上市實體“叮咚開曼”呢?它變成了一個手握7.17億美元現金,但中國業務已經剝離的新公司。創始人可以在這個實體下,輕裝上陣,二次創業,繼續成立其它的子公司,追逐自己的出海夢。當然,我必須提醒你,上述邏輯為了讓你能聽懂,做了大量簡化,甚至簡化到了有些不准的地步。就像你不可能在短影片裡看了15秒的“大廚如何做佛跳牆”,就能去國宴掌勺。反正,結構之憂,就這樣解決了02現金之憂:咱能不能別“用現金買現金”?解決方案:現金剝離緊接著,你這位美團大老闆,會遇到第二個難題:叮咚帳上怎麼有4億多美元現金,王多魚都浪不完,咋辦啊?能不能把錢趕緊弄走?啥?沒聽錯吧?錢多居然成了難題?沒錯,還真是難題。再看一段公告原文:基於截至2025年12月31日的資產負債表,在叮咚(開曼)有限公司從叮咚BVI及其子公司獲得總額不超過2.8億美元的現金後(前提是叮咚BVI及其子公司的合併剩餘淨現金不低於1.5億美元),買方將支付7.17億美元的總現金對價。大白話說:現在合同簽訂了,但叮咚BVI帳上還有4.3億美元現金。美團允許叮咚開曼,從帳上劃走最多2.8億美元現金,確保留下1.5億美元即可。我看媒體報導,這讓很多人非常迷惑,奇了怪了,公司都買下來了,兜裡的現金,怎麼還能允許別人往外掏?這不是肥水流了外人田?其實這很好理解。想像你買了一個二手愛馬仕包包,5萬塊。沒想到賣家突然說,哎呀,我這個包包裡還放著2萬塊現金。你看,這,這咋辦?要不,你付我7萬塊買包?2萬現金就歸你了。你可能也一頭霧水。這有啥意義?我要的是這個包,又不是現金。更何況這“現金買現金”,並不是毫無成本的。它憑空把包價從5萬抬到了7萬。你交的稅呀,付給中古店的佣金呀,都會憑空變多。你會咋辦?你一定想說:要不,我還是付5萬,這2萬現金先放著,您找時間拿回去就是。沒錯,美團允許叮咚拿走2.8億美元現金,就是一模一樣的邏輯。美團想要的,只是叮咚的中國業務。如果直接按估值買,那就是“現金買現金”,白交一道稅,沒有任何意義。要多少現金?夠叮咚中國的營運和發展就可以。扒拉扒拉算盤,大約1.5億美元。那剩下的2.8億,您就找時間轉走。那你說,美團吃虧了嗎?當然沒有,因為這7.17億美元的價格,就是扣除了這“被拿走的2.8億美金”後的淨價。如果包含這筆錢,就不是這個收購價了。當然,還得再嚴謹一下。7.17億美元,其實也是個基準,最後成交時,還會根據那天的具體情況再做微調(這也是為什麼一開頭公告裡說“初始價格”)。但這塊實在太複雜,隨便一說又是幾千字,不展開了。總之現金剝離的大頭已經定死了。現金之憂,就這樣解決了。03擺爛之憂:買的時候7億,到手只剩7塊了咋辦?解決方案:鎖箱機制第三個難題,可能需要一點解釋成本:從下單到付錢的這段時間,你擺爛咋辦?我們去菜市場買菜,一手交錢一手交貨,不容易有爭議。但問題是,這是全國級的公司大併購,不是咱們買顆蘿蔔買頭蒜,沒法叮咚一聲,“支付寶到帳,7億美元”。這個過程註定非常漫長。在法律上,這就形成了三個概念:基準日、交割日、過渡期。1. 基準日:鎖定價格的那一天公司的經營情況,每天都在千變萬化。可能今天估值7.17億,明天就是7.29億了。咋辦?好辦,找一個確定的日子,定下來。這一天就是“基準日”。在這次交易裡,基準日是2025年12月31日(看看上面的原文:基於截至2025年12月31日的資產負債表)。叮咚這家公司,有多少資產、多少負債、多少裝置、多少爛帳、辦公室有多少桌椅板凳,甚至公司印表機裡還有多少張A4紙,全都在12月31日定格下來。就像刑偵人員勘察現場收集證據一樣,咔嚓拍張照,裝袋,封條。公司一切的估值,就按照這一天的情況來。那怕後面再有變化,也不改了。2. 交割日:主權移交的那一天你說,既然定了這一天,為何不能這一天一手交錢一手交貨呢?還是那句話,買公司不是買蘿蔔白菜,有一大堆的法律程序要走。股東大會要投票、監管部門要審查、業務要梳理、帳目要稽核……全都走完,交易才能完成。等完成的那一天,就是付錢、移交主權。在法律上,叮咚中國這攤業務,正式從“姓叮”變成“姓美”。這一天就是“交割日”。3. 過渡期:焦急地等待如果你理解了前面兩個概念,最後一個就很好理解了:過渡期,就是從基準日到交割日之間的這段時間。只能焦急地等待,短則數月,長則幾年。等等,不知道你有沒有意識到了,過渡期,好像是一段非常特殊的時期:這段時間,叮咚這家公司,已經被美團“預定”了。但在這幾個月裡,名義上公司依舊歸叮咚,依舊由叮咚團隊來經營。那,豈不是雙方的利益,可能會有衝突?萬一你幹一些什麼事情,我7億的價格預定的,到手只剩7塊了,咋辦?當然,我還是得強調,叮咚作為一家優秀且有職業操守的公司,肯定不會這麼幹。咱只是打個比方,讓你知道,如果沒有嚴格的法律限制,那理論上可以幹什麼。比如,突擊提款。既然公司以後是美團的,那趕緊把錢給兄弟們分了。管理層發一筆“特別貢獻獎”。帶著獎金環遊世界去。比如,利益輸送。既然我要撤了,那就趕快和某家小舅子公司簽一個20年的採購合同,價格比市場價高出80%。反正付的不是我的錢,不簽白不簽。比如,極速透支。給使用者瘋狂賣儲值卡,再把該付給供應商的前死死拖住。等交割那天,帳面現金流看起來完美無瑕。但美團接手進來第二天就會發現,門口全是討債的供應商。甚至,僅僅是不作為。比如,某個大客戶其實欠了一大筆錢。但叮咚直接做個順水人情,簽份放棄追索的聲明,一筆勾銷。損失是美團的,人情卻是叮咚的。這些在財務上操作,在財務上有一個專業名詞:漏損。瞭解了這些,再看這段原文,就不會有任何阻礙了。業務經營與過渡: 自簽約日至交割日(“過渡期”),公司承諾將按常規業務模式。營運目標公司。目標公司及其子公司在此期間產生的任何經營盈虧均由買方承擔。公司在此期間須遵守慣例性的限制性條款,包括但不限於:限制資本結構變更以及簽署重大的非正常業務合同。公司向買方聲明並保證,此前未發生、且此後也不會發生任何未經授權的資金漏損。任何此類漏損均可能導致從交易對價中直接扣除相應金額。這,就是“鎖箱機制”。既然公司已經預售給了我,那過渡期裡你就要承諾繼續正常營運公司,不能變更資本結構(比如不知道從那多出來一大筆負債),不能簽署重大非正常業務合同(比如把公司資產賣給小舅子公司)。如果你真的有這種資金漏損發生,怎麼辦?那就補,被查明漏損了1億,交割時付的價格,就減掉1億。擺爛之憂,就這樣解決了。04變卦之憂:你是不是還想“貨比三家”?解決方案:禁止尋價條款信不信,如果你能順利看到這兒,看懂下面的內容就越來越容易了。不信?再來一條:Exclusivity: The Company is bound by a "no-shop" obligation, prohibiting the solicitation or facilitation of alternative acquisition proposals from third parties during the Transition Period.排他性:公司受“禁止尋價”條款約束,禁止在過渡期內尋求或促進第三方的競爭性收購建議。這條就特別好理解了。既然定了價格,簽了合同,就該各幹各的事。我去準備錢,你去準備法律程序。不能過兩個月,你拿出一份京東的報價:你看看,東哥開價10億美元,你不得匹配個報價嗎?這就太不講武德了。所以,必須有這麼個條款,在過渡期內,叮咚嚴禁去接觸任何第三方競爭性收購者。你只能跟我談,不能再去找備胎。變卦之憂,就這樣解決了。05意外之憂:萬一併購黃了咋辦?解決方案:分手費與反向分手費接著看下一個擔憂,如果說前面的本質都是“君子條款”,只是保個底。那這項真的非常重要,因為這很有可能發生。還是先看原文。終止與費用: 若12個月內(可協商延長)未完成交割,協議可終止。設有階梯式終止費:1) 若滿足所有條件但買方未能完成交割,買方須支付1.5億美元終止費。2) 若公司未能滿足重大可控條件或不配合監管備案,公司須支付7500萬美元終止費。3) 若公司已盡力配合但未能獲得反壟斷審批或其他監管許可,買方須支付7500萬美元終止費。大白話說,就是醜話說在前頭。如果最終收購沒完成,咋收場?萬一婚結不成,彩禮退不退?你說,這麼大的事,世人皆知,難道真會黃嗎?當然有可能,能不能交割,取決於一大堆原因。這樣的例子簡直數不勝數。遠的不說,2020年,輝達宣佈400億美元收購晶片巨頭ARM,震驚世界。但在隨後很長一段時間裡,美、英、歐盟的監管機構,都對收購表達了嚴重擔憂(擔憂啥就不說了,自己猜猜吧)。總之,就這麼來來回回來來回回,鬧騰了5年。就在2個月前的2025年12月5日,輝達宣佈因始終無法通過審批監管,放棄收購。高通收購恩智浦、輝瑞收購艾爾建、螞蟻金服收購速匯金,全都是這樣,一地雞毛。所以,必須提前約好。這些約定,被稱為“分手費”和“反向分手費”。嗯,別看有點不正經,但它真的是個專業名詞。簡單來說,如果賣方(叮咚)滿足了所有條件,但買方(美團)原因沒能完成(比如不想要了、尺碼不對、地址填錯、商品少件……想想你淘寶退貨時候那些理由)。那就買方負責,美團支付1.5億美元終止費。如果買方一切正常,賣方捅了婁子,比如財務有問題呀、不配合監管呀,這啊那啊的。那就賣方負責,叮咚支付7500萬美元終止費。如果雙方都盡力配合,但是人力沒能勝天,交易最終被監管叫停(比如反壟斷,這種情況並不罕見),咋辦?也約定好了。美團說,我誠意求購,我認,這種情況,我出7500萬美元。你可能要問,為什麼兩邊承擔的後果,似乎不一樣?美團賠的多(1.5億),叮咚賠的少(7500萬)?你可以大致理解成,在這次交易中,美團是勢在必得的強勢方,而叮咚是需要確定性的保護方。美團用更高的分手費給叮咚吃定心丸:放心,只要你不出錯,我絕不悔婚。總之,醜話說在前面,是避免事後扯皮的唯一方法。所以,交割前,是雙方最脆弱的時刻。對於美團和叮咚的律師、審計,以及監管機構來說,接下來的幾個月,將是頻繁加班的日子。這些夥伴們,如果忙碌之餘看到這篇文章,祝你們一切順利,注意身體。意外之憂,就這樣解決了。06背刺之憂:我買的是資產,還是買了個對手?解決方案:不競爭條款再看一段原文:Non-Competition: The Company and the Founder have agreed to a five-year non-competition and non-solicitation covenant following the closing, covering the To-C fresh grocery e-commerce business within the Greater China region.不競爭條款:公司及創始人承諾在交割後五年內,不在大中華區經營面向消費者的生鮮電商業務,且不得招攬原員工。這個就更好理解了,美團擔憂的是什麼?是“買出一個競爭對手”。不能前腳我7億多刀買了叮咚買菜,後腳創始人再創一個“騎德龍東強買菜”,然後再把老部下都挖過去。那我不成了冤大頭了嗎。所以,要有這條規定,創始人5年內不能在大中華區跨入同賽道,並且不准帶走原公司老部下。想創業,請去中東、去美洲、去東南亞。背刺之憂,就這樣解決了。07稅務之憂:可別埋什麼隱藏的雷解決方案:尾款擔保還有最後一個問題,如果經歷千難萬難,西天取經,九九八十一難,終於到了交割日。是不是7億美元一次性付清?咱們看原文:The adjusted consideration will be payable in cash in two installments:(i) 90% of the consideration payable at closing.(ii) the remaining 10% payable following the Company's settlement of applicable taxes related to the Transaction.調整後的對價將分兩期支付:1) 90% 在交割時支付。2) 10% 在公司結算與交易相關的適用稅費後支付。最後還是有一項擔憂:這筆交易本身,也是有稅的(這也是為什麼,前面必須要把現金剝離掉)。這筆稅,必須妥善處理,不然會留下隱患。根據中國稅務局著名的“7號公告”,如果賣家(海外實體)賣了中國公司股權但不交稅,買家(美團)是有扣繳義務的。如果賣家跑路了,稅務局會找美團要這筆稅。所以,這10%尾款,是最後一道防火牆。交割當天只付90%,剩下的。等確保這筆交易的所有法律風險都排除(原文:在公司結算與交易相關的適用稅費後),把完稅證明貼我臉上,再把這10%結給你。稅務之憂,就這樣解決了。08最後的話有人可能要問,天吶,真的有必要這樣嗎?這麼不信任合作夥伴?做生意就不能真誠一點,拿電視劇裡那種“一張紙合同”,真誠互信?我反而覺得,這正是商業的美妙之處。它讓兩個可能從未謀面、甚至曾經你死我活的對手,也能夠坐在同一張桌子上,醜話說在前面,用把所有“萬一”寫在紙上的方式談生意。我有一系列特別大的收穫:1. 現代商業制度,真是一套偉大的體系它最偉大的地方,不在於讓大家都變成“好人”,而是“讓壞人也沒法作惡”。通過極其複雜的博弈,為原本脆弱的“信用”焊上了鋼筋鐵骨。2. 那些天書一樣的法律術語,背後一定有它的道理背後不知道是多少人的血淚和多少公司的坑。我們不能嘲笑他們“不說人話”。而是要搞懂它,在遇到問題時候,敬畏專業人士的力量。3.在巨大的利益面前,我們不能寄希望於“人性大發慈悲”,而要寄希望於“制度嚴絲合縫”商業社會,其實就是用一份份越來越厚的合同,去避險那些說不清的風險。商業的魅力,或許也正在於此——用最複雜的條款,成全最簡單的信任。 (正和島)
難造下一個“王興興”
圖源:視覺中國“上春晚”——這句曾經屬於演藝明星的口號,如今成為人形機器人賽道企業扎堆競逐的真實寫照。從1月下旬開始,銀河通用、宇樹科技、魔法原子、松延動力四家機器人公司接連官宣要“上春晚”。其中,銀河通用為2026春晚指定具身大模型機器人,宇樹科技為2026年春晚機器人合作夥伴,魔法原子為2026春晚智慧型手機器人戰略合作夥伴,松延動力為2026年春晚人形機器人合作夥伴。“人形機器人上春晚,本質上仍是一筆商業合作,而非外界想像中的技術競標或複雜博弈。說白了,就是上央視、乙方出錢,誰出得起錢,誰就能上,沒有太多額外空間。”有具身智能公司相關負責人透露。事實上,在這場“明牌”官宣之前,關於春晚席位競爭的暗戰早已悄然上演。消息人士稱,多家機器人公司參與了此次春晚合作資格的競爭。據《財經》報導稱,今年將會有五家機器人公司登陸春晚,每家分別出資金額1億元。目前公佈的僅有四家,暫無法確認第五家是誰。億元門票曝光或許能買來知名度,卻難再造一個“王興興”。億元上春晚背後的商業邏輯花1億上春晚什麼概念?以“人形機器人第一股”優必選的年營收做對比,就能直觀看出這筆投入的份量。據財報顯示,優必選2022年至2024年的年營收分別為10.08億元、10.56億元、13.05億元。“目前年營收過10億元,就能躋身國內具身智能第一梯隊。”有具身智能領域投資人透露。豪擲1億元上春晚,相當於拿出了其年營收的十分之一,來購買春晚4個多小時的曝光量。“從一家具身智能公司的營運和內部決策邏輯出發,很難將這筆支出視為理性投入。”某具身智公司高管張鵬(化名)坦言,“這並非否定春晚曝光的價值,而是在投入產出比層面難以自洽。”他進一步解釋:“一方面,春晚帶來的更多是一次性的、不可拆解的集中曝光,很難與具體業務指標建立清晰對應關係;另一方面,同樣規模的預算,完全可以拆分,用於更長期、更具複利效應的市場建設,或產品、研發、管道等關鍵環節的投入。”不過,張鵬也承認,春晚在品牌勢能上的放大效應確實客觀存在。以宇樹科技為例,去年春晚,宇樹H1人形機器人身穿東北花棉襖,與舞蹈演員共同演繹節目《秧BOT》,不僅讓宇樹從科技圈“小眾明星”躍升為全民認知的“國家科技代表”,更在後續帶來了實實在在的商業紅利。“去年春晚之後,宇樹機器人的知名度確實被明顯拉高了,不僅在C端租賃市場打開了局面,也在B端的產業合作中佔據了先機。”張鵬說。然而,去年宇樹機器人一家獨享春晚舞台,且恰逢DeepSeek大模型爆發帶來全社會對AI的空前關注,形成了難以複製的強大的破圈合力。“今年多家具身智能公司扎堆亮相。一方面,觀眾的新鮮感被稀釋,注意力在多家同台中分散,觀眾或許只記住了‘春晚有機器人’,卻記不清具體是那家;另一方面,市場期待已從‘看個熱鬧’過渡到‘看個門道’了,單純的舞台展示難以轉化為持久的品牌認知或實打實的訂單。”睿爾曼智能科技創始人兼CEO鄭隨兵分析稱。而在天使投資人、資深人工智慧專家郭濤看來,具身智能公司扎堆上春晚,本質是資本訴求主導下的戰略行銷行為,融資及IPO鋪路的權重遠高於直接商業化鋪墊。“企業投入高額費用競標春晚席位,核心是借助春晚的公信力放大融資故事,而非單純推廣產品。當前行業仍處於早期的商業化驗證階段,大規模商業化落地尚不成熟,春晚的核心價值始終服務於企業的資本化處理程序。”郭濤解釋稱。“要麼在IPO的路上,要麼想法活下去”郭濤的判斷很快得到了驗證。就在官宣成為2026年春晚智慧型手機器人戰略合作夥伴的當口,魔法原子聯合創始人顧詩韜透露,“魔法原子最快可能在2026年在二級市場有新消息,公司正按照最快速度排上市時間表。”縱觀已經官宣上春晚的四家具身智能公司,其資本化步伐也在明顯加速。其中,宇樹科技已完成IPO輔導備案;融資超24億元的銀河通用已完成股改;松延動力一年內多次融資,近兩輪融資額接近5億元;魔法原子雖成立時間最短,但高管團隊已透露或將最快於年內啟動IPO處理程序。“頭部企業借春晚曝光後,其估值與資本關注度均大幅提升,老股交易也變得異常火熱,足見其對融資的催化作用。”郭濤分析稱。而這場集體亮相的本質:是資本敘事壓倒商業邏輯。事實上,除了已官宣上春晚的四家公司明顯加快了資本化處理程序外,其他具身智能企業也在緊鑼密鼓地向資本市場發起衝刺。據天眼查資料顯示,具身智能公司星海圖已完成股份制改造,並正式更名為“星海圖(北京)人工智慧科技股份有限公司”;與此同時,眾擎機器人也已完成股改,更名為“深圳眾擎機器人科技股份有限公司”。在資本市場語境中,股改通常被視為企業啟動IPO的關鍵一步。它不僅意味著公司治理結構向公眾公司標準靠攏,也釋放出明確的上市意圖。比如,已完成股改的樂聚智能和雲深處科技已正式啟動上市流程。據中國證券監督管理委員會網上辦事服務平台披露,樂聚智能(樂聚智能(深圳)股份有限公司)和雲深處科技(杭州雲深處科技股份有限公司)均已辦理輔導備案登記,正式啟動IPO流程。“因為一級市場融資空間正逐步縮小,今年具身智能公司要麼在IPO的路上,要麼就要想法活下去,而且部分投資人也在等著上岸。”一位投資人的話點破了行業的殘酷現狀。在一級市場融資收緊的背景下,春晚成了打響知名度、拉高估值、為老股交易造勢,進而“救命上岸”的關鍵一搏。鄭隨兵則表達了不同的觀點,“具身智能行業正在經歷‘擠泡沫’和‘顯真金’的過程。IPO只是資本路徑之一,真正活下去的企業靠的是產品化能力和商業閉環。那些只做組裝、沒有核心技術的公司,確實會在2026年面臨淘汰。而掌握核心部件,或者在特定場景有深度應用的公司,就算不IPO,也能靠穩定的訂單和現金流活得很好。在鄭隨兵看來,IPO只是企業發展的一個選項,不是必選項,把IPO當成生死線,本身就是對商業本質的誤解。不能否認的是,由於具身智能公司前期研發投入高,且商業化處於早期階段,不少機器人創業公司前期主要靠融資維持營運,目前真正實現盈利的具身智能公司鳳毛麟角。淘汰賽開始:從“講故事”到“交答卷”曾經因技術願景和宏大敘事而備受追捧的人形機器人賽道,如今正面臨從“講故事”到“交答卷”的嚴峻考驗。“2026年具身智能行業已正式進入‘資本化淘汰賽’階段。一級市場融資空間持續縮小,在前期賽道融資熱潮後,資本開始回歸理性,投資邏輯從追捧概念轉向看重技術落地與訂單兌現能力。”郭濤分析稱。喧囂之下,行業的淘汰賽已經鳴槍。投資人邏輯正從追捧宏大願景,急轉為苛刻審視技術落地與訂單兌現能力。訂單成為新的生命線。1月22日晚,宇樹科技官方微信公眾號發佈了一份關於2025年銷量資料的澄清聲明,明確指出宇樹科技2025全年人形機器人實際出貨量超5500台(指實際出售發貨給終端客戶的數量,並非訂單數量,訂單數量更高),2025年本體量產下線超6500台(上述均為宇樹純人形機器人的數量,不含雙臂輪式等其他機器人產品)。此前,市場對宇樹訂單的實際交付規模存在諸多猜測。例如,據市場研究機構Omdia此前統計,2025年人形機器人出貨量前三名分別為智元機器人(5168台)、宇樹科技(4200台)和優必選(1000台)。從宇樹主動更正出貨量資料可以看出,具身智能公司在B端市場的訂單獲取與實際交付能力,已成為競爭的關鍵點。例如,去年7月,智元機器人和宇樹科技就共同中標了中移(杭州)資訊技術有限公司人形雙足機器人代工服務採購項目,總預算超過1.2億元。然而,“拿下訂單”只是開始。面對部分具身智能公司高調宣傳和密集的訂單公告,業內對訂單的真實含金量和可執行性仍存疑慮。摩根士丹利指出,許多訂單在2025年內無法完成交付,且其中一部分屬於 “框架協議訂單” ,執行的確定性較低。與此同時,多數企業為2026年設定了激進的出貨目標,部分目標高達10萬台,這與目前機器人“有限的工作能力”形成反差。“受限於高品質訓練資料(尤其是 action model 部分)的缺乏,樂觀估計,2025年只有5成機器人能實現商用規模部署,進入產線或服務業,其餘多處於資料採集階段,2026 年這種情況會有很大好轉。”Counterpoint機器人分析師EthanQI分析稱。宇樹科技創始人王興興曾在第七屆“北京智源大會”上談及機器人登上春晚的意義。“無論是上春晚還是格鬥比賽,目的是給人形機器人一個展示平台,讓大家知道目前機器人發展到什麼階段,終極目標是讓機器人幹活,真正解放人類生產力,無論是進工廠還是進入家庭場景。”對於人形機器人未來落地節奏,EthanQI進一步預判,因汽車和倉儲物流等行業工序結構化,容易實現端到端強化訓練, 2025-2027 年人形機器人的替代率能達到70%以上。而家用市場預計2030年才會有較大突破,前提是解決安全性和人機協作(包括物理接觸)的問題。“人形機器人真正融入社會、全面替代高技能工作、成為人們工作生活中的得力幫手,可能要到 2035 年以後。”EthanQI判斷。它們用億元門票購買了一張參與殘酷資本競賽的入場券。然而,真正的考驗才剛剛開始——是憑藉這次曝光撬動資源、夯實技術、兌現訂單,最終穿越周期? (深網騰訊新聞)
王興想靠什麼走出至暗時刻
戰火下的基因融合與突變有熟悉王興的人告訴我,2025年的9月到10月王興比外界設想的平靜許多。“他心情明顯很放鬆,和朋友聚會也是談笑風生的狀態,鬆弛許多”。該人士描述了一個細節,在9、10月期間,王興甚至饒有興致地去看了一本與生意無關的、講述古典文學的書。然後他拿出相當多的時間,把視線從喧囂的外賣戰場投向AI,他拜訪了多位國內外AI、具身智能賽道的頂級學者或知名創業者。讓王興鬆弛下來的核心原因,是他嗅到了外賣戰場風向變化:友商們始於2025年一季度的強烈攻勢,日漸接近“攻勢烈度上限”。“攻勢依然很猛,但投入側不再出現幾何級增勢”——一位知情人士分析稱,美團核心層發現,幾個主要友商並未能真正做到“投入不設上限”,各自在某個“ROI邊界紅線”上,選擇了“維持火力”而非“繼續擴大火力”。這個關鍵變化意味著,美團面前的戰場,並非是充滿不確定的迷霧模式,而是“承壓與戰損”可以精準測算的“全景模式”。不過,“全景模式”看到的現實可謂“慘烈”。根據美團最近一次財報會議透露的資訊,在外賣大戰最激烈的時刻,2025年Q3美團經調整淨虧損為160億元(去年同期業績為盈利128.29億元),其中核心本地商業類股三年來首次由盈轉虧,虧損141億元。導致虧損的核心原因是外賣大戰引發美團陷入“行銷大戰”,季度內行銷支出激增91%。但好消息是,如果美團內部對於行業的判斷(即友商投入力度瀕臨邊界,戰火可能不會再擴大,甚至可能會降溫)精準,那麼擺在美團面前的局面可能會出現質變:再堅持一到兩個季度,隨著友商攻勢減弱,美團可以把更多核心資源投入到原本的“核心計畫之中”。核心計畫,即美團內部的AI相關科技創新業務,及核心本地商業此前提出的“深入產業鏈”等。虎嗅瞭解到,在2025年外賣大戰出現前。美團原本的計畫是通過2023~2024兩年在AI、無人機、具身智能等方面積累的技術、業務經驗,在2025年推動整體核心業務“AI提效”“AI重構”。一位接近王興的友人告訴虎嗅,在2024年下半年,王興曾跟他交流自己的夢想,王興認為自己整個創業的動力,在於在兩個世界——一個是“由程式碼構成的虛擬世界”、一個是“由人和無數線下商家構成的真實世界”——中搭建橋樑。王興甚至暢想了一個基於AI、機器人、無人機構成的全新的生活與消費世界,他還聊到了對於宇宙、太空探索的暢想。可以說,2025年友商在美團腹地“外賣”領域發動的突襲和陣地戰,把王興和美團從夢想拉回現實,虎嗅認為它實際上對這家公司帶來了三重深刻影響:原本“美團的AI進化”處理程序延後,大量原本在2025預計投入到AI、具身智能、無人機相關的資源和人,不得不牽引到“守住基本盤”的戰場;這場外賣大戰,給美團和王興的理想主義,打了一針“冷靜劑”,它們近期的AI方向從更“探索性”演變為“更務實”、“更實用”;外賣大戰,加速了美團這家公司的整體轉型,包括AI降本、提效、以及提前把相關工具與武器投入到戰場。01 兩個世界,三條路2025年12月中旬至2026年1月初。在和三位美團工程師、兩位外賣及本地生活相關人士以及一位中層人士溝通後,虎嗅瞭解到2025年,美團內部 AI Coding(基於AI輔助生成程式碼)已經成為這家公司的主要工作模式。據上述人士透露,美團內部,2025年新程式碼中大約有52%依託於AI Coding生成。(虎嗅注:52%是上述人士中其中一位基於自己團隊情況推算,另一位交流人士認為普遍來看美團2025年新生成程式碼中40%基於AI Coding產生)。虎嗅獲悉,美團內部已經把“AI Coding”納入到標準流程之中。據我們瞭解到的情況顯示,所有新生成程式碼(無論是人工生成還是AI Coding生成),必須經過“AI檢測環節”去完成程式碼的校驗。“AI檢測環節”除了確保程式碼精準度外,還成為美團評估效率的一種手段——通過AI檢測加上既有的人工評判,更綜合地評估所生成程式碼的質量價值。在美團內部,幾乎所有的一線部門都被鼓勵用AI提效。2025年美團內部增設了更多“AI提效之星”一類的獎勵制度,去獎勵通過AI提效的個人與團隊。在培訓上,美團在2025年針對新入職員工、多年入職員工分別開設了不同的“AI Coding 實戰課程”。虎嗅瞭解到,這些實戰課除了培訓外,還設有完善的“考試”體系,以確保員工迅速掌握AI Coding相關能力。一位不願具名的美團內部技術人士告訴虎嗅,2025年美團圍繞AI Coding的“全員化推廣”,實際上是依託於2022~2024年的積澱。他表示,美團內部針對AI Coding開發了大量核心自研工具和元件,比如內部主流的AI Coding工具NoCode和CatPaw,就是基於自研LongCat模型自建的。AI Coding只是美團整體AI進化的一個縮影。虎嗅瞭解到,美團內部正在嚴格執行王興所描述的“三層AI戰略”或者叫“美團AI的三條路”:AI at Work、AI in Products和Building LLM。AI at Work:通過AI提效,通過AI提高整個美團的工作效率和能力AI in Products:將AI融入到美團現有的產品之中,強化C端和B端(商家)使用者的感知和體驗Building LLM:自研大預言模型,核心是打造有美團基因、適合美團業務特質的自研模型AI Coding屬於美團AI at Work中的一部分,也是2025年美團內部的升級焦點。和阿里、字節等公司推動內部AI化的策略有所不同。虎嗅觀察研究後發現,美團的AI進化,有“更靈活”、“更依託小單元團隊”、“無強烈的C端市場目標”等特點。在美團,龍貓(LongCat)團隊是其自研模型核心團隊。這個團隊在2025年的核心方向是升級模型的多模態能力、降低算力成本、並提高算力利用效率。在2025年海外多個開源模型榜單上,LongCat模型殺入了前五。但在美團內部,LongCat並非集團內“政治正確的模型選擇”。不同業務可以靈活地根據自己業務特點,選用LongCat或者市面上其他大模型。實際上,龍貓團隊並沒有被一些諸如開源社區下載量或榜單排名類的考核維度綁死,虎嗅瞭解到美團給予龍貓團隊非常大的自由空間,以確保團隊的創造性和靈活性。相比之下,國內其他大廠的主流模型團隊,基本上都以使用者量(非開源)或者開源社區下載量(開源模型)作為核心考核指標。另一個典型案例是光年之外。這家由美團聯創王慧文創立的公司,在2023年被美團收購之後,在美團內部扮演“探索者”形象。虎嗅獲悉,龍貓團隊等美團相關AI團隊,在研發和探索時,一般要基於美團的既有業務和場景去做研究;但光年之外的方向被明確為“既有業務之外的廣大世界”。如果說沒有“下載量”等考核維度的龍貓團隊相比於友商的模型團隊已經算是“靈活”,那麼光年之外團隊已經是“徹底放飛”了。值得注意的是,在字節和阿里內,實際上也有類似的為了確保創造性和探索性、而重點培育的“和主業關係較遠”的“天才小組”。但光年之外的特殊性在於,它整個團隊的人才基底,是當時王慧文獨立創業時挑選的一批人才。有相關人士告訴虎嗅,由於早期人才選取模式的差異,光年之外團隊是美團內部一個徹底的“人才與探索特區”。而其他大廠內部的探索性項目組,往往依然依託於本身的人才選用體系或者取材於系統本身,很少有類似光年之外這樣的“異數奇點”。另一個美團AI化的特點是整體AI落地到了一個個細小的單元團隊。虎嗅瞭解到,美團內部每個業務類股都被允許開發適合自己場景的AI工具或者AI功能。集團並不會有一個統一的整體進度規劃,但會從集團層去拉齊技術協同與復用。一個典型場景是。美團內部某業務類股下的項目組(8~15人構成),是可以針對所在業務場景,單獨提報並開發AI功能模組的。業務類股可以自由決定是否允許這一動作,並予以支援。當這一功能模組開發完成後,業務類股可以決策是否上線測試,並基於此決定後續資源扶持力度。相比於友商,美團整體的態勢,更接近於“靈活小單元”,而非在AI方面“大兵團作戰”。實際上,美團的龍貓、無人機、無人配送車等重點AI相關項目,很少會“抽到集團各個部門精銳”“組建大兵團”“畢其功於一役”。這些項目大多是起源於數年甚至十餘年前的某個業務(項目),然後根據新的AI業務需求重新調整,然後以單獨業務單元的模式存在於美團內部。對C端市場的不同態度,也是美團與其他網際網路大廠在AI這件事上的明顯差異。虎嗅獲悉,2024~2025年美團內部都有過“是否進軍C端AI市場”的討論。但王興及集團核心層最終判斷,他們並不會去做類似豆包、OpenAI類的C端AI產品。王興的思路是,基於美團現在的業務,去進行AI想像和升級。如果我們詳細分析美團近三年在AI上的佈局,可以發現,它實際上在做四類事情:大模型及相關工具(但主要是對內提效、或嵌入APP提高C端體驗)、無人機(主要是探索新技術如何提高配送效率)、無人配送車(依然是新技術提高配送效率)、通過投資入局具身智能上下游(探索針對分揀、配送等關鍵業務環節的未來技術想像空間)。一位相關人士告訴虎嗅,豆包等大廠AIC端產品,本質上是流量入口之爭,但美團無意於參與流量入口之爭,美團關心的問題是:如何通過AI提效?如何通過AI升級組織體系和業務流?該人士認為,這其實和王興“美團的本質是連接兩個世界(虛擬世界+現實世界)”的設想有關。“在2025年美團也推出了C端市場AI產品小美APP,但本質上這個產品並非流量入口,而是一種AI助手工具,讓使用者換一種方式去體驗美團業務。”另一位接近王興的人士認為,AI at Work、AI in Products和Building LLM三條路,實際上是一種美團自己的“閉環邏輯”:通過Building LLM自研大模型,給AI at Work、AI in Products提供生產力;然後通過AI at Work、AI in Products兩件事對內對外(使用者感知)提高效率和體驗,而這一過程中產生的新資料,又可以成為Building LLM的資料飼料。但也有質疑的聲音。一位資深AI行業觀察人士告訴虎嗅,外賣大戰牽扯了美團過多的資源,如果2025年美團沒有被迫應戰,那麼數百億的行銷費可能會投入到AI相關領域。“可能在某個瞬間,美團是有機會殺入C端AI市場的,推出類似豆包或者千問類的產品。”02 因為大戰而變化的美團虎嗅近期詢問了多位美團內部業務相關人士,其中有中高層也有一線員工:2025年,外賣大戰到底給美團帶來了什麼影響?其中一位人士認為,美團被迫應戰,改變了一些既定的路線(一些業務的先後次序、權重發生了變化),但從更大的局面看,這場仗可能早晚會來,2025年其實是一個對美團有利的節點。“美團過去三年業務是持續上升,疫情後達到了現金流、利潤表現最好的階段,也就是說美團在一個相對兵精糧足的周期內遭遇了一場硬仗;2025年的壓力雖大,但美團在AI、無人機等事情上的關鍵基礎投入沒有減少,咬著牙堅持下來了,這意味著可能被影響的是速度而不是趨勢,AI化一定會給美團帶來質變;這場仗讓美團內部發生了一系列微妙變化,從長遠看,這對美團是有利的。”該人士認為,2025年美團發生了三類關鍵變化:在2025年外賣大戰之際,美團內部的人才完成重要迭代,一批年輕精銳“因戰”上位。大浪淘沙下,美團幾乎所有部門都進行了圍繞人、圍繞崗位的重新思考與調整;美團內部匯報流程和層級進一步縮短、精簡,一些在2023~2024年的工作方式,隨著2025年的大戰而消失,取而代之的是更“通暢的資訊流淌速率”;AI徹底成為武器庫裡的“人均標配”。虎嗅研究發現,外界可能忽視了一個關鍵細節:在外賣大戰最熱的2025年,美團在AI及相關領域的年度投入,大機率進入了疫情後最高峰。(基於財報、財報電話會議及交流內容總結而得出的觀點)如果這一推論確實,那麼真實的戰場全貌是:當友商通過高額補貼大戰讓美團被迫應戰之際,美團在完成“雙線戰爭”,一方面以低於對手現金流的能力參與大戰、維繫份額局面;一方面在以“忍耐邊界”的極限保持在AI等關鍵未來上的投入。一位不願具名的內部人士透露,美團加大了對AI圈內頂級學者和人才的延攬力度,王興多次親自登門拜訪這些人才,並給予“不設考核、不設目標,共同探索”的合作方案。“他會告訴你,如果願意來美團,不會被世俗考核束縛,會有自由的探索空間。如果礙於身份,不想入職公司,還可以在研究院掛職。他不只是和你聊工作,還會分享對人生、宇宙的感悟。”一位圈內人士這樣提及了一段某美團高管在2025年的交流細節,“有一次在酒局上,他陷入了漫長的沉默,我們認識二十餘年,第一次看到他這樣。但是他在朋友聚會上,從來不會聊工作,他又是一個會照顧朋友情緒的人。在漫長沉默後,他努力地聊起美食、酒、話劇以及閒篇。”警報聲並未遠離。虎嗅瞭解到,在即將來到的春節,部分友商可能將發動新一輪大戰,以搶奪春節期間的“外賣心智”。除了外賣戰場,在巴西美團和滴滴的海外大戰也正焦灼。一位圈內人士認為,因為一季度瀕臨美股上市公司財年年底,相關業務線勢必要通過市場份額去證明業績,這意味著美團在接下來兩三個月可能會持續承壓。但這可能也是黎明前的至暗時刻。截至2025年,美團內部超過90%的員工已經日常使用AI工具;截至2025年底龍貓大模型在海外多個榜單中已經在細分測試領域殺入前二;在經歷了三個季度的猛烈戰爭後,美團在外面和即時零售上的市場份額依然保持在了60%以上……擺在王興和美團面前的,可能並不是一個持續的冬天。而是經歷大戰洗禮、全員已換上AI制式武器、對手炮火即將削弱的新局面。 (虎嗅APP)
里程碑!人形機器人與具身智能標委會成立,王興興彭志輝發言
據中國電子學會微信公眾號消息,12月26日,工業和資訊化部人形機器人與具身智能標準化技術委員會(以下簡稱“標委會”)成立大會在京舉行。工業和資訊化部副部長柯吉欣,全國政協常委、致公黨中央副主席、全國婦聯副主席、中國電子學會理事長徐曉蘭,工業和資訊化部總工程師、標委會主任委員謝少鋒,中國電子學會理事會黨委書記張峰,標委會委員,工業和資訊化部科技司有關負責同志,地方經信部門代表,企業、媒體等100餘人出席會議。成立大會由中國電子學會副理事長兼秘書長、總部黨委書記陳英主持。柯吉欣副部長、徐曉蘭理事長、謝少鋒總工程師、張峰書記為人形機器人與具身智能標委會揭牌柯吉欣副部長在致詞中表示,黨中央高度重視人形機器人與具身智能等未來產業發展。在各界的共同努力下,中國人形機器人與具身智能產業蓬勃發展。當前成立標委會,系統推進人形機器人與具身智能標準化工作,恰逢其時。一是精準把握產業需求,加強高品質標準供給。加強標準制定的系統性和前瞻性,加快完善標準體系。二是充分凝聚各方合力,建構協同發展生態。以標委會為平台,拓寬參與管道,建構分工明確、優勢互補的標準生態。三是前瞻佈局國際標準,提升產業競爭能力。堅持“開門做標準”,主動與國際標準體系協調對接,深化標準合作與交流互鑑,提升國內產業的國際競爭力。徐曉蘭理事長在致詞中表示,人形機器人是人工智慧、晶片、感測器、材料、軟體等諸多技術的集大成者,已成為新質生產力的典型代表。中國電子學會作為標委會秘書處單位將著力做好以下四方面工作,一是建構“敏捷迭代”的標準供給機制,堅持急用先行,穩步推進。二是強化“全鏈條”協同生態,對內打通上下游適用壁壘,對外做好跨領域協同。三是深化“應用為先”的貫標機制,堅持企業主體地位,結合真實場景,建立健全認證評估體系,推動標準落實落地。四是推動建立“主導型”標準體系,深度參與國際國家標準化活動,加強與國內外標準組織的協同聯動。魏巍司長宣讀成立工業和資訊化部人形機器人與具身智能標委會的公告,柯吉欣副部長、徐曉蘭理事長、謝少鋒總工程師、張峰書記共同為標委會揭牌。柯吉欣副部長為謝少鋒總工程師頒發標委會主任委員聘書,標委會主任委員謝少鋒總工程師為標委會副主任委員、秘書長、副秘書長頒發聘書。柯吉欣副部長為謝少鋒總工程師頒發標委會主任委員聘書標委會主任委員謝少鋒總工程師向標委會副主任委員、秘書長、副秘書長頒發聘書隨後,標委會召開了第一屆第一次全體委員會議。首先,工業和資訊化部科技司杜廣達副司長解讀推動人形機器人與具身智能創新發展的有關考慮。會議審議通過了標委會章程、秘書處工作細則、標準制修訂工作程序、下設工作組管理細則、下設工作組組成方案、2026年工作要點等。標委會副主任委員兼秘書長、中國電子學會副秘書長、北京經濟技術開發區管委會副主任(掛職)梁靚主持會議。江磊副主任委員發言熊友軍副主任委員發言王興興副主任委員發言彭志輝副主任委員發言韓震峰委員發言王仲遠委員發言焦繼超委員發言王曉剛委員發言在發言環節,人形機器人(上海)有限公司首席科學家江磊,北京人形機器人創新中心有限公司總經理熊友軍,宇樹科技股份有限公司董事長王興興,智元創新(上海)科技股份有限公司首席技術官彭志輝,應急管理部國家自然災害防治研究院有限空間應急機器人實驗室常務副主任韓震峰,北京智源人工智慧研究院院長王仲遠,深圳市優必選科技股份有限公司副總裁焦繼超,上海商湯智能科技有限公司執行董事、首席技術官王曉剛等標委會委員代表發言,大家一致表示將在標委會履職盡責,引領行業標準規範,建構產業發展基礎。謝少鋒總工程師在總結講話中表示,我們要深刻認識緊抓人形機器人發展機遇的重大意義,提高政治站位,切實加強使命感和責任感。聚焦關鍵領域、集中優勢力量,推進開源、資料、作業系統、模擬平台等實現突破,全面築牢產業發展根基。凝聚各方力量,加快推進產業規模化發展,合理配置各方力量,堅持需求導向,明確技術路線,尋求最優路徑,紮實推進各項工作。加快建構完善標準體系,以高水平標準服務產業高品質發展。加大資金政策支援,並在倫理治理、質量提升、中試驗證等方面做好相關工作,助力人形機器人加速落地。標委會將在工業和資訊化部指導下,夯實組織基礎、聚焦產業需求、加快標準供給、強化實施應用、拓展國內外協同,助力中國人形機器人與具身智能產業在規範、協作、共贏的框架下,開啟高品質發展新篇章。此前,工業和資訊化部在11月24日公示人形機器人標準化技術委員會委員名單。名單顯示,宇樹科技股份有限公司王興興、智元創新(上海)科技股份有限公司彭志輝等為副主任委員。(上海證券報)
王興興,有新身份!
11月24日,中國工業和資訊化部網站發佈了《人形機器人標準化技術委員會委員名單公示》:根據產業發展和行業管理需要,有關單位提出了工業和資訊化部人形機器人標準化技術委員會的組建方案。為進一步聽取社會各界意見,現將有關委員名單予以公示。公示時間:2025年11月25日—2025年12月24日。公示名單顯示,來自宇樹科技股份有限公司的王興興和來自智元創新(上海)科技股份有限公司的彭志輝擬任該委員會副主任委員。王興興出生於1990年,宇樹科技股份有限公司總經理兼首席技術官,2025年10月任董事長。2013年,還在讀本科的王興興動手製作了第一款四足機器人XDog,兩年後,他帶著XDog參加創業大賽,拿下二等獎,賺了8萬元獎金。2016年,王興興因為XDog測試視訊的“出圈”而獲得融資,成立了屬於自己的公司,全新獨立研發了所有系統,在第二年正式對外發佈了首款四足機器人。此後,王興興的四足機器狗產品不斷迭代,逐漸“出圈”。彭志輝,1993年出生,他是B站百大UP主“稚暉君”,也是曾經的“華為天才少年”,更是如今具身智能行業頭部企業智元機器人的創始人。智元機器人如今剛滿2歲而已,然而一路突飛猛進:2023年8月發佈首款人形機器人“遠征A1”;2024年打造上海首座人形機器人量產工廠,今年1月下線突破千台;今年3月10日發佈首個通用具身基座大模型GO-1;3月11日發佈新款人形機器人靈犀X2,能騎車能玩滑板能縫針,還能做到情感互動。據央廣網此前報導,去年9月30日,工業和資訊化部網站公示了人形機器人標準化技術委員會籌建方案(以下簡稱“籌建方案”),包括業務範圍、標準體系、組成人員、成立後工作計畫四方面內容。為進一步聽取社會各界意見,工信部將籌建方案予以公示,截止日期為2024年11月6日。籌建方案明確,人形機器人標準化技術委員會成立後,擬圍繞最佳化完善標準化路線圖、加快關鍵技術標準研製、促進行業標準的制定和實施、促進標準化工作的國際合作交流四方面開展工作。 (科技日報)
王興興最新發聲!這將是具身智能的“ChatGPT時刻”
“未來1至2年,誰能實現這個目標,誰將擁有全球最領先的具身智能AI模型。”11月5日,宇樹科技股份有限公司創始人、董事長王興興在第八屆虹橋國際經濟論壇“人形機器人創新發展合作”分論壇上對具身智能的“ChatGPT時刻”何時到來作出前瞻判斷。在他看來,誰能在未來一兩年內實現“在80%的陌生場景中完成80%任務”的突破,誰就是全球最領先的具身智能。“比如到明年這個時候,隨便一台人形機器人到會場,你跟它交代任務,比如說‘幫我拿一杯水’或者說給某位記者朋友拿一份東西過去,它可以直接過去把這個任務完成。這個場景完全沒有預訓練過,你給的東西它也沒有看到過。”王興興舉例說。他認為,在完全陌生場景下,機器人能達到80%左右成功率,就已經掌握突破性技術了。“目前人形機器人(包括具身智能)最關鍵的還是機器人大模型(具身智能模型)的進展速度,我覺得稍微有點慢了。”王興興表示,相對去年來說,今年深度強化學習的全身運控的進步非常明顯,但在具身大模型,“端到端能幹活“的技術進步稍微慢了一點,但總體而言其對人形機器人的前景較樂觀。王興興稱,“具身機器人目前的發展階段類似於ChatGPT發佈前的1-3年左右,大家已經發現了方向,但還沒有做成可以突破臨界點的事情。為了早日實現“ChatGPT時刻”,更應該研究模型,還是收集更多的資料?王興興表示,目前在模型結構上大家做了很多嘗試,但泛化能力不夠,還需要創新。大家也需要收集更大規模的資料、質量更好的資料。但目前,對資料的採集、對資料質量的評判還非常困難。另外,他提出,模型和資料需要相輔相成,而不是一股腦採集大量資料,或者一股腦把模型做大。目前,具身智能主流模型有VLA(視訊語言動作)+RL(強化學習)模型和基於視訊生成的世界模型。王興興表示,前者可以用模擬環境做訓練,或者用真實場景做訓練,但泛化能力相對來說不是特別夠。因此,他更喜歡基於視訊生成的世界模型。然而,王興興也認為,該模型面臨比較大的挑戰。因為基於視訊生成的世界模型對算力的需求非常大,需要的算力卡比較多,所以中小型人形機器人公司往往“跑不動”,反而是一些大型AI公司、網際網路公司視訊模型的資源更加豐富,做出該模型的機率更大。 (金融時報)
美團王興狂捲大模型!開源561B“全能”龍貓模型,上線首款AI通用助手App
“首個全模態、端到端、大參數量高效推理於一體的開源大模型”。智東西11月3日消息,今天,美團正式開源全模態模型LongCat-Flash-Omni,模型總參數量5600億,啟動參數量270億。美團官方部落格稱,LongCat-Flash-Omni是業界首個實現全模態覆蓋、端到端架構、大參數量高效推理於一體的開源大語言模型。LongCat-Flash-Omni中的“Omni”譯為“全能”,其在全模態基準測試中達到開源SOTA,同時在文字、圖像、視訊理解及語音感知與生成等關鍵單模態任務中均有明顯優勢,實現“全模態不降智”。LongCat-Flash-Omni基於LongCat-Flash建構,後者採用了高性能的Shortcut連接的混合專家(MoE)架構,並實現了零計算專家,LongCat-Flash-Omni整合了高效的多模態感知和語音重建模組,支援128K tokens上下文窗口及超8分鐘音視訊互動。在預訓練階段,研究人員收集了包含超過2.5兆個詞元的大規模、多樣化的多模態語料庫用於預訓練,同時採用漸進式訓練策略,逐步從簡單的序列建模任務過渡到更複雜的序列建模任務。這是9月1日以來,美團正式發佈LongCat-Flash系列後的第三款模型,此前其已開源LongCat-Flash-Chat和LongCat-Flash-Thinking兩大版本。值得一提的是,今天美團LongCat官方App開啟公測,目前支援聯網搜尋,還可以發起語音通話,視訊通話功能後續上線。LongCat-Flash-Omni目前可以在網頁版和App端體驗音訊互動功能。▲LongCat官方App首頁(左)、LongCat官方App音訊通話(右)據LongCat官方交流群中的官方透露,目前LongCat的文字端模型是longcat-flash,當有多模態輸入,比如圖片和PDF內容時,會自動呼叫omni模型。不過智東西體驗時發現,在LongCat中上傳.jpg格式圖片時一直顯示上傳錯誤。今天中午,官方還修復了一波Android端聯網搜尋相關問題,需要Android使用者解除安裝重裝。Hugging Face:https://huggingface.co/meituan-longcat/LongCat-Flash-OmniGitHub:https://github.com/meituan-longcat/LongCat-Flash-Omni體驗地址:https://longcat.chat/01. 視覺、音訊、文字理解生成拿下多項開源SOTA研究人員將LongCat-Flash-Omni與各種閉源和開放原始碼的多模態模型進行比較,包括視覺理解、音訊理解、文字理解和生成、跨模態理解以及視聽互動。其將LongCat-Flash-Omni與Gemini-2.5-Pro、GPT4o、Seed-1.6和Qwen3-Omni和視覺語言模型Qwen3-VL、Qwen2.5-VL-72B等進行了比較。圖像轉文字方面,總體而言,LongCat-Flash-Omni的性能與Gemini-2.5-Flash相當,並且優於開放原始碼的Qwen3-Omni,其優勢在多圖像任務上尤為顯著。視訊轉文字方面,LongCat-Flash-Omni在視訊轉文字任務上取得了最先進的性能。具體而言,它在短影片理解方面顯著優於所有對比模型,在長視訊任務上,LongCat-Flash-Omni的性能與Gemini-2.5-Pro和Qwen3-VL等模型不相上下。在VideoMME基準測試中,它在全模態模型中取得了最佳性能。音訊能力中,研究人員主要評估了自動語音識別(ASR)、文字轉語音(TTS)和語音延續。基礎模型在預訓練階段的ASR和TTS性能結果顯示,不同階段的基礎模型在上下文語音延續評估中表現良好,文字輸出和語音輸出之間的性能差異可以忽略不計。在語音識別和翻譯、音訊理解、語音轉文字能力中,在所有模型中,LongCat-Flash-Omni的語音識別與翻譯測試集S2TT中表現最好最強;LongCat-Flash-Omni在沒有視覺輸入的情況下,能夠有效地作為原生音訊理解模型運行;在語音轉文字測試集中,LongCat-Flash-Omni在所有基準測試子集中均表現出色,並在多個案例中達到了最先進的水平。此外,LongCat-Flash-Omni還引入了高級跨模態理解和類人語音互動功能,能夠處理跨模態輸入。評估結果顯示,LongCat-Flash-Omni的性能優於Gemini-2.5-Flash-non-thinking,並達到了與 Gemini-2.5-Pro-ThinkingBudget128相當的水平。在強調真實世界音視訊理解的WorldSense和DailyOmni測試中,LongCat-Flash-Omni超越了其他開源全模態模型。在評估跨模態感知和推理能力的UNO-Bench測試中,LongCat-Flash-Omni在開源全模態模型中也表現出色。即時音視訊互動的評估結果顯示,LongCat-Flash-Omni在端到端互動的自然度和流暢度方面得分排名第三。與音視訊互動產品相比,LongCat-Flash-Omni的排名低於豆包和GPT-4o,但優於科大訊飛星火和StepFun。值得注意的是,LongCat-Flash-Omni在開源替代方案中得分比目前最先進的開源模型Qwen3-omni高出0.56分。目前,LongCat支援音訊通話10分鐘,且響應很快,智東西讓其“講一個睡前小故事”,LongCat就即時生成並進行了講述。02. 劍指全模態大模型訓練四大挑戰美團提出四大創新技術思路訓練既具備強大的離線多模態理解能力又具備即時音視訊互動能力的全模態模型的挑戰性在於:跨模態異構性指的是,不同模態之間存在顯著差異,因此需要探索有效的統一表徵和融合策略,以實現跨模態的協同作用,確保任何單一模態的性能都不會低於同等規模的單模態對應模態。統一的離線和串流媒體能力,將離線多模態理解與串流媒體音視訊互動相結合是一項重大挑戰,串流媒體互動場景需要一些離線處理通常不具備的獨特能力,例如感知相對時間、精確同步音視訊資訊以及高效管理多輪互動上下文。實現即時音視訊互動本身就存在諸多難點,包括需要同時支援串流媒體音訊和視訊輸入以及串流媒體語音輸出,嚴格的低延遲要求進一步對計算效率提出了嚴格的限制,從而對模型架構設計和部署基礎設施都提出了很高的要求。訓練效率挑戰,模型和資料的異構性給分佈式策略的設計帶來巨大挑戰。為克服第一個挑戰,研究人員設計了一個多階段大規模預訓練流程。基於早期文字預訓練基礎模型,他們逐步將音訊和視訊資料融入大規模預訓練過程,採用均衡的多模態資料混合和有效的早期融合策略,使得該模型在保持強大單模態性能的同時,實現跨模態的深度融合理解。▲LongCat-Flash-Omni模型架構概覽為了應對平衡離線多模態理解與即時音視訊互動的第二個挑戰,研究人員引入一種人機協同策略來建構高品質的互動資料,並考慮到長期記憶和多輪對話的處理。此外,其從現有的視覺文字語料庫中提取視覺語音問答資料,從而實現自然語音輸出,有助於將強大的離線多模態理解能力遷移到互動場景中。對於第三個挑戰,研究人員採用ScMoE架構,並以LongCat-Flash的零計算專家作為大模型骨幹。為了處理流式輸入,其採用高效的音訊和視訊編碼器進行特徵提取,並引入同步分塊交錯策略以實現即時處理。對於第四個挑戰,研究人員進行了大規模全模態分佈式訓練,其提出一種模態解耦平行(MDP)策略。該方法能夠獨立最佳化大模型、視覺編碼器和音訊編碼器的性能和記憶體使用情況。實驗結果表明了該策略的有效性,其系統能夠保持純文字訓練吞吐量的90%以上。03. 採用五階段漸進式訓練策略借鑑LongCat-Flash訓練基礎設施LongCat-Flash-Omni是一個端到端全模態模型,可以接收多種模態的輸入,包括文字、音訊、圖像、視訊及其任意組合,並能夠直接從大模型主幹網生成語音token。該模型採用視覺編碼器和音訊編碼器作為多模態感知器,大模型處理多模態輸入並生成文字和音訊token,音訊解碼器從大模型生成的語音token中重構波形,從而實現自然的語音互動。其中,音訊編碼器、視覺編碼器和音訊解碼器均為輕量級元件,每個元件的參數量約為6億個。在預訓練階段,資料整理方面,研究人員收集了包含超過2.5兆個詞元的大規模、多樣化的多模態語料庫用於預訓練。該預訓練語料庫由音訊資料、通用圖像-文字資料、視訊資料、OCR、長上下文多模態資料等部分組成。訓練全模態模型最根本的挑戰之一在於不同模態間資料分佈的顯著異質性,面對這一挑戰,研究人員採用了一種漸進式訓練策略,該策略逐步從簡單的序列建模任務過渡到更複雜的序列建模任務。▲訓練策略研究人員首先進行大規模文字預訓練(階段0),在此基礎上引入結構上更接近文字的語音資料,以將聲學表徵與語言模型的特徵空間對齊,並有效地整合副語言資訊(階段1),語音-文字對齊完成後,其引入大規模圖像-描述對和視覺-語言交錯語料庫(階段2),以實現視覺-語言對齊,從而豐富模型的視覺知識。▲預訓練階段1示意圖然後,研究人員會引入最複雜的視訊資料以實現時空推理(階段3),同時整合更高品質、更多樣化的圖像資料集,以增強視覺理解能力。為了進一步支援長上下文推理和多輪互動,其將模型的上下文窗口從8K個詞元擴展到128K個詞元(階段4)。最後,為了減少離散語音詞元表示的音訊輸入的資訊損失,他們引入了一個音訊編碼器對齊階段(階段5),使模型能夠直接處理連續的音訊特徵,從而提高下游語音任務的保真度。在訓練後階段包含兩個組成部分:監督式微調、強化學習。監督微調通過高品質且多樣化的指令資料賦予模型多模態指令遵循、推理和語音互動能力;強化學習通過直接偏好最佳化(DPO)進一步增強模型的行為一致性、連貫性和一致性。在基礎設施方面,LongCat-Flash-Omni的核心設計原則借鑑了LongCat-Flash開發過程中使用的訓練基礎設施,為了保證數值一致性,研究人員強制執行確定性、最小化誤差並保持誤差的可解釋性,從而確保每次訓練運行都具有確定性和可復現性。為了提高效率,他們將大模型、視覺編碼器和音訊編碼器的各個元件解耦,從而可以獨立最佳化它們的性能和記憶體使用情況。實驗結果表明,在多模態環境下,他們的系統能夠保持純文字訓練90%以上的吞吐量。推理與部署時,研究人員提出解耦的多模態推理框架,該框架將特定模態的編碼器/解碼器與層級模型分離,以實現最佳化部署。每個模組都部署在與其計算特性相匹配的專用硬體和加速器上,從而緩解跨模態資源爭用。其還採用非同步流式模型服務管道,每個模組都支援流式輸入的增量推理和自適應批處理策略,從而實現並行調度以降低延遲。04. 結語:未來要探索更豐富的具身智能互動形式大量評估表明,LongCat-Flash-Omni不僅在Omni-Bench和WorldSense等全模態基準測試中取得了最先進的性能,而且在圖像和視訊理解以及音訊理解等關鍵單模態任務中,其性能也與閉源系統持平甚至更優。此外,主觀評估證實了該模型能夠提供自然、低延遲、高品質的互動體驗,凸顯了其作為下一代人機互動介面基礎的巨大潛力。研究人員提到,基於LongCat-Flash-Omni,他們未來的工作將著重於擴展訓練資料的多樣性和規模、整合自適應思維模式、完善流式傳輸和生成能力,並探索更豐富的具身智能和互動智能形式。他們相信,LongCat-Flash-Omni的發佈不僅將加速多模態理解和生成的研究,還將啟發建構以人為本、面向通用人工智慧系統的新應用和新範式。 (智東西)