我每天做8小時家務,給機器人當燃料

在這裡,我們按秒“出賣”身體資料。

“以後都是機器人在工作,咱們又要出去找新工作了。”排隊等待的時候,我的臨時搭檔李晨晨看著前一組的兩人,突然感嘆到。

前一組正在凌亂的桌子前,重複著一個頗有未來感的畫面:

一個人,戴著裝有運動相機的頭盔和手套,身後拖著三根粗細不一的長線,行動遲緩地微微彎腰,單手把一本書拉到桌子邊緣,拎起,放進置物架,然後又慢慢側身,把一包隨意放置的濕紙巾推到置物架旁邊擺正。

長線另一端,她的搭檔坐在電腦前,盯著顯示器上的感測器和相機畫面,挪動滑鼠、切換視角,觀察對應出的3D模型運動軌跡是否和真人一致、相機訊號是否穩定……

一組採集員正在採集桌面整理資料。圖源:AI生成

他們在教機器人如何整理桌面、打掃衛生、鋪床或者折衣服。人做的每一個動作——先拿什麼後拿什麼、用什麼姿勢、抓物品的那個地方、使多大勁……都會被相機和感測器記錄下來,轉換成資料,經過質檢、標註後用於訓練機器人模型。

通俗點來說,我們是資料採集員,也是機器人的老師。

就像人類幼兒要學會走路、拿筷子,需要大人手把手地教,機器人也一樣,需要大量的人類動作資料來“喂”它。只不過,這些資料在網際網路上十分稀缺。機器人要學會疊衣服、擦桌子、開門、整理書籍,必須先有人一遍遍地做給它看。

原本機器人最美好的願景是服務於人,但在它學會服務之前,人先彎下腰,成了它的燃料。

在北京的一間民宿裡,我見到了被裁員的程式設計師、背著房貸的前房產中介、結伴來的大學生......他們戴上頭盔和手套,一遍遍重複疊被子、折毛巾、整理桌面,把自己的身體經驗拆成資料,賣出去,全勤一個月能拿大約6000元。

這短暫地成了他們的一份工作,一份誰也不知道能幹多久的工作。

李晨晨今年36歲,做了很多年IT維運工作,2024年被裁員後創業,虧光了積蓄,還倒欠了幾萬元。她看著前一組那個緩慢整理桌面的人,像看到了某種隱喻——等機器人學會了所有這些,人還能做什麼呢?

一種巨大的無力感席捲這個空間,這裡的人或許都希望那一天不要來得太快。

像機器人一樣地行動

6月的一個下午,我花了半個小時,在招聘網站海投了近十家公司的機器人資料採集崗。

很快,有四家公司聯絡了我,三家確定了第二天的線上面試,其中一家還是估值百億元的機器人公司。但也只有這家招全職,並會通過第三方勞務公司繳納“五險一金”,其餘兩家是“外包”公司,後來我發現它們都為同一家資料採集公司服務。

事實上,繳納“五險一金”的公司佔比極低,這些機器人資料採集崗大多在兼職管道流通。一般是200元一天,工作八小時,晚班因為晝夜顛倒,會比白班每天多50元。工資有周結也有月結,干的時間過短,可能會被扣除一部分工資。

機器人資料採集崗招聘資訊。圖源:螢幕擷圖

成為一名機器人資料採集員不算難。投簡歷、被拉進招聘群、線上面試、線下試崗,整個過程最快24小時內就能完成。我最終參加了兩家公司的線上面試,只被詢問了身高和體重,最終都通過了,並去了無需全職的公司試崗。

這個崗位幾乎不看學歷和經驗,入行門檻最終退回到了身體機能。

有30多個人和我參加了同一場視訊群面。

一位眾包外賣員很熱情,圓胖的臉被曬得黢黑,聲音高亢地做了一段自我介紹。他說自己以前是程式設計師,被裁員後開始送外賣,但還是想找份穩定的工作。他不太確定崗位到底叫什麼,憋了半天說自己是來應聘“抓娃娃”的。面試官很平靜地糾正他,“是機器人資料採集”。

一位應屆畢業生報完身高體重,身型比較嬌小,面試官的言語間表現得有些遲疑,讓她把手掌伸到鏡頭前,看了看說,先來試試吧。

整場面試下來,只有一位應聘者被當場拒絕。理由是體型過於肥胖,無法穿戴資料採集裝置。

對於這個剛剛興起的行業來說,什麼才是最理想的資料採集範式,還沒有形成統一答案。目前主流的方案大致可以分為三類:真人資料、模擬資料和真機遙操資料。

真機遙操資料,是由人遠端操作或通過外骨骼裝置,控制機器人在真實環境中完成任務,機器人身上的感測器同步記錄全過程。這類資料最接近機器人未來實際工作的場景,被認為價值最高,但其成本也最高——相當於同時承擔機器人本體和人工操作兩層成本,目前主要由機器人廠商自建採集體系完成。

模擬資料則是在虛擬環境中生成的資料,不需要真實場地和真人,成本主要來自算力,可以大規模平行訓練。但由於虛擬世界與現實世界之間存在差距,材質、摩擦、光照等細節很難完全復刻,訓練出來的機器人到了現實裡可能會“水土不服”。

真人資料則有兩種情況,一種僅採集真人行為視訊,成本最低,但能夠提供的資訊相對有限。另一種在視訊基礎上加上了動作捕捉、感測器軌跡等,能記錄更多細節,價格適中,是目前最划算的方案。

我們應聘的便是真人資料採集崗。一套真人採集裝置,主要由一個裝有運動相機的騎行頭盔、兩隻內建感測器的數采手套、手部運動相機、多個定位器以及配套軟體組成。加起來約十萬元,招聘方告訴我們,這套裝置目前正在申請專利。

正式工作前,需要經過三天培訓和試崗。

第一天,項目經理和組長挨個“捏手”,檢查每個人的手部條件。數采手套是均碼,手指太長不行,太短不行,太胖不行,太軟也不行。四十多個試崗人員排排坐,把手放在身前待檢。檢查結束後,現場少了四五個人。

李晨晨也在被淘汰的邊緣。她的小拇指偏短,戴上手套後,感測器在指節位置皺成一團,軟體無法精準還原指關節的動作。她仰頭瞪大眼盯著組長,央求說讓她再試試。組長點了點頭。

但手指只是第一關。

第二天,開始實操,人少了一半。我和李晨晨被分到一組,她偵錯軟體,我穿戴裝置。先戴頭盔,確保固定牢靠;再套上一層一次性手套防汗,然後戴上內建了感測器的數采手套,最外層再加一層針織手套,用來隔絕訊號干擾;三根長長的資料線從手套和頭盔延伸出來,被一根鬆緊帶固定在腰間。

接下來,我需要雙手平舉在胸前保持不動,等待軟體校準。

李晨晨坐在電腦前,對著螢幕裡的虛擬手模型不斷調整參數,組長坐在旁邊指導。十分鐘過去,模型手依然沒調到合適的位置。組長有些著急,直接接過滑鼠,點了幾下,“就這樣,換人,下一個。”

李晨晨起身幫我拆裝置。那天天氣不熱,房間裡開著空調,但她額頭上已經冒出一層細汗。“學不會。”她低聲說。

第三天試崗,李晨晨沒有出現,組長重新給我安排了搭檔,一位護理專業應屆生。

這一天工作地點安排在一間兩室一廳一廚一衛的民宿。我和搭檔在主臥,任務是整理床鋪、折疊毛巾;另一組人在客廳採集整理桌面的資料。還有一些同事被安排到桌游館、廚房等場景工作——具體去那裡、做什麼,取決於機器人公司的資料需求。

一位資料採集員在工作。圖源:AI生成

我們被要求像機器人一樣地行動——慢,手指活動幅度小。這是一個和本能對抗的過程。

起初,我像平時做家務那樣,儘可能高效的完成。彎腰、拿起枕頭、放一邊,組長在一旁說:“快了,視訊裡都成虛影了,等下感測器會跟不上。”我有意識地放慢速度,組長又說:“太僵硬了,自然一點,只是動作慢,但要像人一樣。”

於是,我不得不緊繃腰臀部的肌肉,拎起毛巾、展開、鋪平、折疊、壓實,拉平被子、掖好邊角、整理褶皺,每一個動作都儘可能地緩慢、完整、連續。

“不要甩毛巾、抖被子。”組長補了一句。因為小臂處沒有相機和感測器,機器人看不懂、跟不上,這類動作都被禁止。

我們還被要求靈活變換物品擺放的位置和整理物品的動作。有時毛巾在被子上方,有時夾在枕頭縫隙裡,我們有時要用一隻手拎起枕頭的一角,有時又要用兩隻手把枕頭抱起。這是為了豐富資料的類型。

工作前,組長跟我們說,工作地點就在民宿,上廁所還是很方便的。但事實上,穿脫、偵錯裝置往往需要至少十五分鐘,上一次廁所,會浪費兩個人將近半小時的時間,而少采一分鐘,都可能影響最終的績效考核——採集的資料過少不扣錢,但每天採集的有效資料達到5小時、18000秒,才會獎勵50元。

這裡的時間是按秒計算的。一天86400秒,一個班次工作8小時,也就是28800秒。作為新手,我們需要每天採集約9000秒的有效資料,但在戴上裝置、偵錯裝置的1000多秒時,我就感到了疲倦。

為了不讓頭部相機在我的運動過程中晃動,我只能儘可能旋緊頭盔的調節帶,這使頭盔像孫悟空的金箍一樣死死地紮在我的頭頂;防汗用的一次性手套,經過層層包裹,形成了高溫高濕的“小氣候”,採集一輪後,也不過是2000多秒,摘下時,手套和我的手都變得潮濕又皺巴。

傍晚,我已經記不清自己疊了多少次被子、折了多少條毛巾,肩頸因為頭盔的重量變得痠痛,腰也因為長時間弓著身子有些僵硬。在機器人學會像我一樣工作之前,我先變得和它們一樣了。

誰在買賣燃料?

試崗那天,這些正在申請專利的裝置幾乎一直在出問題。一會兒是定位器頻繁斷聯,一會兒是感測器發生形變,無法校準;不同人的手型還會導致對應效果出現偏差。

一位維運人員在幾棟樓之間來回奔波,換著方案不停重啟、偵錯,額頭上的汗一直沒幹過。因為裝置是全新研發的,沒有標準操作流程,只能靠人工調整。他告訴我,半個月前他還在做視訊剪輯,來到這裡後,修裝置的知識也是現學的。

“兩小時了,數采手套還沒連上。”隔壁組的一位組員有些無奈。他舉著雙手站在原地配合偵錯,肩膀酸了就活動兩下,然後繼續保持姿勢等待。那天八小時的工作時間裡,我們有將近一半時間耗在了裝置偵錯上。

所有人都希望裝置盡快恢復正常。這裡只有24套裝置,也是整個空間裡最昂貴的“資產”。為了儘可能高效利用這些裝置,公司安排了白班和夜班,每套裝置對應4名採集員輪換使用。裝置閒著一分鐘,就意味著少一分鐘資料產出。

而在具身智能行業,這樣由真人操作、有視覺和感測器資訊的資料,有價無市。據澎湃科技報導,當前,具身智能資料總體定價區間在200至500元/小時,部分在現實場景中實際操作採集的真機資料高達每小時1000元。理論上,一組機器人資料採集員,一天工作8小時的有效資料產出,最高可以賣到1600至8000元。

但“有效”兩個字就像是在給資料“過篩”。在8小時的班次裡,視訊畫面丟失、動線設計不合理、操作重複、相機拍到人臉,都意味著資料失效,需要在對應的資料檔案上標叉,然後重新開始。

熟練的採集員一天能產出4-5小時的有效資料,新手往往只有2-3小時。這些資料在流入市場之前,還要經過質檢、清洗、標註,每一輪都在損耗,最終能按那個價格賣出去的,遠比想像中少。

即便打了許多折扣,資料依然值錢。但值錢的是資料,不是生產資料的人。

勞務公司告訴我們,這個崗位白班日薪200元,晚班日薪250元。而招聘方又說,他們實際給了勞務公司每個人每天300元,“不便宜”。從人的日薪200元到資料每小時最低200元,中間隔著勞務公司、資料服務商、機器人廠商等,每一層都從中抽走了價值,採集員就站在這條價值鏈的最底層。

這條價值鏈之所以存在,恰恰是因為資料太稀缺了。

一家估值超過百億元的機器人公司HR透露,機器人資料生產大致分為採集、質檢和標註三個環節,眼下行業最緊缺的仍然是最前端的資料採集。

這類資料天然無法從網際網路獲得。過去幾年,大語言模型能夠快速成長,一個重要原因在於網際網路已經積累了海量文字、圖片和視訊,模型只需要不斷閱讀和學習這些公開內容,就能獲得關於網際網路世界的大量知識。

機器人不同。機器人需要學習的是如何抓取杯子、折疊衣服、打開櫃門、搬運物品,這些知識並不存在於現有的網際網路資料庫裡,只存在於人的身體經驗之中。

智元機器人合夥人、具身智能業務負責人姚卯青曾表示,機器人完整的資料,包括各種感測器所帶來的資料,有視訊,還有力觸覺感測器等,它需要以某種方式去採集。無論是在真實環境裡採集,還是在虛擬世界裡採集,都需要先布設機器人、搭建場景,再引入遙操人員來控制機器人採集這類資料。

換句話說,大模型主要是在學習如何像人類一樣地思考和表達,機器人則是在學習如何像人類一樣地行動,對真實的物理世界產生影響。

這也是機器人資料採集爆發的根本原因。截至2026年初,全球高品質真實物理互動資料總量僅約50萬小時,而訓練通用具身智能模型需要千萬小時起步,缺口巨大。

需求迅速催生出一門新的“賣鏟子”生意。

智元機器人、銀河通用、自變數機器人等機器人公司,都加速自建資料體系,建設真機資料採集基地、訓練機器人“小腦”模型,甚至推動資料業務獨立拆分;京東建設資料採集中心,希望兩年內積累1000萬小時真實場景資料。

但嗅到機會的並不全是機器人相關的公司。我試崗的這家公司去年成立,核心團隊此前從事VR裝置相關業務。營運負責人告訴我們,公司已經完成融資,目前最主要的工作是為機器人企業採集和生產訓練資料。

與此同時,不少活躍在具身智能資料賽道的明星企業,如無問智科、弈人科技,最早其實誕生於自動駕駛浪潮之中。隨著具身智能升溫,這些公司開始將原有的資料生產能力遷移到機器人領域,從模擬資料逐漸擴展到真實場景資料採集。6月22日,如祺出行也發佈了具身智能資料平台。

不少機器人資料採集企業誕生於自動駕駛浪潮之中。圖源:AI生成

今年,多家資料服務企業陸續披露融資和訂單情況,有的轉型不到一年,資料採集業務收入便超過億元,有的獲得多輪億元乃至十億級融資,在手訂單達到數億元規模,部分資料採集企業甚至比機器人本體廠商更早實現盈利。

不確定的人進入不確定的行業

試崗結束後,我再也沒見過李晨晨。那些走了的人,雁過無痕。留下來的人,困在這套裝置裡,也困在自己的生活裡。

在機器人資料採集現場,我很少聽到有人討論機器人,大家聊得更多的是房貸、婚育、找工作和工資。

一個前地產中介,31歲,不久前辭了職。大概六七年前,他在河北廊坊買了房,背上房貸。如今他和妻子在北京城區租了一個小單間,房租、房貸成了兩人每月的固定開支。

“先幹著吧。”他說。他知道這不會是一份長期職業,但眼下沒有更好的選擇。過不了多久,他的妻子就要休產假了,在此之前他希望能找份更穩定的工作。

一個25歲的女孩,和丈夫認識三個月就結了婚,之前在父母開的電商公司工作。因為這段婚姻,她從家裡出走,但未能順利解除勞動關係,只能到處找兼職。機器人資料採集是她出走後的第一份工作。

還有兩個結伴而來的大學生,來自北京某大專院校物聯網專業。他們參加過市級競賽,拿過獎項,履歷並不差。培訓時,公司負責人走到他倆面前,半開玩笑地感慨:“還是工作不好找啊。”

另一位剛工作一年的女生比較簡單——天氣太熱,她不想在外面跑面試,於是先來做兼職,等天氣轉涼點再找新工作。偵錯裝置時,她舉著胳膊站了十幾分鐘,第二天手臂酸得發抖。

這些人年齡不同、經歷不同,來到這裡的原因也不同,但他們有一個共同點:都在等待下一份更確定的工作出現。沒人相信自己會一直幹下去。

事實上,這份工作也很難一直幹下去。枯燥本身就會篩掉一大批人,第一天的40多人,到第三天,已經只剩下20個人。很多人不是因為被淘汰,而是受不了。

我也只忍受到了第三天,沒拿到工資。

但與此同時,外面關於這個行業的傳言卻越來越熱鬧。過去一年中,社交媒體上流傳著不少關於資料採集員的帖子。智聯招聘2026年產業人才報告顯示,這個崗位招聘職位數同比暴漲769%。

央廣網和央視財經將它定義為具身智能浪潮下的熱門新職業,預計未來五年全產業鏈相關崗位增量將突破百萬。各地機器人企業、資料服務商持續線上線下大規模招工,職校校企專場、居家兼職招募廣告隨處可見。

“熱門新職業”“百萬崗位缺口”“門檻低、上手快”——這些詞聽起來像是一個風口在向所有人招手。但真正進到這個行業的人很快發現,確實有高薪,比如通過外骨骼裝置或遙操系統直接控制真實機器人的操作員,這需要一定的技術背景,採集員日薪可達千元以上。

但更多的還是最下面那一層——日薪兩百。便如這間民宿裡的人。

成為機器人燃料的採集員們。圖源:AI生圖

在這家公司裡,大部分中基層員工都不是正式員工,而是通過第三方勞務公司招聘。負責培訓我的組長今年21歲,是機電專業應屆畢業生,來到公司不過三個月時間。因為控製成本,公司暫時沒有擴張團隊,他至今仍然按照周結方式領取工資,勞務公司要從他的日薪中抽去兩成。

即使是身處行業中心的人,也很少對未來做出長期承諾。培訓時,營運負責人只能告訴我們,公司未來一年的訂單已經確定,未來兩年發工資沒有問題。

聽到這句話,我們紛紛扭頭,彼此對視,眼神有些意味深長。

訂單在增長,融資在增長,行業規模也在增長,但在這間民宿裡,這些數字和站在床邊彎腰疊毛巾的人沒什麼關係。

具身智能依然是當下最熱門的創業賽道之一,企業相爭融資、上市,資本也在不斷湧入,所有人都在爭搶高品質資料。但另一方面,它也依然處於早期階段,機器人還不能穩定、成規模地投入市場,很難獨立完成一個完整、流暢的家務動作。

因此,整個行業都在拚命收集完整的機器人資料。今天的機器人需要學習如何疊毛巾,於是有人重複折疊幾百上千次;需要學習如何整理桌面,於是有人一遍遍把水杯歸位、書本按大小放整齊,再打亂重來。這些資料最終會變成機器人的能力。

但當機器人真的學會了這些動作之後呢?

類似的變化在大語言模型行業發生過。最初,行業需要大量標註員處理基礎資料,標註員也成為了一個“熱門新職業”——門檻低、需求大、到處招人。人們只需坐在電腦前,給圖片打標籤、給文字分類,用最機械的勞動喂養最前沿的演算法。

但隨著模型能力提升,簡單標註逐漸失去價值,需求開始向法律、醫療、教育、科研等專業領域轉移,真正稀缺的標註員成了高等院校畢業的碩士、深耕行業的專家。

眼下這間民宿裡的人,正在走同一條路。資料採集不會消失,但採集員未必還是今天這批人。苗頭是,行業裡已經開始討論資料標註質量、場景真實性以及資料是否真正能夠提升模型能力。換句話說,機器人學到的越多,人類需要教給它的東西也會變得越難。

下午六點半,我們撤下裝置,給相機和定位器充電,離開民宿。兩個半小時後,夜班的採集員會陸續到崗。那時候,裝置重新啟動,定位器亮起綠燈,新一輪的資料採集開始了。24套裝置,幾乎晝夜不停地運轉。

在民宿之外,關於這個行業的敘事,是另一套話術:這是一個即將解放人類勞動力的兆級產業,機器人將走進千家萬戶,照顧老人、陪伴孩子、打理家務......

我們不知道機器人什麼時候能夠服務於人類,但知道在這之前,會有人重複千萬遍同樣的動作,把自己與世界相處的經驗拆解成資料,把身體裡的常識、習慣和判斷一點點教給機器。僅僅只是把這份工作視作人生中的一個臨時停靠點,但他們做的事情,卻指向一個漫長得多的未來。

至於未來到來的那一天,自己會身處何處,沒有人知道答案。

“以後都是機器人在工作,咱們又要出去找新工作了。”我又想起李晨晨說的這句話,想起她說這句話時皺著的眉頭和牽強上揚的嘴角。她至今沒敢告訴父母自己欠下的債務,和四處找兼職的境況。 (融中財經)