《晚點LatePost》獨家獲悉,字節機器人團隊已有約50 人,計劃年底擴充到上百人,並生產一些服務字節自己的電商履約需求,能在倉庫里分揀、打包貨物的機器人。
字節機器人團隊目前隸屬於字節AI Lab,其負責人是AI Lab 總監李航。李航曾擔任華為諾亞方舟實驗室主任和首席科學家,2017 年加入字節,現在向字節副總裁、算法技術負責人楊震原匯報。
字節跳動的機器人探索始於2020 年,當時字節跳動創始人張一鳴對機器人表現出興趣,此後會不定期參與機器人項目討論。
約一個月前,張一鳴與字節跳動CEO 梁汝波、算法技術負責人楊震原、字節跳動產品和戰略副總裁朱駿,和曾任字節戰投負責人,現任集團戰略負責人的趙鵬遠一同參與了和AI Lab 機器人團隊的討論。
與以往不同,這次會議的目的是探討字節機器人的產業化落地方向與計劃。此前,字節對機器人的投入以技術嘗試為主。到2021 年底,團隊只有十餘人,2022 年之後開始逐漸增加投入。
這次討論中,張一鳴鼓勵團隊不妨把目標定得大一點。
會上有機器人團隊成員提出:機器人行業的商業化門檻是1000 台,可以此為產業化目標的參考。張一鳴、朱駿等一些參會管理層的反饋是“1000 台有點少”:“為什麼特斯拉要搞100 億台,我們只搞1000 台?”
楊震原在這次討論中提到,做機器人無非三種可能性:一是追求在技術山頂上插桿旗,就像波士頓動力那樣做出一個技術領先的原型;二是用現有的相對成形的方案服務字節的內部需求;三則是用相對成熟的方案對外找客戶,把規模做大。
總結這一輪討論中字節管理層的想法,他們認為現在字節做機器人,應該:
近期,字節機器人團隊再次討論了業務方向,目標更明確了,分為兩大部分:
一是生產一些機器人,優先服務字節的電商履約需求;二是關注前沿技術,探索把AI 大模型能力用到機器人上。
電商履約是指在電商交易完成後,平台把貨物送到消費者手中的過程,它涉及倉儲裡的分揀、組貨和打包,以及物流環節。
字節現在已建立了一些自營倉庫,主要服務字節電商中的抖音超市,抖音超市佔字節電商業務的比例還很小。字節想用機器人代替人類完成揀貨、搬運和打包等過程。中國的人力成本現在不算昂貴,但使用機器人還有其它好處:它更能應對大促、爆品銷量大增帶來的短時間倉儲工作量的大增。
由此推測,字節要做的機器人,可能是具備移動能力的、能在電商倉里送貨的分揀機器人,以及帶有視覺感知能力、能自己打包貨物的機械臂。行業裡,前者的對標產品有亞馬遜的Kiva,國內公司有極智嘉、快倉等;後者的對標公司有Mujin(日本)、梅卡曼德、XYZ 等。
它也有可能是一種新的產品和方案。據了解,字節目前還沒有框定機器人的具體形態,形態最終取決於字節電商履約的需求。
字節目前並未確定今年製造機器人的具體數量目標。
對機器人的重視和投入增加,可能來自張一鳴和字節對AI 新發展的思考。
《晚點LatePost》曾報導,張一鳴近期時常會和一些字節人士分享AI 論文學習心得和對ChatGPT 的思考。從大模型開始,字節加大了對人工智能的研發投入,今年新向英偉達訂購了超過10 億美元GPU。GPU 是AI 訓練必不可少的算力基礎設施。
機器人現在也被認為是AI 大模型的重要方向,二者相互促進:大模型能為機器人帶來“常識”;與現實物理世界交互的機器人,則能為AI 發展提供新類型的數據。
在這之前,字節對機器人的探索相對克制:2021 年開始,字節AI Lab 旗下的機器人團隊就曾嘗試過做樓宇服務機器人,它可以在辦公樓內送餐、送快遞包裹;同時該團隊也在字節之外尋找一些可能服務字節電商自營倉儲物流的機器人,但大部分方案都不太成熟,“ROI 算不過來”。
從字節機器人團隊的組織架構也可看到,它過去並不以業務為導向。2016 年成立的字節AI Lab 目前分為兩個大組:NLP(自然語言處理)與Research,前者更多為字節的業務提供技術支持,而機器人屬於的Research 組,並不直接支持業務。
2019 年以來,字節也陸續投資了一些機器人公司。如掃地機器人公司雲鯨智能,前發那科副總經理沈崗創立的盈合機器人,服務倉儲物流的迦智科技、炬星科技和未來機器人等多家公司,涵蓋家庭清潔、配送、物流、工業等多個領域。
這些機器人公司大多成立於2017 年前後,共性是研發針對特定場景、解決特定問題的機器人,它們的產品因而形態各異。這是因為在此前一段時間的技術限制下,機器人無法做到真正通用,比如同一個機器人既能在工廠搬零件,又能送外賣,甚至幫你洗水果、切菜。
特斯拉在2021 年宣布Optimus 擎天柱人形機器人計劃後,行業風向開始改變。
Optimus 的目標是讓人形機器人替代人類完成一些危險、重複和無聊的工作。在特斯拉的演示中,Optimus 已能澆花、收拾桌子和搬運物品。今年特斯拉的股東大會上,馬斯克說未來人形機器人的需求是百億台,可能還不止。
特斯拉Optimus,與目前大部分採用輪式移動的機器人不同,Optimus 採用了雙足設計,看上去更像人。
在馬斯克的大膽計劃後,大模型技術進展又為行業添了一把火。一些人開始相信通用機器人可能比預期中更快到來。
今年5 月的ITF World 2023 半導體大會上,英偉達創始人、CEO 黃仁勳在演講中提到,人工智能的下一個浪潮將是具身智能(embodied AI),即能理解、推理、並與物理世界互動的智能係統。
海內外的科技公司也都在嘗試把參數規模更大的AI 大模型與機器人結合,打造更通用的機器人。
OpenAI 在今年3 月投資了一家挪威人形機器人公司1X Technologies,這家公司正在研發人形機器人。
1X Technologies 已開發出了輪式雙臂機器人EVE(左),它的手部使用了雙指夾具(中),它們正在研發雙足機器人NEO(右),從概念圖看,手部會採用靈巧手。
今年6 月,Google 旗下DeepMind 發布了RoboCat,把大模型的能力應用到了機器人上,DeepMind 科學家Alex Lee 在接受TechCrunch 採訪時說:“我們證明了一個單一大模型可在多個機器人實體上解決多樣化任務,並且可以快速適應新任務和機器人實體。”
今年以來,騰訊RoboticsX 機器人實驗室也把AI 模型應用到了機器狗上;在阿里巴巴的通義千問大模型的支持下,用戶可在釘釘對話框直接以自然語言輸入命令,遠程指揮機器人。4 月,小米成立北京小米機器人技術有限公司;6 月,華為成立“極目機器”,佈局機器人與智能製造。
新一輪熱潮中起步的機器人項目和公司能堅持多久,還有待驗證。建立一個機器人團隊並穩步推進研發工作,需要巨大的投入,更大挑戰是訓練機器人的數據比訓練一般軟件AI 系統的數據要稀缺得多。
OpenAI 首席科學家伊利亞·蘇茨克維(Ilya Sutskever)今年4 月接受采訪時,被問到OpenAI 放棄機器人是正確的決定嗎?他說“是的,我們那時真沒辦法繼續研發機器人了”,如果要蒐集優化機器人所需的數據,需要有一個龐大團隊來製造並維護機器人:“製造100 台機器人已是巨大投入,但即使如此,你也不會獲得很多數據。”
一名機器人從業者告訴《晚點LatePost》,機器人的數據採集和自動駕駛類似,最直接的方式是用真實的機器人做各種測試去蒐集數據,成本很高;另一個重要補充是以仿真技術,建設模擬的環境和各種情景(corner case)以獲得數據。目前運動控制方面沒有太多可用的高質量公開數據。這背後都對應著技術與資金的資源。
字節過去在硬件上的嘗試,並不如它的互聯網應用那樣成功,大力檯燈和VR 頭顯PICO 是先例。大力檯燈已不再發布新品,一度1000 人的團隊至少有一半離開;PICO 今年一季度也經歷裁員,並下調2023 年銷量預期至50 萬台,比2022 年的實際銷量縮水50%。Meta 的Quest2 2022 年銷量則超過700 萬台。
字節不缺資源,它過去擅長大力出奇蹟:定下目標後,調動人力、資金等全部可用力量在短時間全力衝擊。但硬件行業和前沿科技有另外的邏輯,它考驗耐心、韌性與認知,需要更長期的等待與堅持。(晚點LatePost)