特斯拉、輝達機器人背後的“賣水人”

“具身智能,還處於亂世。”

這是與CyberOrigin(下稱:賽源)創始人殷鵬見面時,他對我說的第一句話。賽源是特斯拉、輝達等公司在人形機器人領域的合作商之一。而其所在的珠三角,是世界機器人供應鏈的核心,那是殷鵬真正的“戰場”——全球任何一家機器人相關的公司,都必須到珠三角尋找硬體供應鏈,如今,還包括資料。在機器人圈,這些為特斯拉、輝達人形機器人提供關鍵訓練資料的公司,往往被視為巨頭背後的“賣水人”。

和此前十餘年“賣水人”多為生產製造環節相關公司不同,AI紀元下,資料類“賣水人”正在異軍突起。一批諸如賽源,開始聚焦於提供機器人與真實物理互動的資料。以殷鵬的公司為例,它的客戶名單中,包括輝達、特斯拉、OpenAI的人形機器人;也包括Google和史丹佛李飛飛的機器人模型訓練實驗室,也是賽源能夠與其他機器人資料公司拉開差距的地方。

但對於這些“賣水人”而言,2025年以來警報聲不時響起。

近期,據媒體報導,特斯拉被曝暫停人形機器人的研發,調整設計。殷鵬在四月份已知道這個消息,暫停的主要原因,仍然在資料問題——特斯拉需要更多機器人資料以訓練模型。這對於賽源這樣的資料提供商而言,是個好消息,真實物理互動資料,而非本體,正在成為這場具身智能軍備競賽中的核心彈藥——“機器人是引擎,資料是石油。沒油,發動機運不了。” 殷鵬說,“我們需要成長為特斯拉最大的資料端供應商。”

當虎嗅於六月在上海見到殷鵬時,他穿了一身運動打扮,黑色迪桑特polo衫和運動鞋,倔強的劉海,時不時在說話間甩到前額,他再利落地把它撇開。見面時,他正經歷一場短期出差,還帶有一絲風塵僕僕,他需要在晚上飛回深圳,也是大量“賣水人”的基地所在。

作為賽源的CEO,殷鵬的另一個身份是香港城市大學助理教授,他曾師從SLAM和規劃界傳奇人物,JiZhang教授,他開創了即時 3D 雷射雷達 SLAM 的先河,並將其商業化。這一技術,是機器人、自動駕駛車輛的“導航大腦”,如果沒有它,掃地機器人、車輛自動駕駛將無法存在。而殷鵬在此後曾深度參與NASA(美國國家航空航天局)、DARPA(美國國防部高級研究計畫局)和輝達的課題,其第一篇國際頂刊文章,成為NASA火星降落的參考方案之一,殷鵬也是NASA火星登陸項目的高級顧問;在DARPA的地下機器人挑戰賽上,殷鵬和團隊開發出了首個超大規模多機協作定位建模系統,這個成果也發了第二篇國際頂刊論文。

圖為殷鵬在實驗室 圖片由殷鵬提供

在與虎嗅的交流中,殷鵬不斷提及馬斯克——特斯拉的創立者,他強調“第一性原理”的方法論,他讀馬斯克的自傳,拆解這位矽谷“鋼鐵人”的創業邏輯、商業故事,他稱馬斯克為“老馬”,“第一性原理非常可怕,他能把一件在旁人看來不可能實現的事情變成可能。”殷鵬說。

2024年,殷鵬選擇創立賽源。在創業之初,殷鵬請教過不少前輩,其中包括香港科技大學教授李澤湘與高秉強,前者建議充分利用大灣區的資源。後者則建議做海外市場,以及思考C端的生意。高秉強不僅是導師,也是殷鵬最早的天使投資人,這位在硬科技領域投資了不少上市企業的前輩告訴他,當下時點,找一個切口去創業,再層層迭代。

面對虎嗅,殷鵬分享了自己對具身智能的看法和創業的想法,從學者轉化為企業CEO,殷鵬很堅決,因為學術已經很難滿足他需要的資源,他需要到業界、到一線去獲得更快更真實的資料反饋。這也是為什麼他沒有選擇做CTO,而直接選擇做CEO的原因。

“如果認準了身位,那就義無反顧。”殷鵬說。

機器人的ChatGPT時刻

虎嗅:很明顯的行業趨勢是,ChatGPT出現之後,出現了Emboied AI的概念,隨即特斯拉、輝達、亞馬遜等大公司開始發佈其各自的通用人形機器人計畫。這個飛躍在過去機器人歷史中極為少見。Transformer架構究竟做了什麼,讓這個行業出現這樣質的飛躍?

殷鵬:Transformer架構最大的提升在於發明了一種可以Scaling Law的模式。過去我們強調強化學習的效果能達到多少,訓練資料集和測試資料集相差不大,因為場景很多,一定無法涵蓋所有場景,那麼模型要不斷重新訓練。但這種基於監督學習的方式,在未知領域發展很慢。Transformer架構可以輸入足夠多的資料,在足夠多的資料下再進行微調和提升。

這個策略架構最早是Google提出來,但真正用起來的是特斯拉的那群人,將Transformer架構運用在自動駕駛上。因為研究人員發現,Transformer的核心是當資料量到一定數量級時,會出現湧現。這讓具身智能在空間理解方面有了很大進步。

首先,它實現了空間理解能力的質變:傳統強化學習在有限場景中只能進行局部探索,而借助Transformer的自注意力機制,機器人能夠對整個三維空間進行全域感知,並通過同時處理視覺、語言與動作等多模態資訊,形成統一的空間認知模型;其次,它在泛化能力上取得了突破,傳統方法在訓練集和測試集場景相似時表現尚可,但一旦場景變化就需重新訓練,而Transformer模型通過大規模資料訓練後,能夠在未見過的場景中自主推理與適應;第三,這一架構推動了從規則驅動到資料驅動的範式轉變,徹底告別了基於IF-ELSE的人工規則系統,實現了從感知到動作的端到端學習,極大地減少了中間環節的資訊損失。

此外,Transformer擅長時序建模,其注意力機制讓機器人不僅理解動作間的先後關係,還能進行複雜動作序列的長期規劃;更重要的是,它支援多工學習:在世界模型中,視覺、語言與操作被整合於同一模型;在分層架構中,上層負責高層推理與決策,下層則承擔精確執行,兩者兼顧;在資料效率方面,儘管依然需要大量資料,但與傳統方法相比,Transformer能用更少的任務特定示教資料完成複雜任務,並將學到的知識遷移到相關任務;同時,其線上學習能力使機器人在執行過程中不斷學習與調整,並對光照、物體位置等環境變化具有更高的魯棒性;最後,它實現了語言理解與執行的統一,不僅能理解複雜的自然語言指令,還能結合視覺資訊進行多模態推理並轉化為具體動作。

這種從“專用AI”向“通用AI”的轉變,讓機器人從只能執行預設任務的工具,進化為具備環境理解、技能學習與新場景適應能力的智能體,這一技術進展正是“通用機器人成為可能”的根本驅動力,也是當前人形機器人熱潮的核心所在。

虎嗅:你剛才說最早將Transformer發揚光大的是特斯拉的無人車,讓大家看到一個重要的實現路徑,可以展開說說嗎?

殷鵬:特斯拉無人車將Transformer"發揚光大"的關鍵在於他們率先將Transformer架構應用於自動駕駛的視覺感知系統,實現了從多個攝影機輸入到駕駛決策輸出的端到端學習。

這打破了傳統自動駕駛依賴雷射雷達和複雜感測器融合的技術路線,證明了純視覺方案的可行性。特斯拉擁有全球最大的自動駕駛資料收集網路,每天有數百萬輛車在路上收集資料,他們率先驗證了Transformer架構在大規模真實世界資料下的"湧現"效應,當資料量達到一定規模時,模型性能會出現質的飛躍。

特斯拉的Transformer模型能夠同時處理8個攝影機的即時畫面、車輛運動軌跡和歷史狀態、以及3D環境理解和路徑規劃,這種統一的多模態處理能力為後來的具身智能提供了重要借鑑。

更重要的是,特斯拉證明了Transformer不僅能做感知理解環境,還能做決策規劃路徑和控制車輛,實現了完整的感知-決策-執行閉環,這為機器人的"大腦"設計提供了重要範式。通過車輛在真實道路上的行駛資料,特斯拉實現了大規模的自監督學習,讓模型能夠從未標註的資料中學習駕駛技能,這種方法後來被廣泛應用於機器人的動作學習中。

另外,還將其工程化,實現了在車載硬體上的即時推理,這為具身智能的實際部署提供了重要經驗。

所以特斯拉的成功讓整個AI界看到了一條重要路徑:通過大規模真實世界資料訓練Transformer模型,可以實現從感知到行動的端到端智能。這直接啟發了Google的機器人項目開始大規模收集機器人運算元據,OpenAI將類似架構應用於機器人控制,各大科技公司開始重視具身智能的資料收集。

所以,特斯拉實際上開創了"用資料驅動的AI來解決物理世界互動問題"的先河,這正是當前具身智能熱潮的技術根源。他們證明了Transformer不僅能處理語言,更能處理複雜的時空序列資料,為機器人的"ChatGPT時刻"奠定了基礎。

虎嗅:目前全球機器人模型主要來自幾家實驗室,包括Google和史丹佛李飛飛實驗室,這些不同的模型技術路線有什麼不同以及優劣之分?

殷鵬:目前,模型體系大致分為兩類,很難簡單評判優劣。第一類是“世界模型”,將視覺、語言與操作等多種能力整合進一個統一模型中進行訓練。例如,李飛飛實驗室的 Open VRA1.0 和Google的 PaLM。這類模型的優點是收斂速度快,適用於在廚房、浴室、臥室等特定場景中採集資料並最佳化機器人性能。但其缺陷在於泛化能力弱。一旦超出訓練場景(如機器人從一個房間移動到另一個),就需重新採集數十小時的資料進行訓練,否則性能會大幅下降。例如 SLAM(同步定位與地圖建構)對光照和場景元素極為敏感,細微變化就可能導致如抓取等操作失敗。因此,該類模型更適合簡單場景的演示,難以應對如工廠等複雜、動態環境。

第二類是分層混合架構模型,代表如 Figure.AI。該模型結構類似於人腦與小腦的分工:大腦部分負責文字和視覺推理,解決“去那裡”“拿什麼”的邏輯問題,如根據臥室或廚房的圖像定位目標與制定抓取策略;小腦部分控制機器人本體的具體動作,如行走、開冰箱門、抓取雞蛋等,需靠大量資料訓練實現高精度控制,例如調整機械手的力度和手指分佈。

這類模型的優勢在於分工明確:上層負責空間邏輯與決策,下層執行精細動作,尤其在完成“最後一釐米”的操作時,能精準控制執行細節。

以特斯拉等公司的機械手為例,通常具備19至20個自由度,因搜尋空間龐大,必須通過大量資料學習來最佳化動作路徑。這種架構更適用於環境複雜、頻繁變化、泛化要求高,且對操作精度極高的場景,如精細抓取。Figure 和特斯拉走的是這條路線。

虎嗅:剛剛說到美國,中國這兩年也跑出了不錯的人形機器人公司,比如宇樹,中國的機器人技術水平和美國有差異嗎?有一個觀察,如果從兩國具身智能公司所展示的Demo側重點來看,似乎中國機器人公司習慣於先做硬體、再做模型,國外似乎是反過來。

殷鵬:我認為這與兩國國情有關。中國大陸有很強的智能製造供應鏈,可以讓我們將所有元器件以很低成本進行快速落地和迭代,在中國做靈巧手,可能只需要在1-2個月的時間,用有限的資源就做成,這在美國是根本不可能的事。但美國更擅長的是大腦模型的開發,其實雙方可以形成良好的互補。美國擅長從0到1的突破,中國很擅長從1到100。

機器人資料可能是具身智能中最快完成商業閉環的

虎嗅:為何選擇在這樣一個時間點創立一家創業公司?雖然大模型湧現許多機會,但具身智能的商業化還有很長的路要走,遑論人形機器人的大規模商業化,而作為這些機器人廠商的上游-資料提供商,商業鏈條更長。

殷鵬:首先是時間點。當下是一個關鍵節點,全球都能看到大模型在空間理解、推理能力上的突破,這讓通用機器人成為可能。從硬體層面看,也出現了實際落地的跡象,這與上一波主要聚焦特種機器人的機器人浪潮不同。

未來的發展周期到底是10年還是20年,難以下定論。但對我們這群做機器人的人來說,更看重的是它最終能否實現。就像老馬說的,“能像人一樣上工位幹活”,這是我們真正想看到的。這也是我選擇在這個時間點創業的核心原因。

如果一味等待,就無法真正感受到時代脈搏。我也希望能親自下場,挖掘行業中的核心難題。很多問題只有真正進入行業、面對真實場景,才能體會到,線下純思考往往顯得太簡單。

你剛才提到周期可能很長,確實如此,資料鏈路也很長,但對於機器人本體來說,資料反而可能是最快能形成商業閉環的。

沒有大量真實資料,本體和大腦都難以進化。就像訓練大語言模型需要龐大的語料,無人車需要日采數以百萬計的車輛資料,機器人也是一樣。如果不解決資料問題,就會長期被卡住。

模型只是引擎,資料才是石油。只有源源不斷的資料供給,整個“車”才能真正跑起來。具身智能也是如此,若無法突破資料瓶頸,整個行業就會停滯。而建構資料閉環雖然最具挑戰,卻也是最直接、最快和風險最高的一環。

虎嗅:往往這類商業鏈條長,對技術要求高,並且是“石油”屬性的事情,往往是大公司在做,例如輝達、特斯拉、Google,或者就是例如史丹佛實驗室這樣的學術機構。初創公司來做這件事,一面是錢無法和大公司抗衡,一面是有商業化壓力,如何競爭?

殷鵬:全世界所有機器人公司、做大腦的公司、做本體的公司,都是我們的友商。我們會給他們提供資料。目前我們已經給很多頭部大型AI公司提供大批次機器人資料。起碼未來5到10年,我們和這些頭部機器人公司都是友好關係。

我知道這個賽道未來會很卷,人也會非常多,很多公司也會轉去做資料,不過我認為這個並不影響事情本身。因為對於最深層的資料,很難通過一家或兩家公司做成。

虎嗅:我理解,相當於是做一個具身智能界的Scale AI嗎?

殷鵬:是的,都是資料供應商。但我們和ScaleAI不同的點是,Scale AI更加注重資料標註,大廠會直接給Scale AI提供資料。但我們在做資料標註之外,還需要做資料採集和驗證的工作。

首先我們有訓練模型的能力,會和大量大型客戶建立大批次採集資料基地,做幾百萬小時的海量資料採集。拿到這些資料之後,我們還要做標註、清洗、模型初期驗證,再把資料轉給大廠,做更精細化的處理和訓練。

虎嗅:我們現在主要有兩部分資料,一部分是在真實場景中收集的資料,另一部分是模擬3D資料?

殷鵬:我們主要聚焦真實場景的資料。

一方面,我們有一個開源社區,裝置供應商都可以參與資料採集,這是一個共享的平台。另一方面,我們在拿到資料後會先在內部進行訓練和驗證,確保可運行後才發佈。目前我們收集的資料主要是上百萬小時的真實資料,沒有涉及合成或模擬資料。

這在業內其實算是比較“反常識”的選擇。現在很多公司在做合成或模擬資料,我們當然認可不同類型資料各有價值,但從我們的角度來看,真實、豐富的資料最能提升模型訓練效果。

雖然我們也有能力基於真實資料做大規模合成,比如一條生成十條,但這個技術門檻並不高,大廠也完全可以做。所以我們更專注在他們不方便做、或者不願意做的事——也就是收集真實世界的資料。

至於模擬資料,雖然它在強化學習裡的確是個不錯的驗證平台,但效果很難直接遷移到現實中。比如我們用幾十張顯示卡訓練一個抓取動作,在模擬裡成功率可能有95%,但一旦部署到真實機器人上就可能掉到60%;像繫鞋帶這種更複雜的動作,成功率甚至可能降到45%。也就是說,模擬資料很難在真實環境中泛化。

因此我們最終決定專注於真實資料的建構,既來自人,也來自機器人自主採集。

虎嗅:真實場景資料的採集,很考驗效率和採集效果,怎麼保證質量和數量?

殷鵬:例如工廠的一條包裝產線,有很多操作細節,如何抓取、如何吸收、如何剖析這些動作,可以創造非常豐富和高濃度的機器人資料。我們會讓操作員穿戴裝置,在真實生產流程中採集資料。一小時內,就能採集出約500到1000條高密度的資料,每條資料都包含具體動作、文字描述、圖像抓取等資訊。

相較之下,真人採集效果比遙控機器人要好很多。遙操作是用機器人實機在現場完成任務,但以現在機器人的能力來看,那怕是簡單操作,也可能執行得很複雜,效率低下,一小時只能採集幾十條真正有價值的資料。

虎嗅:從資料收集的角度,需要找一個合作生態非常關鍵?你從什麼時候開始做這件事,做了多久?

殷鵬:去年八月份開始,持續半年多,大概有幾十家合作公司,包括工廠、小作坊等。我們現在大概有十萬小時的資料,後面會把量級擴大到10倍,達到100萬小時量級。我認為這個量級,才會讓機器人達到比較客觀的效果。

只有成為一號位,才能獲取業界最快最真實的反饋

虎嗅:一般科學家創業,成功率往往不高,或者說很多行業的共識是科學家創業,其更適合做CTO,而不是CEO。在創業之初是否有面對這樣的質疑?在創業過程中對於自己的定位,你是怎麼看的?

殷鵬:這種質疑對我來說經常出現。我想創業的真實原因是,具身智能這件事,學術的資源已經不能滿足我,只有真正到業界,才能拿到足夠多的企業資源,但如果我只是個二號位或者三號位,我沒辦法得到最快最真實的反饋。

虎嗅:決定下場創業時,有跟行業前輩聊過嗎?

殷鵬:和很多前輩聊過,比如李澤湘老師(虎嗅註:香港科技大學教授,固高科技董事長,松山湖國際機器人產業基地發起人)和高秉強老師(虎嗅註:香港科技大學榮休教授、工學院原院長,全球知名微電子專家,投資了思特威、博通整合、瀾起科技等公司)。

虎嗅:他們有沒有給一些不錯的建議?

殷鵬:李老師的想法是,機器人的生意,還是非常吃硬體的,需要充分利用好大灣區的資源。高秉強老師的建議是一旦這個商業模式跑通,一定要做海外市場。因為海外在具身智能上走得更早,會有更深的Know-how。另外,具身智能這件事還是偏早期,B端的應用最終還是會落到C端,因此也需要思考這個過程中,B端和C端的邊界,除了給各大廠來用,還需要考慮如何讓普通民眾也用起來。

虎嗅:第一筆投資是怎麼拿到的?

殷鵬:第一筆投資其實是高秉強老師投的,他是我們的天使投資人,高老師很瞭解我,當時我們常一起交流,高老師建議在當下時間點,找一個非常好的切入口可以去創業,再層層迭代。

虎嗅:很多科學家在與工業界交流溝通的時候往往存在一些語言體系的不同和由此帶來的挑戰,科學往往希望在單點突破,但工業界對技術的領先性反而沒那麼重視,更重視是否解決問題,是否穩定,你如何適應這樣的身份轉變,適應不同的溝通方式?

殷鵬:確實如此。學者轉換到CEO,之前關注一個點,可以挖得很深,可以調動這個點周圍相關的資源,其他所有的鏈路都不用考慮。但變成公司就不一樣了,更多要考慮的是公司的管理、文化、這個業務本身的商業模式是否閉環,是不是賺錢。這裡會出現很多不同的難點,需要各個擊破。另外,作為一家創業公司,任何一個新的模式都有人質疑。所以就需要用最小的成本,完成產品的可行性驗證,這些都是創業需要回答的事情。

虎嗅:這兩個路徑是相反的,一個往縱向裡扎,一個做橫向。

殷鵬:是的,一個點的突破不代表整個系統就被解決了。創業需要對整條鏈路的每個環節都足夠瞭解,即使自己不懂,也要找到懂的人一起做。而且要有對時間周期的把控,畢竟創業公司的資源不是無限的,沒人能等你10年、20年才考慮商業化。

同時,還需要一個優秀、細緻的團隊來承擔核心任務。這其實至關重要。矽谷有個說法叫“創始人模式”——公司價值觀往往反映的是創始人對行業的理解。如果我們理解足夠深,就能抓住行業的核心問題,不會過於激進也不會太保守,戰略方向會更清晰,團隊也會知道自己的定位。

殷鵬實驗室團隊,右一為殷鵬

只有具備這樣創始人導向的文化,才能吸引真正志同道合的人。那怕像老馬這樣的創業者,在他的每個公司也都有一群忠實的追隨者。

虎嗅:在這個過程當中比較大的挑戰,或者壓力挺大的時候是什麼?

殷鵬:因為首先是作為老師要去轉型,非常痛苦。要從一個釘子變成一個類似於像梳子這樣的模組。

在正式創業之前,我們往往專注於一個單點問題的深入突破,個人只需思考得足夠深入即可。但作為創始人,就要從“釘子”思維轉變為“梳子”思維,不僅要深挖某一點,還要兼顧全域多個維度。

創始人關注的面非常廣,但面廣不等於“大而空”,否則團隊會不知道具體該做什麼。在此基礎上,既要全面佈局,也要在每個關鍵點深入推進,明確每個人的任務、節奏和具體內容。這對時間管理和綜合能力提出了極高要求,也是每一位創業者都必須經歷的一關。

第二點是商業模式的不確定性。在發展的某個階段,一種模式可能完成閉環,實現真正的突破,但我們無法精準預測這一刻何時到來。以資料行業為例,外界對其構成存在爭議——有人強調課程資料,有人依賴模擬資料,也有人重視真實資料。我們相對開放,認為多種模式都有機會成功,但難以完全把控這種趨勢在長期周期內的演進規律,因此要依靠直覺判斷。

虎嗅:直覺主要來自那裡?

殷鵬:這種直覺,來源於第一性原理的分析、快速獲取行業和使用者的反饋。我們站在前線,能第一時間獲得大廠在性能最佳化等方面的經驗和資訊,這使得“即時響應、快速溝通和反饋”變得極其關鍵。因為一旦資訊誤判,就可能導致決策失誤,進而影響整體戰略。

所以,在創新過程中,創業者常會經歷兩個挑戰:一是從個人高深度突破轉向全面統籌,二是在不確定中尋找方向,並始終保持對資訊的敏銳感知和快速反應。這也是“黎明前的黑暗”階段,雖然痛苦,但唯有衝到一線,深入思考和建設,才有可能迎來真正的突破。

虎嗅:在深入業界之後,你發現了那些是過去沒有意識到的行業痛點或者問題?

殷鵬:比如我們之前做遙操,操縱這個領域我們做了兩年,我們會做例如抓取蘋果、杯子,這樣簡單的事情,也會做擰螺絲這樣很難的研究。但真的和工業界交流時發現,這些事往往無法落地。比如說他們不需要訓練一個多Fancy的模型,只需要百分百做成一件事,一個可以落地的策略解決方案。

虎嗅:其實創業公司的初創團隊是很重要的,很多時候如果找的都是能力很強的人,反而不能成功。搭團隊的時候你看中的是什麼?花了多長時間搭團隊?

殷鵬:找人對創業公司而言至關重要,我們大概花了半年時間。我還是更借鑑黃仁勳的機制,一開始兩三個人一定要有情感基礎和長期合作夥伴的關係,對彼此有長期信任感,能夠共同承擔風險。比如我們早期和美國大型公司談訂單,拿下第一個客戶,這種事情形成的革命友誼在創業中尤為難得。我們並不介意這個人是否一定是名校,更在乎的是在進入公司後是否能夠快速適應公司文化和氛圍,把自己的能力進行快速提升。所以我更看重的是加速度,如果加速度很強,說明他有很強的內驅力,能夠在一個公司找到自己很好的身位,把能力做極大的發揮。

虎嗅:話說回來,在“畫餅”這件事上,您如何讓大家願意相信這個願景並堅定往這個方向努力?

殷鵬:當年老馬做 SpaceX 時,業界普遍認為火箭回收不可能。但他憑藉個人魅力,做了初步驗證,拿到融資,從 NASA 招來一批相信他的團隊,最終把這件事做成了。

我也是從第一性原理出發,思考什麼樣的資料真正能起量,拆解整個過程,預判可能遇到的問題,與團隊逐步攻堅,一旦突破,可以達到怎樣的規模和影響力。

現在看 Scale AI 的市值就能明白,一家“賣水”的公司也能做到行業頭部。這個願景是大家可以一起實現的。我們要做的是搞定大客戶,與他們建立深度繫結,讓外界更願意相信這個故事。

具身智能尚處亂世,認可了就義無反顧去做

虎嗅:你其實是一個習慣於將長目標拆分成一個個短目標的人?

殷鵬:是的。我覺得任何複雜的事情都耐不住細化,短期可以是一個季度為計或者半年可實現的目標,層層往上迭代,總會實現。黃仁勳也是這個策略,他最早就All in算力,只是在當時的時間點沒有人提。所以他開始做遊戲,然後挖礦,之後遇到AI。

虎嗅:你一直在提到“第一性原理”,馬斯克是把“第一性原理”發揚光大的人。什麼時候開始意識到“第一性原理”這件事並認可它?

殷鵬:我是去美國之後第一次真正瞭解Elon Musk,他背後的創業邏輯、故事路線,瞭解特斯拉、SpaceX。我在美國的那幾年,正好見證了特斯拉如何衝出低谷,再往上爬升的過程。見證馬斯克如何一層層把大家對他的質疑劃破,去兌現。包括他承諾了將近十年的Robotaxi。所以我研究了他的商業歷史,我發現第一性原理真的非常可怕,能把一件在旁人看來不可能實現的事情變成可能。

虎嗅:現在在看什麼書?

殷鵬:最近的新書就是馬斯克的自傳。

虎嗅:看起來你很喜歡馬斯克。

殷鵬:對,可以說我的整個的商業邏輯,商業模式,很多都是來自老馬的啟發。他如何在早期就思考這件事,如何設計、如何在某個時間點頂住壓力,做別人看起來不可能的事情。

虎嗅:現在還會堅持冥想嗎?每天會花多長時間?

殷鵬:我現在每天早上五點起床,會花半小時冥想然後開始每天的日程工作。因為事情會越來越多,如果沒有一個合理的放空機會,人會在一些雜事情上迷失。如果每天沒辦法得到自己內心深處的反饋,在路徑選擇上還是會出現一些問題。

虎嗅:創業至今,有沒有發生一些反常識的事?

殷鵬:我覺得是有的。泡泡瑪特的王寧曾總結過一個經驗:創業時我們常以為A很重要,離了它不行,但實際做下去才發現,真正關鍵的是B,而B在最初甚至看不出來有多重要。到面對客戶時,又可能是C才對,因為客戶需求會不斷變化。最終是通過B的調整,才演化出C的形態,不斷最佳化這個過程。

一開始設想的路徑,在不斷試錯和收斂中,可能會自然找到最優解,但這個最優解很難一開始就預料到。正如那句話:“偉大的事情無法被計畫。”

虎嗅:對於你和公司而言,未來的挑戰會在那裡?

殷鵬:現在可見的是,進入具身智能行業的“使用者”越來越多,而不是專注做資料的公司。我們去年剛創業,還需要向投資人解釋機器人資料的重要性,但如今這幾乎已成共識。

這當然是好事,但也是一把雙刃劍。大家認同資料的價值,意味著越來越多的公司開始湧入這個賽道,不論大廠還是中小團隊,生態變得越來越“卷”,也開始出現不少重複造輪子的現象。

整個行業仍處於“亂世”階段,關鍵在於如何找到自己的獨特位置。對我們來說,資料是最核心、也是最擅長的部分。既然如此,就沒有猶豫的理由,只能義無反顧地往前走。 (虎嗅APP)