極簡觀點版來源:AI工業(採用 AI 工具整理)1. 範式拐點:神經網路 + 資料飛輪 → “斷層式提升”神經網路讓人形機器人能力出現斷層式提升,一年時間就可能讓業務面貌煥然一新。隨著持續採集與訓練,資料成為強進入壁壘與核心資產;一台機器人學會的任務可迅速同步給整支“艦隊”。決定“像人、動起來像人”的不再是幾十萬行硬編碼,而是從自組織神經網路**中湧現的行為模式。2. 軟體與控制:刪 109,000 行 C++,全身切到端到端網路團隊刪除剩餘 109,000 行 C++,將全身控制切換為端到端神經網路。到 Helix 2,整體“全身控製器”取代為強化學習訓練的控制策略(System 0 / S0),控制層幾乎不依賴手寫程式碼。系統已能完成“房間級”完整任務序列,下一步擴展到“整套房子級”自主操作。3. 系統設計原則:從網路需求反推“本體該長什麼樣”Figure 採取自上而下:從神經網路/控制架構需求出發,反推機器人本體形態。買過多款現成人形平台試驗後發現常見問題:感測器不足、算力不夠、散熱不佳,手和頭的形態也未圍繞端到端棧設計,導致難以跑起真正閉環 AI。對“炫技視訊”(空翻、武術等)不屑:多為預編好的開環動作。現實是:幾乎沒有人形機器人能在視訊裡連續不剪輯、完全由神經網路控制超過一分鐘。而人形任務比機械臂難得多:全身都在動(骨盆、軀幹、頭、雙臂共同參與)。4. “常識/物理直覺”門檻:狀態空間爆炸讓人形機器人具備常識與物理直覺,難度遠高於訓練文字大模型。全身 40+ 自由度、每個電機理論上可 360° 旋轉,狀態空間接近 360^{40},規模極其誇張。5. 世界模型層 × 全身神經控制層:OpenAI 合作經驗與目標曾與 OpenAI 合作,用語言對機器人棧做條件化控制,把 LLM 視作一種“世界模型”,但最終未按最初設想落地。目標是把 LLM/VLM 世界模型層與 Helix 這類全身神經控制層真正打通,讓機器人在真實世界執行複雜任務,而非停留在演示級。6. 行業格局判斷:最終玩家遠少於 10 家,主要對手是“中國”判斷行業將高度集中:全球真正頭部玩家將遠少於 10 家。中國約有 150+ 機器人公司,甚至被稱“泡沫”;美國“嚴肅玩家”十來家,其中只有兩三家非常認真。從 Figure 視角,主要競爭對手整體上就是“中國這個集合”。過去 12 個月幾乎與全球每家頭部科技公司都聊過,也認為一線巨頭最終都會被迫入局。7. 路線選擇:Neural nets all the way down,反對“遙操作偽自動”從底層就信仰神經網路,“neural nets all the way down”,目標是真正通用用途,而非依賴人類遙操作的半自動系統。真正厲害的不在於造多少台,而是誰能用很少的機器人把通用機器人問題啃下來。8. 製造與交付:Baku 擴產,節拍 30 分鐘/台;瓶頸在產能Baku 工廠擴產 Figure 3,短期目標節拍做到平均 30 分鐘/台。現有簽約/准簽約客戶足以消化未來兩三年產能,瓶頸是能造多少而非有沒有需求。同時強調被迫走向垂直一體化:供應鏈尚不成熟,難以按要求交付執行器、電機、感測器、算力與熱管理的完整方案。並提到:計畫在2026 年夏天基本不再依賴中國供應鏈。9. 部署與商業模式:偏“租賃”,BMW 半年是大課商業模式偏租賃(leasing)而非一次性買斷:“人類本質上也是被租賃的(僱傭關係)。”在 BMW 半年部署學到很多:每天跑、天天修、天天總結,收穫遠超實驗室 demo。行業裡能拿出“那怕 1 分鐘 Keurig 咖啡機操作的全程閉環、不剪輯視訊”的仍很少。10. 團隊強度與現實難度:不是“六個月衝刺”能堆出來系統不是短期衝刺能完成:團隊長期高強度投入,幾乎每天幹到午夜、周末也在公司。11. 算力與訓練:3000 片 B200 叢集,目標把通用智能“拉滿”上線新訓練叢集,約 3000 片輝達 B200 GPU,並計畫繼續擴容。算力用於預訓練與大規模資料集訓練,盡快把通用機器人的智能能力拉滿。12. 安全門檻:像“敢帶家人坐飛機”一樣嚴格安全標準類比飛機:只有當他願意讓機器人在家裡完全自主運行、在孩子身邊活動而無需時刻盯著,才算達標。走類似 Apple 路線,把開箱體驗與安全/隱私做到極致,使用者可能會像選手機優先 iPhone 一樣優先選 Figure。13. 應用優先順序:醫療健康/養老 + 多感測融合;成本目標 2 萬美元/台優先看好醫療健康與養老:按個人狀態定製飲食、協助康復與照護。疊加紅外/紫外/觸覺/掌內攝影機等感測器,在櫃內摸索取物等場景已有明顯提升;相信多感測融合將提升高精度場景可靠性。硬體角度認為2026 年左右可具備完成外科醫生動作的運動學/動力學能力;成本目標是2 萬美元/台區間,而非 5 萬美元級“性能怪獸”。14. “機器人造機器人”與極端環境願景若一切順利,未來 24 個月內希望實現機器人造機器人:讓產線儘可能由機器人搭機器人,觸發自我加速的量化循環。願景包括月球、軌道、海底等極端環境部署,並延伸到更大規模製造與資源供給的想像。完整內容版1. 神經網路帶來的“斷層式”升級在這段訪談中,主持人以旁觀者視角評價 Figure 的進展,認為 神經網路正在讓人形機器人能力出現“斷層式”提升:相較傳統程式碼,今天用神經網路實現的動作與行為已經遠超此前想像。對於一家人形機器人公司來說,一年時間就足以讓業務面貌煥然一新。隨著大量資料被持續採集與訓練,資料本身正演變為極強的進入壁壘和核心資產。在這種架構下,一台機器人學會的任務可以迅速同步給整支機器人“艦隊”,而人類仍然只能一個個個體地學習,這構成了效率上的根本差異。2. 三代機身:從 Figure 1 到 Figure 3來源:AI工業(採用 AI 工具整理)圍繞 Figure 機器人的演化,團隊經歷了從 Figure 1 到 Figure 2、再到 Figure 3 的完整路徑。Figure 1 在不到一年時間內從零搭建完成,主要承擔採集遙操作和感測資料的任務,為後續模型訓練打基礎;Figure 2 在外觀和功能上更成熟,開始在全身更大範圍運行神經網路,並大幅削減 C++ 控制邏輯;而 Figure 3 已成為當前的“主力工作機”,在工廠與走廊中可以看到大量樣機在測試架上運行、行走、洗碗等執行任務。新一代機型通過增加可彎曲腳趾(flexible toe)和掌心攝影機(palm camera),顯著改善步態和抓取能力,同時整機減重約 30 磅、製造成本下降約 90%,明確指向規模化量產與成本最佳化。在技術路線選擇上,Figure 團隊早期就面對幾個“生死級”問題:其一是 能否做出電驅、低成本但又接近人類能力的人形機器人硬體;其二是能否不再依賴大規模“寫規則/寫程式碼”,而是通過神經網路去學習人類式的技能和表徵。為此,團隊在早期用 Figure 1 完成了著名的 Keurig 咖啡任務:機器人通過雙臂完成拿膠囊、打開咖啡機、放入膠囊並運行整個流程,全程由部署在機器人本體上的雙臂神經網路控制,這一系統後來演化為 Helix 架構。團隊內部把這一任務視為重要拐點,驗證了“全端 All in 神經網路”的可行性和必要性。3. “刪掉 10 萬行 C++”:Helix 2 的範式拐點來源:AI工業(採用 AI 工具整理)在控制軟體架構上,Figure 早期一度維持著數十萬行手寫 C++ 控制程式碼,這些程式碼開發成本極高、測試複雜、行為覆蓋有限且系統脆弱。在 Helix 1 階段,公司已經將大部分高層行為遷移到神經網路上,僅在下肢控制等底層仍保留 C++;到了 Helix 2,團隊徹底刪除了剩餘的 109,000 行 C++ 程式碼,將全身控制切換為端到端神經網路。這一變化使系統從原本只擅長小範圍桌面操作(例如沖咖啡、簡單物流),進化為可以全身動態行走、邊移動邊操作、在複雜場景中持續規劃和重規劃的“房間級自治”系統。為實現這一切,團隊花費了一年多時間重構 Helix 架構,以支撐全身等級的端到端控制。在具體實現層面,Figure 3 與 Helix 2 依靠多模態全身感知和高頻閉環控制來工作。多組攝影機、掌心攝影機以及觸覺感測器持續輸出資料,所有推理均在機器人本體嵌入式運行,並以每秒數百次的頻率向各個電機輸出力矩指令。機器人執行的是各種複雜的雙手任務:抓取和持物、調整身體姿態、避障、犯錯後的自動重規劃等,從感知到動作的全鏈路由端到端神經網路完成。目前系統已經可以完成“房間級”的完整任務序列,下一步目標則是擴展到“整套房子等級”的自主操作,讓機器人能在更大尺度的真實環境中連續完成工作。……4. 通用機器人真正的門檻:不是炫技視訊,而是 6、7 小時閉環來源:AI工業(採用 AI 工具整理)現實情況是:我們今天在網上看到的很多炫酷機器人視訊,其實背後都是遙操作(tele-operation),有一個人類在遠端控制。他用一個比喻:這就像一家“自動駕駛公司”,車其實是田納西某個司機在開,但對外宣傳“完全無人駕駛”,還拿這個去賣服務。在他看來,這樣的路線既不可持續,也不是真正意義上的“通用機器人 AI”。……5. 2026 關鍵年:Baku 產線 scale up,客戶現場 scale out來源:AI工業(採用 AI 工具整理)談到 2026 年的目標,他給出了非常具體的量化方向。在生產端,他們正在瘋狂擴張 Baku 工廠的 Figure 3 產能,短期目標是把節拍做到“平均 30 分鐘一台機器人”。他們計畫在 2026 年就在 Baku 產線上正式上機器人,讓“機器人造機器人”,然後通過增加機器人佔比 + 更高水平的自動化,逐步把人工從產線中“相位移除”。 這構成了他們 2026 年的第一個大目標:在 Baku 端“scale up”,把機器人產能拉起來。 (AI工業)