今年的春晚,已經變成機器人大戰了。從靈巧手開始「製造時間」:揭秘 Sharpa 的通用人工智慧之路在熱鬧之下,筆者關注到了一個很有趣的細節,相比於去年的機器人,今年的機器人都開始長出了一雙雙的手。尤其是在沈騰和馬麗《我最難忘的今宵》節目裡,鏡頭罕見地給了一雙手超長時間的特寫——盤核桃、串烤腸、精準拿取、細膩操作。不但讓機器人更有人味兒了,也更接近我們理想中,能幹活的機器人了。過去一年,人形機器人迅速走紅,但始終伴隨著一種質疑:它們真的能幹活嗎,還是只是在作秀?而能幹活的同時,可量產、質量可靠的靈巧手,恰恰是這道分水嶺。造手這件事,實際上比造人形機器人本體還要難的多。馬斯克在談到人形機器人目前面臨的挑戰時指出,一半以上的工程難度,來自於造手。2025 年 9 月,The Information 爆料,讓特斯拉人形機器人量產時間不斷延後的關鍵卡點,就在於靈巧手的設計問題。手為什麼那麼難呢?按常見的人體全身運動模型(全身約 80 個常用自由度)來估算,單手就貢獻 20+ 個自由度,那麼雙手合計超過 40 個自由度,已經佔到全身常用自由度的一半以上。而人手在承擔了極其複雜運動的同時,又擁有一個神奇的感知功能:觸覺。高自由度力控+觸覺,整合在「巴掌大」的一個空間內,簡直是人類光機電設計的終極挑戰。而首次登上春晚的這雙手,幾乎滿足了所有人對靈巧手的幻想。順著春晚鏡頭,筆者發現了一個更有意思的細節:這雙手,並非來自銀河通用的自研體系,而是出自一家長期保持低調、幾乎不主動發聲的公司——Sharpa。深挖一下 Sharpa 背後的故事,或許比春晚的機器人大戰更加有趣。01神秘低調的行業大佬終於站在聚光燈下在業內,Sharpa 是一家很神秘的公司。極客公園第一次注意到 Sharpa 這家公司,是在 2025 年 5 月的 ICRA,機器人領域的國際頂級學術會議之一。當時,不少人的注意力還主要集中在「機器人能不能走得穩」上,而部分意識到「靈巧操作」重要性的前沿學者,還停留在「高自由度靈巧手,離穩定可靠還遙遙無期」的絕望中。而 Sharpa 幾乎是「橫空出世」,成了現場最引人注目的展位。Sharpa 在 ICRA 展出的能力徹底顛覆了這個認知。它可以從一副牌裡,單張分離某張牌發牌。這種展示方式,在當時的靈巧手領域幾乎沒有先例——它不再只是完成單一動作,而是已經開始進入真實互動場景。業界當時普遍認為,這是全球最好的靈巧手之一。這些高度評價主要集中在兩點:一是 Sharpa 對高自由度靈巧手的穩定掌控能力,二是其在靈巧手觸覺這一關鍵難題上的突破,其指尖整合了超過 1000 個觸覺單元的動態陣列,並具備毫牛級(約 5 mN)力分辨能力。換句話說,它能夠感知到接近半克重量變化帶來的細微受力差異。更厲害的是它的觸覺能力。觸覺,才是靈巧操作中真正的「眼睛」。沒有觸覺的靈巧手控制,會像是「帕金森」。實際上,我們在現實生活中,許多精細動作並不主要依賴視覺,而依賴手指的觸覺。扣紐扣時,人並不會盯著孔位,而是通過指尖感受到布料的厚度與紐扣邊緣的位置;拉拉鏈時,需要判斷卡扣是否對齊、是否順暢滑動,一旦出現輕微卡頓,手指會下意識減力或調整角度。甚至翻書頁這種看似簡單不過的動作,也需要觸覺來保持恰到好處的力控。春晚的盤核桃,其實就是一個非常典型的需要觸覺參與才能完成的動作。核桃在手裡轉動時,接觸點在不斷變化,摩擦力也可能隨時發生變化。視覺只能告訴機器人「核桃大概還在手裡」,卻無法判斷「是不是已經開始打滑」,「那一側正在失去支撐」。這時候,觸覺就成了唯一可靠的反饋來源。只有通過指尖對壓力、剪下力和微小滑動的感知,機器人才能及時意識到風險,並在核桃真正掉落之前,調整手指位置和用力方向。這要求靈巧手具備即時、細膩的觸覺感知能力,能夠在接觸狀態發生變化的瞬間做出響應。這樣基於觸覺反饋的靈巧操作,Sharpa 自己也在不同場合展示過類似能力。早在 2025 年 5 月在 ICRA 展會上,Sharpa 機器人就展示過自主地低頭找到相機,瞄準觀眾,按下快門,然後用食指精準地找到相機撥桿,輕輕拉動,最後將照片取出,遞給觀眾的過程。整個過程絲滑而精準,高度依賴靈敏的觸覺和非常快速的響應控制,Sharpa 通過這個高難度的 demo 成為了那次展會「全場最靚的仔」,據說幾天下來同一個機器人拍了幾千張照片。這樣回看過去,Sharpa 這次出現在春晚舞台,其實並不意外。過去一年,從表面上看,靈巧手玩家一直在增加。不過,當自由度、尺寸、負載、可靠性和觸覺能力被同時放到同一張考捲上,能夠真正同時滿足各項要求並且高品質交付的玩家,就變得非常稀缺,也讓 Sharpa 這位長期低調深耕在行業裡的「隱形大佬」,最終站到了聚光燈之下。在機器人圈內,Sharpa 的產品常被半開玩笑地稱為「靈巧手屆的勞斯萊斯」。這種評價背後,其實有兩個很現實的原因:一是業內對其性能和穩定性的高度認可,二是它確實價格不菲——一雙靈巧手的售價在十萬美元等級,沒有折扣。據行業人士透露,Sharpa 的靈巧手供不應求。去年 10 月開售以來,國內和矽谷的絕大多數頂級科技公司,以及機器人公司都第一時間下單,甚至不乏大單。Sharpa Wave 一時間變成了機器人行業靈巧操作最硬的通貨,在公開論壇上每次有人開箱都會獲得同行的羨慕,畢竟誰能先拿到 Sharpa 的產品,誰就能夠有機會確保自己在「能真實操作物理世界」這一層面上不掉隊。靈巧手並不會直接決定模型的上限,但它會決定那些能力可以被真正訓練出來,那些只能停留在模擬或論文裡。Sharpa 的產品變成了靈巧操作「軍備競賽」最重要的彈藥。02Sharpa:春晚炫的是頂級的硬體,CES 上展的是頂級的 AI 能力因靈巧手一戰成名的 Sharpa,卻很少對外自稱是一家靈巧手的公司。筆者深挖後發現,對 Sharpa 而言,靈巧手本身並不是終點,而只是其技術體系中最先成熟、也最容易被外界感知的一部分。Sharpa 真正的護城河,是圍繞靈巧操作和觸覺建立的軟硬一體的 AI 模型能力,和持續快速推進的資料採集和訓練體系。這在 Sharpa 今年 1 月的 CES 現場,體現的尤為明顯。在 CES,Sharpa 推出了人形機器人 North,並對外公開了其自研的 VTLA 模型 CraftNet,展台的展示重點也從靈巧手能做到的單個高難度動作,轉向完整、連續、由模型驅動的任務執行能力。值得一提的是,CraftNet 展現了很強的模型架構創新能力。CraftNet 是一套端到端的分層模型架構,額外引入了一個專門面向物理接觸的高頻控制層——System 0:它不依賴語言或視覺推理,而是直接基於觸覺與力反饋運行,把末端控制頻率提升到了約 100 Hz,比傳統控制層高出一個數量級。這意味著機器人在接觸物理世界時,第一次具備了接近「手感」的連續調整能力。有意思的是,大約三周後,估值已達數百億美元的 Figure 發佈了最新的模型能力更新,在原有架構 Helix 之下同樣引入了名為 System 0 的層級,並強調其在高頻接觸、平衡和全身協調中的作用。這一命名與功能設計,與 Sharpa 此前提出的模型架構在結構層級與職責邊界上都呈現出高度一致性。而在 CES 上,Sharpa 的 North 機器人做出的展示十分有趣。靈巧手的性能優勢被完整保留下來,但更重要的是,它開始服務於一個連續、閉環的任務過程。以 21 點發牌為例,Sharpa 的 North 機器人,在 CES 上,能夠獨立擔任發牌荷官,在完全無人情況下連續陪觀眾打牌。這其實同時考驗了幾件事:一是機器人是否真的「理解」規則,而不是照著指令碼走;二是能否穩定操作紙牌這種又薄又小、很容易粘連和滑動的物體;三是整套系統能否在連續決策和動作中保持穩定運行。更最具代表性的,是 CES 現場展示的折疊風車的長程任務。紙是一種典型的柔性物體,在操作過程中形狀會不斷變化,邊緣容易翹起,摺痕會改變受力方式,摩擦條件也始終在變。正因為如此,這類任務幾乎不可能提前寫好一整套固定動作,機器人只能一邊接觸、一邊感知、一邊調整。North 機器人還展現出了明顯的泛化和抗干擾能力。物體被臨時挪動、接觸條件發生變化,它也能即時重估位置、調整路徑,而不是中斷任務或回到初始動作。這就是行業裡反覆提到的「最後一毫米」。在疊風車這樣的任務中,真正決定成敗的,並不是視覺是否對齊,而是接觸發生之後,機器人能否在不斷變化的受力、摩擦和形變中持續修正動作。Sharpa 的模型,正是在這一層完成了突破:通過將觸覺納入控制閉環,讓機器人在折疊過程中始終「知道自己在摸什麼、該怎麼調」,把原本極易失敗的最後一毫米,變成了可以穩定復現的能力。這些能力,以 Sharpa 一如既往的風格,又是首發就是在展會上 non-stop 連續穩定的展示,又一次讓行業歎為觀止。4 天 CES,每天 8 小時連續工作,風車疊了 400 多個,乒乓球打了 800 場,拍照 2000 多張,牌打了 900 局。現場 demo 和視訊 demo,也許對於業餘觀眾看起來差別不大,但是在每一個從業者心中,都是天壤之別,一個是用於「哄觀眾」的,一個是用於「同行切磋」的。一段 Demo 視訊,那怕實際系統成功率只有 1%,只要成功一次,這個視訊依然是天衣無縫的。而人山人海的現場展會,面對不可控的光照、人流、噪聲和裝置狀態變化,如果不是 99% 以上成功率,每次失敗都會被觀眾拍下來變成反例在網上傳播,每一次失誤都會被無限放大。也正因為如此,絕大多數人形機器人公司,包括 Figure、1X,乃至 Tesla,在公開自己技術進展的時候更多地選擇了提前錄製的視訊,而不是現場 demo(甚至還有幾次現場 demo 穿幫)。Sharpa 這種看似叛逆的技術審美,既是一種極度的自信,也是希望提醒行業,當在全民都在為「泛化性」鼓掌的時候,不要忘了更重要的「魯棒性(可靠性)」。畢竟,只有 1% 成功率的 demo,是永遠不會有機會走進工廠,走進家庭的。03隱形的獨角獸,和它背後的團隊在行業外,Sharpa 並不像人形機器人公司那樣頻繁出現在公眾視野中。網上的 Sharpa 的視訊,常常都是觀眾在參加展會時候自己拍的。細看的話,Sharpa 連一個官方公眾號都沒有。投資圈的朋友們透露,知道 Sharpa 早已是獨角獸,但是想找 Sharpa 聊投資合作還得託人牽線搭橋,基本也都被婉拒了。但在業內,它的定位其實非常清晰。他們的傳播極其定向,更多出現在行業展會、學術會議、技術論壇中。相比曝光度,Sharpa 更在意的是被「對的人」看到。在全球機器人四大會議中,陸續看到了 Sharpa 的硬體產品被學術圈廣泛使用,同時 Sharpa 的 AI 科學家也開始與機器人行業的頂級學者聯合署名。輝達已向 Sharpa 發出公開邀請,將在 2026 年 GTC 大會上發表關於 CraftNet 模型的專題報告。直到最近,Sharpa 的背景才逐漸被更多媒體披露。公開資料顯示,這家公司由禾賽科技的三位核心人物在 2024 年底聯合創立,分別是 CTO 向少卿、CEO 李一帆以及首席科學家孫愷。回顧三位創始人的創業歷程,是典型的「工程出身 + 產業理解 + 充分市場驗證」案例。禾賽通過近 10 年的努力,把雷射雷達這個曾經被美國企業壟斷的行業,成本降低了 99.5%,建立了全球完善的車規量產和質量體系,實現了年產數百萬台並成為全球市佔率第一,兩地上市,數百億市值,且唯一盈利的企業,可以說是「全村的希望」。值得一提的是,禾賽的雷射雷達今年同樣登上了春晚,被應用在宇樹機器人的系統中,支援其完成複雜動作、實現避障和群體協同。很明顯,創始團隊本身長期與最頂尖的機器人團隊、產業夥伴和研究機構保持著密切交流,對當前機器人技術真正卡在那裡,有著非常清醒的判斷。這也解釋了為什麼 Sharpa 把幾乎全部精力投入到機器人最核心的環節上:如何讓操作足夠穩定、絲滑和自然,如何把視覺與觸覺融合進同一套控制體系,以及如何把「最後一毫米」從一個反覆失敗的黑箱問題,變成可以被系統性解決的工程問題。從這個角度看,Sharpa 的低調並不是刻意迴避聚光燈,而是一種被反覆驗證過的工程判斷。創始團隊並非第一次面對這種「看起來慢、但必須穩」的技術路徑——他們此前已經在禾賽身上完整走過一次。在雷射雷達這條線上,禾賽做成過一件極其困難的事:先把產品的質量和可靠性做到行業可用,再把性能推到足夠領先,最後才通過工程和規模,把成本壓下來。這條路徑並不討巧,卻最終穿越了量產、良率和商業化的多重門檻。李一帆在多個場合都提到過,這是一種對「不可能三角」的現實解法:不是同時追求質量、性能和成本,而是明確順序——先質量,再性能,最後才是成本。這套方法論,也被原封不動地帶進了 Sharpa。靈巧手和通用機器人同樣存在一個更尖銳的不可能三角:自由度、穩定性和成本彼此拉扯。很多團隊選擇先把 Demo 做出來,再回頭補工程;而 Sharpa 的選擇,恰恰相反——在能力邊界沒有被真正跑通之前,不急著規模化,更不急著降成本,而是把最難的工程問題先解決掉。從 Sharpa 對靈巧手的可靠性的處理方式上可見一斑。儘管目前的靈巧手真實的應用環境都相對較友好,但 Sharpa 在內部測試中仍然對靈巧手做了累計超過 300 萬次連續按壓 和 5,000 米以上的摩擦行程,接觸對象覆蓋不鏽鋼、大理石、木材、橡膠等多種常見材質,用於驗證高頻操作和多材質環境下的穩定表現。做出來固然重要,但是很明顯 Sharpa 更關注「能不能在真實世界裡反覆、長期地用下去」。從公司結構上看,Sharpa 的佈局也明顯服務於這一目標。公司全球總部設在新加坡,研發和製造中心位於中國上海,而業務營運則放在美國矽谷,能同時兼顧核心技術研發、工程實現和產業落地,是一套明顯為長期可用性而設計的組織形態。CES 上,Sharpa 公開了自己的一句話使命——「We manufacture time by making robots useful.」他們的解讀是,只有真正讓機器人做好「最後一毫米」的工作,才能把人從繁重、重複的勞動中解脫出來。今年得到了春晚聚光燈眷顧的 Sharpa,是為了最終把聚光燈的焦點重新還給人類。Sharpa 所做的,是通過軟硬結合,讓機器人擁有與現實世界進行複雜互動的能力,未來能在工廠、商業、乃至家庭場景中,去接管那些細碎的工作。而人類節省下來的,將不僅是體力,更是可以被重新分配的時間與精力——用於追求更完美的自己,用於和家人、朋友一起創造更高價值、也更有意義的事情。從某種意義上,Sharpa 的終極目標是為我們「製造」時間。 (極客公園)