高通組局,宇樹王興興說了一堆大實話

王興興的大實話,在高通攢的這場局上,全交代了。

  • 目前機器人領域技術路線都不一樣,導致看著熱鬧,但是進展沒那麼顯著;
  • 既然現在大家開發的模型都還不能部署直接用,那還不如開放出來,就像OpenAI開源GPT-1/2;
  • 宇樹前幾天開放原始碼的世界模型也無法直接在工廠中落地使用;
  • 現在機器人和晶片廠商都忽略了晶片對於機器人的重要性;
  • 手機晶片等類似晶片用到機器人身上是非常有想像空間的。

所有終端都被AI、Agent賦予新想像,因為夠new,具身智慧成為被影響最大的那一個領域。但也因為夠new,具身智能的熱鬧下必然存在諸多爭議與挑戰。

宇樹科技,長期站在聚光燈下的明星玩家,此時此刻將行業中的諸多難題直接剖開。

或許不為別的,而是高通攢的這個局太難得。2025驍龍峰會·中國,聚集了國內外終端領域的核心玩家,覆蓋上下游產業鏈。在這開誠佈公討論的問題,或許馬上成為業界最關注的熱點,進而能更快解決。

而不止王興興,來自硬體、模型、操作系統等層級的玩家,也都暢所欲言、應聊盡聊:

  • 理想汽車副總裁、智慧空間研發負責人勾曉菲
  • 面壁智慧CEO李大海
  • 中科創達聯合創始人、執行總裁耿增強

高通全球AI研發負責人侯紀磊與他們對話。

為完整體現各位大咖的思考與理解,我們在不改變原意的基礎上將對話內容進行整理,希望您能從中有所收穫。

算力散熱通訊,說到底機器人應該加強對晶片的關注

Agent落地終端的終極想像,或許就是具身智慧。

宇樹科技創始人、CEO、CTO王興興表示,他們的目標還是希望能夠有通用的AI放在通用的機器人上,幹各種活,無論是在工廠還是家用

當機器人能在未見的環境中,憑自然語言指令完成任務時,就是機器人的ChatGPT時刻。

他將這個目標拆解為幾個階段分別完成:

1.固定動作示範→ 已實現(如舞蹈、武術)。2.即時產生任意動作→ 預計最快今年底/明年初實現。3.在陌生場景執行任務→ 預計明年底左右能做到(如拿水、整理桌子)。4.高成功率與精細操作→ 需要再數年,目標是接近99.9%成功率,能完成拆裝手機等細緻任務。

如果想要機器人能夠做到這些,一個非常關鍵的問題是對物理環境、自然語言指令的即時理解和處理,這就對於端側AI的通訊能力有更高要求

王興興表示,通訊是非常重要的。

目前我覺得包括很多機器人廠商或是晶片廠商,都有點點忽略晶片對於機器人的重要程度。

就像新能源車一樣,最近十幾年最大的變化是隨著新通訊協議出現,線纜數量減少了很多。早年一輛油車的線纜數量是非常誇張的,可能一輛車裡線纜重量就有100公斤。

在機器人領域也是一樣的,一個通訊線纜是4根或5根線,有時為了降低電線數量會花費很多時間和精力。因為對於一台機器人來說,效能越來越好、機器人越來越可靠,降低線纜數量是很重要的。迄今為止,工業機器人最常見的故障就是線纜出問題,可能佔60-70%

對於一台機器人來說,減少線纜數量的最大問題是要提高整體通訊協議、提升通訊品質。

我相信未來機器人的終極想像是每一個手臂上就只有一根線纜,別的都沒有了,多乾淨整潔,想要實現這個目標還有非常多工作要做,但這非常值得做。

此外,在底層晶片上,王興興提到了終端難以部署大規模算力的難題。

機器人本身的空間就那麼大,很多時候高算力的晶片都裝不進去;同時電池容量、散熱,對於這麼大的機器人來說都是很難解決的問題。

他覺得未來具身智慧身上部署的算力,峰值功耗最好控制在100W以內,平均正常功耗可能只要20-30W,可能就相當於幾個手機的功耗。

太大是不行的。我覺得手機晶片等類似晶片用到機器人身上是非常有想像空間的。

目前處在黎明前的前夜,前夕反而是比較麻煩的。最大的問題是業界各家技術路線差別很大,都有各自的想法,這會導致這個領域非常熱鬧,但整體進展沒那麼快。

當下想要真正把具身智能的通用AI模型做出來,在這個階段,大家還是可以保持更開放的態度,反正大家做出來的模型都沒法部署用,不如開放一點

前段時間宇樹開源了一個基於視頻生成的世界模型,不只是權重參數,包括模型本身、資料集、訓練原始碼、部署原始碼通通開源。

王興興說,這個模型真正放在工廠或生活中是不能直接使用的,那不如開源。這有一點像OpenAI早年的時候,因為大模型的商業價值或說距離落地還有點遠,GPT-1、GPT-2都是開放原始碼的。

我們也是希望更多開源能夠讓大家共同來推動這個領域共同進步。

至於現在大家總是討論的VLA模型和世界模型之間的問題,說實在的很難講得非常清楚,因為即使是VLA模型、世界模型本身也都有非常多變種。我們公司會保持開放的態度,嘗試各種模型,包括自己開發以及和第三方合作等。

我個人覺得在AI領域要保持謙卑的態度,永遠有更聰明、更開放的人做更好的東西出來,我們保持謙卑的態度去學習。

有時候我還希望應該把過去很多年的東西儘量忘掉,不要被過去限制了自己的邏輯。

我們的目標是讓機器人真正在家庭和工廠裡使用。我認為無論是晶片、通訊協議、算力、通訊架構、甚至是整個無線通訊架構可能都需要一些調整。

包括安全問題。現在機器人賣得越來越多,有些駭客專門破解我們的機器人,這讓我們也非常頭大

在機器人領域還沒有那麼成熟前,可以從很多其他領域借鏡學習,包括手機、新能源車等,去進行更規範的體系建設、資料採集、模型訓練等。

當下這個領域確實太新了,我們每時每刻都會面臨一些新的挑戰和問題,這不是單一公司能解決的。我們也希望更多人參與進來解決問題,例如我們一般用的Linux系統本身還有很多漏洞,我們在開發時需要把底層漏洞完全解決,這還是比較花時間的,如果有一家第三方公司能把這些問題解決,我們也非常願意合作,這是一件非常有價值的事。

端側模型將是Agent系統中最核心的編排者

Agent根本上是大模型的應用形式,目前Agent的形態更偏向雲端,但隨著落地趨勢逐步推進,端雲協同將是必然。

面壁智慧CEO李大海認為,端雲協同現在已經是產業共識,這樣能提供更好的使用者體驗。雲相較於端側可以提供近乎無限的算力和資源,負責解決複雜問題;端側離使用者更近,它需要響應速度非常快、同時保障用戶隱私。

端側有一個非常重要的優勢,就是「永遠線上」,它可以持續感知世界、實現基於裝置隱私的上下文理解、協同雲不同Agent區組織編排完成複雜任務。

具體到實際的終端上,例如在汽車座艙裡面,就應該有比較強的端側模型,它能夠理解使用者需求然後去和雲側的模型溝通。

舉一個簡單的例子,比如說如果在座艙裡面通過端側模型感知到後面的小朋友有哭鬧的情況,就可以通過端側先去開啟一個雲比較強的語言互動模型,說要不要一起聊聊天,分散一下注意力,給他講一個故事。但這個開啟的過程一定是要透過端側來判斷,而不是讓雲側隨時有一個模型在觀察我們的座艙裡面在做什麼,這對隱私的暴露是非常大的。

我認為終端的端側模型未來其實是整個Agent系統裡最核心的編排者。

那麼未來AI產業對於端側模型的需求是什麼呢?

李大海認為,永遠要去提高端側模型的知識密度

因為端側模型部署在各種硬體裝置、走入千家萬戶和不同用戶場景發生互動,它需要具備很好的自主學習能力,尤其是基於探索的內容進行自我迭代和個性化發展。所以端側模型提升知識密度非常重要,面壁智慧提出了知識密度每三個月提升一倍的觀點。相對而言,雲側模型會更關注智能水準的提升,這二者之間的差異還是很大的。

在模型自我發展的同時,和晶片、終端、系統之間也應該更深度協同。

在這之中,李大海提到了深度合作非常重要。

站在作為端側模型公司角度講,我們跟高通這樣的晶片廠商有非常深度的合作,只有這樣深度合作才能夠把端側模型的知識密度能夠真正發揮出來,能夠去用更低的功耗去做到同樣的工作。

另外在應用側,他認為現在只有MCP這一種智能體協作方式肯定是不夠的,還需要有更多基於用戶認證的、安全的協同方式,這些是原來在移動互聯網時代建設過的基礎設施,現在需要在AI時代重新做一遍。

Agent的核心是提供服務的能力

終端硬體是Agent的物理載體,因為Agent的到來,手機、PC、汽車等硬體終端都煥發新活力。

對於汽車而言,它本身就已處在智慧化升級處理程序中,Agent的到來使這種升級更加全面深入。

理想汽車副總裁、智慧空間研發負責人勾曉菲認為,汽車能夠實現自動駕駛是行業基本共識了,實現自動駕駛後,汽車空間內能夠提供怎樣的服務就會變成各家車企的差異化競爭手段。

AI孕育了一個非常大的機會點,它有機會把看似割裂的生態集中起來。其實很多終端現在都是生態的孤島,例如PC的互動是鼠標鍵盤+圖形介面,手機的互動是基於觸控,AI這種基於對話的、更自然的互動會是一個跨終端的統一互動模態。

現在大家都在談論Agent,Agent是什麼?

今天當大家談論Windows時,默認Windows背後有一大堆服務;在談論Android的時候,也默認Android背後有一大堆服務。同理,在未來大家選擇使用那個Agent其實是看它到底能帶來多少服務。

今年理想汽車也聚焦在做這樣的事,理想同學作為理想汽車的Agent,它接入了大量和汽車出行相關的服務。今年我們也開始接入車內空間以外的生活場景和服務,例如讓理想同學點一杯咖啡、交水電費、叫一個代駕等。它會覆蓋更多、更廣泛的服務,我們相信未來使用者選擇Agent的核心和現在選擇操作系統的邏輯是一樣的。

Agent需要形成行業標準

而談到Agent的服務能力,滿足使用者需求是一方面,更關鍵在於如何讓Agent應用、操作系統和底層硬體之間緊密協同,從而進一步提升應用體驗。

中科創達聯合創始人、執行總裁耿增強認為,現階段AI在不同裝置上的應用高度碎片化。底層晶片不同、運行操作系統各異、上層模型和Agent框架也不統一。這導致行業內存在非常多組合方案,重複開發成本高,缺乏統一標準。

核心問題還是缺乏一個跨終端通用的AI OS或統一的Agent Framework。儘管目前MCP、A2A已經取得了一定進展,但距離形成產業公認的標準還很遠。

不過可以確定的是,未來在Agent的「穿針引線」下,還是可以形成一個跨終端的操作系統,提供流轉的智慧服務。

這種新時代OS的架構,可以將雲視作一個巨大的Cloud OS,各個終端就是Agent,與Cloud OS協同工作,跨平台的一部分由Cloud OS來實現。從單一裝置來看,傳統的Linux、Android等系統將被視為虛擬化層,AI是一種全新的UI,必然催生新的AI OS。

聚焦到廠商該如何做,其實還是產業共建、協同合作。

耿增強認為,很多事需要“自然發生”,但行業可以共建一些基礎設施。例如中科創達已經和高通共建了智慧汽車創新中心、智慧物聯網創新中心,透過這兩個創新中心支援智慧汽車和智慧物聯網不同裝置裡終端廠商共同的客戶以及生態的合作夥伴。

在AI方面,中科創達和火山引擎成立了理想智慧汽車混合AI聯合實驗室,將火山引擎的雲上AI和中科創達的端側AI形成一個混合式AI方案,經過高通平台優化後可以更好支援裝置廠商、客戶創新。

目前也聚焦在單裝置智能,但下一步將走向裝置之間的Agent協作。 (量子位元)