#智能AI
機器人賽道變天:宇樹智元爭搶C位,騰訊阿里字節打響「代理人戰爭」
CES 2026 歸來,小雷發現具身智能和機器人賽道的高人氣,絲毫不見衰減之勢。尤其是 Omdia 近期公佈的一項資料,更掀起了機器人行業兩大明星品牌宇樹與智元間的纏鬥。Omdia 資料顯示,2025 年全球人形機器人市場出貨量預計達 1.3 萬台,其中智元以超過 5100 台的出貨量,佔據 39% 的市場份額,位列第一;宇樹以 4200 台的出貨量,佔據 32% 的市場份額,位列第二;智元和宇樹,合計佔據全球人形機器人市場 71% 份額。就是這樣的一份「兩強爭霸」榜單,結果「居於人後」的宇樹不爽了,官方甚至特地發佈了一份資料澄清說明。宇樹透露,其 2025 全年人形機器人實際出貨量超 5500 台,2025 年本體量產下線超 6500 台,以上兩項資料均不含雙臂、輪式等其他機器人產品。宇樹還特別指出,「目前各種機器人形態多樣,請勿把不同類型機器人數量,直接合併在一起對比」。第三方市場調研機構公佈的出貨量資料,通常都會有一定的誤差區間,相對成熟的品類,誤差區間會偏小,例如手機、電腦等品類市場,而像人形機器人這類既處發展早期、市場規模又極小的品類,官方不給出明確資料的話,第三方市研機構也比較難給出相對精確的各廠商出貨量資料。下一步,就看智元會否給出 2025 全年確切的人形機器人出貨量資料,從而「再次力壓」宇樹。宇樹智元纏鬥,更多機器人「實幹派」不再低調宇樹、智元纏鬥的同時,更多機器人「實幹派」,開始不再低調,甚至開始頻繁刷臉。蛇年春晚,宇樹一家獨舞,引爆全民關注人形機器人的同時,品牌關注度和星光度更是得到全方位擴大。馬年春晚,更多機器人品牌開始爭搶這一頂流秀台入場券,甚至不惜豪擲億元。此前有消息稱,沒有一家機器人企業獲得馬年春晚獨家贊助權益,「最終大約有五家左右的具身智能公司一起上春晚,每家出資 1 億左右」。近日,就有兩家品牌企業搶先宇樹,率先官宣獲得馬年春晚贊助商資格:一家是魔法原子,一家是銀河通用,均非此前呼聲最高的品牌企業。雷科技 CES 2026 現場攝製有說法認為,之所以是這兩家機器人企業率先拿到馬年春晚入場券,更多是因其產品設計理念和場景應用更偏向「實用性」和「可落地性」。這種說法,有一定道理。作為 CES 2026 報導團成員,小雷在拉斯維加斯現場就見識到了這兩家品牌機器人的功用性,而非觀賞性。魔法原子的機器人,今年首次登台 CES,帶來從科研教育到工業生產,再到家庭生活應用場景的機器人產品系列矩陣,例如在工業場景下擁有高自由度仿人作業能力的機器人,能全程自主完成從點單到出餐的機器人,可完成物品遞送、開關門窗等日常家務的機器人,在複雜高危巡檢環境下的工業四足機器人等。顯然,魔法原子想把機器人可以實現的核心能力,盡快適配到更多實際應用和工作場景。圖源:魔法原子值得一提的是,成為馬年春晚首個機器人合作品牌的同時,魔法原子聯合創始人顧詩韜透露,公司將在今年衝擊 IPO。作為搶先官宣登台馬年春晚的另一家機器人品牌,銀河通用在去年 12 月完成新一輪超 3 億美元融資,打破國內機器人行業單輪及累計融資雙紀錄,公司估值也來到 30 億美元。在技術路線上,銀河通用同樣強調「實用主義」。在其 CES 2026 展台,小雷就看到醒目的「AI-Driven Autonomous Robots, Born for Productivity(AI 驅動的自主機器人,為生產力而生)」大標語。展台的機器人,則亮出了兩大核心技能:其一是從貨架取送商品,其二是搬運箱子,全流程自動化。圖源:銀河通用除了這兩家將要登上馬年春晚舞台的新創企業,機器人領域的一些老牌創業企業也在加大自身品牌宣傳和產品推廣力度。雷科技近期就留意到一家名為睿爾曼(RealMan)的機器人和具身智能企業,其成立於 2018 年。睿爾曼創始人鄭隨兵曾對媒體表示,「我們造機器人不是為了造一個人,而是為了造一個能在具體場景幹活的工具」。具體到企業發展上,睿爾曼目前擁有三大核心產品:全端自研一體化關節模組、超輕量仿人機械臂、遠端作業網路(GLN),均有清晰的商用落地場景。其中,睿爾曼在 CES 2026 完成了「北京-拉斯維加斯」跨洋即時遙操演示,即通過建構「北京人形機器人資料訓練中心-拉斯維加斯國際會展中心」的遠端勞動力網路,使在北京的具身訓練師可遠端精準控制在 CES 展台的 RealBOT 輪式折疊機器人,執行「遞送物品」「傳遞水果」等真實場景作業。睿爾曼之外,應該還有更多業內老牌創業企業在默默發力,以求能實現從量變到質變的突破,從而迎來真正的出人頭地日。具身智能賽道火熱,網際網路巨頭掀起「代理人」之爭馬年春晚舞台,魔法原子、銀河通用搶先宇樹官宣,多品牌機器人登台亮相,告別單品牌「獨角戲」。迎接馬年到來,具身智能和機器人賽道更多在場企業,正在怒刷存在感,例如在目前同樣火熱的創投市場舞台。近期,名不見經傳的自變數機器人完成 10 億元 A++ 輪融資,成立不到半年的至簡動力完成第四輪融資。具身智能和機器人賽道,新創企業躍躍欲試、新新企業層出不窮,這一市場格局遠未到定型時。值得注意的是,自變數和至簡動力背後均有多家網際網路巨頭企業的身影。其中,自變數是目前業內唯一同時被美團、阿里巴巴、字節跳動這三家網際網路大廠投資的具身智能企業,至簡動力則是同時被騰訊、阿里巴巴這兩家網際網路巨頭投資的具身智能企業。圖源:自變數為何網際網路巨頭此刻仍在瘋狂押注具身智能和機器人企業,尤其賽道新新企業?一、網際網路巨頭本身也是 AI 大模型平台企業,而具身智能正是 AI 大模型在硬體應用領域的「頂流」和「未來」賽道。主流觀點認為,通往 AGI(通用人工智慧)的道路上,AI 是大腦,機器人是身體,大腦和身體缺一不可。故而,這些 AI 大模型平台企業,不可能不涉足機器人尤其具身智能賽道。與此同時,現階段的具身智能和機器人市場整體規模偏小,網際網路巨頭需要戰略佈局,但又無法自身涉足其中,站台新創企業(尤其尚未成型的新新企業)自然也就成了唯一解。二、機器人亟待解決「大小腦」未同步發育以及批次化交付(快速上量)的難題,而這給了網際網路巨頭一個全面介入的契機。機器人企業,普遍更擅長的是硬體技術、運動控制,以及對應的軟體適配和最佳化,這就決定了多數機器人企業,只能從硬體和運動控制層面去打磨機器人產品。機器人的「小腦」,即控制其運動能力的功能模組;機器人的「大腦」,即控制其智能程度的功能模組。久而久之,就出現了目前機器人「大小腦」未同步發育,具身智能概念落地難的行業發展現狀。機器人行業這一普遍發展瓶頸,既是困難,也是機遇。具身智能賽道的新創企業,尤其是被網際網路巨頭選中的企業,自然不會錯過這一良機。自變數,主打具身智能基礎模型,即獨立於、平行於大語言模型、多模態模型等虛擬世界基礎模型的物理世界基礎模型。自變數的具身智能基礎模型,以所有機器人的感知資訊(例如視覺、觸覺、語音等)為輸入,直接輸出機器人的動作、視覺,以及語言等,讓機器人能夠具備即時處理非結構化、動態及隨機任務的能力。至簡動力,由理想汽車多位前高管共同創辦和帶隊,產品聚焦通用機器人而非人形雙足機器人,基於汽車智駕技術路線(核心成員出自理想智駕研發團隊),力求可以面向 B 端應用場景「快速上量」。圖源:理想這個速度究竟有多快呢?去年下半年才成立的至簡動力,計畫今年實現通用機器人的量產。網際網路思維中的一大要義,是快。也許正是這一點,打動了騰訊、阿里巴巴這兩大網際網路巨頭,並共同為其站台。三、機器人和具身智能賽道已經湧入不少新老企業,此刻還想連續/大額融資的新創企業,尤其新新企業,深信「最後一張船票」的網際網路巨頭,自然也就成了少數可選的慷慨買單者。當然,從根本上來說,軟體層面的 AI、硬體層面的機器人,以及打通兩者的具身智能,對於意欲全面轉型到 AI 大模型平台的網際網路巨頭企業而言,是一場不得不前瞻佈局的必打之戰。只要網際網路巨頭( AI 大模型平台)還沒有拿到足夠多的「船票」和資源,機器人尤其具身智能賽道的新創企業就會繼續躍躍欲試、新新企業就會繼續破土而生。四大勢力逐鹿未來,機器人大戰恐難避免伴隨網際網路巨頭的全面介入,目前中國機器人和具身智能賽道不僅顯得頗為擁擠,而且集合了多派勢力。對於這一「早期還早期」「藍海還藍海」的市場,似乎有點不可承受之重。總體來看,目前機器人和具身智能賽道有以下四大勢力:機器人硬體企業:智元、宇樹等明星品牌企業,銀河通用、魔法原子等躍躍欲試品牌企業,睿爾曼等默默發力型老牌創業企業。智能清潔和大家電企業,包括已經推出的通用機器人、陪伴機器人等產品,以及人形機器人等概念產品。汽車企業,尤其是智能汽車品牌(造車新勢力)企業正在密集入局的人形機器人領域。理想汽車就最新宣佈,一定會做人形機器人,而且將盡快落地亮相。具身智能企業,尤其是網際網路巨頭站台的相關新創企業、新新企業。目前來看,機器人和具身智能賽道這四大勢力,各有千秋,例如:機器人硬體企業擁有機器人關節(自由度)和運動控制領域的核心技術,智能清潔和大家電企業則在 AI 硬科技和居家場景應用有著天然優勢,智能汽車企業可以在機器人賽道全面外延甚至再造 VLA,網際網路巨頭站台的具身智能企業可以在解決機器人「大小腦」未同步發育的問題上發揮重要作用。具體到其中一派勢力,例如最典型的機器人硬體領域,目前的明星企業,或者說「頂流」企業,在業內的位置都遠未「坐牢靠」,而更多非明星企業以及老牌創業企業,在今年開年、春節期間正在掀起的「不再低調」行動,也證明其絕非一直願當「綠葉」之輩。機器人硬體行業的明星企業、非明星企業、老牌企業,智能清潔和大家電企業,智能汽車企業,網際網路巨頭(AI 大模型平台)站台的具身智能企業,這四大勢力各有優勢、各有所長,短期內也很難決出個勝負,但機器人賽道的一場大戰似乎也很難避免。而在即將來到的農曆馬年,四大勢力也將在機器人和具身智能市場掀起更加激烈、甚至慘烈的爭奪戰和卡位戰,尤其是各派勢力內部的企業較量。 (電車通)
2025年度AI創業公司TOP50
2026年1月13日,前釘釘副總裁王銘創立的攀峰智能正式對外宣佈完成數千萬元種子輪融資,2025年10月王銘創立攀峰智能,公司定位為“AI時代的Shopify”,致力於打造商業化視訊Agent。AI應用爆發的這一年,下海創業的遠不止王銘一人,一批曾深度參與釘釘從工具到生態、再到AI戰略轉型的核心高管,正密集走出大廠,投身AI原生創業浪潮。例如,釘釘前副總裁、智能硬體生態總經理林峰於2025年離職後計畫創業聚焦AI辦公硬體領域,釘釘前CEO葉軍也於2025年7月離職投身AI Agent賽道。不僅是中國大廠高管紛紛離職創業,前OpenAI首席技術官Mira Murati創辦的Thinking Machines Lab也已完成20億美元種子輪融資,前GoogleDeepMind資深研究員Andrew Dai與蘋果研究科學家Yinfei Yang聯手創立AI公司Elorian,種子輪融資目標高達5000萬美元。2025年創投圈焦點依然還是在AI、具身智能領域,年終最熱門的AI創投事件是以數十億美元的價格被Meta收購的AI agent公司Manus,Manus的爆火也可以看作是今年社媒流量改變AI創業生態的起點之一。在AI領域,還有更年輕的創業者。成立於2024年的首形科技,95後創始人胡宇航僅抖音平台粉絲量就達到了142.6萬(截至2026年1月25日),Pre-A輪融資高達上億,與手游《逆水寒》合作的角色“方承意”仿生機器人亮相杭州CP32Pre漫展,得益於雙目視覺系統,他能夠與面前的觀眾進行“眼神”交流,並通過搭載的AI仿生運動演算法,做出自然的表情與頭部動作。可以看到的是,越來越多不同AI垂直領域的創業公司湧現,讓AI應用正在從“工具”走向“夥伴”,從“功能”向“情境”轉變。AI在反映人類的需求與渴望的同時,也在重塑社會生產與消費的模式。2025年以來,頭部公司完成的融資額已經達到了數億甚至超十億的規模,技術競爭的壁壘正在被越築越高,AI應用落地也已經從概念驗證階段步入商業快速變現期。AI創業公司從誕生到規模化盈利的周期正在被極度壓縮,2025年真正跑出來的AI公司有一個共性:永遠在為下一個變化做準備,AI時代的創業邏輯是持續進化。結語當今的創業沒有冷門賽道,大家都在百花齊放,AI似乎能夠改變千行百業,但想要真正成長,更多的還是“專注”。 (DBC德本諮詢)
加速時代來臨:全球藥物研發已經被顛覆
在大眾的印象中,製藥研究往往發生在擺滿實驗台、充斥著冒泡液體,研究人員身著白色大褂的傳統實驗室裡。但在倫敦國王十字區,有一位不走尋常路的製藥研究員帕特里克·施瓦布,他的工作場景卻截然不同。這裡曾經是鐵路站場和工業建築的地盤,如今卻搖身一變,成了倫敦最時尚的街區之一。施瓦布博士全身黑衣,供職於製藥巨頭葛蘭素史克(GSK),他正在用電腦科學中同樣熱門的人工智慧(AI),重新構想製藥的未來,致力於將儘可能多的工作從玻璃器皿轉移到電腦上,開啟“矽基藥物設計”新時代。當Transformer遇上藥物研發製藥行業一直以來都面臨著高成本、高風險的困境。一種新藥從研發到上市,平均需要花費26億美元,耗時10 - 15年,而且臨床試驗階段的候選藥物失敗率高達90%。這就好比在黑暗中摸索,投入巨大卻往往收穫寥寥。不過,AI的出現,似乎為這片黑暗帶來了一絲曙光。波士頓的生物技術公司英矽智能(Insilico Medicine)率先將基於Transformer模型的新一代AI應用於藥物研發領域。2019年,他們的研究人員腦洞大開,想用AI從生物和化學資料中發明新藥,第一站就瞄準了特發性肺纖維化這種肺部疾病。他們先是用與該病相關的資料集訓練AI,找到了一個有潛力的目標蛋白。接著,另一個AI登場,給出了能與該蛋白結合併改變其行為,同時毒性和穩定性都不錯的分子建議。最後,人類化學家接力,對篩選出的分子進行合成和測試,最終得到了一種名為rentosertib的藥物,並且最近成功完成了中期臨床試驗。整個過程僅用了18個月,而以往通常需要四年半的時間。這就像是原本開著老牛拉的破車在崎嶇山路前行,突然換成了高速行駛的跑車,效率提升立竿見影。如今,英矽智能已經有40多種由AI研發的藥物正在針對癌症、腸道和腎臟疾病等進行評估。而且,這種AI驅動的藥物研發模式正在迅速擴散。有預測顯示,該領域的年度投資將從2025年的38億美元飆升至2030年的152億美元。製藥公司與AI公司的合作也日益頻繁,2024年就宣佈了十幾項合作交易,總價值達100億美元。去年10月,製藥巨頭禮來(Eli Lilly)與輝達(Nvidia)宣佈合作,要打造行業內最強大的超級電腦,以加速藥物的發現和開發。這就像是武俠小說裡的各路高手紛紛結盟,準備在藥物研發這個江湖裡大幹一場。AI如何顛覆傳統藥物研發流程?傳統藥物研發就像一場漫長而艱難的馬拉松,從篩選具有潛在生物活性的有機小分子開始,就充滿了挑戰。要從數十億個小分子中篩選出合適的,就如同在茫茫大海裡撈針。而AI的加入,讓這個過程發生了翻天覆地的變化。它可以通過軟體模擬,對數以百億計的小分子進行篩選,測試它們的效力、溶解性和毒性等特性,根本不需要真正的分子進入試管。阿斯利康(AstraZeneca)負責這項工作的吉姆·韋瑟羅爾表示,AI篩選的速度比以前快了一倍,該公司90%以上的小分子發現流程現在都有AI助力。這就好比以前是人工一粒一粒地篩選沙子找金子,現在有了一台先進的淘金機器,效率自然大幅提升。在臨床試驗設計方面,AI同樣大顯身手。比如GSK的AI負責人金·布蘭森展示的基於智能體的系統Cogito Forge,當被問及生物學問題時,它能編寫自己的程式碼來回答問題、收集合適的資料集、整合資料,還能製作帶有結論圖表的簡報。它可以就一種疾病提出假設,包括可測試的預測,並通過文獻檢索來驗證或證偽。它甚至會派出三個“智能體”,一個尋找支援假設的理由,一個尋找反對的理由,還有一個來判斷誰對誰錯。這就像是有一群聰明的助手,幫研究人員全面地思考問題,大大提高了研究的精準性和效率。AI在選擇臨床試驗患者方面也發揮著重要作用。它可以分析候選人的健康記錄、活檢和身體掃描等資料,找出最有可能從新藥中受益的人。這樣一來,臨床試驗的參與者選擇更精準,試驗規模可以更小,速度更快,成本也更低。這就好比在一場比賽中,挑選出最有潛力奪冠的選手參賽,比賽自然更容易取得好成績。而AI最讓人驚豔的應用之一,當屬建立合成患者(也叫數字孿生)作為真實參與者的對照。AI通過分析過往試驗資料,學會預測未接受治療的患者病情自然發展情況。當有志願者參加試驗並接受藥物治療時,AI就會建立一個具有相同特徵(如年齡、體重、現有疾病和疾病階段)的“虛擬患者”。這樣,通過對比真實患者和虛擬患者的情況,就能更準確地評估藥物的療效。舊金山的數字孿生公司Unlearn.AI在2025年發佈的研究顯示,這種方法在早期帕金森病試驗中可將對照組規模縮小38%,在另一項阿爾茨海默病研究中可縮小23%。而且,對於那些原本可能沒有對照組的早期試驗,現在也可以通過數字方式引入對照組,增強對藥物療效的信心,並改進後續試驗的設計。這就像是給每個真實患者都找了一個虛擬的“影子”,通過對比兩者,更清晰地看到藥物的效果。AI的“製藥瓶頸”與突破之路不過,AI在製藥領域也並非無所不能。許多蛋白質分子,作為越來越常用的藥物,但它們比傳統藥物分子大得多,還老是晃來晃去,確定它們的精確形狀可不容易。RNA分子,作為新型疫苗的基礎,同樣讓人頭疼,而細胞內部基於膜的複雜結構更是難上加難。但好在這個領域的研究進展迅速,研究人員正在訓練AI來模擬蛋白質與其他分子的相互作用、預測RNA折疊,甚至模擬細胞。鹽湖城的Recursion公司打造了一個AI“工廠”,在其中對數百萬個人類細胞進行各種化學和基因變化的成像,讓AI學習基因和分子通路之間的模式。紐約的AI生物技術公司Owkin則利用醫院患者的大量高解析度分子資料訓練模型。Owkin的老闆湯姆·克洛澤爾認為,通過做出人類無法做到的發現,這項工作正在朝著生物學領域的真正通用人工智慧邁進。隨著AI在製藥領域的深入發展,一個問題也隨之而來:傳統製藥公司會被新興的AI公司顛覆嗎?像OpenAI,它引領了被稱為大語言模型的Transformer的發展,還有從GoogleDeepMind分拆出來的藥物發現初創公司Isomorphic Labs,都在訓練能夠在生命科學領域進行推理和發現的系統,希望這些工具能成為出色的“生物學家”。目前來看,製藥公司擁有豐富的資料以及理解和使用這些資料的背景優勢,所以合作是當下的主流。例如,OpenAI正在與RNA疫苗先驅Moderna合作,加速個性化癌症疫苗的開發。但隨著新模型讓生物學變得更具可預測性,行業優勢的天平可能會發生傾斜。無論未來競爭格局如何變化,有一點是肯定的:AI已經給製藥行業帶來了巨大的改變。如果它能在後期臨床試驗中也取得像前期那樣的改進,那麼上市的藥物數量有望大幅增加。從長遠來看,AI為人類健康帶來的提升潛力是巨大的。也許在不久的將來,我們就能看到更多由AI助力研發的藥物,為無數患者帶來新的希望,就像一場全新的醫學革命正在緩緩拉開帷幕。 (跬步書)
矽谷炸鍋了! AI教母李飛飛萬字長文撕開行業“遮羞布”。
近期,一篇出自 “AI 教母” 李飛飛教授的萬字長文,在矽谷 AI 圈掀起軒然大波。作為曾掌舵史丹佛 AI 實驗室、憑 ImageNet 項目改寫深度學習視覺領域格局的華人頂尖專家,她此次的發聲格外重磅:“當下的 AI,不過是困在暗室裡的文字高手,能說會道卻脫離現實,本質上就是‘睜眼瞎說’。”一、李飛飛撕開AI“遮羞布”這番話看似犀利,卻精準點破了 AI 光鮮外表下的 “致命缺陷”。如今的大語言模型有多 “能打”?寫律詩、寫論文、聊量子物理,分分鐘模仿李白、杜甫的文風,邏輯縝密到讓人難辨真假。可一旦跳出文字的舒適區,面對真實的物理世界,AI 就立刻 “露餡”:讓它估算桌子到門的距離,全靠蒙;讓它預測杯子轉 90 度後的模樣,純屬猜;就連那些刷屏的 AI 生成視訊,仔細看全是破綻 —— 人物突然多根手指、物體莫名穿牆而過,說到底,都是 AI 不懂物理規律的必然結果。二、AI未來:不在大模型,在嬰兒本能李飛飛教授毫不避諱地指出:AI 行業已經走偏了方向。真正的突破口,從不是參數越來越龐大的語言模型,而是連嬰兒都有的 “空間智能”—— 這才是通往通用人工智慧(AGI)的唯一正道。那 “空間智能” 到底是什麼?其實就是人類理解、互動物理世界的本能。嬰兒靠抓、扔、咬,摸清物體的軟硬、輕重;你半夜摸黑起床倒水,不用開燈也能精準拿到杯子;朋友扔來鑰匙,你不用算拋物線就能穩穩接住。這些看似簡單的動作,背後藏著對空間、距離、物理規律的深層認知。更關鍵的是,人類文明的諸多重大突破,都離不開 “空間智能”:埃拉托斯特尼觀察影子長短,算出了地球周長;沃森和克里克搭 3D 模型,破解了 DNA 雙螺旋結構;建築師設計摩天大樓、科學家推演星體運動,本質上都是在運用對空間和物理規律的理解。而這些,是只會 “玩文字” 的大語言模型永遠做不到的。三、AI要“懂”世界:先建世界模型既然空間智能這麼重要,怎麼讓 AI 擁有它?李飛飛給出了核心方案:讓 AI 從 “語言模型” 轉向 “世界模型”。一個合格的世界模型,必須具備三大核心能力:首先,能生成符合物理定律的虛擬世界,不是天馬行空的虛構,而是遵循重力、摩擦力等基礎規律;其次,能整合文字、圖像、動作等多種資訊,不僅聽得懂你說的,還能看懂你做的;最後,也是最關鍵的,能精準預測互動結果 —— 比如知道推杯子會倒、扔球會落地,這才是 AI “看懂” 世界的關鍵。要做到這些,比訓練大語言模型難得多。語言是一維的、線性的,可世界是四維的 —— 三維空間加時間,還受無數物理定律約束。但一旦突破這個難關,AI 的能力將實現質的飛躍。四、空間智能AI:能幫人類做什麼?李飛飛團隊早已用實踐證明了空間智能的潛力:他們研發的 “抹布模型”,能讓電影製作人、遊戲設計師僅憑文字描述,就生成可互動的 3D 世界。不用學複雜的建模軟體,普通人也能當 “造物主”,搭建屬於自己的虛擬場景。這還只是開始。當 AI 真正擁有空間智能,生活將迎來巨變:機器人不再是笨拙的機器臂,能在模擬環境中學會上萬種技能,走進家庭做飯、照顧老人,走進醫院精準手術;教育領域,學生能 “穿越” 到古羅馬街道學歷史,“鑽進” 細胞裡看生物結構;科學探索中,AI 能模擬深海、外太空,幫人類探索無法抵達的領域。正如李飛飛所說:“AI 的終極目標從不是取代人類,而是為人類賦能。現在的大語言模型只是起點,真正的智能,是讓機器理解物理世界。”(AI行銷峰雲)
精讀筆記:李飛飛-從文字到世界:空間智能是AI的下一個前沿
李飛飛博士於 2025 年 11 月發表長文《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》。這是其深耕 AI 領域 25 年的重要思考結晶。全文以圖靈 “機器能思考嗎” 這一經典問題開篇,指出當前以大語言模型為代表的 AI 雖在抽象知識處理上成績斐然,卻存在脫離現實物理世界的短板。文章系統闡釋了空間智能的定義與核心價值,將其定位為支撐人類認知、創造力與文明進步的核心能力,同時提出建構具備生成性、多模態性和互動性的 “世界模型” 是解鎖空間智能的關鍵,還勾勒出空間智能從賦能創意到革新機器人技術,再到推動科學醫療突破的應用演進路徑,為 AI 下一個十年的發展指明了方向。In 1950, when computing was little more than automated arithmetic and simple logic, Alan Turing asked a question that still reverberates today: can machines think? It took remarkable imagination to see what he saw: that intelligence might someday be built rather than born. That insight later launched a relentless scientific quest called Artificial Intelligence (AI). Twenty-five years into my own career in AI, I still find myself inspired by Turing’s vision. But how close are we? The answer isn’t simple.1950年,當電腦還僅僅停留在自動化運算和簡單邏輯運算的層面時,艾倫・圖靈提出了一個至今仍能引發廣泛共鳴的問題:機器能思考嗎?他能洞察到常人未及的可能性,這需要非凡的想像力 —— 智能或許有朝一日能夠被創造出來,而非天生就存在。這一深刻見解隨後開啟了一場名為人工智慧的不懈科學探索。在我投身人工智慧領域的第二十五個年頭,圖靈的這一願景依舊在不斷給予我啟發。但我們如今距離那個目標究竟還有多遠?答案並非簡單就能說清。以 AI 領域的源頭性問題切入,奠定了全文的思辨基調。李飛飛通過回溯圖靈的經典疑問,既致敬了人工智慧的啟蒙思想,又巧妙地引出了核心矛盾 —— 經過數十年發展,AI 仍未完全實現 “機器思考” 的終極目標。她強調智能 “可被建構” 的核心觀點,既是對後續探討空間智能 “可被研發” 的理論鋪墊,也暗示當前 AI 發展尚未觸及智能的核心本質,為後文批判大語言模型的侷限性埋下伏筆。Today, leading AI technology such as large language models (LLMs) have begun to transform how we access and work with abstract knowledge. Yet they remain wordsmiths in the dark; eloquent but inexperienced, knowledgeable but ungrounded. Spatial intelligence will transform how we create and interact with real and virtual worlds—revolutionizing storytelling, creativity, robotics, scientific discovery, and beyond. This is AI’s next frontier.如今,以大語言模型為代表的前沿人工智慧技術,已經開始改變我們獲取和運用抽象知識的方式。然而,這些模型就如同在黑暗中雕琢文字的匠人:能言善辯卻缺乏實踐經驗,學識淵博卻沒有堅實的現實根基。而空間智能將徹底改變我們創造以及與現實和虛擬世界互動的模式 —— 它會給敘事創作、創意設計、機器人技術、科學發現等諸多領域帶來革命性變革。這,正是人工智慧的下一個前沿陣地。這裡點出,當前 AI 的核心短板並拋出全文核心論點。作者用 “黑暗中的文字匠” 這一形象比喻,深刻揭露了大語言模型的致命缺陷:僅擅長文字層面的資訊處理,卻脫離對物理世界的真實感知與互動能力。同時,她明確將空間智能定義為 AI 的下一個前沿,打破了當下 AI 研發集中於文字多模態擴展的侷限,為行業指出了從 “語言理解” 向 “世界感知” 跨越的全新方向。The pursuit of visual and spatial intelligence has been the North Star guiding me since I entered the field. It’s why I spent years building ImageNet, the first large-scale visual learning and benchmarking dataset and one of three key elements enabling the birth of modern AI, along with neural network algorithms and modern compute like graphics processing units (GPUs). It’s why my academic lab at Stanford has spent the last decade combining computer vision with robotic learning.自進入人工智慧領域以來,對視覺與空間智能的探索一直是指引我前行的北極星。這也是我耗費數年時間建構 ImageNet 資料集的原因 ——該資料集是首個大規模視覺學習與基準測試資料集,與神經網路演算法以及圖形處理器這類現代計算裝置一起,共同構成了催生現代人工智慧誕生的三大核心要素。同樣出於這個初衷,我在史丹佛大學的學術實驗室,在過去十年間始終致力於將電腦視覺與機器人學習相結合的研究。該段落通過結合自身學術經歷,增強了論點的可信度與說服力。李飛飛將自己建立 ImageNet 的行為、實驗室的研究方向與空間智能探索強繫結,既體現了她對這一領域研究的連貫性與執著,也從側面印證了空間智能的重要性 —— 畢竟 ImageNet 作為現代 AI 的三大基石之一,其核心價值正是為機器提供視覺感知的基礎,而這正是空間智能的重要組成部分。這一段落也為後文介紹 World Labs 的研發目標做了背景鋪墊,展現出其研究理念的一脈相承。Generative AI models such as LLMs have moved from research labs to everyday life, becoming tools of creativity, productivity, and communication for billions of people. They have demonstrated capabilities once thought impossible, producing coherent text, mountains of code, photorealistic images, and even short video clips with ease. It’s no longer a question of whether AI will change the world. By any reasonable definition, it already has.以大語言模型為代表的生成式人工智慧模型,已經從科研實驗室走進了人們的日常生活,成為數十億人用於激發創意、提升效率與日常溝通的工具。這些模型展現出了曾經被認為難以企及的能力,能夠輕鬆生成邏輯連貫的文字、海量的程式碼、高度逼真的圖像,甚至是短影片片段。如今,問題已不再是人工智慧是否會改變世界。以任何合理的標準來衡量,它都已經做到了這一點。李飛飛在此處先客觀肯定了生成式 AI 的巨大成就,避免了因強調空間智能而全盤否定現有技術的片面性。她列舉文字、程式碼、圖像等生成能力,既符合大眾對當前 AI 的認知,也為後文轉折做了鋪墊。這種先揚後抑的表述方式,能讓讀者更易接受後續關於 AI 短板的論述 —— 承認現有技術的價值,才能更好地理解為何需要向空間智能方向突破,而非停留在現有成果上。Yet so much still lies beyond our reach. The vision of autonomous robots remains intriguing but speculative, far from the fixtures of daily life that futurists have long promised. The dream of massively accelerated research in fields like disease curation, new material discovery, and particle physics remains largely unfulfilled.然而,仍有諸多目標至今我們仍難以實現。自主機器人的願景雖然充滿吸引力,但依舊停留在推測階段,與未來學家們長期以來描繪的、成為日常生活中常見設施的場景相去甚遠。而在疾病治療、新材料研發、粒子物理等領域借助人工智慧大幅加速研究處理程序的夢想,在很大程度上也尚未實現。該段落通過列舉具體場景,具象化了當前 AI 的能力邊界。李飛飛選取自主機器人、疾病治療、新材料發現等具有高關注度的領域,這些領域的共同特點是都需要 AI 具備對物理世界的感知、推理與互動能力 —— 而這正是大語言模型所欠缺的。通過指出這些大眾與行業期待已久的目標尚未達成,有力地論證了單純依靠現有技術遠遠不夠,進一步凸顯了研發空間智能的必要性與緊迫性。Spatial intelligence is the scaffolding of human cognition. It operates when we passively observe or actively create. It drives our reasoning and planning, even on the most abstract topics. And it shapes how we interact—whether through language or action—with others and our environment.空間智能是人類認知體系的腳手架。無論我們是在被動觀察世界,還是主動創造事物,空間智能都在發揮作用。它推動著我們的推理與規劃能力,即便面對那些極為抽象的事物亦是如此。同時,它還影響著我們與他人、與周邊環境互動的方式 —— 無論這種互動是通過語言交流還是實際行動來實現。此處是對空間智能核心價值的高度凝練。李飛飛用 “認知的腳手架” 這一比喻,精準概括了空間智能的基礎性作用 —— 如同腳手架支撐建築一樣,空間智能是人類所有認知活動的底層支撐。她打破了人們對空間智能僅侷限於 “空間感知” 的淺層認知,指出其對抽象推理、人際互動等多方面的深層影響,這一界定極大地提升了空間智能的理論高度,也為後文闡述建構空間智能 AI 的多元價值提供了理論依據。Unfortunately, today’s AI does not yet think this way. Despite significant advances in recent years—multimodal LLMs trained on vast troves of multimedia data have introduced basic spatial awareness, and state-of-the-art robots can manipulate objects in highly constrained settings—AI’s spatial capabilities remain far from human levels.遺憾的是,如今的人工智慧尚未具備這樣的思考模式。儘管近年來人工智慧取得了諸多重大進展 —— 經過海量多媒體資料訓練的多模態大語言模型已經具備了基礎的空間感知能力,最先進的機器人也能夠在高度受限的環境中操控物體 —— 但人工智慧的空間智能水平與人類相比,仍存在巨大差距。作者直面當前 AI 在空間智能領域的現狀,既不否認技術進步,也不迴避核心差距。李飛飛認可多模態模型和先進機器人在空間能力上的微小突破,體現了論述的客觀性;同時明確指出這些能力與人類水平相去甚遠,形成強烈對比。這種表述既避免了對現有技術的全盤否定,又為後文提出建構 “世界模型” 來突破這一差距的解決方案做了完美鋪墊,讓後續的技術路徑建議更具針對性。Building world models that unlock spatial intelligence requires something far more ambitious than LLMs: a new kind of generative model whose ability to understand, reason about, generate, and interact with semantically, physically, geometrically, and dynamically complex worlds—virtual or real—far exceeds that of today’s LLMs.要建構能夠解鎖空間智能的世界模型,需要開展一項遠比研發大語言模型更具挑戰性的工作:我們需要打造一種全新的生成式模型。這種模型在理解、推理、生成以及與語義層面、物理層面、幾何層面和動態層面均極為複雜的世界(無論是虛擬還是現實世界)進行互動的能力,都要遠超如今的大語言模型。這裡明確給出了突破空間智能瓶頸的核心方案 —— 建構世界模型,並凸顯了該方案的挑戰性。李飛飛強調這種新模型需跨越語義、物理、幾何、動態等多個維度,這一定位精準抓住了空間智能的核心需求:機器要像人類一樣綜合多維度資訊理解世界。同時,將其與成熟的大語言模型對比,既讓讀者清晰感知到研發難度,也暗示這一突破將帶來 AI 領域的下一次質的飛躍,為全文的技術構想劃定了核心方向。 (晚筀筆記)思維導圖參考:
王興興最新發聲!這將是具身智能的“ChatGPT時刻”
“未來1至2年,誰能實現這個目標,誰將擁有全球最領先的具身智能AI模型。”11月5日,宇樹科技股份有限公司創始人、董事長王興興在第八屆虹橋國際經濟論壇“人形機器人創新發展合作”分論壇上對具身智能的“ChatGPT時刻”何時到來作出前瞻判斷。在他看來,誰能在未來一兩年內實現“在80%的陌生場景中完成80%任務”的突破,誰就是全球最領先的具身智能。“比如到明年這個時候,隨便一台人形機器人到會場,你跟它交代任務,比如說‘幫我拿一杯水’或者說給某位記者朋友拿一份東西過去,它可以直接過去把這個任務完成。這個場景完全沒有預訓練過,你給的東西它也沒有看到過。”王興興舉例說。他認為,在完全陌生場景下,機器人能達到80%左右成功率,就已經掌握突破性技術了。“目前人形機器人(包括具身智能)最關鍵的還是機器人大模型(具身智能模型)的進展速度,我覺得稍微有點慢了。”王興興表示,相對去年來說,今年深度強化學習的全身運控的進步非常明顯,但在具身大模型,“端到端能幹活“的技術進步稍微慢了一點,但總體而言其對人形機器人的前景較樂觀。王興興稱,“具身機器人目前的發展階段類似於ChatGPT發佈前的1-3年左右,大家已經發現了方向,但還沒有做成可以突破臨界點的事情。為了早日實現“ChatGPT時刻”,更應該研究模型,還是收集更多的資料?王興興表示,目前在模型結構上大家做了很多嘗試,但泛化能力不夠,還需要創新。大家也需要收集更大規模的資料、質量更好的資料。但目前,對資料的採集、對資料質量的評判還非常困難。另外,他提出,模型和資料需要相輔相成,而不是一股腦採集大量資料,或者一股腦把模型做大。目前,具身智能主流模型有VLA(視訊語言動作)+RL(強化學習)模型和基於視訊生成的世界模型。王興興表示,前者可以用模擬環境做訓練,或者用真實場景做訓練,但泛化能力相對來說不是特別夠。因此,他更喜歡基於視訊生成的世界模型。然而,王興興也認為,該模型面臨比較大的挑戰。因為基於視訊生成的世界模型對算力的需求非常大,需要的算力卡比較多,所以中小型人形機器人公司往往“跑不動”,反而是一些大型AI公司、網際網路公司視訊模型的資源更加豐富,做出該模型的機率更大。 (金融時報)
人工智能時代,世界只有第一,沒有第二
大家好,我今天交流的題目是《AI管理革命正向我們走來》。01. 20世紀的管理革命與管理困境(一)第二次工業革命推動了所有權與管理權分離的管理革命AI作為一種技術,正在驅動管理和上層建築的變革。我們知道,第一次工業革命以蒸汽機、鐵路、電報為主導,在鐵路系統中誕生了第一個現代管理系統。第二次工業革命以電力、內燃機、電話為代表,促進了製造業、運輸業、分銷和零售業,以及影視廣告娛樂等產業的繁榮。技術進步以及大規模的併購發生在美國19世紀和20世紀之交,促進了企業規模的擴張和管理複雜性的增加,進而推動了股權的分散,所有權與管理權的分離,以及職業經理階層的形成。正如錢德勒在《看得見的手》中指出,科技的進步完成了第一次管理革命。第一次管理革命的特徵就是我上述的三點:(1)股權的分散化,這是由於大規模併購所推動的;(2)所有權與管理權的分離:創業者不管是到年齡了,還是其他原因,最終要把企業的控制權——即通常所說的管理權——要交到職業經理人手上( 3 )職業經理階級(3)開始形成職業經理人。用錢德勒的話來說,美國企業在職業經理人手上獲得了長足的發展。因此,不管是錢德勒的《看得見的手》,還是格林斯潘的《繁榮與衰退》,主要兩個核心觀點:一是股權分散;二是職業經理人階級的形成。(二)第三次工業革命推動了以資訊科技為基礎的管理革命自科學管理運動以來的一百年中,企業的生產力得到了大幅提升,以電腦、互聯網和行動通訊網路為代表的第三次工業革命使得標準化、流程化、自動化大規模客製化以及資訊系統普及,實現了以資訊科技為基礎的管理革命。但我們看到一個現象:阻礙生產力提高的一般性難題在這三次工業革命中都已經被逐一克服了(所謂“一般性難題”,就是可見的這工具和方法能解決的管理問題),生產力的提升越來越集中在最深層的難題,最難啃的骨頭上。(三)產業的難題與傳統技術與管理的困境企業生產力的提升服從帕累托定理:80%的效益成長依賴20%難題的解決。1.鋼鐵業-高爐的穩定性。以寶武集團為例,煉鋼成本裡70%裡煉鐵成本,高爐不穩定是最大的問題,如能提高前端輸入參數,對輸出鐵水溫度及矽含量預測的準確性,就能提升高爐的穩定性。這是一個百年世界難題。而每噸鋼在煉鐵環境省1塊錢,光是寶武一家的產量就能省下幾億元,因為鋼產量已經是1、2億噸。2.電力產業的困擾:中低端配電網管理的複雜性。電力產業業務重點現在逐步轉向中低壓配電網的建設,由此帶來的需求變化主要表現在:(1)數位化改造設備規模大,僅國網就有470萬台區,480萬的充電樁,8000萬開關,4.3億計量表,300GW分佈式太陽能裝機量。 (2)數位化程度低,有三個老大難問題:「貴」(人工逐站運檢,1500元/站/年)、「難」(故障難查,故障位置不清楚)、「慢」(被動回應,平均30分鐘受理時間) 。 (3)新能源的爆發:太陽能和風電介入電網以後,給電網企業帶來了負載增加,不可預測,無法消納的情況。3.水泥產業的硬骨頭:熟料強度的即時精準預測。2024年4月,海螺水泥與華為礦山軍團計畫組從200個水泥生產場景中辨識出「水泥品質預測循優,水泥生產全域優化,安全生產智慧監控,皮帶機無人巡檢,智慧裝備問答」五大核心人​​工智慧場景。其中最基礎、最關鍵的場景,也是最難啃食的骨頭,就是「熟料強度品質指標的即時預測」。現有的手段和方法在解決此項難題方面已經達到了極限。4.油氣勘探產業的短板:勘探地震資料的處理和解釋。例如,把一個地塊的地震資料處理和解釋,人工需要十幾天的時間,而且嚴重依賴專家的經驗和判斷。再例如中油的FWI (全波形反演,一種高解析度地震成像技術),儘管中石油東方物探已經佔了全球石油勘探近70%的份額,但這都是石油勘探的苦活、累活、髒活,而在高解析度地震成像數據的處理和解釋上,還需依賴美國等公司的設備,與美國競爭對手存在明顯的差距,嚴重製約了企業的效益。我們幹髒活,累活,苦活,是我們的企業在國際化過程中很普遍的存在,原因是核心技術沒有突破。5.煤礦業的老大難:煤礦的痛點就是安全、減人、提效。煤礦現在下井員工的平均年齡為45歲,50歲以上不再允許下井,整個產業都面臨的問題,就是招不到礦工下井採煤。雖然現在都是用機械化採煤了,但井下作業的環境如粉塵、光線昏暗等一系列工作條件,使得年輕人不願意下井。煤礦井下主要生產業務可概括為採煤-掘進-機電-運輸-通風加排水,煤礦生產的痛點就是「減人、安全、提效」。以運輸為例,指的是主煤流透過皮帶運輸機將礦井下的煤運送到井上。作為煤礦的“大動脈”,運輸一旦出了問題就會導致整個礦井停工,因此每個礦區都配有專人專崗,保障煤流運輸系統的正常運作。類似上述的產業生產力難題已經是現有手段攻不破的難題,我之所以稱之為“硬骨頭”,也是這個道理。科學管理和持續改進經過一個世紀的發展,正面臨邊際效應遞減的困境。這恰恰是基於AI大模型聯合創新的用武之地。02. 21世紀管理的大趨勢是AI驅動的管理革命(一)AI是我們面臨的最重要的一場管理革命,也是最後一場管理革命21世紀的管理挑戰是什麼?解決類似上述提到的產業生產力的難題是21實際管理面臨的最大挑戰。現在看得越來越清楚了,解決上述難題的鑰匙是人工智慧,這是一場AI驅動的管理革命。AI也許是人類最後一個科技革命時代,AI驅動的管理也許是人類最後一場管理革命。為什麼要這麼講?我引用華為總裁任正非的話來說,黃仁勳說AI是這個時代最重要的技術,有人問我他說得對嗎?我說還會有下一個新時代嗎?下一個科技革命時代我是想像不出來了。正如穀德所說,第一台超智慧機器是人類最後一項發明,如果沒有下一個時代,如果談彎道超車?中國企業的機會在那裡呢?AI是我們面臨的最重要的一場管理革命,也是最後一場管理革命。在這場管理革命中要能跟上,不落伍,才是企業長期生存的關鍵。如果這個事情做不好,其他的都免談。(二)數位化和智慧化管理革命有兩個重要的方向第一,面向個人,即ToC領域的革命,把人的視野和智力無限擴大,把人從簡單的、重複的操作中解放出來。這種解放對​​於不同的人,就產生了不同的命運:勝任者可能處於更優越的地位,不勝任者就被大量裁撤。例如美國港口工人協會的罷工,其訴求是不在港口中採用無人AI自動化裝置,這會導致大量工人失業。華為在天津港做了一個無人的港口,不但效率提升了,品質提升了,而且節省了1200個員工。但天津港局並沒有把員工裁掉,而是把他們重新配置到顧客介面。這做了一個很好的示範,既推動了AI革命,同時又消化了AI革命所帶來的員工裁撤難題。第二, 面向產業,即ToB領域的革命,將針對解決橫亙在產業中的模糊性、不確定性難題,更深刻地改變產業的面貌。這是華為AI的重點。華為也搞ToC人工智慧,例如消費者BG,“BG”直譯是“集團”,也可以翻譯成“業務群”——因為整個企業叫集團,下面只是一個群組。在人工智慧應用領域,美國的人工智慧應用基本上就是ToC這塊很厲害,因為它的製造業已經空心化,而我們的人工智慧應用除了ToC,正是面向ToB領域。中國如果把這一仗打勝,那中國在世界上製造業的地位就不可同日而語了。因此,關鍵在於我們在關鍵技術及產品和軟體方面是不是準備好了?企業的領導人是不是下定決心「壓強投入」了?03. 華為的實踐:用燈塔照亮前進道路華為公司透過軍團等組織形式,在中國做出燈塔項目,向世界拓展,走出了一條非常富有策略性的前進道路。我舉幾個例子來說明。(一)鋼鐵業的成功合作案例華為和寶武集團合作的高爐模型,在這種大時延、高難度情況下把高爐爐溫和矽含量預測的準確率提升到92%以上,每噸鐵水節省10元以上,別小看了這10元的節省,僅寶武的產量,就能省下幾十億元。該計畫獲得國資委高價值場景認可;湘鋼、南鋼、永峰鋼鐵等都已經全面推廣複製。寶鋼高爐專家又結合與華為聯創的預測結果反過來去調整控制高爐輸入的內容。湘鋼AI大模型創新在2024年「人工智慧向善全球高峰會」上獲得國際電信聯盟全球人工智慧優秀創新案例獎。(二)電力產業的成功合作案例華為和陝西國網電力公司合作了六年,解決新能源連接到電網中以後帶來的難題。陝西國網和廣西南網都與華為軍團合作,實施配網數位化、智慧化改造,同時向業界首次發布配電網數位化評估指標標準,包括覆蓋率、線上率、完整率、成功率、辨識率、準確率。管理上有一條規則,叫「不能度量就不能管理」。所以,能夠準確且清楚地測量這個過程和結果,就能推動管理變革的改進。以陝西國網路為例,目標是打造一套可複製、可推廣、可演進的新型智慧配電網端到端解決方案,其核心是一套智慧物聯體系架構三大核心技術,包括雙模+融合終端+人工智慧,以及N個場景應用。實現配電網全要素(包括運作、故障、現損、計量、靈活異常監測、拓撲、運作、消納,以及計算等)透明化,提升供電可靠性和電網安全運行水平,支撐基層用電客戶雙滿意和國家的雙碳戰略。(三)水泥產業的成功合作案例華為在水泥產業和海螺水泥合作創新的成果非常顯著。世界水泥看中國,中國水泥看海螺,海螺是中國水泥中經濟效益、品質最好的企業,被用在國家許多重點項目。早在2024年4月,海螺水泥就與華為礦山軍團合作,從200多個水泥生產場景中辨識出「水泥品質預測尋優、水泥生產全域最佳化、安全生產智慧監控、皮帶機無人巡檢、智慧裝備問答」5大核心人工智慧場景。基於華為的數位轉型諮詢、雲端平台、盤古大模型的工具平台,推動了海螺水泥集團的智慧轉型,進一步優化了成本,發布了首個建材大模型。僅水泥窯爐優化一項,噸熟料煤耗降低了1%,水泥熟料品質預測準確度達到85%以上。由於產量大,效益非常顯著。2025年4月23日,由中國建築材料聯合會、海螺集團、華為聯合舉辦的水泥建材人工智慧大模型成果發布會,會上發布了建材的AI大模型,這是水泥建材行業全球發布的首個大模型,對行業智能化轉型具有里程碑意義。(四)油氣探勘產業的成功合作案例中石油東方物探公司透過與華為油氣軍團的合作,把一個地塊的地震資料處理和解釋從原來的需要十幾天時間,縮短到現在幾個小時就能走完,而且品質得到了專家的一致認可。再例如中油的FWI(一種高解析度的地震成像技術)效率提升了20倍,FWI的創新也是基於華為無線領域的積累,雙方聯創的結果彌補了中石油東方物探與美國競爭對手的差距。現在,此能力已融入他們自研的軟體,再配上華為的鯤鵬晶片,做成一體機,已經可以和西方廠家同台競爭了。(五)煤炭產業的成功案例仍以剛才提到的運輸環節生產過程改善為例,應用華為的視覺分析AI技術,突破了煤礦井下運輸的難題。眾所周知,AI辨識的異常樣本越多,檢測效果越好,但是煤礦井下光線暗,粉塵多,要把皮帶上的異物如錨桿、木頭、工字鋼等多種異常樣本全部收集起來難度很大,他們遇到的是煤礦業做AI設計的共性難題——缺少樣本。最後,專案團隊提出了一個新的解決方向——非正常即異常,沿著這個創新的解決方向,專案工程師們把需求和方案的設計初稿傳遞給雲EI(企業智慧)產品線,EI給他們推薦了盤古大模型技術,該技術主打的“低門檻AI開發和零樣本、小樣本優勢”,非常契合煤礦行業的井下作業場景。最終,專案實現了減少20-30%的井下作業人數、「用機器代替人」的減人目標。上述都是技術含量很高,在解決難題上有所突破、有所進展的典型案例。因此,對產業數位化、智慧化系統應用有著巨大的改造空間,當然還需要經歷很長的聯合創新過程,可能要10年、20年長期的創新過程。產業數位化、智慧化系統性的優化還是非常困難的,需要客戶夥伴和華為的持續努力,還需要很長的聯合創新過程,不是一蹴而就。華為公司從2018年起,已經陸續成立了9個產業數位化智慧化軍團,全面涵蓋油氣鋼泥冶礦、智慧化交通、數位金融、智慧電力、製造與大企業、智慧化公用事業、智慧化政務、網路服務供應商、智慧園區領域。這幾年的重點集中在大企業數位化智慧化的「燈塔」專案上,做出成功的模式,樹立產業標竿。然後與生態合作夥伴一起,將「燈塔」的成功模式向產業推廣,並逐步向國外擴展。04. AI科技驅動的管理革命的特徵第一,AI時代,數據價值發生了本質變化。AI智慧時代,AI的訓練和推理需要資料的高效使能,資料的價值發生了本質的變化,不再是冷資料、沉睡的資料。因此要求特別關注數據的質量,克服數據孤島,建立統一的數據底座。第二,AI是最後一次科技革命,也將帶來徹底的管理革命。古德認為超智慧機器可以設計出更好的機器,而人類的智慧將遠遠落後。因此,曾經的管理定義是同別人一起,或透過別人來實現組織目標的過程。而未來的管理將是與AI一起,或透過AI實現組織目標的過程。管理從定義上都會發生根本性的變化。第三,在人工智慧時代,世界只有第一,沒有第二。任總講,在人工智慧時代,世界只有第一,沒有第二。現在還在混戰的、內捲的領域,將來都會被先進企業的人工智慧橫掃。 「你們可以參考Google的人工智慧如何評估心臟健康,Google是靠千萬次、億次的機器學習才找到標準模型,並將這個心臟模型開放出來,全世界都在使用,世界上不再需要第二個模型了。在AI領域,對任何產業來說,就是突破和解決最尖端的那一點,抓住一個,紮實實實做好這一個,一旦突破,一覽眾山。AI要抓住解決產業難題的牛鼻子,不只是節省人工,關鍵在於提高競爭力。05. 巨大的機會和巨大的挑戰第一,我們在面臨巨大的機會和巨大的挑戰,AI在產業的應用是中國企業的巨大機會,也是巨大的挑戰;第二,減人不是增效的主流,要做就要做最難的。減人只不過是結果;第三,創新的本質不僅是降低成本,更是創造價值。把成本放在第一位,是一種收斂的管理;把創造價值放在第一位,才是一種開放的思考;第四,未來的競爭是生態圈的競爭。對廣大中小企業來說,要長久生存就要進入領導企業的生態圈。要是進不去領導企業的生態圈,被邊緣化,企業就不可能長久生存。AI科技與管理革命正向我們走來。星星點燈,最後點燃浩瀚的星空。謝謝大家! (華夏基石e洞察)
李飛飛 vs 施密特:超級智能,3年之內?還是遠未開始?
(沙烏地阿拉伯峰會,李飛飛vs施密特:關於超級智能的兩種未來)2025 年 10 月 29 日,沙烏地阿拉伯首都利雅德。在一場匯聚全球政商領袖的峰會上,史丹佛AI實驗室創始人李飛飛和前Google CEO 艾瑞克·施密特(Eric Schmidt)坐上了舞台中央:超級智能,真的要來了?我們來得及準備嗎?這不是泛泛而談的未來暢想,而是一場圍繞 AI 極限、財富重構、人類命運的真實交鋒。施密特給出激進判斷:超級智能可能 3 年內到來,將重新洗牌全球權力與財富。李飛飛則反問:AI連牛頓都成不了,真正的超級智能可能遠未開始。一個說 3 年,一個質疑能否實現。兩位頂級 AI 思想者給出了截然不同的答案。如果 AI 真是人類最後一項發明,你準備好了嗎?第一節|超級智能是什麼?兩人給出了截然不同的答案在這場對話的一開始,主持人問題就是:“超級智能到底是什麼意思?它什麼時候會到來?”李飛飛和施密特的回答,走向了兩個完全不同的方向。✦ 施密特的定義:超級智能,不是一個聰明的 AI,而是比地球上所有人類加在一起還要聰明的存在。他稱之為“總和等級的智慧”。人類智能你可以理解,因為我們就是人。你有想法,有朋友,會思考,也有創造力。超級智能呢?它可能知道我們所有人知道的東西,甚至更多。施密特說:“我認識一群人,住在舊金山,他們相信超級智能在未來3~4年就可能實現。”對他來說,這已經不再是會不會,而是多快。✦ 李飛飛的回應:她沒有直接否定施密特的判斷,而是把問題轉向了智能的本質:AI這個領域從一開始就是在挑戰“什麼是智能”。 我同意,有些 AI 能力已經超過人類,比如同時掌握幾十種語言,或者擁有幾乎無限的知識量。但我們還得問:它能成為牛頓嗎?它成為愛因斯坦或者畢加索嗎?兩種答案的分歧點在於:施密特看的是“能力堆積”:只要把知識堆得足夠高,智能就能超越人類;李飛飛看的是“創造力起點”:真正的智能,是在混沌中找到突破的那一刻。✦ 為什麼這場定義之爭重要?因為它決定了:我們是在製造工具,還是在創造“另一個物種”?施密特相信:技術突破很快就會跨過那條線。李飛飛提醒:別太快以為我們已經懂了智能的本身。如果我們連“超級智能到底是什麼”都還沒有共識,那我們該如何準備它的到來?這不只是學術之爭,而是關乎未來方向的根本選擇。第二節|AI能不能像牛頓一樣“發現”?第一節提出了一個問題:AI 能不能成為牛頓?現在,施密特和李飛飛要解釋:為什麼不能。施密特給出了一個技術層面的回應:假設你把 1902 年全世界能找到的科學知識,全都塞進一台電腦裡。問題是:它能發明相對論嗎?答案是不能。他解釋說,現在的 AI 在處理邏輯時,有個盲點:它不會把一個結論立刻反饋給自己,然後繼續往下推理。比如,一個數學家證明了一個定理,會立刻根據這個結果去想下一個問題。但 AI 不會。它記住了,卻不會用來連續推導。“今天的 AI,在做推理時不會像人那樣反覆思考,它只是做完就停了。”李飛飛從另一個角度補充:我們已經能讓 AI 做很多事情,但你把所有行星的運行資料喂給它,它還是沒法像牛頓那樣,自己推匯出“萬有引力”。施密特也承認這一點。也就是說:AI 擅長處理大量資料,效率很高;但它沒有“頓悟”能力,也缺少跨領域聯想的直覺。現在的 AI,大多數時候還是個超級助理:它可以整理資訊,但跳不出資訊本身。李飛飛最後強調了一點:人類最了不起的能力,是能提出別人沒問過的問題。她認為,這才是未來AI是否真正進化的關鍵。所以,如果我們要用 AI 解決未來的科學難題,就必須回答一個問題:它只能複述答案,還是能像科學家那樣,重新提問?無論是藥物設計、物理猜想,還是氣候預測,都繞不開這個問題。而從這段對話看,至少今天,它還做不到。第三節|效率會提升,財富不會共享如果 AI 真的越來越強,那下一個問題就是誰能從中受益?主持人提出了一個大膽的預設:AI 如果走向超級智能,我們會不會進入一個後稀缺社會(Post scarcity society)?就像有了Google搜尋之後,每個人都能免費獲取知識,那是不是也能人人用上 AI,享受醫療、教育、交通這些服務?聽起來很理想,對吧?但施密特卻先潑了盆冷水:“這是個非常美好的想法,但現實可能沒那麼平均。”AI 帶來的好處,可能會集中在少數人手裡。他用的是經濟學裡的說法:“網路效應”。意思是越早開始用、越有資源的一方,就越容易把優勢變成壟斷。他說:“每家使用 AI 的公司,幾乎都提升了效率。效率高了,財富就會增長。但增長的財富,是不是所有人都能分到?很可能不是。”在沙烏地阿拉伯,AI 只要把石油網路裡的調配最佳化 10%,這個國家就能節省數十億美元。又比如,在醫療和藥物開發中:AI 能加快新藥審批,降低試驗成本。做得快,做得準,企業就更賺錢。這些都是真實收益。但他緊接著說:你可以想像,這些收益只會集中在少數幾個國家、少數幾家公司,還有那些資本集中的人手裡。李飛飛也認同 AI 能提升效率,但她特別提醒:效率不等於共同繁榮。你得承認,技術本身不會主動去解決分配的問題。換句話說,AI 能把事情做得更好更快,但有錢買、會使用,才是真正的門檻。所以誰會落後?施密特點名了一個最危險的區域:非洲。他們沒有穩定政府、強大大學體系、關鍵工業結構,很多地方將難以參與這場 AI 革命。他直言:“它們已經落後很多年了,而現在,可能會被甩得更遠。”就算在歐洲,也存在問題。他說,能源貴、資金難拿,很多國家想建 AI 資料中心,卻根本負擔不起。他的建議是:不行就找合作方。比如法國就與阿布扎比合作,用別人的資源來建設 AI 能力。李飛飛也強調了同一件事:“每個國家都該投資人才、技術和教育生態,不能靠別人。”她沒有說 AI 一定讓世界變得更公平。相反,她的意思是:誰不投入,就會被落下。AI 不會自動把紅利送到你手裡。想要從中受益,就要儘早準備,國家如此,個人也如此。而不行動的,會被遠遠甩在後面。第四節|AI 到底是來幫人,還是來替人?討論完 AI 能做什麼,該問問人類還剩什麼了。樂觀的人說它能提高效率,悲觀的人擔心它會取代所有崗位。主持人把問題擺到了檯面上:如果超級智能能做所有的科學研究、經濟決策、生產設計……那人類在這個世界裡,還剩下什麼角色?✦ 施密特:人類和AI,會組成“搭檔組合”他不是那種完全樂觀的人,但他始終堅持一點:未來真正強大的,不是 AI 單打獨鬥,而是人類和 AI 的組合。他說了一個賽車例子。我們都知道,機器人能開得比人快。但為什麼 F1 比賽我們還是想看真人在開車?因為人類有不可替代的魅力,我們就是想看人做到的事。他的意思是,那怕 AI 技術全都到位,人類的好奇心、審美和創造衝動,也不會被替代。我們會想看人類在挑戰邊界,而不是機器演示流程。他甚至想像了一幅畫面:“以後可能會出現兩種比賽:一種是人類之間的,另一種是 AI 之間的。 但我們會更關注人和 AI 一起完成什麼,而不是誰贏了。”✦ 李飛飛:AI再強,也不能忘了“人的能動性”她的回應,情緒更強烈,底線更清晰:我非常擔心,在超級智能的討論中,我們會忘記人類的價值。她強調了兩個關鍵詞:尊嚴和能動性。無論技術走多遠,都必須記住,這個世界不能讓人類被邊緣化。人必須始終是中心。她說,那怕 AI 再聰明、再全面,也不能讓它替我們做選擇。兩人的分歧很清楚:施密特願意讓 AI 干更多事,但人類不會因此失去價值。李飛飛堅持:那怕 AI 做得再多,決定權也必須握在人手裡。歸根結底:誰來定義未來?是 AI,還是我們自己?第五節|李飛飛在做什麼?重建現實世界前面討論的都是超級智能會帶來什麼影響,但 AI 具體會以什麼形態進入我們的生活?這是李飛飛正在做的事。主持人問:我的14歲兒子已經把大部分時間花在虛擬遊戲裡了。等 AI 越來越強,我們是不是都要搬進虛擬世界?李飛飛給出了肯定的回答:“是的,我們未來的生活,會更像一個多元宇宙。不是離開現實,而是現實和虛擬會完全混在一起。”✦ 這不是科幻設想,而是她正在做的事World Labs,李飛飛創立的新公司,專注建構世界模型。她說:人類不光有語言能力,還有一種空間智能。我們能看懂三維世界,能想像空間、動作、因果關係。而過去的 AI 只學語言,沒辦法理解這些。於是她就幹了這件事:訓練 AI 理解空間、物理和互動,就像人一樣。現在,她的團隊的最新成果叫:RTFM。它的全稱是 Real-Time Frame Model,意思是 AI 能即時生成 3D 場景,而且還能記住它自己生成的世界是什麼樣。這不是做一段視訊,而是建構一個你可以走進去、可以互動的持久空間。✦ 那這個“世界模型”能用來幹嘛?她舉了幾個非常具體的例子:醫療手術訓練:未來醫生不一定非要在人身上練習,而是可以在AI建構的手術空間裡反覆演練教育場景:孩子可以進到AI生成的古代城市,邊學歷史邊親身體驗城市規劃:建築師可以把一整座新城區在 AI 中預演一遍,再決定要不要修換句話說:我們未來的大量工作、學習、娛樂,都會發生在這些 AI 生成的世界裡。✦ 這不是逃避現實,而是重新建構現實李飛飛認為,AI 正在從輸出文字進化到建構世界。而這個世界,不是用來看一眼的,而是用來生活的。施密特也認同這個方向。他甚至預測:“未來某一天,AI 可能會告訴我們:‘我需要更多能源,我自己來設計一種新方式。’那就是 AI 開始自己推動物理世界的轉型。”說到底,這是 AI 角色的轉變:過去,AI 是回答者;現在,AI 是建構者;未來,AI 可能會成為世界的重組者。我們正站在這個轉折點上。結語|你是觀眾,還是參與者?施密特說:超級智能可能 3 年內出現,從研究、能源到軍事、政策,都會被重寫。李飛飛說:AI 連萬有引力都推導不出來,真正的超級智能可能遠未開始。3年,還是遠未到來?這不只是時間判斷,而是關於 AI 本質、人類角色、未來主導權的根本分歧。但無論答案是什麼,有一點是確定的:不是 AI 有多強,而是人類準備得夠不夠快。現在,你得問自己:如果 AI 真的在改變一切,你是觀眾,還是參與者? (AI深度研究員)