#物理AI世界模型 | 熱門關鍵字 | 鉅亨號

2026自動駕駛最熱黑科技——世界模型，開年第一個進展，來自中國明星企業文遠知行。當自動駕駛圈關於世界模型該放在車端還是雲端爭論不休時，文遠知行給出了一個大膽的答案——為什麼不直接做“上帝”呢？這正呼應了黃仁勳此前預言的物理AI“ChatGPT 時刻”已至——通過模擬建構可學習、可互動的虛擬世界，正成為自動駕駛進化的關鍵路徑。從特斯拉的世界模型到輝達借高精模擬打造的虛擬試驗場Cosmos，行業已清晰指向：誰能建構並掌控高度擬真的數字世界，誰就能加速駛向泛化與落地。文遠知行發佈的WeRide GENESIS是一個“通用模擬模型” ，它建構起物理AI（Physical AI）與生成AI（Generative AI）之間的融合橋樑：可以無限生成、回放和變化“長尾場景”的虛擬世界系統，可以在任何時間、任何地點、任何天氣，精準還原物理世界的法則、因果——如同駭客帝國中的Matrix世界。但WeRide GENESIS又超越行業常見的“自動駕駛版Sora”內涵，在建構世界之外，還給這個世界配齊了一整套自動化的反饋、調參、部署、驗證工具。簡單地說，“上帝”創造、修改虛擬世界的方式，也AI起來了。WeRide GENESIS，是什麼？文遠知行剛剛公佈的WeRide GENESIS，是一個自動駕駛模擬平台，但更加強調通用。這意味著和以前常見的自動駕駛卡車、Robotaxi、物流小車等專用模擬環境不同，WeRide GENESIS可以支撐各種自動駕駛產品研發。這本身就與文遠知行“搏二兔”——既有量產L2+，又有無人化L4——的戰略契合。對應不同產品，WeRide GENESIS既可以模擬量產一段式端到端的L2+車輛，也能模擬Robotaxi，當然還有各種無人小巴、清掃車等等。通用的另一個含義，是WeRide GENESIS本身對於環境的精準建構，幾乎能“一句話”無限生成、回放和變化“長尾場景”：△ WeRide GENESIS可模擬任意空間內的位移，自動生成新視角模擬，指數級擴大模擬世界範圍你可能會聯想到3D遊戲開發引擎，實現各種以假亂真的視覺效果：從“渲染場景”這個角度，它的確和遊戲引擎有相似之處，但除基本場景外，其他完全不同：WeRide GENESIS不關心材質、紋理細節，也不需要“光追”等級的計算資源，更加關心的首先是場景環境的物理法則：包括光照、重力、雨霧、碰撞力學等等。第二點，則是事物、事件之間的因果關係，生成的環境場景連續、低時延、可解釋，模擬測試中的任何bad case或good case，都能反映真實情況，而且能夠根據WeRide GENESIS的反饋資料迅速歸因。一句話概括：無限生成、回放和變化“長尾場景”，系統性地驗證演算法能力。WeRide GENESIS的核心包括四大AI模組，首先是AI場景，負責建構各類關鍵情境，模擬自動駕駛車輛可能遇到的多種場景，包括臨車侵入、無保護左轉、緊急避險、行人騎手闖入、火災地震、道路受阻、極端天氣以及其他稀有事件，全面覆蓋了數十億公里的自然駕駛資料。更重要的是，文遠知行超八年來從公開道路上採集的海量長尾和極端案例，也都成為WeRide GENESIS的“創作素材”。第二個模組是AI主體，針對駕駛員、行人、騎手等不同交通參與者建構了智能行為模型，能夠模擬從日常駕駛到高風險行為的全譜系反應，也就是讓模擬環境中發生的事永遠在真實範圍內，避免產生離譜的資料影響模型行為。如對比視訊所示，在左側“原始演算法+無AI主體”的組合下，自車表現猶豫，直至對向車輛完全通過後才開始通行，無法滿足效率要求；在中間“新演算法+無AI主體”的模擬中，自車僅按預設軌跡行駛，缺乏對周邊車輛行為的預測，最後發生碰撞，無法滿足安全要求；在最右側“新演算法+AI主體”的加持下，自車能夠即時判斷周邊車輛的行駛意圖，在確保安全的前提下流暢通過，實現了效率和安全雙重保障。高精度的智能實體建模其實是行業公認的技術難題，核心在於超越“平均化”的交通參與者行為模型，真實反映客觀世界中複雜且難以預測的互動行為，例如人類駕駛員突然魯莽加塞到自動駕駛車輛行駛的車道等場景：這兩個模組配合，可復刻任意路況、可編寫任意場景、可合成任意不同感測器位置視角、可適配任意感測器套件、可模擬任意大範圍街區……另外兩個模組分別是AI指標和AI診斷，前者建立了一套覆蓋安全、合規、舒適、效率等維度的量化評估體系，能夠將駕駛行為轉化為可對比、可分析的資料表現，從而自動判定演算法迭代的實際效果。後者則能夠自動捕捉不理想的駕駛行為、分析其根本原因，並提供可執行的改進方案。四大模組協同，WeRide GENESIS建構了完整的閉環迭代體系：自動生成高價值場景、自動量化性能瓶頸、自動定位弱點環節、自動給出最佳化方向。以經典科幻IP打個比方，文遠知行扮演了《駭客帝國》中“建築師”的角色，創造了一個供AI司機訓練、實戰的無限武器庫、訓練道場：AI司機在其中的體驗、經驗，和在現實世界沒有任何不同，一顆“藍藥丸”就能快速部署到實際任務中：不過，從基本能力來看，WeRide GENESIS算得上是熱門前沿的世界模型嗎？實際上，自動駕駛、智能汽車領域關於世界模型一直有爭論：有玩家認為世界模型就是單純後端的模擬器，用於資料生成模擬訓練。尤其是端到端、資料驅動成為共識後，訓練資料的分佈、質量直接影響模型能力，但關鍵少數的困難場景資料又很難在道路實測中碰到，所以世界模型的生成能力，被認為是解決corner case，降低接管率最重要的手段。但是，也有另一派玩家把車端的系統直接叫世界模型，任務是進行即時環境認知與決策，強調的車端“平行世界推演”能力，相當於“腦內小劇場”。其實，兩派並沒有根本矛盾，屬於工程落地與宣傳上側重點不同，因為AI行業對於世界模型是有階段性共識的：從海量資料中自主提煉物理與社會規律，形成對世界運作方式的抽象理解。從這個定義出發，WeRide GENESIS當然是世界模型。只不過文遠知行的WeRide GENESIS，意義又超越常見的“自動駕駛版Sora”。WeRide GENESIS給“Robotaxi第一股”上分家家都說世界模型，但大部分玩家都把重點放在“生成”能力，比如XX秒連續視訊、XX種目標模擬等等，不自覺對齊OpenAI宣傳Sora的套路。但對於自動駕駛而言，容易被忽略的重點其實是WeRide GENESIS後兩個模組——AI指標、AI診斷。因為這是“真·資料驅動”的最直接證據。也不瞞各位，自動駕駛圈很多資料閉環，其實是“偽閉環”。一種稍微好點的，是各個演算法團隊內部的“小閉環”，代表這支團隊完成了“模型化”，但還沒有建構起統一基座模型能力。這種模式最可能出現的場景是：使用者吐槽+工作群截圖，引發老闆的不滿……接到投訴反饋的研發，連夜加trigger試圖把bad case撈上來。這是問題驅動資料，而不是資料自動發現問題。真正的資料閉環應該是這樣的：首先系統能從海量運行的資料裡自動發現異常行為，然後將問題自動歸類、建成資料集，再針對性自動進行訓練/模擬，出瞭解決方案後，系統還能自動評估效果。資料能不能回來不是關鍵，而是bug、問題能自動走完從“被發現”到“被解決並被驗證”的路徑。比如現實中因急剎車引起的乘客不適，這一行為可在WeRide GENESIS模擬中被AI指標模組，量化為具體的舒適度評分，並即時反饋給演算法團隊，推動針對性最佳化與快速復驗。再比如，當自動駕駛車輛遇到複雜互動場景中識別感知延遲或預測偏差問題，WeRide GENESIS可通過“AI診斷”功能快速修復問題，並重新進行場景驗證，確保車輛行為始終符合預期標準。△ AI診斷模組的工作流程遵循了功能路測→問題檢測→問題歸類→根因分析→演算法改進→再測試與再驗證的閉環邏輯資料閉環的真正含義，應該是安全/體驗/效率等指標被持續量化、某項指標異常偏離後，系統自動報警，以及自動聚類對應封包，把相似問題聚成“問題簇”。研發中“人”的作用，是定義和監管、決策，而不是自己徒手標註、調參、評估、部署……“資料直接解決問題”，尤其是廣義端到端技術範式普及後，自動的資料處理、反饋能力成為持續迭代最關鍵的核心能力。這看似簡單，實際是自動駕駛行業最稀缺的能力，會直接影響泛化性、效率、成本。比如GENESIS實現的“生成場景-量化評估-診斷最佳化”完整閉環，可自動生成高價值場景、定位演算法弱點、提供最佳化方向，將數百萬公里測試壓縮至數天的虛擬模擬中。有“磨刀不誤砍柴工”的意思，高效資料閉環，直接影響的是自動駕駛玩家的產品泛化性、研發效率，以及整體營運成本。文遠知行能成功融合特斯拉路線和Waymo路線，成為全球唯一實現L4級無人駕駛和L2+級輔助駕駛規模商業應用——創始人、CEO韓旭所說的“搏二兔”——除了演算法能力之外，“資料閉環能力”也是關鍵因素。所以，綜合四個模組來看，WeRide GENESIS既是評價文遠知行研發能力現狀最好的指標，也是理解“Robotaxi第一股”的一個最直接切入點。文遠知行從容“搏二兔”眼下，文遠知行已經在全球10餘座城市部署了超過1000輛Robotaxi，其中，北京、廣州、阿布扎比已實現純無人商業營運。放眼整個L4賽道，蘿蔔快跑2025年11月公佈的所有Robotaxi的最新周訂單數是25萬單；小馬智行Q3財報顯示，其Robotaxi車隊數為961台，廣州單台車日均訂單量達到23單。北美“一哥”Waymo，“被”披露的資料是車隊2500輛、每分鐘就能完成45單。至於落地廣度，文遠知行則是整個L4賽道最早敏銳意識到海外需求和機遇的玩家，並且迅速付諸行動，率先在11個國家、40多座城市開展自動駕駛研發、測試及營運，也是行業唯一拿下8個不同國家自動駕駛牌照的科技企業。截至目前，文遠知行既是中國Robotaxi出海No.1，同時還是整個自動駕駛行業落地Robotaxi場景最豐富的玩家。另一邊，2023年文遠知行首次合作博世，幫助這家百年Tier 1追趕高階智能輔助駕駛方案：落地量產奇瑞旗下的星途星紀元車型。△ 奇瑞星途星紀元ES2025年年末，文遠知行又發佈了量產一段式端到端方案，同樣是幫助博世一夜間追趕上L2+最先進技術範式。從這個層面看，文遠知行首先是整個L4賽道唯一有穩定量產智能輔助駕駛項目的玩家；另一個角度，文遠知行也是整個自動駕駛行業內，唯一一家L4、L2技術堆疊覆蓋，且都有成熟落地案例的公司。從一段式量產節奏來看，文遠知行現在同樣也處於行業內的T0梯隊。也就是說，文遠知行現在明明白白在“搏二兔”，而且搏成了行業領先。L2+、L4落地場景、技術要求各不相同，海外迅速落地數十城，環境、路況、交通規則、基礎設施標準也各不相同。這樣的泛化性，除了演算法本身，背後離不開WeRide GENESIS建構的模擬測試、資料閉環體系——文遠知行“來時路”的一部分，現在終於清楚了。更進一步，WeRide GENESIS也可以解釋文遠知行為何能“搏二兔”，在量產智能輔助駕駛和Robotaxi這兩個看似尖銳對立的陣營遊刃有餘。L2陣營緊跟的端到端，本質不是一段式、兩段式、VLA，甚至不是絕對的模型化，而是資料驅動，是一種底層方法論。資料驅動下，可以純視覺，可以融合感知，可以一段式，可以多段式，可以世界模型，也可以VLA，甚至也可以有規則存在。所以對於L4陣營來說，探索世界模型根本談不上“轉軌”，甚至Waymo早就在做。文遠知行無意參與行業爭論口水仗，只是默默開啟探索規則+模型多元技術體系，自證自動駕駛L4的安全性、L2的泛化性可以共存，符合一貫的“行勝於言”。最後，從WeRide GENESIS，又能看出文遠知行未來的可能性。資料閉環能力之外，再次回到“生成”：WeRide GENESIS本身是物理AI（Physical AI）與生成AI（Generative AI）之間的融合橋樑，真正打通“現實物理世界”與“虛擬模擬世界”之間的能力通道。讓AI從海量資料中自主提煉物理與社會規律，形成對世界運作方式的抽象理解——而這是實現通用人工智慧（AGI）的關鍵路徑之一。黃仁勳預言物理AI的“ChatGPT 時刻”已至，從文遠知行的實踐來看，這個時刻很有可能最先出現在跑通通用自動駕駛的玩家身上。 (智能車參考)