在今日舉行的2026台北GTC大會期間,輝達發佈了Cosmos 3——一款基於突破性Transformer混合架構的物理AI世界模型。
據悉,Cosmos 3是全球首個完全開放原始碼的全能模型(Omni-Model,也叫全模態模型)。其能夠以領先的物理精度原生理解和生成文字、圖像、視訊、環境聲音和動作,將物理AI的訓練和評估周期從數月縮短到數天。
“得益於多模態推理語言、視覺和世界模型的突破,物理AI的爆發式增長指日可待。”黃仁勳表示:“Cosmos 3將使開發者在建構機器人、自動駕駛汽車和視覺人工智慧方面實現代際飛躍,從而在物理世界中感知、推理、規劃和行動。”
在此之前,Cosmos系列平台均由多個專用模型整合而來,需要跑多個模型才能完成推理、生成、動作的過程。相比之下,Cosmos 3解決了物理AI的一個根本挑戰:使機器人、自動駕駛汽車在訓練資料有限和模擬堆疊分散的情況下,也能夠在現實世界穩定工作。
在已開放原始碼的世界模型中,Cosmos 3的世界生成精準率在Artificial Analysis、Physics-IQ、PAI-Bench和R-Bench測試中均排名第一;在動作策略方面,Cosmos 3在RoboLab和RoboArena測試中排名第一。
截至目前,Cosmos已有眾多機器人及自動駕駛領域的使用者,根據輝達披露的名單,包括思靈機器人、斗山機器人、LG 電子、三星、Skild AI、理想汽車等。值得一提的是,輝達今日宣佈推出Isaac GR00T人形機器人參考設計,將在2026年底由宇樹推出,此外也將與美國、歐洲及韓國的人形機器人製造商合作,打造研究用途機器人。
後續,Cosmos系列模型還將繼續發展,輝達於今日宣佈推出了輝達Cosmos聯盟,這是一個由世界模型建構者和AI開發人員組成的全球合作組織,其中包括思靈機器人、德國黑森林實驗室、Generalist、LTX、Runway和Skild AI,將共同致力於推進下一代世界模型的發展。
國投證券認為,物理AI是人工智慧下一步演進方向,當前仍面臨多重挑戰,包括資料成本高、物理定律難等問題。而世界模型和空間智能將為物理AI提供感知和認知三維世界的基座。
浙商證券指出,物理AI還沒有一個固定實現範式,當前物理AI需要世界模型+VLA共同實現,其中世界模型的實現方式尚未收斂。據輝達測算,物理AI對應製造與物流產業重塑空間約50兆美元;據投資機構Coatue Management測算,物理AI市場規模基準為6兆美元。 (科創板日報)
