在今日舉行的2026台北GTC大會期間,輝達發佈了Cosmos 3——一款基於突破性Transformer混合架構的物理AI世界模型。
據悉,Cosmos 3是全球首個完全開放原始碼的全能模型(Omni-Model,也叫全模態模型)。其能夠以領先的物理精度原生理解和生成文字、圖像、視訊、環境聲音和動作,將物理AI的訓練和評估周期從數月縮短到數天。
“得益於多模態推理語言、視覺和世界模型的突破,物理AI的爆發式增長指日可待。”黃仁勳表示:“Cosmos 3將使開發者在建構機器人、自動駕駛汽車和視覺人工智慧方面實現代際飛躍,從而在物理世界中感知、推理、規劃和行動。”
在此之前,Cosmos系列平台均由多個專用模型整合而來,需要跑多個模型才能完成推理、生成、動作的過程。相比之下,Cosmos 3解決了物理AI的一個根本挑戰:使機器人、自動駕駛汽車在訓練資料有限和模擬堆疊分散的情況下,也能夠在現實世界穩定工作。