News
2025.01.21
知財ニュース
NVIDIA、物理AI向けの世界モデル「Cosmos」を発表し、オープンソースを公開
NVIDIAは、CES2025で物理AI向けの世界基盤モデル「Cosmos」を発表し、そのオープンソースを公開した。
「Cosmos」は、自動運転車(AV)やロボットなどの物理AIシステムの開発を促進するために構築された最先端の「世界基盤モデル」、高度なトークナイザー、ガードレール、および高速ビデオ処理パイプラインで構成されたプラットフォームだ。
物理AIモデルの開発にはコストがかかり、膨大な量の実世界のデータとテストが必要だった。Cosmosの世界基盤モデルでは、開発者が既存のモデルをトレーニングや評価するための、大量のフォトリアルな物理ベースの合成データを簡単に生成することが可能だ。
テキスト、画像、ビデオ、動きなどの入力データを使用して、シーン内のオブジェクトの空間関係と物理的な相互作用を正確にモデル化し、仮想世界を生成およびシミュレートする。
Cosmosモデルは1X、Figure AI、Waabi、XPENGなどの大手ロボティクスや自動車会社、ライドシェアリング大手のUberなどの企業で採用されている。
Cosmosの世界基盤モデルは、Hugging FaceやNVIDIA NGCカタログでオープンモデルライセンスに基づいて現在提供されている。またNVIDIA NeMoで基盤モデルを微調整するためのエンドツーエンドのパイプラインも提供される。トークナイザーは、GitHubとHugging Faceの/NVIDIA/cosmos-tokenizerから使用することができる。
NVIDIAの創業者/CEOであるジェンスン フアン氏はCESの基調講演にて、「雪道の状況や倉庫の混雑など、ビデオデータから特定のトレーニングシナリオを簡単に見つけることが可能になる」などの使用例を紹介した。また、Cosmosモデルを使用し、同社のプラットフォーム「Omniverse」で開発した3Dシナリオからフォトリアルのビデオの生成や、AIモデルが選択する可能性のあるすべての将来の結果を生成し、最善で最も正確な道を選択できるようにすることも含まれている。
Top Image : © NVIDIA