News
2025.01.14
知財ニュース
NVIDIA、物理世界で動くAIの開発基盤「Cosmos」発表―ロボットや自動運転車の開発を支援
米NVIDIAは、ロボットや自動運転車などに用いるフィジカルAIの開発プラットフォーム「NVIDIA Cosmos」を発表した。2025年1月6日(米国時間)、テクノロジー見本市「CES 2025」(米ラスベガス)の基調講演にジェンスン・ファンCEOが登壇。開発者が自由に使えるオープンな基盤として提供すると明らかにした。
ロボットなど物理世界で動くプロダクトには、フィジカルAIモデルの開発が欠かせない。現実世界で起こり得る多様なシミュレーションや判断精度を高める強化学習を重ね、正確に指示や状況を理解して複雑なタスクを自律的に行えるモデルを構築する必要がある。そのためには、膨大な量の現実世界データや高い計算性能が必要になり、膨大なコストがかかる。
「Cosmos」では、テキスト・画像・ビデオなどの入力と、ロボットセンサーまたはモーションデータを組み合わせて、物理ベースの合成データを生成できる「Cosmos世界基盤モデル(WFM)」を提供する。ロボット工学や自動運転など関連分野から2,000万時間のデータを含む9,000兆トークンでトレーニングされた生成AIモデルで、開発者サイドでの調整や新しいモデル構築もできる。
併せて、従来の主要製品よりも12倍速い処理速度で画像やビデオをトークンに変換するビデオトークナイザーや、動画処理やラベル付けなどを高速処理できるデータ処理パイプラインを搭載。ビデオデータの収集・整備が可能なキュレーション機能もあり、倉庫や工場の現場環境、道路状況などの物理世界を反映した合成データを素早く生成できる。悪質なプロンプトには応じないガードレールも導入している。
合成データの生成やシミュレーションは「NVIDIA Omniverse」と連携して行う。「Omniverse」は、デジタルツインアプリケーションの開発を支援するプラットフォームだ。画像やビデオなどのデータを取り込んで、実在する空間を仮想空間として構築できる。仮想空間を利用してリアルタイムの動作シミュレーションなどが可能。「Cosmos」と連携してコンピューター上に物理世界を反映し、フィジカルAIモデルの強化学習や性能評価を効率的に行える。
例えば、自動運転のシミュレーションに必要な、時間帯や天候状況で変わる道路の合成データを生成してトレーニングすることが可能。また、倉庫内の物の落下やロボットの自律走行、ヒト型ロボットの動作などのシミュレーションや訓練ができる。
「Cosmos」は一部企業ですでに利用されている。ヒューマノイドロボット事業を展開する1X TechnologiesやFigure AI、アームロボットのAgile Robotsなどロボット関連企業のほか、自動運転事業を手がけるUber、Waabi、Wayveなどが採用。UberはNVIDIAと提携し、保有する運転データセットと「Cosmos」を組み合わせて強力なAIモデルの構築を目指すという。
NVIDIAのジェンスン・フアンCEOは基調講演で、「ロボティクスに ChatGPT の時代が到来しつつあります。大規模言語モデルと同様に、世界基盤モデルはロボットおよび AV 開発の進歩に不可欠ですが、すべての開発者が独自のモデルをトレーニングするための専門知識とリソースを持っているわけではありません。NVIDIAは、フィジカル AI を民主化し、一般的なロボティクスをすべての開発者が利用できるようにするために Cosmos を作成しました」と説明。
「Cosmos」はオープンモデルライセンスで提供する。開発者は、NVIDIAのAPIカタログや、AI開発のオープンソースプラットフォーム「Hugging Face」などから利用できる。オープンな開発環境の提供で、ロボットや自動運転車の開発と社会実装の加速が期待される。
Top Image : © NVIDIA Corporation