News

2024.09.30

知財ニュース

音声からリップシンク動画を数分で生成できる「SyncWaveX」を発表―唇や顔の動きを音声と自動的に同期

20240915 news06

「GD Culture Group Limited」と子会社の「AI Catalysis Corp.」が音声からリップシンク動画を数分で生成できるAIアプリケーション「SyncWaveX」を発売した。

「SyncWaveX」は、唇や顔の動きを音声と自動的に同期させ、簡単にリアルな動画が生成される。音声から動画に直接合成する方法を採用しているため、従来の3Dモデリングやフェイシャル・ランドマーク手法(顔の3Dを作成し、さまざまな表情や動きを反映するようにアニメーション化する手法)は必要ないとのこと。高度なリップシンク技術は、99%の高精度で、自然で没入感のある視聴体験が可能になる。

20240915 news06

個人の声の特徴をモデルに学習させ、元の話し手によく似た新しい音声を合成することができる。また、動画や画像内の顔を正確に検出できる高度な顔認識技術も搭載。眉毛、頬、鼻、唇など、個人の顔のあらゆる動きを綿密にキャプチャし、リアルで正確な動画を生成することができる。

20240915 news06

「SyncWaveX」は、ソーシャル メディア コンテンツからプロフェッショナルなプレゼンテーションやマーケティング キャンペーンまで、幅広い用途に最適だとしている。さらに、同社はキャンペーン広告の制作や翻訳サービス、話す能力を失った人を支援する強力なツールとしての利用も想定しているとのこと。

20240915 news06

プレスリリースはこちら

「SyncWaveX」公式サイト

Top Image : © GD Culture Group Limited

広告