News
2022.12.26
知財ニュース
画像生成AIの最新版「Stable Diffusion 2.0」がリリース─解像度向上、アダルトコンテンツ排除が可能に
Stability AI社は現地時間2022年11月24日、画像生成AI「Stable Diffusion」のバージョン2.0をリリースした。
「Stable Diffusion」は、テキスト入力されたワードからAI(人工知能)によって自動で画像を生成できるサービス。任意のテキストを入力するだけでハイクオリティな画像をAIが短時間で生成し、商用利用もできる。
「Stable Diffusion 2.0」の画像変換モデルには、同社のサポートを受けてLAIONが開発した新しい文字エンコード (OpenCLIP) を使用。以前のモデルから画像品質が大幅に向上し、512x512ピクセルと 768x768ピクセルの両方のデフォルト解像度で高品質な画像が生成可能になった。また、これらのモデルは、同社のDeepFloydチームによって作成されたLAION-5Bデータセットのサブセットでトレーニングされており、LAION のNSFWフィルターにより、アダルトコンテンツの排除が可能になった。
また、画像の解像度を4倍に高めるUpscaler Diffusionモデルを実装。生成画像の変換モデルと組み合わせることで、2048x2048ピクセル以上の解像度の画像を生成可能になった。
さらに、「Depth2img」と呼ばれる新しい深度ガイド拡散モデルにより、テキストと深度情報の両方を使用して立体的な画像を生成可能。また、新しいtext-guided inpainting modelにより、画像の一部を賢く迅速に切り替え可能になった。
同社では、本リリースがdepth2imgや高解像度のアップスケーリング機能などの強力な新機能とともに、新しい創造的な可能性を爆発させることを期待している。
Top Image : © Stability AI