No.753
2022.09.15
テキストから画像を描画するオープンソースの画像生成AI
Stable Diffusion(ステーブル・ディフュージョン)
概要
「Stable Diffusion(ステーブル・ディフュージョン)」とは、テキスト入力されたワードからAIが自動で画像を生成する、オープンソースの画像生成AIサービス。描画させたい画像の内容を文字入力すると、AIがテキストに応じた画像を数秒で作成する。また、出力できる画像はフォトリアルな画風からアーティスティックな画風まで幅広く対応し、生成した画像の複製や改変、商用利用も可能。ソースコードや学習済みの機械学習モデルは無償で公開されており、さまざまなサービスやアプリケーションへの拡張が期待されている。
なぜできるのか?
手軽に画像生成できるAIサービス「DreamStudio」
開発元のStability AI社は、「Stable Diffusion」のオープンソースβ版として「DreamStudio」を無償公開。ユーザーは描きたい画像の内容を英語でテキスト入力するだけで、AIによってテキスト内容に沿った画像が描画されるほか、画質や画像のサイズも自由に設定可能。プログラミングの知識がないユーザーでも手軽に画像の生成ができる。
パブリック・ドメインとして利用できる出力画像
生成された画像には、CC0(クリエイティブ・コモンズ・ゼロ) 1.0 Universal Public Domain Dedication が適用され, パブリック・ドメイン扱いになる。そのため、ライセンスを明記することで営利・非営利問わずに使用でき、生成した画像の権利は作成者自身が有する。また、営利目的であっても、許可を得ずに複製、改変、翻案、配布なども可能。
一般家庭にあるPCで動作可能なスペック
他社の画像生成AIよりも低スペックなコンパクト設計がなされているため、一般消費者のPC端末でも動作可能。誰もが使えるAI作画環境として構築されている。
“美しさ”重視のデータセットを使用した学習
AIの学習には、“美しさ”を重視したデータセットの「LAION Aesthetics」を使用。このAI学習データの作成は「NVIDIA A100 PCIe」40GBタイプを8基搭載した端末32台を使って、20億枚の画像とキーワードのペアを学習させた。
閲覧注意の画像を判定する「セーフティーフィルター」機能
「Stable Diffusion(ステーブル・ディフュージョン)」は、成人向けの表現などを生成すると、閲覧注意画像として黒塗りする「セーフティーフィルター」機能を搭載。画像のNSFW(Not Safe For Work: 職場で開くのに不適切)を自動で判定する。
相性のいい産業分野
- メディア・コミュニケーション
「Stable Diffusion」で生成した画像を使用した広告
- アート・エンターテインメント
「Stable Diffusion」で生成した画像を挿絵に使った「誰でも作れる絵本」サービス
- 生活・文化
生成された画像からお気に入りの作品を探せる検索エンジン
- 金融・保険
ハイクオリティなAI生成画像をNFT化して販売
- IT・通信
メッセンジャーアプリとAPI連携し、チャット内容の感情に合わせた絵文字を自動生成
- AI
独自の感性でAI絵画作品を量産する「AI描画家」
この知財の情報・出典
この知財は様々な特許や要素技術が関連しています。
詳細な情報をお求めの場合は、お問い合わせください。
Top images:© Stability AI