No.753

2022.09.15

テキストから画像を描画するオープンソースの画像生成AI

Stable Diffusion(ステーブル・ディフュージョン)

Stable Diffusion(ステーブル・ディフュージョン)

概要

「Stable Diffusion(ステーブル・ディフュージョン)」とは、テキスト入力されたワードからAIが自動で画像を生成する、オープンソースの画像生成AIサービス。描画させたい画像の内容を文字入力すると、AIがテキストに応じた画像を数秒で作成する。また、出力できる画像はフォトリアルな画風からアーティスティックな画風まで幅広く対応し、生成した画像の複製や改変、商用利用も可能。ソースコードや学習済みの機械学習モデルは無償で公開されており、さまざまなサービスやアプリケーションへの拡張が期待されている。

2 4x

スクリーンショット 2022-09-06 001043

なぜできるのか?

手軽に画像生成できるAIサービス「DreamStudio」

開発元のStability AI社は、「Stable Diffusion」のオープンソースβ版として「DreamStudio」を無償公開。ユーザーは描きたい画像の内容を英語でテキスト入力するだけで、AIによってテキスト内容に沿った画像が描画されるほか、画質や画像のサイズも自由に設定可能。プログラミングの知識がないユーザーでも手軽に画像の生成ができる。

パブリック・ドメインとして利用できる出力画像

生成された画像には、CC0(クリエイティブ・コモンズ・ゼロ) 1.0 Universal Public Domain Dedication が適用され, パブリック・ドメイン扱いになる。そのため、ライセンスを明記することで営利・非営利問わずに使用でき、生成した画像の権利は作成者自身が有する。また、営利目的であっても、許可を得ずに複製、改変、翻案、配布なども可能。

一般家庭にあるPCで動作可能なスペック

他社の画像生成AIよりも低スペックなコンパクト設計がなされているため、一般消費者のPC端末でも動作可能。誰もが使えるAI作画環境として構築されている。

“美しさ”重視のデータセットを使用した学習

AIの学習には、“美しさ”を重視したデータセットの「LAION Aesthetics」を使用。このAI学習データの作成は「NVIDIA A100 PCIe」40GBタイプを8基搭載した端末32台を使って、20億枚の画像とキーワードのペアを学習させた。

閲覧注意の画像を判定する「セーフティーフィルター」機能

「Stable Diffusion(ステーブル・ディフュージョン)」は、成人向けの表現などを生成すると、閲覧注意画像として黒塗りする「セーフティーフィルター」機能を搭載。画像のNSFW(Not Safe For Work: 職場で開くのに不適切)を自動で判定する。

相性のいい産業分野

メディア・コミュニケーション

「Stable Diffusion」で生成した画像を使用した広告

アート・エンターテインメント

「Stable Diffusion」で生成した画像を挿絵に使った「誰でも作れる絵本」サービス

生活・文化

生成された画像からお気に入りの作品を探せる検索エンジン

金融・保険

ハイクオリティなAI生成画像をNFT化して販売

IT・通信

メッセンジャーアプリとAPI連携し、チャット内容の感情に合わせた絵文字を自動生成

AI

独自の感性でAI絵画作品を量産する「AI描画家」

この知財の情報・出典

この知財は様々な特許や要素技術が関連しています。
詳細な情報をお求めの場合は、お問い合わせください。

Top images:© Stability AI