“世界を変える”レベルの画像生成AIサービス、Stable Diffusion（ステーブル・ディフュージョン）がオープンソースとして公開

ロンドンを拠点とするAIスタートアップ・Stability AI社は2022年8月22日（現地時間）、画像生成AIサービス「Stable Diffusion（ステーブル・ディフュージョン）」をオープンソースとして全世界に公開した。

2 4x

「Stable Diffusion」は、テキストから画像を生成できるサービス。任意のテキストを入力するだけでハイクオリティな画像をAIによって短時間で生成でき、商用利用もできる。また、AIの学習には「美しさ」を重視したデータセットである「LAION Aesthetics」を使用し、フォトリアルな画風やアーティスティックな画風など、さまざまなテイストの画像を生成できる。

同AIは、ソースコードから学習済みの機械学習モデルまで公開されている点が画期的とされ、今後様々なシステムやアプリケーションへの実装が予想される。また同AIをもとに作成した機械学習モデルは、ライセンスを明記することで営利・非営利問わずに使用でき、生成した画像の権利は作成者自身が有する。また、法律に違反するものや人に危害を与えるもの、誤った情報を広めるものなどでの利用は禁止している。

FireShot Capture 128 - Stable Diffusion Public Release — Stability.Ai - stability.ai

2022年9月現在の同AIの利用方法は以下の3つ。

1. DreamStudio Lite
同AIのβ版。アカウント登録すると2.00ポンド（約324円）の無料枠が与えられ、生成したい画像の指示を英語で入力することで画像を生成できる。生成する画像のサイズや品質、枚数などを設定でき、設定によって画像生成に必要な費用が変化する。

2. Google Colab
Googleが提供している「Google Colab」（ブラウザ上でPythonを記述し、実行できる機械学習の教育、研究を目的としたツール）上で動かす方法。ディープラーニングコミュニティ「Hugging Face」にアカウントを作成し、Google ColabからHugging Faceにログインし、Hugging Face側のサーバーを流用することで利用できる。

3. ローカル環境
ローカル環境で使用する場合、8月22日時点ではメモリの使用量は6.9GBで、NVIDIAのGPUの使用を推奨している。今後、AMDやAppleのM1/M2などに最適化したものもリリースする予定とのこと。

スクリーンショット 2022-09-06 001043

Stability AI社は今後、音楽・動画などに対応した「DreamStudio Pro (video/audio)」や「Dream Studio Enterprise (studios)」の提供も予定。同社の創業者エマード・モスターク氏は同AIで「10億人の人々をクリエイティブにしたい」と語っている。

オープンβ版「Dream Studio」公式サイト
「Stable Diffusion」デモサイト
Stability AI 公式サイト

この記事のタグ

広告