No.756
2022.08.30
テキストからハイクオリティな画像を自動生成するAI
Midjourney(ミッドジャーニー)
概要
「Midjourney(ミッドジャーニー)」とは、テキストから画像を生成するAIサービス。コミュニケーションアプリから入力された画像の内容(プロンプト)をAIが読解、学習、予測し、1分ほどで高品質な画像を出力する。また、画像の内容を指示する際に、細かくパラメーター(関数)を設定することで、画像の表現力やスタイルを調整することも可能。テキストに基づいてさまざまなパターンの画像を生成できる自由度の高さから、ノベルゲームやマンガをはじめ、さまざまな分野での活用が期待される。
なぜできるのか?
チャットで入力できる手軽さ
画像内容の指示には、コミュニケーションアプリ「Discord(ディスコード)」を使用。「Midjourney(ミッドジャーニー)」ホームページから「Discord」にログインし、Botチャンネルで「/imagine」に続けて画像内容を入力すると、テキスト内容に合致した画像が4種類生成される。その4枚の中から最もイメージの近いものを選択・生成を繰り返すことで、意図に沿った高精度なイラストをつくり出すことができる。チャット形式でコマンド入力ができるため、プログラミングの知識を持たないユーザーでも利用できる。
言語AIを活用した画像生成
従来の画像生成AIは、実在の人物の画像を多数学習し架空の画像を生成していたが、「Midjourney」は、「BERT」や「GPT-3」などの言語AIを活用し、Web上にある画像と文章の組み合わせを学習。これにより、テキストの正確な把握と画像の生成が可能になる。
画像の表現力を向上させるパラメーター
プロンプトの後にパラメーターを追加することで画像を細かく調整可能。パラメーターには、画像の比率を指定できる「--aspect」や、レンダリングの品質を上げる「--quality」、画像の芸術性を高める「--stylize」などがあり、より自由で精度の高い表現を可能にする。
他ユーザーの画像を閲覧できるWebギャラリー
生成された画像は、「Midjourney」公式ホームページ上のWebギャラリーで公開される(非公開で使いたい場合は有料の「プライベートモード」に加入する必要がある)。Webギャラリー上では他のユーザーの画像も閲覧でき、ユーザーのフォローや画像の保存ができる。
相性のいい産業分野
- アート・エンターテインメント
「Midjourney」による生成画像を取り入れたマンガやゲームの制作
- メディア・コミュニケーション
画像のイメージをスピーディに自動生成することによる会議の円滑化
- AI
画家としての個性を確立したAI描画アーティスト
- 教育・人材
絵が苦手な人でも思い通りのイラストが生成できる美術学習
この知財の情報・出典
この知財は様々な特許や要素技術が関連しています。
詳細な情報をお求めの場合は、お問い合わせください。
Top images:© Midjourney