No.756

2022.08.30

テキストからハイクオリティな画像を自動生成するAI

Midjourney(ミッドジャーニー)

FYhAZHlVEAEXN62

概要

「Midjourney(ミッドジャーニー)」とは、テキストから画像を生成するAIサービス。コミュニケーションアプリから入力された画像の内容(プロンプト)をAIが読解、学習、予測し、1分ほどで高品質な画像を出力する。また、画像の内容を指示する際に、細かくパラメーター(関数)を設定することで、画像の表現力やスタイルを調整することも可能。テキストに基づいてさまざまなパターンの画像を生成できる自由度の高さから、ノベルゲームやマンガをはじめ、さまざまな分野での活用が期待される。

FireShot Capture 108 - Midjourney Showcase - www.midjourney.com

FireShot Capture 110 - newbies-168 - discord.com

なぜできるのか?

チャットで入力できる手軽さ

画像内容の指示には、コミュニケーションアプリ「Discord(ディスコード)」を使用。「Midjourney(ミッドジャーニー)」ホームページから「Discord」にログインし、Botチャンネルで「/imagine」に続けて画像内容を入力すると、テキスト内容に合致した画像が4種類生成される。その4枚の中から最もイメージの近いものを選択・生成を繰り返すことで、意図に沿った高精度なイラストをつくり出すことができる。チャット形式でコマンド入力ができるため、プログラミングの知識を持たないユーザーでも利用できる。

言語AIを活用した画像生成

従来の画像生成AIは、実在の人物の画像を多数学習し架空の画像を生成していたが、「Midjourney」は、「BERT」や「GPT-3」などの言語AIを活用し、Web上にある画像と文章の組み合わせを学習。これにより、テキストの正確な把握と画像の生成が可能になる。

画像の表現力を向上させるパラメーター

プロンプトの後にパラメーターを追加することで画像を細かく調整可能。パラメーターには、画像の比率を指定できる「--aspect」や、レンダリングの品質を上げる「--quality」、画像の芸術性を高める「--stylize」などがあり、より自由で精度の高い表現を可能にする。

他ユーザーの画像を閲覧できるWebギャラリー

生成された画像は、「Midjourney」公式ホームページ上のWebギャラリーで公開される(非公開で使いたい場合は有料の「プライベートモード」に加入する必要がある)。Webギャラリー上では他のユーザーの画像も閲覧でき、ユーザーのフォローや画像の保存ができる。

相性のいい産業分野

アート・エンターテインメント

「Midjourney」による生成画像を取り入れたマンガやゲームの制作

メディア・コミュニケーション

画像のイメージをスピーディに自動生成することによる会議の円滑化

AI

画家としての個性を確立したAI描画アーティスト

教育・人材

絵が苦手な人でも思い通りのイラストが生成できる美術学習

この知財の情報・出典

この知財は様々な特許や要素技術が関連しています。
詳細な情報をお求めの場合は、お問い合わせください。

Top images:© Midjourney