News

2025.08.18

知財ニュース

Alibaba、複雑なテキストの描写が可能な画像生成AIモデル「Qwen-Image」を発表

qwen 01

AlibabaのAI開発チームのQwenは、2025年8月4日、画像生成AIモデル「Qwen-Image」を発表した。

qwen 01

「Qwen-Image」は、複雑なテキストの表示と高精度な画像編集が可能な画像生成AIモデルだ。このモデルは、200億のMMDiT画像基盤モデルで、言語は英語と中国語に対応しており、画像内にテキストを高精度で描画することができる。性能の比較では、特に中国語テキスト生成において優れた性能を示し、既存の最先端モデルを大幅に上回っているのだという。

qwen 02

同社は、複数の生成例を挙げており、英語で生成した例では、「New Arrivals This Week」を正確に出力するだけでなく、「The light between worlds」、「When stars are destroyed」、「The silient patient」、「The night circus」という4冊の本の表紙テキストも正確に生成している。より複雑な英語の表現や、小さいテキストの描画も生成可能だ。

qwen 05

また、以下では「QWEN」のマークを付けたTシャツの女性、ガラス板に書き込むテキストも忠実に再現されている。言語は、中国語と英語をいつでも切り替えることができるとのことだ。

qwen 06

ポスターや資料のような画像も作成可能で、1行目はタイトル、2行目はサブタイトルなども細かく指定することができる。

qwen 04

テキスト処理だけでなく、一般的な画像生成でも優れており、幅広い芸術スタイルをサポートしている。フォトリアリスティックなシーンから印象派の絵画、アニメ風からミニマルなデザインまで、幅広い創造的なプロンプトに柔軟に対応している。

qwen 07

画像編集機能に関しては、スタイルの転送、追加、削除、ディテールの強調、テキスト編集、キャラクターのポーズ調整など、様々な操作が可能。これにより、一般ユーザーでもプロレベルの画像編集を簡単に実現することができる。

「Qwen-Image」についてはこちら

Top Image : © Qwen

広告