News

2022.09.28

知財ニュース

日本語に特化した画像生成AI「Japanese Stable Diffusion」が公開─日本語での画像生成が可能に

image1 l

rinna株式会社は9月9日、画像生成AI「Stable Diffusion」に日本語の追加学習を行うことで、日本語に特化した画像生成モデル「Japanese Stable Diffusion(ジャパニーズ・ステーブル・ディフュージョン)」を公開、提供開始した。

同社はこれまで、「人とAIの共創世界」をビジョンに、AIキャラクターが発信する画像生成サービス「AIりんな」や、それらの研究成果として学習済みの言語画像モデルを公開してきた。日本語に特化した言語モデルの「GPT」や「BERT」、言語と画像の関係を表現する言語画像モデル「CLIP」などを公開し、多数の研究・開発者に利用されてきた。

2022年以降、世界的に話題を集めている「DALL-E 2」「Midjourney」「Stable Diffusion」などの画像生成AI。rinna株式会社はStability AI社がオープンソースで公開している画像生成モデル「Stable Diffusion」に、日本語のキャプション付き画像を用いて追加学習することで日本語での画像生成に特化した「Japanese Stable Diffusion」の開発に至った。

本モデルにより、日本語のプロンプト(テキストによる画像内容の指示)での入力が可能になり、翻訳入力では表現が困難な日本語圏の文化を反映した画像生成を実現する。また、AIモデルライブラリであるHugging FaceとGitHubで本モデルを公開することで、言語・画像の研究・開発コミュニティでも本取り組みの成果を紹介するという。

また、同社が運営するAIキャラクターSNSサービス「キャラる」や、AIキャラクター「りんな」のツイッターにも本モデルを実装。加えて、開発者向けに公開しているAPIサイトのrinna Developersでも、本モデルを使用したAPI「Text To Image API v2」を公開。このAPIを使用することで、「Japanese Stable Diffusion」での画像生成機能をアプリケーション等に実装できるという。

MicrosoftTeams-image202-0001

同社は今後もAIの研究を続け、高性能な製品・サービスの開発を目指す。なお、研究成果は引き続き公開し、研究・開発コミュニティへ還元していくという。

プレスリリースはこちら

rinna 株式会社 公式サイト

Hugging Face モデル公開サイト

GitHub モデル公開サイト

Top Image : ©︎ rinna 株式会社

広告