News

2025.02.25

知財ニュース

Google、複数画像をミックスして画像生成できる生成AI「Whisk」を発表―日本でも提供開始

05 whisk

Googleは、Google Labsで生成AIを活用した画像生成の試験運用機能「Whisk」を、日本を含む100以上の国と地域で順次提供すると発表した。

05 whisk

「Whisk」は、詳細なテキストプロンプト不要で、画像をプロンプトとして使用する画像生成AIだ。画像を選択して、「Whisk」に入力するだけで簡単に始めることができる。(プロンプトを使用し編集することも可能)

モデル、シーン、スタイルごとに自分の好きな画像の入力が可能。入力後、それらを組み合わせて、選択したぬいぐるみなどのテンプレートに合わせたオリジナルの画像を生成できる。

01 whisk

日本での提供にあわせて、日本文化からインスパイアされた新しい2つのテンプレート「カプセルトイ」と「お弁当」も新しく追加されている。また、今回はバレンタインデーに合わせた特別なテンプレートも用意されているとのこと。

02 whisk

04 whisk

「Whisk」のシステム内では、Geminiが画像の詳細なキャプションを自動的に作成し、その説明をGoogleの最新の画像生成モデル「Imagen 3」に入力する。このプロセスは、入力したモデルを正確に複製するのではなく、入力された画像から主要な特徴を抽出して新しい画像を生成するため、モデル、シーン、スタイルを新しい方法で簡単に組み合わせることができる。

03 whisk

「Whisk」は画像からいくつかの重要な特徴のみを抽出するため、画像のモデルの身長、体重、髪型、肌の色などがユーザーが予期するものとは異なる画像が生成される場合があるのだという。

その場合は、いつでも基となるプロンプトを表示、編集できるようにされている。同社は、Whiskを最大限に活用するために、英語でのプロンプトの使用を推奨している。

スクリーンショット 2025-02-20 22.36.09

スクリーンショット 2025-02-20 22.37.06

プレスリリースはこちら

「Whisk」公式サイトはこちら

Top Image : © Google

広告