ニュース

グーグル、画像を組み合わせて画像をつくる「Whisk」

Googleは12日、「Google Labs」で生成AIを活用した画像生成の試験運用機能「Whisk」を発表した。日本を含む100以上の国と地域で順次提供する。

Whiskは、詳細なテキストプロンプトの必要なく、画像をプロンプトとして使用する画像生成AI。画像を選択して、Whiskに入力するだけで簡単に始められる。

Whiskは、モデル、シーン、スタイルごとに自分の好きな画像を入力。入力後、それらを組み合わせて、選択したぬいぐるみなどのテンプレートに合わせたオリジナルの画像を生成できる。日本での提供開始にあわせて、日本文化からインスパイアされた2つのテンプレート、「カプセルトイ」と「お弁当」も追加。また、今回はバレンタインデーに合わせた特別なテンプレートも用意している。なお、一部の機能については、英語での利用を推奨している。

Whisk - 生成画像例:ソフトクリームを持った犬のぬいぐるみ
Whisk - 生成画像例:かごに入った猫のカプセルトイ

Whiskのシステム内では、Geminiが画像の詳細なキャプションを自動的に作成し、その説明をGoogleの画像生成モデル「Imagen 3」に入力する。Whiskは画像からいくつかの重要な特徴のみを抽出するため、ユーザーが予期するものとは異なる画像が生成される場合がある。たとえば、生成されるモデルの身長、体重、髪型、肌の色が異なるものになることもあるという。

Whiskが生成した画像が予期するレベルに達していない場合は、もととなるプロンプトを表示および編集できる。この場合は、英語でのプロンプトの使用を推奨している。なお、Whiskの利用は18歳以上からとしている。

Whisk - 生成画像例:花束を持ったカップルのぬいぐるみ
Whisk - 生成画像例:ゆめかわいいハムスターのお弁当箱