ニュース
グーグル、画像を組み合わせて画像をつくる「Whisk」
2025年2月12日 13:02
Googleは12日、「Google Labs」で生成AIを活用した画像生成の試験運用機能「Whisk」を発表した。日本を含む100以上の国と地域で順次提供する。
Whiskは、詳細なテキストプロンプトの必要なく、画像をプロンプトとして使用する画像生成AI。画像を選択して、Whiskに入力するだけで簡単に始められる。
Whiskは、モデル、シーン、スタイルごとに自分の好きな画像を入力。入力後、それらを組み合わせて、選択したぬいぐるみなどのテンプレートに合わせたオリジナルの画像を生成できる。日本での提供開始にあわせて、日本文化からインスパイアされた2つのテンプレート、「カプセルトイ」と「お弁当」も追加。また、今回はバレンタインデーに合わせた特別なテンプレートも用意している。なお、一部の機能については、英語での利用を推奨している。
Whiskのシステム内では、Geminiが画像の詳細なキャプションを自動的に作成し、その説明をGoogleの画像生成モデル「Imagen 3」に入力する。Whiskは画像からいくつかの重要な特徴のみを抽出するため、ユーザーが予期するものとは異なる画像が生成される場合がある。たとえば、生成されるモデルの身長、体重、髪型、肌の色が異なるものになることもあるという。
Whiskが生成した画像が予期するレベルに達していない場合は、もととなるプロンプトを表示および編集できる。この場合は、英語でのプロンプトの使用を推奨している。なお、Whiskの利用は18歳以上からとしている。