西田宗千佳のイマトミライ
第190回
アドビ「Firefly」とGoogle「Bard」に見る「ツールとしてのAI」の責任
2023年3月27日 08:15
先週は、アメリカ・ラスベガスに取材に行ってきた。目的は、アドビの年次開発者イベント「Adobe Summit」を取材するためだ。
今回の目玉は、アドビがジェネレーティブ(生成系)AIへの積極的な採用を開始したことだ。画像を作る「Adobe Firefly」に注目が集まっているが、それだけを発表したわけではない。
また同じタイミングで、Googleは、かねてより開発を表明していたチャットAIサービス「Bard」について、アメリカ・イギリスでテスト公開を開始していた。
筆者はちょうどアメリカにいたので、BardとFirefly、双方をテストする機会に恵まれた。
今回は、Fireflyから見えるアドビの思惑、そして、Bardから見えるGoogleの戸惑い、それぞれについて語ってみたいと思う。
最終的には「アドビ製品全てで使われる」Firefly
先にFireflyの方から行こう。
「Adobe Firefly」は、3月21日にアドビが公開したジェネレーティブAIだ。同日より登録が開始されており、利用可能と返答があった人から順に利用できる。
現状のFireflyは、「プロンプト(命令文章)をベースに画像を生成するAI」である。対象は、画像に加え、文字に装飾を加えた「フォントエフェクト」。近日中に、ベクターベースのアートワークに対してカラーバリエーションを生成する「Recolor vectors」が追加予定だ。
また、さらに今後の予定として、以下9つが例示されている
プロンプトで指定した内容で塗りつぶす
スタイルを指定した上で、それに合わせて生成
文章からベクターグラフィックスを生成
画像の存在しない部分を生成し、アスペクト比を変更
任意の方向から見た3Dモデルから画像を生成
シームレスなタイルパターンをプロンプトから生成
PhotoshopやFresco用のブラシをプロンプトから生成
簡単なスケッチから詳細なイメージを生成
プロンプトから、編集可能なテンプレートを生成
これらは「ウェブブラウザ上でプロンプトを入力して画像を作る」ことからは大幅に離れた機能である。ようするにアドビは、Photoshopなど、同社の「Creative Cloud」に含まれるアプリのほとんどに、作業を補助するための機能としてジェネレーティブAIであるFireflyを搭載していく、ということになる。
実際に使ってみると、「ああ、今の2つはFireflyとしてはお披露目レベルなのだな」と感じる。
アスペクト比が指定できたり、生成した映像にテイストを指定できたり、といった自由度はアドビらしいが、まあ、そのくらいの話であり、「絵を描くジェネレーティブAI」として特筆すべきところがあるように思えない。
Text effectsは、ロゴに特化しているという意味でよりアドビらしいが、こちらも機能としては実にシンプルだ。
Fireflyは、日本語を含む多言語での対応を目指しているが、現状プロンプトとしては、英語のみが対象となっている。Text effectsでは日本語の入力もできるのだけれど、フォントの変更ができないので「とりあえずは作れる」レベルでしかない。
こういう部分も含めて、まだまだ開発途上なのだ。
「企業で安心して大量に使う」ために制限
重要なことがもう1つある。
Fireflyには制限が多い。いくつかの単語を入れると「ガイドラインに違反している」と警告が出ることもあるのだ。例えば「battle」「attack」などの単語が使えない。
詳細は以下のページに記載されているが、簡単に言えば、ポルノや差別、暴力の助長に関する内容はNGとされている。
これを「つまらない」と思う人もいるだろう。
だが、それは一面的な見方に過ぎる。アドビはそもそも、「なんでも作れるAI」を作るつもりはないのだ。
アドビが作るのはアーティストを助けるAIであると同時に、「アートを使う人々」のためのものである。
次の画像を見ていただきたい。
これは、Adobe Summitの、開発途上技術を公開するイベント「Sneaks」で公開された「Project Limitless Options」という技術だ。
Fireflyをベースに、コンテンツに合った画像を無限に生成するものだ。扱う食材に合わせて登場人物の服や背景、ポーズを作り変える。コアとなるコンテンツはちゃんと自分で用意した上で、それを「無数のシチュエーションに合わせる」ことが可能になってくる。
なぜこんなことをしているかというと、広告などで使う画像が爆発的に増えていくからでもある。人やメディアに合わせて画像を最適化するのは大変だ。そのためにアーティストが全部作業するのは無理がある。かといって、広告担当者が編集して素材を作るのは難しい。
だが、AIがバリエーションを短時間で作ってくれるなら、効率は上がる。ブラックな作業も減るだろう。
Fireflyはそのために作ったわけで、「企業が安心して使える」ものである必要がある。だから、問題があるキーワードで生成「できない」方がいいし、問題があるものが混ざらない方がいい。
FireflyはAdobe Stockの画像から学習している。まずStockに登録される段階で、著作権などの問題を「一応」クリアーしておき、さらに画像についたタグで精査し、その上で生成時にキーワードでもチェックする。
だから、著作権上問題がある画像が生成されることは少なくなっているし、前述のように、ポルノや暴力的な画像が生成されることも少ない。
なんでもできる、研究素材として使えるジェネレーティブAIとは別の存在を目指そうとしているのではなく、徹頭徹尾「企業が使う」「プロが使う」ことを前提としたAI基盤として自社開発しているのがFireflyであり、Adobe Senseiをベースとした「Adobe Sensei GenAI」なのである。
Googleの「Bard」は「テスト」として慎重に導入
慎重さ、という意味では、Googleの「Bard」も似たところがある。
BardはGoogleの大規模言語モデル「LaMDA」の軽量版を使っている。その上で「ジェネレーティブAIの可能性を模索するテスト版」と明確に位置付けられている。ライバルのマイクロソフトが、Bingのチャット検索を大々的に公開したのとは対照的だ。
現状、利用できるのは英語のみ。アメリカとイギリスだけで使えるのだが、これは単に言語の問題だけではない。IPアドレスで地域が判別されており、日本など対象外の地域からは利用できない。筆者はアメリカ出張中だから利用できたが、帰国後は(想定通り)利用できなくなった。
そんな事情もあり、何十時間もBardを試せているわけではない。あくまで「英語はそこそこできるレベルの人間が、数時間使ったインプレッション」とお考えいただきたい。
現状のイメージとして、Bardは「ChatGPTほどなんでもできるわけでもなく、Bing Chatほどサービスとして洗練されていないが、両方の特性を引き継いでいる」と感じる。
回答の質や内容が、ChatGPTやBingのネット検索とどう違うのか、どちらが上なのかを評価するのは難しい。回答にキャラクター性が薄いような気もするが、それは筆者の英語読解力によるものかも知れないからだ。
ChatGPTのようなシンプルな画面だが、出てくる内容はBingに近い。最新に近い情報をネット検索から引っ張ってくるし、根拠となったネットの情報の「索引」も、ウェブサイトのリンクとして表示される。
さらに「Google it」というボタンがあるのもユニークだ。要は、あくまでAIの回答は「検索結果」ではないので、関連する情報をネット検索したければこのボタンを押してくださいね……ということなのだ。
また、回答については3つくらいの内容を「ドラフト」として提示する。
すなわち、Bardが示すのは「たった1つの回答」ではなく、あくまで「利用者が回答・レポートを作るためのドラフト」という扱いなのだ。
どの企業も、ジェネレーティブAIを人間のサポート、Copilot(副操縦士)と位置付けている。それは結局、アドビもGoogleも変わらない。Adobe Summitでもそれが強調されていた。
そんな中で、「ネット検索における責任」を重視するGoogleとしては、マイクロソフトほど「ヤンチャ」な展開ができる状況にない。慎重な態度でありつつ、今できることを示さねばならない、という意味で出てきたのがBardなのだろう。
Bardの回答はかなり穏当なもので、人によっては「ChatGPTより面白くない」と思うだろう。これは、Fireflyが「穏当なジェネレーティブAI」として作られていることに似ている。
そのことを批判するのは簡単だが、今後の道具としては「倫理性の高いAI」が求められているのは間違いない。大手としてはそちらを目指さざるを得ないのだ。大手の採った手法ですら、「失敗したら誰が責任を取るのか」と言いがちな日本の常識から言えば、かなりのリスクとも言える。
GoogleはBardの履歴について、検索履歴と同様、プライバシーに配慮し、「なにを行なったか」を記録し、ユーザーが可視化できるようにした上で、消せるようにもなっている。こうした部分もまさに「倫理性の追求」だろう。
大手が「倫理性の高いAI」を作ろうとする動きが成功するかはまだわからない。そもそも、今のジェネレーティブAIは、それをうんぬんできるタイミングではないのかもしれない。
しかし、「倫理性を考えて作らねばビジネスにも生活にも使えない」のは事実。マイクロソフトもその点は否定していないし、努力している。
ツールになるということは、そういう「責任の山」を超えていくことなのだろう。