西田宗千佳のイマトミライ
第187回
Microsoft DesignerとAI「サービス化」競争の幕開け
2023年3月6日 08:20
マイクロソフトが昨年発表した、ジェネレーティブAIを使ったツール「Microsoft Designer」のプレビュー公開が始まった。利用希望登録をした人向けには、すでにメールで連絡が届いていることだろう。筆者の元にもメールが来たので、使ってみて狙いを探ってみた。
ジェネレーティブAI(生成系AI)に関しては毎日のようになにかしらニュースがある。そろそろ技術的なアプローチだけでなく、多くの人が日常的に使うサービスへと広がっていくフェーズが見えてきた。今回はその辺についても考察していくことにしよう。
Microsoft Designerのプレビューがスタート
まずはMicrosoft Designerの話から行こう。
Microsoft Designerは、2022年10月に開発者会議「Microsoft Ignite 2022」で発表されたサービスだ。その背景については、本連載でも解説している。
昨年秋は、プロンプトで絵を描くタイプのジェネレーティブAIが大ブームになっていた頃だ。Microsoft DesignerはジェネレーティブAIを使ったサービスだが「絵を描く」ことが注目されていたので、Microsoft Designerも「大手マイクロソフトが手掛けるお絵描きAI」的な語られ方もしている。
ただ、サービスの方向性はちょっと異なる。Microsoft Designerが作ろうとしたのは一枚絵ではなく、パンフレットやアイコンなどの「デザインが必要なもの」を作るサービス、といった方がいいだろう。
もっとシンプルにいえば、競合はAdobeの「Adobe Express」だ。Adobe Expressはテンプレートから作りたい文書を選び、シンプルかつ簡単に「デザインが必要な作業」を終えるためのツールと言っていい。
違うのは、Microsoft Designerはテンプレートから選ぶのではなくテキスト入力による「プロンプト」で命令を与える、というところだ。現状のプレビュー版は英語が基本となっているが、プロンプトとしては英語だけでなく日本語にも対応している。ただし、日本語の理解にはまだかなり問題があり、英語の方が良い。プロンプトからデザインを生成するデザインサービス、という感じだろうか。
出てくるもののクオリティは「シンプルすぎる」
ただ正直なところ、Microsoft Designerでプロンプトを入力して生成された結果を見ると、「うーん?」と首を傾げざるを得なかった。あまりにもシンプルで、クオリティが低かったからだ。
同じようにラーメン屋のチラシを作ってみた。
上がMicrosoft Designerで「プロンプトだけ」で出力した直後のもの、下がAdobe Expressで「ラーメン」でテンプレートを検索した直後のものだ。Adobe Expressに用意されているテンプレートがよく出来ていて、両者に天地ほどの差が生まれている。
こうしたことを予測させる話は、すでにあった。
昨年10月、マイクロソフトによるIgniteでの発表の後、筆者は、ロサンゼルスで開催されたAdobeのイベント「Adobe MAX 2022」に参加した。
そこで、Adobeのスコット・ベルスキーCPO(最高製品責任者)へインタビューした際、「Microsoft Designerをどう思う?」と質問した。
すると彼はこう答えていた。
内容はわかっている。実際に試してもらえればわかるが、彼らが作っているのは非常にシンプルなもので、Adobe Expressと競合はしない
確かに、出てきたものを見れば、MSのものはちょっとシンプルすぎる……というにも厳しい印象を持った。
なお、Adobe Expressはチラシの作成だけでなく、動画の簡易編集や画像変換、SNSへの自動投稿など、非常に多彩な機能を持っている。その点を見ても、Adobeが「そもそも競合しない」というのはよくわかる。
テストしているのは「AIで作業を楽にする」アプローチ
ただ、シンプルではあるものの、「AIによる生成」に注目すると、いろいろなことをしているのも見えてくる。
前述の例は、すべての部分をプロンプトに頼って生成した。だが実際には、チラシを作るにしても、使う写真を指定した上でレイアウトを考えてもらったり、「使う画像」自体をプロンプトから生成してもらったりもできる。
プロンプトから作ったデータは最初の一歩に過ぎない。そこに、他の画像やテキストなどが挿入されると、自動的に新しいレイアウトがAI生成される。よく見るとこの機能は「Copilot」(副操縦士)と命名されている。AIが画面上に配置したオブジェクトから、「どういうものを作るといいか」を提案し、サポートしてくれているわけだ。
テキストの位置や画像の上限関係、背景の加工などができるのはAdobe Expressにかなり近い。その上で、レイアウトや素材の提案などについて、生成済みのテンプレートではなく「AIからの生成」を積極的に使ったサービスを作ろう……としている意図が読み取れる。
API公開で競争は「サービスとしての作り」に変わる
画像生成AIが手元にあったとして、それはどのように使うべきなのだろうか?
あなたがイラストレーターだったとしたら、絵を描くためのアイデアを見つけたり、下絵の一部に使ったりするのだろう。
では、そうでない人はどうするのか? プロンプトで生成してもらって面白い、という時期はもう過ぎ去っているように思う。
「AIに画像を作ってもらう」ことを日常の業務に活かすには、「日常必要とされるデザイン的な仕事」の中にAIを組み込み、デザインやイラスト制作の知見を持たない人が使えるサービスを作るべき……という話になる。
Microsoft Designerはそれを目指したサービスである。現状はプレビュー版であり、拙い(つたない)のは当然でもある。プレビューの段階でどう使われるかの知見を積み重ねた上で、最終的なサービスに仕上げようとしているのだろう。
別の言い方をするならば、Microsoft Designerは「絵を描くAIをサービスとして日常使う形に実装し始めた」例の1つと言える。
AIがなにかを作るのはいい。ではそれでどんなサービスを作るのか。それが1つの本質だ。
そういう意味で、先週は記念すべき週だった。
OpenAIが、会話向けAI「ChatGPT」を活用するためのAPIの提供を開始したからだ。
ChatGPTは、チャットから様々な文章を作り出す。巷では検索エンジンのように使われ、文章の内容が「正しい」「正しくない」という議論がなされている。これはあまり本質的なことではない。
ChatGPTはあくまで「なめらかでバリエーション豊かな文章とそれに付随するデータ」を生成するために作られたものだ。質問に答えられるのは、大量の文章から学ぶために、ネットから大量の文章を集めた結果である。
だから、「検索エンジン」としてのサービスを作るために、マイクロソフトは自前の技術「Prometheus」を作り、組み合わせて「新しいBing」を開発した。
では、「文章を生成するAI」として作られたChatGPTを生かしたサービスとして、どんなものが作れるのだろうか?
それを試すにはAPIが必要だ。
GPT-3などを直接使うよりも、ChatGPTのAPIとして提供されたものを利用する方が簡単に色々作れる。
筆者も「音声データから日本語のテキストを生成する」ことにチャレンジしてみたが、ほんの1時間もあればできた。もちろん、ネットですでに試みた方々の知見を参考にして、という前提はあるが、プログラマーでもない人間でも、完全なサービスになっていない「お試し」レベルのことならできてしまう。
APIを介して「サービスとして求められるものはなにか」を、実際に作って試せるわけで、これは破壊的な変化だ。
そうしたトライアルの中から、今までにない価値のあるサービス、本当に役立つサービスを作る人々も出てくるだろう。
APIが公開されたことは、単にプロンプトを書くのではない「サービス開発競争」の始まりでもある。当然、以前からサービス開発を進めているところは多いと思うが、そこにさらに、多数の開発者が加わって本格的な競争となっていく。
だとするとおそらく、単純にAPIでできることをサービス化しても収益性の高いビジネスにはなりづらい。用途自体が独創的でない場合、ユーザーインターフェースや機能の見せ方、すなわち「サービスとしての作り」が重要になる。
そう考えた上でMicrosoft Designerを見ると、ちょっと見え方が変わってくる。Microsoft Designerが作っているのは、プロンプトから画像を生み出す部分ではなく、そこからの作業を助けるインターフェースそのものである。
そう考えると、「出てくるデザインがダサい」だけで思考停止してはいけないはずだ。