西田宗千佳のイマトミライ

第187回

Microsoft DesignerとAI「サービス化」競争の幕開け

マイクロソフトが昨年発表した、ジェネレーティブAIを使ったツール「Microsoft Designer」のプレビュー公開が始まった。利用希望登録をした人向けには、すでにメールで連絡が届いていることだろう。筆者の元にもメールが来たので、使ってみて狙いを探ってみた。

ジェネレーティブAI(生成系AI)に関しては毎日のようになにかしらニュースがある。そろそろ技術的なアプローチだけでなく、多くの人が日常的に使うサービスへと広がっていくフェーズが見えてきた。今回はその辺についても考察していくことにしよう。

Microsoft Designerのプレビューがスタート

まずはMicrosoft Designerの話から行こう。

Microsoft Designerは、2022年10月に開発者会議「Microsoft Ignite 2022」で発表されたサービスだ。その背景については、本連載でも解説している。

昨年秋は、プロンプトで絵を描くタイプのジェネレーティブAIが大ブームになっていた頃だ。Microsoft DesignerはジェネレーティブAIを使ったサービスだが「絵を描く」ことが注目されていたので、Microsoft Designerも「大手マイクロソフトが手掛けるお絵描きAI」的な語られ方もしている。

ただ、サービスの方向性はちょっと異なる。Microsoft Designerが作ろうとしたのは一枚絵ではなく、パンフレットやアイコンなどの「デザインが必要なもの」を作るサービス、といった方がいいだろう。

Microsoft Designerの画面。一般的なグラフィックツールに近いが、ウェブ上で動作する

もっとシンプルにいえば、競合はAdobeの「Adobe Express」だ。Adobe Expressはテンプレートから作りたい文書を選び、シンプルかつ簡単に「デザインが必要な作業」を終えるためのツールと言っていい。

Adobe Express。無料で使えるデザインツールだが、できることもテンプレートの数もかなり多彩で便利なものだ

違うのは、Microsoft Designerはテンプレートから選ぶのではなくテキスト入力による「プロンプト」で命令を与える、というところだ。現状のプレビュー版は英語が基本となっているが、プロンプトとしては英語だけでなく日本語にも対応している。ただし、日本語の理解にはまだかなり問題があり、英語の方が良い。プロンプトからデザインを生成するデザインサービス、という感じだろうか。

作業は「プロンプト入力」から。サービスは日本語化されていないが、プロンプトとしては日本語も受け付ける。ただし、英語の方が「理解力」は高い模様

出てくるもののクオリティは「シンプルすぎる」

ただ正直なところ、Microsoft Designerでプロンプトを入力して生成された結果を見ると、「うーん?」と首を傾げざるを得なかった。あまりにもシンプルで、クオリティが低かったからだ。

同じようにラーメン屋のチラシを作ってみた。

上がMicrosoft Designerで「プロンプトだけ」で出力した直後のもの、下がAdobe Expressで「ラーメン」でテンプレートを検索した直後のものだ。Adobe Expressに用意されているテンプレートがよく出来ていて、両者に天地ほどの差が生まれている。

Microsoft Designerから「プロンプトだけ」で一発生成したラーメン屋のチラシ。実になんというか、簡素で味気ない
Adobe Expressでの例。テンプレートの出来が段違いなので、もちろんこちらの方が実用性は高い

こうしたことを予測させる話は、すでにあった。

昨年10月、マイクロソフトによるIgniteでの発表の後、筆者は、ロサンゼルスで開催されたAdobeのイベント「Adobe MAX 2022」に参加した。

そこで、Adobeのスコット・ベルスキーCPO(最高製品責任者)へインタビューした際、「Microsoft Designerをどう思う?」と質問した。

すると彼はこう答えていた。

内容はわかっている。実際に試してもらえればわかるが、彼らが作っているのは非常にシンプルなもので、Adobe Expressと競合はしない

確かに、出てきたものを見れば、MSのものはちょっとシンプルすぎる……というにも厳しい印象を持った。

なお、Adobe Expressはチラシの作成だけでなく、動画の簡易編集や画像変換、SNSへの自動投稿など、非常に多彩な機能を持っている。その点を見ても、Adobeが「そもそも競合しない」というのはよくわかる。

テストしているのは「AIで作業を楽にする」アプローチ

ただ、シンプルではあるものの、「AIによる生成」に注目すると、いろいろなことをしているのも見えてくる。

前述の例は、すべての部分をプロンプトに頼って生成した。だが実際には、チラシを作るにしても、使う写真を指定した上でレイアウトを考えてもらったり、「使う画像」自体をプロンプトから生成してもらったりもできる。

画像を指定し、そこからチラシ自体を生成
画像自体をプロンプト生成。日本語だとイマイチなものしか出てこないので、ここでは英語で。表示されている男性の写真はAIが生成したもの

プロンプトから作ったデータは最初の一歩に過ぎない。そこに、他の画像やテキストなどが挿入されると、自動的に新しいレイアウトがAI生成される。よく見るとこの機能は「Copilot」(副操縦士)と命名されている。AIが画面上に配置したオブジェクトから、「どういうものを作るといいか」を提案し、サポートしてくれているわけだ。

写真を追加するとAIがレイアウトを再度生成。赤枠内がAIによって再生成されたサンプルのリストだ。ここが「Copilot」と命名されているのがポイント

テキストの位置や画像の上限関係、背景の加工などができるのはAdobe Expressにかなり近い。その上で、レイアウトや素材の提案などについて、生成済みのテンプレートではなく「AIからの生成」を積極的に使ったサービスを作ろう……としている意図が読み取れる。

API公開で競争は「サービスとしての作り」に変わる

画像生成AIが手元にあったとして、それはどのように使うべきなのだろうか?

あなたがイラストレーターだったとしたら、絵を描くためのアイデアを見つけたり、下絵の一部に使ったりするのだろう。

では、そうでない人はどうするのか? プロンプトで生成してもらって面白い、という時期はもう過ぎ去っているように思う。

「AIに画像を作ってもらう」ことを日常の業務に活かすには、「日常必要とされるデザイン的な仕事」の中にAIを組み込み、デザインやイラスト制作の知見を持たない人が使えるサービスを作るべき……という話になる。

Microsoft Designerはそれを目指したサービスである。現状はプレビュー版であり、拙い(つたない)のは当然でもある。プレビューの段階でどう使われるかの知見を積み重ねた上で、最終的なサービスに仕上げようとしているのだろう。

別の言い方をするならば、Microsoft Designerは「絵を描くAIをサービスとして日常使う形に実装し始めた」例の1つと言える。

AIがなにかを作るのはいい。ではそれでどんなサービスを作るのか。それが1つの本質だ。

そういう意味で、先週は記念すべき週だった。

OpenAIが、会話向けAI「ChatGPT」を活用するためのAPIの提供を開始したからだ。

ChatGPTは、チャットから様々な文章を作り出す。巷では検索エンジンのように使われ、文章の内容が「正しい」「正しくない」という議論がなされている。これはあまり本質的なことではない。

ChatGPTはあくまで「なめらかでバリエーション豊かな文章とそれに付随するデータ」を生成するために作られたものだ。質問に答えられるのは、大量の文章から学ぶために、ネットから大量の文章を集めた結果である。

だから、「検索エンジン」としてのサービスを作るために、マイクロソフトは自前の技術「Prometheus」を作り、組み合わせて「新しいBing」を開発した。

では、「文章を生成するAI」として作られたChatGPTを生かしたサービスとして、どんなものが作れるのだろうか?

それを試すにはAPIが必要だ。

GPT-3などを直接使うよりも、ChatGPTのAPIとして提供されたものを利用する方が簡単に色々作れる。

筆者も「音声データから日本語のテキストを生成する」ことにチャレンジしてみたが、ほんの1時間もあればできた。もちろん、ネットですでに試みた方々の知見を参考にして、という前提はあるが、プログラマーでもない人間でも、完全なサービスになっていない「お試し」レベルのことならできてしまう。

APIを介して「サービスとして求められるものはなにか」を、実際に作って試せるわけで、これは破壊的な変化だ。

そうしたトライアルの中から、今までにない価値のあるサービス、本当に役立つサービスを作る人々も出てくるだろう。

APIが公開されたことは、単にプロンプトを書くのではない「サービス開発競争」の始まりでもある。当然、以前からサービス開発を進めているところは多いと思うが、そこにさらに、多数の開発者が加わって本格的な競争となっていく。

だとするとおそらく、単純にAPIでできることをサービス化しても収益性の高いビジネスにはなりづらい。用途自体が独創的でない場合、ユーザーインターフェースや機能の見せ方、すなわち「サービスとしての作り」が重要になる。

そう考えた上でMicrosoft Designerを見ると、ちょっと見え方が変わってくる。Microsoft Designerが作っているのは、プロンプトから画像を生み出す部分ではなく、そこからの作業を助けるインターフェースそのものである。

そう考えると、「出てくるデザインがダサい」だけで思考停止してはいけないはずだ。

西田 宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、週刊朝日、AERA、週刊東洋経済、GetNavi、デジモノステーションなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。
 近著に、「顧客を売り場へ直送する」「漂流するソニーのDNAプレイステーションで世界と戦った男たち」(講談社)、「電子書籍革命の真実未来の本 本のミライ」(エンターブレイン)、「ソニーとアップル」(朝日新聞出版)、「スマートテレビ」(KADOKAWA)などがある。
 メールマガジン「小寺・西田の『マンデーランチビュッフェ』」を小寺信良氏と共同で配信中。 Twitterは@mnishi41