西田宗千佳のイマトミライ
第214回
「数十億人が使うAI」を目指すMeta Googleの“次”を固めるBing
2023年10月2日 08:20
9月中旬以降、筆者はアメリカ各地を周り、Apple、Amazon、Microsoft、Metaなど米ビッグテックの戦略に関する発表を取材してきた。その発表の端々に生成AIが絡んできているのが今年のトレンドだ。
生成AIといっても、画像からテキストまで色々ある。ただ、中でも人間とインタラクションする、いわゆる「チャットAI」に近いものは、少しその在り方が見えてきたようには感じている。特に、先週のMetaの発表からは、その方向性がはっきり見える。
今回はすこし、その部分を考えていこう。
ポイントは「個性とウェブ検索連携」だ。
Metaはメッセージ連携で「AIのマス化」を目指す
9月27日、Metaは米・カリフォルニア州メンローパークにあるMeta本社で、開発者会議「Meta Connect 2023」を開催した。その基調講演では、新しいVRデバイス「Meta Quest 3」やスマートグラス「Ray-Ban | Meta Smart Glasses Collection」などが発表されている。
それらに加え、Metaが発表した生成AI活用サービスが「Meta AI」だ。
Meta AIは、OpenAIにおけるChatGPT、GoogleにおけるBard、マイクロソフトにおけるBingチャット、というところだろうか。
Metaが開発したLLM(大規模言語モデル)であるLlama2をベースに、画像を生成する「Emu」を組み込み、さらに、それらをMeta傘下のメッセージングサービスである「Facebook Messenger」「WhatsApp」「インスタグラム」と連携させる。
狙いは「生成AIサービスの利用拡大」だ。
Meta Connectの基調講演で、Metaのマーク・ザッカーバーグCEOはこうコメントしている。
「今年はAIにとって素晴らしい年です。しかし、これは本当に始まりに過ぎない。業界全体を見渡してみれば、ほとんどの人はまだ、LLMやAIの進歩を体験するチャンスに恵まれていない。そこで今日は、最先端のAIを何十億人もの人々が使うアプリに導入する方法について話したい」
確かにこれはそうなのだ。
多数の生成AIサービスが生まれているとはいえ、「IT機器を持つ使うすべての人が1日に何回も使う」ような状況にはない。だから各社が工夫をし始めているわけだが、MetaはSNSをはじめとした「人と人をつなぐ技術」の会社なので、主軸サービスたるメッセージングアプリに組み込むわけだ。「@Meta AI」と相手を指定してチャットすることで、それが命令になるよう作られている。
そしてさらに利用者の興味をかきたて、利用頻度を高めるために用意したのが、「生成AIにキャラクターという役割をもたせる」ことだ。
スポーツやファッション、マンガなど、ジャンルごとにキャラクターが設定され、それぞれには有名人が扮する。ただ、実際に会話するのはもちろんMeta AI。それぞれのキャラクターに合わせたパーソナリティと知見が設定され、質問するとそのパーソナリティに合わせた返答が返ってくる。Meta AIがダンションマスター役になり、テーブルトークRPGをプレイすることもできるくらいだ。
さらには、同時に発表された「Ray-Ban Meta Smart Glasses」と連動し、対話したり質問したりもできる。
来年以降の実装となるが、スマートグラスからの映像をMeta AIが解析し、その内容について答えられるようにもなる。要は、スマートグラスがAIの目や耳になるわけだ。
独自ツールも用意 「キャラクター化」に進むMeta AI
LLMを使ったチャットサービスといえばChatGPTだが、こちらでも「あなたは弁護士です」といったフレーズからプロンプト(命令)をスタートさせ、ある役割になりきって回答させる……というアプローチがある。
Meta AIがやっているのも簡単に言えば同じことだ。
スマートグラスとAIを音声で連動させる、という点についても、すでにAmazonが「Echo Frames」で手がけている。Echo Framesは音声のみで画像連携はないが、発想としてそこまで飛び抜けたものではない。
ただ違う点が2つある。
1つ目は、回答を差別化するための個別学習や語調の調整など、かなりのカスタマイズが行なわれていることだ。
現在のMeta AIはテストの段階で、アメリカ市場向けに英語でのみ提供される。キャラクターもかなりアメリカに特化している。
多言語対応について、AI担当のリサーチ・サイエンティストであるアンジェラ・ファン氏と、Metaのアンドリュー・ボスワースCTO(最高技術責任者)は次のように語る。
ファン氏:もちろん、多言語化は進めていきます。キャラクターはエンターテインメント性があり、楽しく、多様な興味にアピールするようにデザインされています。しかし確かに、現状はアメリカ市場向けに集中した作りです。今後多言語向けの開発をするにつれ、世界中のさまざまな関心事をカバーする必要が出てくるでしょう。ここには間違いなく投資をします。
ボスワースCTO:そこで我々が持つ「AI Studio」のような技術が重要になります。AI Studioを使い、独自のキャラクターを作っていけるようになりますが、最終的な狙いは、誰もが自分自身で、その人が目指すものを表現できるようにすることです。
ボスワースCTOが言う「AI Studio」が、もう1つの違いだ。
AI Studioとは、MetaがAIのキャラクター付けや対応傾向などをカスタマイズするためのツールだ。まずはメッセージングアプリに統合するためのAPIが数週間以内に公開され、その後、企業向けのカスタマイズから広げていく。最終的には、プログラミング知識を要求することなく、AIの対応をカスタマイズできるようにしていくという。
他社は生成AIを使ったチャットに、ここまで多数の個性を持たせようとはしていない。
Alexaには「Amazonが作ったAI」という明確な個性が植え付けられているし、Bingチャットにも相応な個性があるように見える。ただ、キャラクターと言えるほど濃い個性にはなっていない。そしてChatGPTやBardは、あえて明瞭な個性をつけないよう作られているように見える。
一方でMetaは、ツールまで用意して「多様なAIを作り、人々に使い分けてもらう」考えでいる。
他社とMetaの違いはそこであり、それは「作業のためのコパイロット」であるのか、「コミュニケーションの一員」であるのかの違い、と言いかえることもできる。
どちらのアプローチもまだ初期段階であり、理想的な形からは程遠いところがあるが、それでも「目指す方向の違い」はよくわかる。
結局、対話することで作業や理解を進めていくならば、「個性は必要か不要か」の議論は、ある段階で衝突せざるを得ない時期が来る。
MetaもBing連携 生成AIの「ウェブ窓口」で有利な立場に
キャラクター性の有無では各社の方向性に違いがあるものの、ビッグテックが発表した生成AI絡みのサービスには、1つの明確な共通項がある。
それは「ウェブという巨大なデータベース上の知見と、生成AIを司るLLM(大規模言語モデル)上の知見を明確に分けている」という点だ。
Metaは今回、生成AIについてマイクロソフトとの協業も発表している。Meta AIはネットから新しい情報を取得する際、マイクロソフトの検索サービスであるBingを介して行なうのだ。
これは、ChatGPTが採用している「プラグイン方式」や、Bingチャット検索、Googleが生成AI検索「SGE」に用いている方式に近い。
生成AI自体も学習はしているものの、情報自体をLLMから取り出すわけではない。ネット検索に使う文章・キーワードを「人間が入力した文章」から生成AIがネット検索を行ない、さらにその回答を生成AIがまとめ直して答えにする、という構造だ。
先日の連載でも解説したが、その中で示した解説図を見てほしい。
ChatGPTも、有料サービス利用者向けに「Webブラウジング機能」の提供を再開した。こちらもパートナーはBingだ。
ネット検索ビジネスの主体はもちろん広告であり、ウェブブラウザーが最大の入口ではある。
だが、今後生成AIが入り口として占める役割は高くなっていくだろう。
そこで、OpenAI・Metaという2社がBingを入り口として選んだことは大きい。もちろんマイクロソフトは、「Microsoft Copilot」「Copilot in Windows」でBingを入り口に使う。
過去のネットビジネスと違う収益をどう形作るのかなど、まだ明確でない点は多数ある。
しかし、スマートフォンの登場でウェブ検索が変化し始めると、Googleは「Android」を用意して自ら「スマホでの窓口」をつくりつつ、同時に、アップルへ「iPhoneに標準設定されている検索エンジンの座」を守るために巨額の支払いを伴う契約を結んだ。
同じことが「生成AIの外部知識」としてのWebサイトへの検索機能で起きつつあるのだとすれば、非常に興味深い現象である。
現時点で、ここはBingがかなり有利なゲームを進めつつある……というのが今の筆者の印象だ。