西田宗千佳のイマトミライ
第213回
アマゾンとマイクロソフト、ビッグテックのAI戦略に見る「次のフェーズ」
2023年9月25日 08:15
現在筆者はアメリカ滞在中だ。先週はAmazonとマイクロソフトのイベントを取材していた。どちらもテーマは「生成AI」だ。
今年に入ってから、IT業界にとって生成AIが大きなテーマになっているのは疑いのない事実だ。イベントの冒頭で、マイクロソフトのサティア・ナデラCEOが「(ChatGPTの発表から)たった10カ月しか経っていないのが信じられない」とコメントしたのだが、筆者もまったく同感だ。
本連載の中でも幾度も紹介してきたが、OpenAIとのパートナーシップによってマイクロソフトはいち早くこの波に乗り、他社もそれを急いで追いかけるという流れにあったように思う。
そこにAmazonも追いついてきたわけだが、実際には両社がやっていることは、対象となる顧客も違えば、狙いも異なる。ただ軸には「似ている部分」もある、と筆者は感じた。
今回は両社のイベントを現地で取材しながら感じたことを解説してみよう。
Alexaの理想を実現した「Alexa Chat」
まずイベントを開いたのはAmazonだ。
Amazonのハード&デバイス事業の軸といえばAlexa。だがこのところ、Alexa事業の評判は良くなかった。「音声では思ったようなことができない」「収益性がイマイチなのではないか」という指摘だ。
Amazonは直接的には、収益性について「意見が異なる」(Amazon Devices・インターナショナル担当のエリック・サーリーノ氏)としており、同意はしていない。ただ、コストがかかっていることは認める。
また、音声だけでなにかを処理するのは難しい、というジレンマを抱えているのも事実だろう。今回発表された新製品の1つである「Echo Hub」は、タッチ入力によってスマートホームをコントロールする、一種の「家電コントローラー」である。
家電コントローラーが必要である理由は、家のどこにどの機器があるのか、正確に声だけで指示するのが難しいからでもある。発話する人と同じ部屋の中にあるデバイスはともかく、別の部屋にあるものをどう指示するのか、というのは確かに面倒なことだ。
だから、ルームスキャン技術を使って「ホームマップ」を作る、という話にもなる。
1つ1つの家電に命令を与えることはできるが、その先としてのAlexaをどうするのか?
Amazonの出した答えは、「生成AIを導入したモードを用意する」ということだった。
「Alexa Chat」と名付けられたこのサービスは、大規模言語モデル(LLM)をベースとした生成AIを使い、Alexaと対話をするものだ。今までは「Alexa」というコマンドから始まる「命令」だったが、Alexa Chatでは質問を含めた「対話」になる。ChatGPTなどで会話することにかなり近い。
Amazon Devices・サーリーノ氏への取材によれば、Alexa Chatが使っているのは「Amazonが独自に開発したLLMをベースにした技術」だという。どの技術から派生した生成AIなのか、パラメータ数がどれだけなのか、といった詳細は不明だが、少なくとも、GPTやPaLMなど他社技術を軸にしたものではない。
通常のAlexaへの命令から、さらに「Alexa,Let's Chat.」と命令して遷移して使う機能である、というあたりに、若干開発上の事情を感じる部分がある。だが、「命令ではなく対話でコンピュータを操作する」というのは、まさにAlexaが目指していた理想そのものであり、ようやく、開発側も消費者も目指す形に到達した……といってもいいだろう。
残念ながらまだ英語のみであり、テストの開始も「数カ月後」とされている。そのため今回は発表のみで、ハンズオン会場などでも試すことはできなかった。英語以外への対応時期は明言されていないが、確実に対応は行なわれるし、それに何年も時間がかかる、ということはないだろう。ざっくり予想して1年くらい、というところではないだろうか。
また生成AIは、Alexaの「ルーチン設定」にも使われる。複数の動作をまとめて行なえるようにする「ルーチン」の設定はスマートホームのキモなのだが、ロジカルに動作を考えて指定する必要があり、ちょっとハードルが高い。そこで一般的な言葉での一連の命令をルーチンに読み替えることに生成AIを使うわけだ。
実のところAmazonは、生成AIのベースとなるTransformer技術を以前から採用し、「教師なしで他言語への対応を広げる」のに使っていた。わかりやすく「チャット」という形ではAIを使っていなかったものの、当然技術的には見ていたわけだ。
今回はようやく、「ChatGPTショック」の後を追いかける形で生成AIを、本丸であるAlexaに導入してきた、ということになるだろう。
半年前からの展開が結実した「Microsoft Copilot」
ではマイクロソフトの発表に移ろう。
色々細かいことはあるが、本質は1つ。マイクロソフトが個人や企業向けに展開するサービス・OSに、チャットAIをベースにした「コパイロット(副操縦士)」を導入することだ。
チャットをベースに操作し、生成AIを介してスケジュールや文書ファイル、過去の会議履歴などを扱うことで、「チャットでビジネスに必要な作業」を速やかに実現する。
会見の中で示されたキャッチフレーズが「Copy and Paste and Do」だ。
今も我々は、多数の文書を作ったり整理したり、検索したりするのに「コピー&ペースト(貼り付け)」を多用しており、その後の作業は「自分」で行なう。だがそこで生成AIを使い、文章で命令を与えることで各種作業の間をつなぎ、より素早く作業が終わるようにする、という考え方が「Copy and Paste and Do」。最後のDoをカバーするのが生成AI、ということになる。
ファイルを探して要約してまとめ、そこからスピーチの文章とイベントのタイムスケジュールの草稿を作る……といったことがチャットからできるようになれば、ファイルを探したりまとめかたを考えたりする労力が減る。
Windows 11を使えば、さらにそこからスマホと連動し、スマホ側のメッセージに送られた情報から検索し、その中のフライト情報から現地で滞在するホテルの予約をする、ということもできる。
1つ1つの技術というよりは、Windows・Microsoft 365・Bingといったマイクロソフトの製品それぞれが連携して実現するものがほとんどである。
これは急に発表されたわけではない。今回はそれぞれをまとめ、トータルでの名称を「Microsoft Copilot」と定めて発表されたわけだが、方針自体は、今年の春には示されていたものだ。
今年3月にはGoogleとマイクロソフトが相次いで「生成AIのビジネスツールへの導入」を発表しており、英語をベースとして一部顧客への導入をはじめていた。
同じようにGoogleも展開はしているが、BardとGoogle Workspaceの連動はようやく始まったところで、ネット検索の「Search Generative Experience(SGE)」とBardにはまだ連携が弱いように思える。
マイクロソフトは一部顧客向けではあるが、Microsoft 365 Copilotのテスト公開を3月から始めており、11月1日からは一般公開が始まる。たった数カ月でよくぞ、と思うほど動きが速い。逆にいえば、OpenAIとの連携を以前から進め、ライバルを出し抜ける準備ができていた、ということでもあるのだろうが。
実のところ、Microsoft 365 Copilotはまだ「大企業向け」であり、個人や中小企業向けのライセンスでは利用できない。個人だとCopilot in WindowsとEdgeから利用するBingチャットの組み合わせとなるので、まだ本当にすごいところが利用できていない。日本でMicrosoft 365 Copilotの知名度が低いのはそこもありそうだ。
しかし、マイクロソフトはようやく、個人・中小企業向けMicrosoft 365 Copilotもテストを開始すると発表した。まずは小さい範囲からのテストとなりそうだが、来年中には使えるようになるだろう。
「利用者に合ったプロファイルの活用」で生成AIは次のフェーズへ
家庭向けとビジネス向けで、Amazonとマイクロソフトの施策は大きく違うように見える。実際、テクノロジーとして生成AIは使っているものの、それをどう連携させてユーザーにサービスとして提示するのかという意味では、全く違う存在である。
ただ両者の生成AIの使い方には共通点がある。
それは利用者・利用企業のプロファイルを最大限に活用する、ということだ。
Amazonの場合には、利用者がどこに住んでいてこれまでどのような会話をし、どのようなスマート家電を配置しているか、ということを加味して対話する「パーソナライズ性」が大きな特徴だ。だから贔屓のフットボールチームの会話にも乗ってこられるし、料理の相談にも乗れる。
マイクロソフトの場合にも、特にMicrosoft 365 Copilotでは、企業・部署ごとに蓄積された文書や、データ連携を行なう「Microsoft Graph」とも連携する。その結果として、利用している個人や企業、部署に特化した存在として動く。
また、Bingのチャット検索に関しても、マイクロソフトアカウントでログインして使うことで記録される過去の対話履歴を踏まえ、パーソナライズした形で対話を進められる。毎回前提条件を教えずとも、自分に合った回答をしてくれる可能性が高まる、ということだ。
すなわち、どちらも汎用の生成AIチャットではなく、個人に対するパーソナライズを加えて使うことが有用である……という判断をしているということだ。
生成AIをAI単体として使う場合はまた話が別だろう。だが、人に対するある種のインターフェースとして使う場合、その人の要求や空気を読むためにも、十分に「その人に合ったデータ」を活用する必要がある。
そう考えれば、両社の展開からは、生成AIの絡むネットサービスが、すでに「生成AIだけで決まるのではない次のフェーズ」に入っている証拠と言えるのではないだろうか。