西田宗千佳のイマトミライ
第282回
アマゾン「アレクサ+」の大きな可能性 “家”に浸透するAIとガジェットの変革
2025年3月3日 08:20
先週、筆者はニューヨークを訪れていた。目的は、米Amazonの発表会を取材すること。そして、そこで発表されたのが「Alexa+」である。
発表の模様と開発の経緯は以下にまとめている。
Alexa+は生成AIを使った、新世代のAlexaだ。Amazon側も主張する通り、生成AIによって「作り直した」ことで別物といえるレベルに進化している。
音声アシスタントはAIがあって産まれたものだ。それがまた、生成AIの登場で生まれ変わろうとしている。
だが、今は他にも生成AIは多数ある。それらとAlexa+はどう違うのだろうか? そして、Alexa+は他の生成AIにどういう影響を与えて行くのだろうか?
今回はその点を考察してみたい。
10年で刷新が必須になった「Alexa」
Alexa+とはどんなサービスなのか? そのためには、オリジナルのAlexaの課題を理解するのが近道だ。
Alexaは、ちょうど10年前に誕生した。
当初はアメリカでのみサービスをしており、日本でのサービス開始は2017年11月なので、2年以上時間がかかった計算になる。2017年はAmazon以外にもGoogle/Apple/LINEと、複数の企業から製品が登場し、「音声アシスタントを使ったスマートスピーカーブーム」といっていい年になっていた。
2015年に音声アシスタントが実現したのは、機械学習によって音声認識と音声合成の精度が劇的に向上したためだ。以来、スマートフォンを含め「音声で命令を与える」機器は一般的になり、もはや珍しいものではない。
一方、音声アシスタントの課題は「音声を認識した先」にあった。
かなりの精度で音声を認識できたものの、それをどう処理するかはまた別の話。リモコン的に「声で命令する」ことはできるのだが、その先はなかなか難しい。
家電やIoT機器と連携する「スマートホーム」も拡がってきたが、単に起動する・設定を変えるだけでは利便性も限られる。複数の作業を連続して行なう「ルーチン」という機能もあるが、事前に設定しておく必要があるし、その設定は意外なほど難しい。
結果として、「音声アシスタントが理解できる命令」を覚えてそれだけを発声する……という使い方になってしまった。
一方、人間に指示を与える場合、複数の指示を組み合わせても問題はない。また、なにをすればいいかを相談しながら進めることもできる。
オリジナルのAlexaをはじめとした音声アシスタントは、人間と同じような対応が難しかった。解決のために色々な技術が採り入れられてきたが、根本的な解決には至っていない。
そうした問題を解決するために採られたのが「生成AIでAlexaを作る」ことだった。
生成AIは会話の内容を把握するのに有利だ。聴き取り自体の能力も上がる。さらに、複数の要素を組み合わせて処理することもできるし、「ルーチン」のようなものを生成することも可能だ。
Alexaが抱えていた閉塞感を解消するため、Amazonは核となるAIを「音声認識モデル」から「生成AI」へ切り換えて作り直した。
それがAlexa+、ということになる。
生成AIを導入し刷新、大幅に機能アップ
生成AIで音声アシスタントを立て直す、という発想はAmazonだけのものではない。むしろAmazonはこれまで、「出遅れている」という意見が強かった。
生成AIと音声アシスタントの性質が似ていることはよく知られていた。生成AIをベースとした技術で会話を行なうサービスも増えており、それらは「音声アシスタント以上になめらかな対話」を実現している。
Googleは自社の生成AIである「Gemini」をスマートフォンの音声アシスタントに採用、アップルも昨年秋から導入した「Apple Intelligence」を導入、「Siri」の改善に努めている。
Alexaに生成AIを組み込めば……との話は、生成AIが脚光を浴びた2023年以降ずっと話題に上がってきたが、ここにきてようやく実現したというのが正しいだろう。
では、GeminiやApple Intelligence版Siri、さらにはOpenAIなどの生成AIと、Alexa+はどう違うのだろうか?
この部分については、Amazon・Device & Services担当シニア・バイスプレジデントのパノス・パネイ氏の言葉を引用するのが良いだろう。
「チャットツールはエッセイを書き直したり、画像を作成したりするのに良いもので、時には役に立ちます。しかしほとんどの場合、タスクを完了するのに役立ちません。生活の他の部分から隔離されているからであり、毎日使っているアプリともつながっていないからです。良いメニューは知っていても、食品を注文してはくれないし、友人に夕食の招待状を送ったりもしません」
たしかにその通りだ。
生成AIの持つ言語能力・画像生成能力は非常に高い。その能力は日進月歩で進歩中だ。
他方、その能力はサービスの中に閉じている場合が多い。GeminiはGoogleのサービスと連携し、Siriはアップルのサービスと連携しているものの、他社のサービスとの連携はまだ少ない。ChatGPTなどの場合、連携の幅はさらに限られる。
AIの中にある能力だけで解決できる範囲には限界がある。相手が「生成AIである」と考え、生成AIが得意とすることをやらせる分には問題がないが、Alexaに求められるのはもっと幅が広い。
おそらくだが、Amazonが苦慮したのはその部分だ。
Alexaは「Skill」という形で他社のサービスとの連携を進め、他社周辺機器の対応を強化してきた。
AmazonでAlexaの開発を統括するバイスプレジデントのネディム・フレスコ氏は、筆者とのインタビューの中で次のように述べている。
「オリジナルAlexaでの10年間で、『ゆっくりと多くの製品やサービスをAlexaに対応させる』こと自体がハードワークであることをよく分かっていた」
だからこそ、オリジナルのAlexaが広げた「他社との連携」について大切にし、Alexa+で互換性を維持して「色々なことが最初からできる」存在を目指したのだ。
ウェブ連携で可能性を拡大
もう一つ、Alexa+の面白い特徴に「ウェブからの情報を使ってサービスを拡大する」という要素がある。
デモとして清掃事業者を選ぶ例が公開されたが、そこではAPI連携した特別な事業者ではない。Alexa+が事業者の公開しているウェブの情報をまとめ直し、オススメの事業者を提示していた。
ネット情報を使って質問に答える、という機能も大きな価値を持つ。
これは、過去からの互換性を超えて、「ネットに存在する情報をうまく使ってサービスを拡大する」という可能性を示している。
この考え方、要は「AIエージェント」であり、多くの生成AI事業者が目指している方向性とも重なる。
文書作成や事業効率化、リサーチなどには、他の生成AIが目指すAIエージェント化が向いている。
だが家庭の中ならどうだろう?
技術的には近しいことをやっていても、実装の方向性として、Alexa+がやっていることはかなり正解に近いのではないかと感じる。
生活の場でデモ以上のことをやらせた場合、どうなるのかはまだ分からない。しかし、非常に期待を持てるものであることは間違いない。
「ディスプレイ付き」がスマートホームの主役に?
Alexa+の登場後、他社の生成AIはどうなるだろうか?
家庭・個人向けの用途で、生成AIが苦戦しているのは間違いない。GeminiやApple Intelligenceは可能性のある技術だが、「これが便利」という用途に欠けている。メールの返信代筆や通知の要約、「ジェン文字」などの機能はいい機能だと思うが、10人が10人に響く、というわけでもないだろう。ここからいかに用途を開拓するかがキモだ。
Alexa+は「Amazonのビジネスに沿ったやり方では」というエクスキューズがつくものの、かなり面白い位置づけにある。
各社とも、技術やアイデアはある。どこが先に飛び出すかだけの違いだ。Amazonが答えを見つけたのだとしたら、他社も追いかけ、それぞれの工夫を前に進めるだろう。
そこで感じるのは、「これからのスマートホーム機器」の変化だ。
これまで、スマートホーム向けには、音声を軸にした「スマートスピーカー」が使われてきた。今回のAmazonの発表でもスマートスピーカーである「Echo」が使われていたが、スピーカーだけの製品の姿は少なかった。ディスプレイのついた「Echo Show」が中心だ。
チャット文面が出るだけなら、ディスプレイがある必然性は薄い。だが複数の選択肢を示したり、レシピなどの情報を表示したりするなら、ディスプレイ付きであることが望ましい。
従来のEcho Showは、映像の再生や写真の表示にディスプレイを使っていた。ある意味ディスプレイはオマケ的であり、「あった方がいい」くらいのイメージではある。
しかし、生成AIでAlexaとのコミュニケーションが拡がるなら、音声だけよりも文字が合った方が望ましい。
なぜなら、音声は「最後まで聞かなければわからない」一方、文字情報はより短い時間で情報を把握できるからだ。命令に対する「はい」という言葉だけなら音声でいいが、生成された長い回答をチェックするなら、たしかにディスプレイがあった方がいい。
実は同じ課題はスマートグラスにも存在する。現状はスピーカーだけを内蔵した製品が主流だが、もし安価で見やすいディスプレイが内蔵できるなら、「内容を素早く把握できるから、ディスプレイ内蔵の方が望ましい」とみられている。
スマートスピーカーが生成AI時代に「ディスプレイ付き」、すなわちスマートディスプレイに移行していく……というのはありうる話だし、テレビがスマートディスプレイとして価値を高めていく可能性も十分にありうる。
そんな目線で見ていくと、今年出てくるガジェットの予測にも変化がうまれそうだ。