西田宗千佳のイマトミライ
第256回
Google Pixel 9とGeminiが目指す「スマホのパラダイムシフト」
2024年8月19日 08:20
8月13日(アメリカ太平洋時間)、Googleは、スマートフォン「Pixel 9」シリーズをはじめとした自社ブランドハードウエアを発表するイベント「Made By Google」を、米・マウンテンビューにあるGoogle本社で開催した。筆者も渡米し、その様子を取材している。
Pixelは特に日本で人気であるため、各種製品は同時に発売。積極的なアピールが行なわれているから、すでに多くの人がニュースを耳にしたのではないだろうか。
意外かもしれないが、Googleが「Made By Google」イベントを世界中から記者・インフルエンサーを集めるのは初めてのこと。これまではアメリカ向けのイベント+オンライン配信+各国での説明会というパターンだったので、ちょっと変化が感じられるところだ。
では、Googleはそこでなにを語ったのか?
軸は「Gemini」。同社のAIであるGeminiの活用がスマートフォンにどう影響を与えるのかを分析してみよう。
スマホの情報をAIが整理する
GoogleでPixelおよびAndroid事業を統括する、同社シニア・バイスプレジデントのリック・オステルロー氏は、現状を「コンピューティングに関するパラダイム・シフトの只中にいる」と説明する。もちろん、そのパラダイムシフトをリードするのはAndroidでありPixelである……という話だ。
彼らの考えるパラダイムシフトとはなにか?
シンプルにいえば、スマホに入ってくる情報をAIで整理することだ。
特に大きいのは、通話音声を自動的に書き起こしてサマリーを作る「Call Notes」と、スクリーンショットに含まれる文字や内容を認識、検索・分類する「Pixel Screenshot」だろう。
これらはデバイス内で独立して動作するGemini Nanoを使う。理由はプライバシー保護だ。
音声でリアルタイム対話を実現する「Gemini Live」もスタートした。従来に比べ英語の音声がスムーズになったが、それ以上に、人間側の語りかけが「若干ちゃんとしていない」状態でもちゃんと解釈してくれるのが大きい。
人間は普段、文章のようにちゃんと話しているわけではない。特に思いつきで話し始める時には、いい淀みがあったりふんわりとした話し方だったりするものだ。
従来の音声アシスタントは、「〇〇して」という命令のような形でないと対話を認識しづらく、そこがストレスにもなった。
だがGemini Liveは、リアルタイムに近い素早い対話ができるだけでなく、人間側の語りかけが多少ラフでも、人間同士に近い形でコミュニケーションが成立する。結果として、スマホの操作や検索といったことが、より音声だけでもやりやすくなる。
各社が一斉に目指す「次のパラダイム」
これがちゃんと実用的なレベルで可能なら、たしかにスマホの「パラダイムシフト」である。
スマホは一番身近なコンピュータであり、生活に密着したものだ。一方で、「画面を見て操作する」という点に変化はなく、常にスマホを触っているライフスタイルが常態化している。
「電話」という存在も変化が少ない。メールやインスタントメッセージと違い記録が残しづらく、検索も効かない。携帯電話によってどこでも通話できるようになったが、一方で「どこでも割り込んでくる」存在にもなった。個人に直接つながるものなので、詐欺などの被害にもつながりやすい。
色々な情報が入ってくるものの、それがちゃんと整理されているか、というとそうでもない。結局人間の記憶に頼るシーンは多く、限界も多い。
AIの力によって「画面タッチ以外の操作方法をもっと実用的にする」「情報を要約・検索可能にする」ことは、スマホの使い方を大きく変える可能性がある。それが、彼らのいう「パラダイムシフト」だ。
この変化は、なにもGoogleだけが目指しているものではない。
アップルは「Apple Intelligence」で同じようなことをしようとしているし、サムスンもGoogleと協力しつつも、自社で「Galaxy AI」を展開している。
さらにいえば、マイクロソフトも「Copilot+ PC」で同じような機能の実装を目指している。パラダイムシフトはスマホだけでなく、PCでも起きようとしている。要は「個人が使うすべてのコンピュータ」を巻き込んでいるわけだ。
もちろん、疑問や課題も多い。
現状、英語でしか使えないために日本でその価値を感じられるようになるには相応の時間が必要になるだろう。英語での機能についても、どこまで想定通りの動きになるのか、検証されたわけではない。生成AIという技術の特性上、「オンデバイスで動作する小さなモデルで動かした時の信頼性」がどこまで担保できるのかは、使ってみるまで見通しが効かない、というのが実情だ。
マイクロソフトの場合、目玉機能である「Recall」の提供で手間取っており、Copilot+ PC自体の価値をちゃんと評価できるタイミングになっていない。
どこも「テスト中」「言語に制限がある」段階で可能性だけがアピールされているところ……という見方もできるわけで、「騒ぐには早すぎる」と感じる人もいるはずだ。
だがそれでも、これが大きな変化であるのは間違いない。
これまでの、AlexaやGoogleアシスタント、Siriなどの「音声アシスタント」は、極論すれば「声のリモコン」を実現したところで足踏みしていた。だが、生成AIの力でようやくその先が見えた。生成AI=プロンプトでのチャット、という時代も終わり、個人にとって価値のある機能になってくる可能性が示されつつある。
AI時代にプラットフォーマーはさらに強くなる
機能の実用性の他にも課題はある。
AIを軸にした「パーソナルアシスタント」的な機能を提供するには、3つの条件が必要になる。「高い機能を持ったAIを持つこと」「AIと連携するサービスを持っていること」、そして「パーソナルなAIが生きるプラットフォームや機器を持っていること」だ。
どれか1つの条件をカバーすることは可能だろう。だが、3つすべてを持つのは大変だ。
生成AIをリードする存在だ、と多くの人が考えるOpenAIも「パーソナルなAIが生きるプラットフォームや機器を持っている」わけではない。
現状、明確に3つの条件を満たしているのは、Googleだ。PCも加えるなら、マイクロソフトも満たしている。アップルについては、持っているAI技術の質がGoogleやマイクロソフト、OpenAI・Metaとは違うので一律には比較しづらい。ただ「パーソナルなデバイスに向けたビジネス」に限定するなら、アップルも条件を満たしている……と言えそうだ。
つまり、巨大かつパーソナルなデバイスとサービスを持つプラットフォーマーは有利であり、そうでない企業との差が開きやすい状態になっているわけだ。
これまでの経緯から、スマートフォン・プラットフォームを持つアップルとGoogleには「公正競争」を軸とした規制がかけられつつある。EUのデジタル市場法(DMA)規制により、アップルは「代替ストア」導入を求められ、結果としてEpic Gamesはモバイル向けストアを提供することとなった。
アメリカでは、Googleを「分割」する規制の話が出始めている。それがいいことか悪いことかはともかくとして、プラットフォーマーに対する視座が厳しいものになっているのは間違いない。
そこにパーソナルAIによるコンピューティングの変化が加わると、話はまた複雑化する可能性が高い。
今回Googleは、自社ハードウエアに関する発表会でありながらも、「自社ハード以外でのGemini」への言及が目立った。発売されたばかりの「Galaxy Z Fold 6」(サムスン)や「Motorola Razr+」(モトローラ)などで、いかにGeminiが使われているかをアピールしたのだ。
Googleは、「本日発表されたGeminiに関する新機能はすべて、Pixel 9だけでなく、すでにあるPixelやPixel以外のスマートフォン、Androidのエコシステム全体に提供される」と説明している。つまり、「自社独占でも閉じているわけでもない」とアピールしているわけだ。
これ自体は消費者にとって朗報なのだが、前出のような「Googleの有利さと独占議論」という視点では、また別の形に見えてくる。
Googleはまだ「XRデバイス」を残している
なお、今回の「Made by Google」で語られなかった要素もある。
Googleはサムスンとともに「XR機器」を開発中だ。
5月のGoogle I/Oで取材した際には「年内に別途、消費者と開発者向けに説明する機会を用意する」とされていたが、その機会とはMade by Googleイベントのことではなかった。
まだ市場は立ち上がってきていないものの、Apple Vision Proが日本でも発売された。Metaは「Meta Quest互換機展開」を進めており、9月25日・26日には、Metaの年次イベントである「Meta Connect 2024」が開催され、さらに施策が発表されるのは間違いない。
状況から考えると、Googleはまた年内にイベントを行なう可能性が高い。これらの動きから、スマホとは別のパラダイムについても、また盛り上がることになりそうだ。