西田宗千佳のイマトミライ
第245回
マイクロソフトが目指す「AIアプリを作る」時代、「AIは消える」未来
2024年5月28日 08:00
5月20日から5月23日まで、シアトルに取材に行ってきた。目的は、米マイクロソフト本社での発表イベントと、シアトル市内で開催される開発者イベント「Build 2024」の取材だ。
特に本社での発表イベントで公開された「Copilot+ PC」についてはすでにいくつかの記事でお伝えしている。
では、こうした施策はどういう意味を持っているのだろうか?
それを考えるには、「Build 2024」で発表されたことも合わせて考えていく必要がある。
Copilot+ PCはマイクロソフトの生成AI戦略の一つであり、開発者むけの施策とも大きく絡んでくる。
マイクロソフトの「Copilot」戦略全体を俯瞰し、Copilot+ PCがどんな意味を持っているのかを考えてみよう。
Copilot+ PCがめざすものはなにか
Copilot+ PCとはなにか?
すごく簡単に言えば、「個人向けのPCのうち、Windowsが搭載する、生成AIなどのオンデバイスAIを動作させる能力を備えたもの」を示すブランドだ。
PCの中にはプライベートな情報や機密に関わる情報も多数ある。個人がPCをより便利に使うには、AIがそうした情報に触れる必要が出てくるわけだが、クラウドに情報をアップする形ではできることに制限が加わる。
Copilot+ PC対応のWindows 11に搭載される「Recall(回顧)」は、典型的な「オンデバイスAIが必要な機能」だ。
Recallではスクリーンショットを定期的に記録、その内容を生成AIが解析して内容を検索用のインデックスにすることで、後から「青い服」「赤い車」「3日前に使ったプレゼン資料の中のキャッチフレーズ」といったざっくりしたキーワードから「この間見たアレ」を見つけ出せるようにする。PCで行なった作業すべてを記録するので、当然プライバシーも機密保持も重要になる。だから処理はPC内で完結するよう、オンデバイスAIを使うのだ。
オンデバイスAIは画像処理や音声認識などで広く使われている。しかし、この2年で急速に進展した生成AIの力を使うには、十分な処理性能が必須となる。
生成AIのほとんどはクラウドで処理されている。開発用途を含むオンデバイスAI処理は、現状、PCではGPUを使う例がほとんどだろう。
世の中にあるPCが皆、高性能なGPUを搭載しているならそれでもいい。だが、巷にあるPCの大半はノート型であり、NVIDIAやAMDのdGPUを搭載したPCを持っている人は多くない。
一般的なコストとそれら機器の中で許される消費電力の中で生成AIをちゃんと動かせるようにするには、PCが使うプロセッサーの中に、十分なパワーを持っていて、しかも効率的に生成AIを使える機構が必要になってくる。
それが「NPU」だ。
Copilot+ PCでは「40TOPS以上」という、かなり強力なNPUの搭載が必須条件になっている。アップルが先日発売した「iPad Pro」に搭載した「M4」のNPU(Neural Engine)が38TOPSなので、それより上であることを求めているわけだ。
現状、Windows PC向けで40TOPS以上のNPUを搭載しているのは、クアルコムの「Snapdragon X」シリーズのみである。だから今回発表されたCopilot+ PCは、すべてSnapdragon Xシリーズで動作している。
ただし今年後半には、インテルやAMDから「40TOPS以上のNPU搭載」の条件を満たしたプロセッサーが登場する。
だから別の言い方をするなら、本格的な競争は2024年後半にスタートすることになるわけだ。
OSに生成AIを組み込む「Windows Copilot Runtime」
ここで重要なのは「Copilot+ PCが40TOPSのNPUを必要とすること」自体ではない。
ポイントは、WindowsというOSが「NPUが搭載されたPCを求めるようになり、その活用方法を定めた」という点だ。
今回マイクロソフトは「Windows Copilot Runtime」というレイヤーをOSの中に設け、これを介して40種類以上のAIモデルを使えるようにする。
WindowsにはAI関連処理を行なうローレベルなAPIとして「DirectML」が用意されており、GPUなどを使ってAIを使ったアプリケーションの開発を行なう場合にはこちらを使う。一方で、もっと簡単にAIの価値をアプリに入れていくための方法論も必要であり、そこをカバーするのがWindows Copilot Runtime、ということになる。
例えば前出の「Recall」で使われているAIによるインデックス処理も、それ自体がWindows Copilot Runtimeの機能として提供されるので、Recallとは別の機能を持つアプリを開発者が作ることも可能になっている。
Windows Copilot Runtimeが組み込まれる予定であり、今年後半の公開予定のアップデート「24H2」に向けて、アプリ開発を進めてもらいたい……というマイクロソフトの意図も見えてくる。現状、Copilot+ PCを満たすための条件は高く、買い替えには相応のハードルがあるが、アプリケーションが充実していけば買い替えの促進になる。
ただ、Windows Copilot Runtimeに組み込まれる生成AIは「GPT-4ほど賢くはない」ということも理解しておく必要性がある。単にプロンプトで知識を聞くようなやり方では、さほど便利にはならないだろう。
Recallが「画像になにが写っているかの情報をインデックス化する」のにAIを使うのも、「複雑な質問」自体ではなく、インデックス化という、求められる機能の枠が定まった使い方をしたいからだと考えられる。
だとすれば、公開されたWindows Copilot Runtime向けの言語モデルを使い、「どんな命令を与えてなにをさせるべきか」を考えつつアプリ開発をするのが良い……ということでもある。
AIが「アプリ」「機能」として組み込まれていくためには
マイクロソフトが提供する「Copilot」関連機能はCopilot+ PCだけではない。
Team Copilotなどのビジネス向け機能は、Copilotの持つ能力を活かしつつ、チームでの働き方を円滑化する「チームメンバー」として仕事をサポートしてもらうことを狙った機能だ。
生成AIというと多くの人は、ChatGPTやウェブ版のCopilotのような「チャット的UI」を思い出す。
だが、チャット的UIが常に使いやすいわけではない。色々なことをAIに命令するにはいいが、「自分がなにをして欲しいか」をちゃんと把握した上で、それを文章の形にまとめないといけない。チャット的UIを使った生成AIサービスは決して「ネット検索」ではないのだが、多くの人が検索的に使ってしまうのは、「して欲しいことを考えて命令する」のがそれだけ難しいことだから、でもある。
しかし、AIの使い方はチャットで指示するだけではない。またチャットを使ったとしても、その指示対象が「AIの中の知識」とは限らない。
ビジネス向けのCopilot拡張機能として紹介されたものは、どれも「使い方がある程度決まっている」ものを、チャットなどの少ない労力でカスタマイズし、より日常的に使えるように工夫したものと言える。
AIを使ったアプリを作るというのはそういうことだし、Windows Copilot Runtimeが目指す「WindowsというOSの中にAIを組み込んでいく」行為は、ウインドウのパーツと同じ感覚でAIを使ってアプリを作っていけるようにする、ということでもある。
今回のBuildでは、AIが大きな可能性を持っていることは何度も説明されたものの、マイクロソフトやパートナーのOpenAIが持っている言語モデルの機能や性能の詳細が語られることはなかった。そこは日々変わっていくものだし、マイクロソフトとしても今必要としているのは「いかにAIを使ったアプリやサービスを増やすか」という観点なのだ。
Buildの基調講演で、マイクロソフトのサティア・ナデラCEOは以下のように説明した。
「Copilotは3種類ある。1つはサービスとしてのCopilot、次に企業のアプリケーションに入っていくCopilot、最後がPC上で動作するCopilot+ PCだ」
どれもCopilotだが、それぞれが違うレイヤーで使われ。それぞれに向けたアプリケーションが開発され、個人や企業が利用する形になっていく。
基調講演の最後には、OpenAIのCEOであるサム・アルトマン氏が登壇した。彼の口から新情報は出てこなかったが、彼が来場者に語りかけた内容は、新しいGPTシリーズが出てくるのと同じくらいの意味を持っていた、と筆者は考えている。
「今の生成AIは、インターネットの普及機と同じような、大切な時期だ。一方で、モバイルが普及しきってしまったら、誰も自社を『モバイルの会社』とは言わなくなった。(モバイルの要素があることは)当たり前になったからだ」(アルトマンCEO)
すなわち、今は開発者にとって重要な時期ではあるが、「AIを使っている」だけで珍重される時期はすぐに過ぎ去る……と見ているわけだ。
そんな時に備えて、アプリの中の一要素として「AI」を活用できる基盤が必要になる。
特にマイクロソフトがCopilot+ PCで主張したかったのは、「自分たちがPCで新しい基盤を作ったから、その上でソフトを作って欲しい」というメッセージなのである。