ニュース

Windows 11、Copilotでファイル検索・音声対話強化　「深い推論」も

西田宗千佳

2024年10月1日 23:00

10月1日(アメリカ時間)、米マイクロソフトは、Windows 11とCopilotに関する多数の新機能搭載について発表した。マイクロソフトとしては「すべての人にAIコンパニオンを」(Microsoft AIのMustafa Suleyman CEO)という方針で開発を進めており、より生活の中で人をサポートするテクノロジーを目指し、「この方向への慎重な第一歩を踏み出す」とする。

同社は現在、オンデバイスAI機能を強化した「Copilot+ PC」を展開中だが、そこに複数の機能を追加することで魅力を拡大する狙いがある。Windows 11の大型アップデートである「Windows 11 24H2」の提供が開始されることもあり、それに合わせ、Copilot+ PC向けにも多くの機能が追加される。

Copilot+ PCへの機能強化は、Snapdragon X搭載製品では10月から、AMD・Intel搭載製品では11月から、Windows Insiderを通じてテストが開始され、その後数カ月で幅広いユーザーに提供が拡大される予定だ。

なお、Windows 11の動作するPCすべてへの提供が開始される「24H2」についても、Bluetooth LE AudioやWi-Fi 7への対応、HDR対応の強化など多数のアップデートが行なわれる予定となっている。

Windows 11、バージョン 24H2 | セキュリティ、エクスペリエンス、パフォーマンス、移行の更新

Recallから検索機能強化まで。Copilot＋ PCに新たな価値が

では機能を順に見ていこう。

まずは「Recall(リコール)」の提供。PC上での行動について記録し、AIの力を借りて検索可能にする機能だ。

Recallの動作画面

先日、Recallのプライバシー方針刷新が公開されたが、これもこの秋以降のCopilot+ PC強化の一環である。

本来は今年6月、Snapdragon Xシリーズを搭載したCopilot+ PCの発売に合わせてテストが開始されることになっていたが、プライバシー対策の見直しなどで提供が延期されていた。

Recallの詳細設定からプライバシー関連の確認も行える

こちらはSnapdragon Xシリーズ搭載のCopilot+ PCで10月にWindows Insiderからテスト提供が始まり、AMD・Intel製プロセッサー搭載のCopilot+ PCでは11月からテストが始まる。一般公開はその後になるが、時期は明示されていない。

次に、新機能として搭載されるのが「Click to Do」。

新機能「Click to Do」。クリックすれば「なにをしたいのか」をAIが判断してメニューから簡単に機能を呼び出せる

これは、画面上の情報をオンデバイスAIが認識し、「可能な処理」をワンクリックで呼び出せるようにするもの。現在右クリックで呼び出せるコンテキストメニューのオンデバイスAI版、というところだ。画面上でWindowsキー＋クリックをすると、写真ならば「背景ぼかし」「オブジェクト消去」などの機能が出てきて、文章なら「要約」「検索」などが出てくる。表示されているものをオンデバイスAIが認識して動作する、という意味では、Recallに近い部分もある。

Windows 11が標準で持っている「検索」機能も、Copilot+ PC向けには改善される。

エクスプローラーでのファイル検索にもAIが導入される

従来は主にファイル名を手がかりに検索する機能だったが、内容に関する検索機能が追加される。例えば写真については、「バーベキューパーティー」など、写真になにが写っているかを文章で検索も可能になる。PCのストレージ内にあるファイルの他、OneDriveとも連動する。

検索機能はオンデバイスAIで動作するので、クラウドには依存せず、PCがオフラインの状態でも動作するという。

まずはファイルを扱う「エクスプローラー」に搭載され、その後Windows全体の検索機能にも導入される予定だ。

超解像やペイントで「生成塗りつぶし」が無料

生成AIが得意な画像系にも機能追加が行なわれる。

まずは「写真の超解像」。オンデバイスAIを使い、解像度の低い写真を4Kまで高解像度化する。もちろんコストはかからない。

低解像度の画像を4KまでオンデバイスAIで超解像可能に

次に「生成塗りつぶし」。画像の一部を生成AIによって補完するものだが、従来はAdobe Photoshopなど、一部のツールでのみ可能だった。だがCopilot+ PCでは、標準添付のツールである「ペイント」が機能強化し、生成塗りつぶしに対応する。

写真の中の修正したい部分を生成AIの画像で塗りつぶす「生成塗りつぶし」がペイントに

超解像機能と生成塗りつぶしについては、OSのアップデートではなく、対応アプリをMicrosoft Storeから取得する形で実現される。どちらも、追加コストはかからない。

Copilotは音声対話を強化ただし日本提供は後日

Copilot+ PCではなく、Webなどを介して色々なデバイスに提供される「Copilot」についても機能強化はある。

わかりやすいのは「Copilot Voice」だろう。文字通り音声での対話を改善する機能だ。

最近はどの生成AIも「音声によるすばやく滑らかな対話」を実現するべく機能強化が行なわれているが、これも同様のものである。

Copilot Voice

それを踏まえて実装されるのが「Copilot Daily」。朝にその日のニュースなどをCopilotが要約し、読み上げる。今後はリマインダーなど自分の予定に加え、パーソナライズ機能なども追加される。

今日のニュースなどをCopilot Visionがまとめて読み上げる「Copilot Daily」

Copilot VoiceもCopilot Dailyも、残念ながらスタート段階では、日本では提供されない。

Copilot Voiceはオーストラリア・カナダ・ニュージーランド・イギリス・アメリカで英語版が提供され、その後他の言語に拡大予定。Copilot Dailyは本日からイギリス・アメリカで提供が開始され、その後他の地域に拡大する予定とされている。

Webブラウザーである「Edge」でのCopilot連携も強化される。ブラウザーのアドレス欄に「@copilot」と入力すると、そこから直接Copilotと対話できる。Copilotのページを開く必要がなくなり、手間が減る。

画面を見ながらAI対話「Copilot Vision」と深く推論する「Think Deeper」

Copilotの将来に向けた機能強化として重要なのが「Copilot Labs」だ。

まだ開発中の機能を提供するための仕組みだが、Copilot Labsの中でフィードバックを受けることで、機能をより適切に導入していくことを目指す。Copilotの有料版である「Copilot Pro」ユーザーから提供開始の予定。

最初の2つの例となるのが「Copilot Vision」と「Think Deeper」だ。

Copilot Visionは、PCに表示されている画面の内容について、Copilotと人が自然に対話する技術。RecallやClick to Doで使われている認識技術を活かしたものであり、対話にはCopilot Voiceが活用されている。

例えば母親が若い頃の写真を表示してCopilotに「この写真、どう思う?」と尋ねると、「いい写真ね。これはどなた?」と返してくる。他人と一緒に写真を見ながら対話する時と同じような反応を返してくれるわけだ。一緒にWebサイトを見ながら買い物の相談をしたり、提案をしてくれたりもする。

Introducing Copilot Vision

Copilot Visionはプライバシーにも強く配慮しているという。

対話中に見ている情報は記録されず、学習にも使われない。セッションが終わると情報は廃棄される。Webを表示している場合、まずは「特定の人気があるサイト」でのみ機能する。また、著作権保護されたコンテンツや機密性の高い情報も扱われない。

Copilot Vision

Think Deeperは、一般的なCopilotよりも「深い洞察」をするための機能。応答速度は重視せず、複雑な質問に対しての推論能力を高めたという。OpenAIが先日、同様の仕組みを持つ「o1」を公開したが、そのCopilot版という印象だ。

ただし公開資料の中では、Think Deeperがo1を使ったものであるかは言及がない。

なお、Copilot Visionは「まもなく」アメリカの限られたCopilot Pro加入者にのみ公開され、徐々に利用範囲を拡大する。また、Think Deeperは本日からオーストラリア・カナダ・ニュージーランド・イギリス・アメリカのCopilot Pro加入者に限定公開という形でスタートするという。日本向けの提供時期については言及されていない。

キーワード：

Microsoft