トピック
「メタバースもちろん続ける」 Meta CTOに聞く「AI」「メタバース」の未来
2023年4月13日 08:20
Metaは、FacebookやInstagramをはじめとしたSNSを運営しつつ、近年はいわゆるメタバース関連事業にリソースを注いできた。一方で、同社の研究開発機関であるReality Labsでは、メタバース関連だけでなく、AI関連の研究も数多く行なわれている。
MetaはAIやメタバースにどのようなビジョンを持ち、研究開発を進めているのだろうか? そして、各製品やサービスは、どのような意図のもとに開発されているのだろうか?
MetaのCTO(最高技術責任者)である、アンドリュー・ボスワース氏(Boz)へのロングインタビューの機会を得た。「AI」「メタバース」「コンテンツモデレーション」などをテーマに、Metaがいま、どのようなことを考えているのかを聞いた。
MetaもAIに注力、大規模言語モデルから「自律型エージェント」へ
まず「AI」の話から始めよう。
大規模言語モデルを使ったジェネレーティブ(生成系)AIが、IT業界のみならず社会全体を揺るがす大きな変革になっているのは疑いない。
Metaも先日、LLMである「LLaMA」を研究者向けに提供している。現状をどのように捉えているのだろうか?
ボズワース氏(以下Boz):大規模言語モデルについては10年前から開発し、公正な評価をしてきました。私たちの研究チームは、世界でもトップクラスの研究機関です。
ChatGPTが刺激的であったのは、インターフェースとしての部分にあります。大規模な言語モデルをオフラインからオンラインに移行させ、AIと一緒に人間が1つのループの中にいる状態を作りました。これはとてもエキサイティングなことです。
ただし、OpenAIがやっていることは、私たちがやっていることと比較し、技術的な優位性があるわけではありません。
それに、同じ市場で競争しているわけでもありません。
私たちは皆、「言語モデル」に、同じように取り組んでいるんです。
私たちはAIを、FacebookやInstagram、MessengerにWhatsApp、そしてメタバースやQuestなど、製品を通じた形で、消費者に価値を提供しようとしています。それに対しOpen AIは、AIプラットフォームのサービス会社を作っているところです。
つまり、私たちはまったく異なる空間にいるのだと思うのです。彼らは多大な称賛を受けるに値する、素晴らしい存在だと思いますが、私たちは、自分たちが競争相手だとは思っていません。
また、私たちは、彼らが持っていないいくつかの利点を持っていると考えています。
仮想世界を構築するために多くの勉強が必要だったプログラミングやグラフィックス開発が必須です。しかし今は、AIになにをしたいかを伝えると、コンピュータがそれを生成し、その場で編集できる、非常に強力なツールが生まれつつあります。
つまり、そこで重要なのは「AI」だけではありません。インターフェイスや、AIと一緒に人間がどう働くのかも重要なことなのです。
私たちは長い間、この技術の最前線にいました。そして今、このようなユースケースを探すための特別なチームを作りました。
メタバースはもちろん、Instagram(インスタグラム)やFacebook、Messenger、WhatsAppなどでも利用されています。
私たちが提供するアプリケーションの多くは、非常に安全なものばかりです。例えば、うまく機能しないかもしれませんが、悪いことは起こらない。
ですから、私たちは生成系AIにとても期待していますし、消費者の手に届くようにする方法について、たくさんのアイデアを考えています。
一方で、AIには安全性と安心、正確性について課題がある。Metaとしてはその点をどう考えているのだろうか?
Boz:その観点については、複数のレイヤーが存在します。
1つ目は、リスクがほとんどないアプリケーションもたくさんある、ということ。私がAIに、「写真向けのフィルターを作って」とお願いしたとしましょう。そこでは多少の不都合が起きても、悪いことは起こらない。そういうユースケースは、すでに大量にあります。間違えてもリスクはない、一方で消費者にとって価値のあることを、今すぐにでも実現できる。それが1つの鍵だと思います。
2つ目は「言語」です。AIが間違ったことを言ったり、意地悪をして傷つけたりすることもあるでしょう。そこで、業界全体が“フィルター”を開発中です。
私が言いたいのは、今のAIも「インターネット上のどの場所よりも悪いわけではない」ということです。インターネット上の人々が、今も間違っていることを正しいと思うように。
もちろん、私たちはもっといいことができるはずです。私たちはもっとうまくやれるはずです。
検索で本当の答えを得たいと思っても、推測で答えられては困ります。
私たちのAI担当チーフ・サイエンティストであるヤン・ルカン(Yann LeCun)は、この夏、大規模言語モデルを超えて「自律型エージェント(Autonomous Agent)」と呼ばれるものに移行するために必要な将来の仕事について、素晴らしい論文を書いています。そして、私たちの研究チームも、自律型エージェントに焦点を当てています。
自律型エージェントは世界をモデル化できます。なぜなら、彼らは大規模言語モデルよりも大きなメモリー(トークン数)を持っているからです。現在の大規模言語モデルが処理できるメモリーはとても小さいので、長く話を続けるのは難しいし、世界を理解する能力も持っていません。
より高度な認識を望むなら、もっと研究する必要があります。だから私たちは、そこに多くの投資をしているんです。
MetaのAI担当チーフ・サイエンティストであるヤン・ルカン氏は、現在の機械学習(AI)の基礎的な手法である「畳み込みニューラルネットワーク(CNN)」のパイオニアであり、2018年にはディープラーニングの研究でチューリング賞を共同受賞している、このジャンルの巨人である。
Boz:私たちの研究は、今後10年間のAIが進むべき方向について、非常に明確なビジョンを持って継続されています。そして、ヤン・ルカンには素晴らしい実績があります。
彼はニューラルネットワークのパイオニアです。誰もが「ニューラルネットワークは無価値だ」と言っていた時代あら、それを信じていました。ですが、この15年間、ニューラルネットワークはAIを支配するパラダイムとなったのです。素晴らしい先見性です。
そして、私たちはそれとはまた別に、より近い将来、仕事をするために生成AIを引き出し、それを自社の製品……メタバース、インスタグラム、広告、そして自社のコーディングやエンジニアリングなど、に活用していきます。
大規模言語モデルは翻訳とコンテンツモデレーションに活躍
もう少し、実現に近い部分ではどうだろうか。
AI、特に大規模言語モデル(LLM)には、「言語の壁を超える」力がある。すでに翻訳では多く使われており、Metaもこの分野で多くの研究をしている。
Boz:大規模言語モデルのユースケースとして、おそらく最初に開発されたのが翻訳でした。
例えば、私たちは最近、中国語の珍しい方言である「福建語」の翻訳を開始しました。福建語はあまり広く話されておらず、文書もあまりありません。
しかし、非常に少ない情報から、大規模言語モデルが福建語を十分に学習し、ライブ翻訳を行なうことができました。
ですから、私たちの目標は、あらゆる言語からあらゆる言語へのライブ翻訳が可能な大規模言語モデルを手に入れることです。明らかに野心的で、価値のある製品になると思います。
素晴らしいARメガネが準備できれば、どんな言語でもライブ翻訳でき、どんなサインや画像でも翻訳することができます。
ですから、私たちは、このプログラムを懸命に推進し続けます。
しかし、現在の課題は、まだ計算コストが高いことです。そのため、モデルだけでなく、小型のデバイスで効率的に動作させることにも力を入れなければなりません。サーバーベースでの翻訳では、あまりにも遅いですからね。
Bozが話した「福建語」の例は、2022年10月に発表されたものだ。
Metaは「Universal Speech Translator(UST)」というプロジェクトを進めているのだが、この技術では、他の多くの翻訳技術とは異なり、「英語」を介さない。例えば日本語からウクライナ語に翻訳する場合、多くのツールは日本語>英語>ウクライナ語、といった形で翻訳するが、USTでは日本語から直接ウクライナ語に翻訳することを目指している。そしてその場合、話者が少ない言語が不利にならないようにすることが重要となる。
もう一つ、MetaにとってAIの重要な活用先が「コンテンツモデレーション」だ。
コンテンツモデレーションとは、「不適切」と思われるテキストや写真・動画などを管理し、場合によっては削除などを行なうものだ。
MetaはFacebookなどでの「問題のある書き込み」のコントロールに苦慮してきた。まだまだ課題は大きいものの、Meta自身も課題と考え、積極的に大規模言語モデルの導入を進めている。
Boz:コンテンツモデレーションには、現在最も先進的なAIツールが使われています。ニュースフィードや広告での活用よりも先を行っているのですが、これらの用途への拡大も進んでいます。
大規模言語モデルが登場する前の長い期間、最新のAI研究を最も活用していたのはコンテンツ・モデレーションチームでした。コンテンツ・モデレーターの人間を助けるために非常に洗練されたモデルを構築し、一定レベル以上のアクションを自動的に行なうスコアを提供し、効果的に支援していました。また、一定レベル以下であれば、人間側のレビューを求めることができます。私たちは世界で最も優れたコンテンツ・モデレーション技術を持っている、と考えています。
完璧ではありません。間違っている例も常にあります。監督委員会と協力して、時間をかけてポリシーを改良していきますが、現在の技術も非常に優れていて、非常に効率的です。
今後は大規模言語モデルによって、さらに改善されるのではないかと思います。
一方で、「不適切な内容」を書きたい人は必ず裏をかいてきます。コンテンツモデレーションツールが良くなると、不適切なコンテンツを書きたい人たちが、それをかいくぐる新しい方法を見つけるんです。そのため、モデルを適応させ、再教育する必要があります。大規模言語モデルは、「コンテンツモデレーションをかいくぐる技術」をより速く学習できるかもしれません。
ですから、私たちは今後もこの分野に投資していくつもりです。
コンテンツモデレーションでは「塩梅」がとても重要です。
人々は自分の言いたいことを言う権利があります。あまりに多くの投稿を削除してしまうと、非常に悪い影響を与えてしまいます。逆にあまりに少ないと、敵対的な雰囲気になり、人々はその場にいることを嫌がります。
良い塩梅を見つけるそのため、私たちはコンテンツモデレーションに多大な投資を続けています。
メタバースは「すでにある」
次に、みなが気になっていることを聞きたい。
それは「メタバース事業、まだ続けるんですか?」ということだ。
もちろん、同社は「続ける」「注力する」と以前からコメントしているし、Bozの回答も同様だ。だが、もう少し深掘りした言葉が返ってきた。
Boz:テクノロジー業界には「ハイプ・サイクル」と呼ばれるものがあります。まあ、この業界に長くいる人は、そういう「雑音」がよく聞こえてくるものだ、ということもわかると思うんですが(苦笑)。
私たちは、この仕事を理解しています。メタバースがまだ完全なものでないことは知っていますから、改善に取り組んでいます。解決可能な問題であると信じているんです。
私はよく「メタバースはすでにある」という話をします。ただ、どこの誰にでも、均等に広がっているわけではありません。
現在、VR用のHMDは、「人々が一緒に時間を過ごす」ことに使われています。ソーシャルなユースケースに、1番時間を費やしているわけです。
すでにコンセプトはあります。私たちが構築しようとしている「Horizon World」は、それ自体がゲームや体験になるのではなく、誰でもコミュニティを作り、ゲーム体験を作ることができるようにするものです。これは、Facebookがインターネット上で自分の存在感を示し、他の人とつながることを可能にしたのとまったく同じ種類の「民主化」です。
私たちはこれらのコンセプトにまだ自信をもっていますが、必要なすべてを把握し、チューニングするには、まだ時間がかかりそうです。ですから、私たちはまだ投資を続けていきます。
この意見には筆者も同意する。
メタバースはコミュニケーション空間として可能性をもったサービスだが、それを構成する技術や必要なサービス要件などは、まだ出来上がっていない。それを見つけるにはもう少し時間がかかる。もともと長期戦略であったこともあり、今賭けから降りるのは得策とは言い難い。
Bozは、また別の観点から次のような例も示す。「ビジネス向けの活用がまず広がるのではないか?」という筆者の問いかけに頷きつつも、その先が重要、との見方を話す。
Boz:弊社の「Meta Quest Pro」では、バーチャルな空間での生産性・コラボレーションを目指し、パーソナルワークのための空間を作り出そうとしています。メタバースのビジネス・ビジョンとして、たとえ物理的に同じ場所にいなくても、人々が一緒に時間を過ごすことができる、という要素も重要です。
しかし、メタバースは本当に、ずっと大きなものです。
メタバースは、ひとりで行ってゲームをし、新しい人と出会ったりする楽しい場所であり、また、友人と行く場所でもあると思います。イベントを企画するのもいいですね。
アメリカ人はボウリングが好きです。人間が行なう行為として、ボウリングはかなり奇妙な行動だとは思いますけど(笑)、楽しい。
なぜボウリングをするのか? ボウリングが好きな人もいれば、友達と飲むためにボウリングをする人もいます。
ポイントは「一緒にいること」。ただ部屋に座ってお互いを見つめているだけではダメです。
メタバースには一緒にできるアクティビティがたくさんありますが、重要なのはアクティビティそのものではなく「一緒にいること」です。
「Fortnite」は、その好例です。
Fortniteでこの2週間に起きたことは、素晴らしい例です。携帯電話やゲーム機、PCで、バトルロワイヤル・ゲームをプレイしているのですが、誰もお互いを撃ち合ったりはしません。バトルロワイヤル・ゲームなのに!
Fortniteの例のように、私たちの周りにはメタバースが垣間見えます。しかし、私たちはまだその可能性に気づいていないだけなのです。
Fortniteの例については、少し説明が必要かもしれない。
FortniteはEpic Gamesのバトルロワイヤル・ゲームだが、3月23日に「Unreal Editor For Fortnite」というPC用のツールを公開した。
これは、Fortniteでも使っているEpic Gamesの最新ゲームエンジン「Unreal Engine 5」の機能を活かし、Fortnite内で遊ぶマップやアクティビティを開発できるものだ。その結果、多数のマップが公開され、その中で遊びまわる人の姿が多く見られた。SNSでも、そうした状況がシェアされている。
AIに生成させたバーチャル新宿をFortnite上にぶち込んでゲームできるようにしてみた(開発期間は3日)。Fortnite上に並行世界が作れそう。
— 佐藤航陽 🌎 著書「世界2.0 メタバースの歩き方と創り方」 (@ka2aki86)March 30, 2023
ChatGPTと連携してゲームシステム・ストーリー・会話などもAIに作らせて、VR対応できればガチのマトリックスだな。#UEFN#Fortnitepic.twitter.com/Ras5FUvtoD
Epic Gamesという他社の例ではあるが、こうした動きが、メタバースの一端が可視化されたものである……とBozは言いたいのだろう。
一方で、メタバース自体は産業としてなかなか大きくなれずにいる。だからこそハイプサイクルにおける「落胆」の時期が来ているのだし、市場性に疑問を持つ人もいるのだろう。
メタバースが大きな市場になるには、どのような条件が必要なのだろうか?
Boz:(メタバースを利用する頻度に)現状は、ムラがあるのでしょう。
メタバースに行くことが日常的な習慣になっている人たちが、すでにいます。彼らはすでにここにいて、メタバースで暮らすことが好きで、有意義なことだと感じているのです。
問題は、それがより広範な行動となるには、どれくらいの時間がかかるかということです。それに対する良い答えがあるとは思えません。しかし、今は何が原因で成長が遅れているのかはわかっています。だから、その問題に取り組みます。クリエイターに力を与え、コミュニティ・ビルダーに力を与え、コミュニティの友人を招待し、ツールを提供する。
これらはすべて、FacebookやInstagramでもやってきたことです。私たちは、クリエイターやコミュニティのモデレーターが仕事をするのを助けるため、ツールの構築に多くの時間を費やしました。
その種のことはメタバースでも進めています。
しかし、それがいつ実を結ぶかはわかりません。バーチャルリアリティ(VR)だけでなく、携帯電話、ウェブブラウザ、PC、コンソールなど、メタバースは「人々がいるすべての場所」にあるべきだと思います。
「スタートレック」でわかる、メタバースにAIが必要な理由
MetaはAIとメタバースに対し、同時に投資している。
「AIはメタバースの構築にどう影響するのか?」という問いに、Bozは以下のように答えている。
Boz:もちろん重要です。AIは、メタバースを誰でも利用できるようにするために必要です。
「スタートレック:ネクストジェネレーション(TNG)」はご存知ですか?
筆者:もちろん!
Boz:よかった。あの作品に「ホロデッキ」が出てきますよね。あのイメージを思い浮かべてください(筆者注:ホロデッキは、TNG劇中に出てくる、自分が体験したい世界をそのまま再現する設備のこと)。
例えば「森に行きたい」とします。現在、森をメタバースで再現するには、自分でモデルを用意し、場合によってはプログラミングもしなければならない。
でも将来は「森を作って」と言えば、それが自動生成されるようになるはずです。そこに友人を招待し、「自分の姿をロビン・フッドにしたい」と言えばいい。そうすれば、アバターがロビン・フッドの姿になります。
AIが作れないような、斬新で美しい世界を作るクリエイターの存在は重要です。そこに市場が生まれるわけですから。メタバースでは、プロフェッショナルが作った体験やゲーム、コスチュームをやりとりする、大きな市場が出来上がるでしょう。
しかし、欲しいものが言葉で現れるのも楽しいし、重要です。
ここで示されたビジョンは、一部がすでに「Builder Bot」と呼ばれる技術で再現されている。2022年2月に発表されたもので、音声の指示でメタバースに置くオブジェクトを作り、配置などを構成していく。
これはあくまで初歩的なものであり、AIがメタバース環境を用意してくれる=ホロデッキ的ビジョンには程遠い。しかし、音声認識や生成系AIを進化した先に、ホロデッキのような世界を作る技術があるのもまた事実。MetaはそのためにAI開発を進めている、ということなのだ。
HMDは「低価格」と「ハイエンド」の両方が重要
Bozもいうように、メタバースはPCやスマホなど、あらゆる場所から使えるようになるべきである。
ただそうは言っても、メタバース「HMD(ヘッドマウント・ディスプレイ)」がつきものだ。PCでもスマホでもメタバースには入れるが、やはり、HMDによって視界を覆って自分のいる場所が入れ替わっているような錯覚をもたらすことが、重要な要素にもなっている。
一方で、HMD開発はなかなか難しいものだ。良い製品が出始めたが、まだ理想的なHMDは生まれていない。
理想的なHMDを作っていく上で、Metaはなにが重要だと考えているのか? 答えは少々意外なものだった。
Boz:VRでは、熱容量と膨大な量のセンサーを管理することが重要です。
携帯電話には1つか2つのカメラがあり、同時に作動しています。さらにマイクが動作しているかもしれませんが、それだけです。
VR用ヘッドセットには、自分の位置を把握するためのセンサーがいくつもついています。Mixed Realityを実現するパススルー用センサーがあるかもしれません。ハンドトラッキングや空間トラッキングのためのセンサーがあるかもしれません。視線追跡や表情認識用のセンサーもあります。
一度にたくさんのカメラを動かすのは、バスや帯域幅に制限が起きやすく、プロセッサにとって本当に難しいことです。そこから熱量的な制限も生まれます。そのため、最高のモバイルプロセッサーを採用したとしても、動作の制約はプロセッサーの性能ではなく、ヘッドセットから安全に放熱できる熱量から生まれるのです。
また、画質を上げるためにスクリーン解像度を上げると、レンダリングコストが2次関数的に増加します。
もし、本当に優れたFoveated Rendering(視野の中央を認識し、周辺部の解像度を下げることで、演算量を減らしつつ、画質を維持する技術)ができれば、演算量の増大を回避できるかもしれません。しかしそれには、本当に優れたアイトラッキングが必要です。しかも、アイトラッキングにも計算コストがかかります。
このような事情から、熱とセンサーの数が、優れたディスプレイ・優れたヘッドマウントディスプレイを提供するための最大の制約条件だと思います。
だから私たちは、サプライヤーとの協力関係を大切にしています。日本や中国、韓国など世界中の優れたサプライヤーと協力して、これらの問題を解決し、より熱効率の高い、スペース効率の高い、計算効率の高いセンサーを作る手助けをしています。
Metaは現在、「Meta Quest Pro」と「Meta Quest 2」という2つのラインを展開している。前者はハイエンドで、後者は普及型だ。
Boz:もちろん、価格も重要です。このカテゴリーの製品は、非常に価格に敏感ですし、誰もが手にできるものにしたいからです。特にソーシャルアプリケーションでは、より多くの人がヘッドセットを持っていることが重要になります。
同時に私たちは、技術を前進させたいとも考えています。だから「Quest Pro」のような、Mixed Realityを実現するプラットフォームも必要です。また、ソーシャルプレゼンスの向上には、フェイストラッキングやアイトラッキング、高精度なハンドトラッキングが必要です。
そうした要素を持ったHMDを「VR 2.0」と呼んでいます。
一方で、それらの技術すべてを低価格帯に導入する方法はまだありません。そこで、より高い価格帯で、マニアや開発者向けに導入しました。
着脱が容易で快適な使い心地を求めるプロフェッショナルの方々にも、満足できるだろうと考えています。
一方で、Quest Proは先日、226,800円から159,500円へと大幅値下げされた。これはなぜなのだろうか?
Boz:価格が低くて量が多ければ部品代が安くなり、価格が高ければ量が少なくても部品代が高くなります。双方、2つの価格帯で経済性は同じです。そのため、ほとんどの企業は高いほうを選びます。その方が、将来的に高い値段を付けられますからね。
弊社は、多くの人に使ってもらいたいので、できるだけ低価格を選ぼうと考えていました。
製品を市場に投入した後、しかし、1月に価格テストを実施し、その変化を見たところ、低価格でも十分な経済性があると確信しました。それで、私たちは価格を下げたんです。
ただ、これは一面しか表していないのではないか、と筆者は考える。1月にはHTCが、同じくハイエンド型のライバルである「HTC VIVE XR Elite」が発表されており、これが179,000円と、Quest Proより大幅に安かったことが影響している可能性は高い。
今後、Metaのライバルはさらに増える。真偽のほどはともかくとして、アップルもHMD二への参入を準備中、と噂されている。
「ライバルのHMDが多数登場することをどう思うか?」とBozにたずねると、彼は次のように答えた。
Boz:本当に良いニュースだと思います。
私たちは、VRで自立した開発者エコシステムとして構築したいと考えています。
例えば、ソニーがPlayStation VR 2を発売したとき「Beat Saber」をソフトとして提供しました。Beat Saberは私たちがライセンスを持っているタイトルです。
我々はソニーとも非常に良好な関係を築いていますが、ヘッドセットでは競合しています。
デベロッパーにとって、消費者のためにできる最も重要なことは「より多くの優れたコンテンツを提供すること」です。そして、そのためには、より大きな市場が必要です。
HMDのメーカーが増えれば、より多くのイノベーションが生まれると思います。私たちもそこから学ぶことができます。
そして、デベロッパーの市場が拡大すれば、私たちも自信を持って戦えるようになります。
私たちのHMDで最も重要なことは、開発者が経済的に成功することです。
要は、スマートフォンのアプリで起きたことと同じ状況がVRでも生まれることが重要、という考え方なのだ。
ARグラス開発は「エコ」のためでもある
次に重要なのが「持続性」、すなわちエコロジーの問題だ。
AIにしろメタバースにしろ、サーバーの規模とその負荷は大きくなるばかり。人類が供給可能なエネルギーの量は限られており、それは、今後の文明が持続可能なレベルで展開しなければならない。
いわゆるビッグテックには、持続性の観点からの責任も大きくなっている。テクノロジーは、課題解決のカギとなる。
Metaはその点をどう考えているのだろうか?
Boz:これには3つの要素があります。
1つ目は効率化。もちろん、私たちは常に効率化に取り組んでいます。これは非常に得意とするところです。非常に複雑な機械学習モデルをデバイス上で実行できるように小型化することは、Metaが得意とする技術のひとつです。結果として、驚異的な効率化を実現することができるのです。
こうした改善は非常に予測しやすい曲線を描きます。新しいテクノロジーは、最初は非常に非効率的ですが、非常に早く、より効率的にする方法を学ぶことができるのです。経済的にも、こうした技術革新を進めるインセンティブは多くあります。
2つ目は、私たちのサーバーやデータセンターについてです。私たちはクリーンな再生可能エネルギーにコミットしています。
そして最後に、3つ目のピースは、時間の経過とともに変化するものです。
AR(拡張現実)は、歴史上最も大きな環境改善のひとつになるでしょう。
素晴らしいARグラスがあれば、どれだけのデバイスをなくすことができるとお思いですか?
スマホもいらないし、ノートパソコンもいらない。(会議室の大きなテレビを指差して)あれもないでしょう。
まだはるか先の話になりますが、もし理想的なARグラスが実現するなら、巨大でエネルギーを消費するディスプレイを、こんなにたくさん持ち歩き、配置する必要はなくなります。現在の何十分の一のエネルギーで済むようになるでしょう。
最後の話は少し極端だが、面白い発想だ。
現在のディスプレイは、ほとんどが「高い輝度かつ、広い面積で映像を見せる」ために存在している。そのため空中に大量の光を放出しているわけだが、もし、自分の目にだけ「仮想的な空間の中に映像を届ける」ことができれば、話は変わってくる。ごく小さな面積に映像を流せばいいので、エネルギーの消費量は激減する。
フラットパネルではなく走査型のレーザーで網膜に投射するなら、「網膜に影響を与えないくらい弱い半導体レーザーを駆動させるエネルギー」だけで済むことになり、さらに桁違いに下がる。
Bozが話しているのは、そんな未来の可能性だ。
ここで疑問も出てくる。すべてのディスプレイが不要になる、とまではいかないものの、「十分に実用的」なARグラスの登場はいつになるのだろうか? MetaがARグラス向けのプロジェクトを進めているのは、よく知られている。それらの登場時期はいつになるのだろうか?
Boz:コスト的な理由から発売はできないかもしれませんが、非常に優れた内部プロトタイプに取り組んでいて、その完成度に私たちは興奮しています。
私たちにとって重要なのは、開発した技術を、消費者にとって納得のいく経済性との間を、どのように結びつけるかということです。
ですから、初期バージョンが市場に出回るようになるまでには、まだ何年もかかると思います。
とはいえ、10年以内には十分普及している。10年経てば「驚くほど進歩した場所まで到達している」ことに気づくはずです。
Metaはなぜリサーチに投資するのか
これらの例でお分かりのように、Metaはかなりのコストを「研究開発」に投じている。一方で、レイオフも進行し、会社のコントロールは常に大変な状況にある。その上で、研究開発自体にはあまりブレーキはかけないようだ。その理由はどこにあるのだろうか?
Boz:マーク・ザッカーバーグは、会社を効果的に運営するために「投資ポートフォリオ」を重視しています。コアビジネスを維持・発展させるために、有意義なリソースを確保したい。本業で新しいアイデアを試すためのリソースも必要だし、その先のアイデアを進めるためのリソースも必要です。
うまくいくとわかっているアイデアだけを持ちたい、と思ってもうまくいきません。業界で起こった変化に対する事前準備が必要です。それがなければ、変化に気づかないままになってしまう。そして、変化が起きたときに、ついていけない。
ですから、なにが起こるかを知り、それに適応するチャンスを得るために、「遠い未来」になんらかの投資をする必要があるのです。
その良い例が「AI」です。大規模言語モデルが登場する前の10年間が、まさにそうですね。
そして今日、私たちは素晴らしいポジションにいます。適切な研究、適切な人材、そして非常に迅速な対応が可能なのです。
私たちが長い間投資していなければ、生成系AIの分野に追いついていけなかったでしょう。もちろん、Reality Labsや私のチームについても、同じように考えています。
私たちは新しいビジネスを構築しており、それが非常に強力で重要なものになると信じています。VRも重要ですが、ARはもっと重要で、最終的にはスマートフォンよりも重要かもしれません。
ですから、コアビジネスが非常に成功していることは、非常に幸運なことです。現在も圧倒的にコアビジネスに投資していますし、仕事の大半はコアビジネスで行なっていますが、こうした新しい分野への投資のためのエネルギーを確保することは十分に可能です。
最後に、Bozが個人的に気に入っている、注目しているプロジェクトについて聞いてみた。
Boz:おそらく最もエキサイティングなのは「ニューラル・インターフェイス」でしょう。リモコンを手に取ったり、携帯電話を取り出したりすることなく、思考と意思だけでコンピュータやARメガネを操作できるようになるのです。かなりエキサイティングな技術で、非常に良い進歩を遂げています。
今のプロトタイプは、操作する際に指を動かす必要があります。しかし、動きを必要としないプロトタイプもあるのです。筋肉自身はほとんど動かさなくても、機械は「動かそう」という意思を拾うことができます。
筆者:だとすると、タイプするのに指を動かす必要はない?
Boz:そうです。全く使わない。ただし、トレーニングは必要ですが。これは普通のタイピングも同じですね。
まだプロトタイプではありますが、実現への道は開けていると思います。
現代のコンピュータは、人間がループの中にいることを忘れています。つまり、画面→人間→キーボードやマウス→画面→人間→タッチスクリーンと戻る。そしてまた戻る。
ニューラル・インターフェースのエキサイティングなところは、AIから人へ、そして拡張現実へ、キーボードもマウスもなく戻ってくることです。ブレスレットを装着して操作すれば、クローズドループで非常に速く、効率的です。
数年前に買収した会社とともに開発していますが、(足首を見せて)今日はそこのロゴが入ったソックスを履いているんです。たまたま、手に入ったからなんですけど(笑)。
この技術については、2021年の3月、Reality Labsのリサーチに関する取材をした時に見ている。2019年にFacebook(現Meta)が買収したCTRL-labsの技術をもとにしており、以来、開発が続けられているようだ。
ARグラスなどだけでなく、こちらもそろそろ実際に試す機会が欲しい。