ニュース
グーグル「Gemini 2.0」公開 「エージェント時代のAIモデル」
2024年12月12日 01:48
Googleは11日(米国時間)、最新のAIモデル「Gemini 2.0」を発表した。画像や音声出力などのマルチモーダル対応のほか、Googleが目指す「ユニバーサルアシスタント」としての新たなAIエージェント構築をもたらすという。
11日からは軽量なGemini 2.0 Flashの試験モデルを全てのGeminiユーザーに提供開始。また、高度な推論と、長文の文脈理解により調査アシスタントとして機能し、レポートを代行作成できる新機能「Deep Research」も開始する。この機能は11日からGemini Advanced(月額2,900円)で利用できる。
Google 検索におけるAI活用「AI Overviews」は、すでに10億人が利用しているが、ここにもGemini 2.0を活用。高度な推論機能を備えたGemini 2.0をAI Overviewsに展開することで、よい複雑なトピックや、高度な数学、マルチモーダルなクエリ、コーディングを含む複数ステップの質問などに対応可能とする。今週からテストを開始し、2025年には広範囲に展開。さらに多くの国や言語でAI Overviewsを導入していく。
GoogleとAlphabetのスンダー・ピチャイCEOは、マルチモーダル対応のGemini 1.0/1.5は情報を理解・処理するためのものと言及。このGemini上での開発成果から、ローカルのデータとLLMを組み合わせる「NotebookLM」のような、マルチモーダルとロングコンテクストを活用する製品も生まれてきた。
Gemini登場からの1年間で、Googleでは、「エージェンティックなモデル」の開発に投資を拡大。ユーザーの周囲の世界についてより深く理解し、複数のステップ先まで考え、ユーザーに代わって行動を起こすことができるAIを目指してきた。ピチャイ氏は、Gemini 1.0が情報の整理と理解を目的としたのに対し、「Gemini 2.0は情報をより有用なものにすることが目的」と述べている。
Googleによれば、公開した軽量版のGemini 2.0 Flashでも、多くのベンチマークでGemini 1.5 Pro 002の性能を上回っている。Gemini 2.0 Flashは、デスクトップやモバイルWebで11日から利用可能となっており、Geminiアプリでもまもなく対応予定。2025年には対応製品を拡大していく。
また、Gemini 2.0 Flashを活用したユニバーサルAIアシスタントのプロトタイプ「Project Astra」のアップデートなども紹介している。