ニュース

Gemini 2.0は「エージェント時代」にどう活用するのか グーグルが説明

グーグル・ジャパンは、Google Cloudにおける新サービスおよび機能のアップデートについて記者向け説明会を開催した。今回の発表は、AIの実用化を加速させる「エージェント時代」を見据えたものであり、最新AIモデルのサポートやインフラ強化が中心。

最新AIモデル「Gemini 2.0 Flash」がVertex AI上で試験提供開始された。本モデルは「Gemini 1.5 Pro」と比較して2倍の速度向上を実現し、音声・動画・テキストのリアルタイム処理およびレスポンス返答機能を新たに追加。自然言語からのコード生成精度も13.1%改善するなど、実用性が大幅に向上している。

特筆すべきは、リアルタイム処理を活かした「マルチモーダルライブAPI」の提供。同APIは、複数のデータ形式(音声・動画・テキストなど)をリアルタイムに処理し、即座にレスポンスを返す機能である。画面共有やカメラを活用し、AIが視覚や聴覚情報を理解しながら、人間との自然かつシームレスなインタラクティブ対話を実現する。

また、テキストから高精細な画像を生成する「Imagen 3」もVertex AI上での提供が開始された。今回のアップデートでは、マスク機能を用いて既存画像に対する編集(インペイント)や、生成画像の追加編集が可能に。ほかにも動画生成AIの「Veo on Vertex AI」もプライベートプレビュー版として提供開始された。

さらに、最新AIアクセラレータ「TPU-V6(Trillium)」が東京リージョンで利用可能になった。TPUは「Tensor Processing Unit」の略称であり、機械学習や生成AIモデルのトレーニングおよび推論に特化したアクセラレータ。「V6」ではトレーニング速度が従来比で4倍、推論性能が3倍向上しており、Gemini 2.0の運用を支えるインフラとして提供される。

企業向けAIエージェントプラットフォーム「Google Agentspace(エージェントスペース)」の提供も行なう。同サービスは、企業内に点在するデータを統合し、Geminiの高度な推論機能とGoogle品質の検索技術を組み合わせたもの。Google Drive、SharePoint、Slackなど複数のデータソースから情報を一元的に集約し、従業員が求める情報やナレッジを迅速に検索・抽出する。また、アクセス権限管理を適用することで、情報漏洩リスクを抑えつつ必要なデータのみを提供する。

加えて、業務支援の高度化も可能であり、福利厚生情報の検索、プレスリリースの自動生成、資料作成のサポートなどの複雑なタスクをエージェントが代行する。「Notebook LM Enterprise」との統合により、PDFや動画、Word、PowerPointなどの非構造化データも対象とし、情報検索や要約作業を効率化する。Google Agentspaceは日本語をサポートしており、日本国内での対応も予定している。