ニュース

グーグル、最も優れた思考モデル「Gemini 2.5」 推論・コード生成能力が大幅向上

Gemini AdvancedでGemini 2.5 Pro Experimentalに対応

Googleは25日(米国時間)、“最もインテリジェント”という思考モデル「Gemini 2.5 Pro Experimental」を発表した。Google AI StudioとGeminiアプリ、Gemini Advanced(月額2,900円)ユーザーが利用できる。また、Vertex AIでもまもなく対応し、今後数週間中に価格も発表予定。

最新の“2.5”を冠したモデルとなり、高いベンチマーク性能と、強力な推論とコード作成能力が特徴。レスポンス生成中に「思考プロセス」を使用し、応答する前に思考を通じて推論を行なうため、推論能力が向上。複雑なタスクを解決できるようになる。

Google Workspaceでも対応を確認

Gemini 2.5 Pro Experimentalは、複雑なタスクに対応するGoogleの最も高度なモデルと位置づけ。強力な推論能力とコード作成能力を示しており、GPQAやAIME 2025など、数学や科学のベンチマークでトップの性能を発揮。AIベンチマークの「Humanity's Last Exam(人類最後の試験)」は18.8%でツールを使わないモデルでは最も高いという。

各種ベンチマーク
Gemini 2.5 ProとOpenAI GPT-4.5、Claude 3.7 Sonnetなどの比較

コーディング能力も大幅に向上。2.5 Proが推論能力を活用して、1行のプロンプトから実行可能コードを生成する。同社の発表では、プロンプトからゲームを作成するデモも紹介している。

Gemini 2.5: Create your own dinosaur game from a single line prompt

Gemini 2.5は、Geminiモデルの特徴であるマルチモーダル性とロングコンテクストウィンドウを継承。2.5 Proは、100万トークンのコンテクストウィンドウを搭載し、まもなく200万トークンに対応予定。テキスト、音声、画像、動画、コードなど、さまざまなソースからの複雑な問題を処理可能とした。

2月に公開した初の思考モデル「Gemini 2.0 Flash Thinking」に対し、Gemini 2.5では、大幅に強化されたベースモデルと、改善されたポストトレーニングを組み合わせることで、パフォーマンスを向上。今後は、Googleのすべてのモデルに思考能力を組み込み、より複雑な問題に対応し、高性能でコンテクストを認識するエージェントを実現していく。

Google AI StudioでGemini 2.5 Proを試用可能となっているほか、Gemini Advancedユーザーもすでに利用な状態。今後数週間のうちに、Vertex AIでも利用可能となる予定。