ニュース

グーグル、Gemini 1.5 Pro/Flash最新版 50%値下げや速度向上

Googleは24日(米国時間)、AIモデル「Gemini」の最新バージョンを提供開始したほか、Gemini 1.5 Proの価格値下げを発表した。Google AI StudioとGemini APIから利用可能で、Google CloudではVertex AIから各モデルを利用できる。

新たに「Gemini-1.5-Pro-002」と「Gemini-1.5-Flash-002」を公開。また、1.5 Proの価格は50%以上値下げ(プロンプトの入力と出力が128K未満の場合)し、1.5 Flashのレート制限は2倍に、1.5 Proでは約3倍に引き上げる。出力は2倍高速で、レイテンシーは1/3になる。

Gemini 1.5では、全体的な品質を向上し、数学、長文、Vision(視覚認識)において大きく改善。アップデートにより、1.5 ProとFlashは、実運用環境での構築がより良く、より速く、よりコスト効率の高いものになるという。

ベンチマークのMMLU-Proでは、7%程度改善。MATHとHiddenMathベンチマークでは、両モデルとも20%程度の改善が見られたという。また、Visionとコードのユースケースにおいても、視覚的理解とPythonコード生成において、2~7%のパフォーマンス向上が図られている。

また、安全性ポリシーを維持しながら、モデルの「回答拒否」を減らし、有益な答えを得られるようにしたほか、回答スタイルをより簡潔なものに変更。これにより、コスト削減にもつなげるという。

Gemini 1.5 Proでは、10月1日から入力トークンを64%値下げ、出力トークンを52%値下げ、128Kトークン未満のプロンプトに対するキャッシュされた増分トークンを64%値下げする。また、有料のGemini 1.5 Flashのレート制限を2,000RPMに、1.5 Proのレート制限を1,000 RPMに引き上げる。1.5 Flashでは、待ち時間を大幅に短縮する。