ニュース

アマゾン、新たな基盤モデル「Amazon Nova」 高速・低コストかつ高性能

Amazonは3日(米国時間)、米国で開催されているイベント「AWS re:Invent」において、独自の新世代基盤モデル(Foundation Models)「Amazon Nova」を発表した。Micro、Lite、Pro、Premierなど用途に応じたモデルが用意され、AWSのAIプラットフォーム「Amazon Bedrock」で利用可能となる。

高速でテキスト用のAmazon Nova Microから、テキストだけでなく画像・動画などマルチモーダル対応のAmazon Nova Lite、Amazon Nova Pro、Amazon Nova Premierを用意。また、スタジオ品質の画像生成対応のAmazon Nova Canvas、動画生成対応のAmazon Nova Reelなど、特定用途向けのモデルも展開する。

Micro、Lite、Proは3日から利用可能となり、Premierは2025年第1四半期に公開する。

Pasta City, created with Amazon Nova Reel by Amazon Ads

Microは、Meta LLaMa 3.1 8Bと、Gemini 1.5 Flash-8Bと同等か、それ以上の性能としており、高速レスポンスが特徴。Liteは、GPT-4o miniと比較した19のベンチマークのうち17のベンチマークで同等かそれ以上、Gemini 1.5 Flash-8Bと比較した21のベンチマークのうち17のベンチマークで同等かそれ以上としている。

Proは、GPT-4oと比較して20のベンチマークのうち17で同等かそれ以上で、Gemini 1.5 Proと比較して21のベンチマークのうち16で同等かそれ以上の結果を出している。またマルチモーダルなエージェントワークフローに優れているという。

Amazon Nove Reelで画像からプロンプト入力でドリーズーム風の動画を作成

Microは128K入力トークンのコンテキスト長を、LiteとProは300Kトークン、または30分のビデオ処理のコンテキスト長をサポートする。

また、Amazon Bedrockにおける他の高性能モデルに対して「少なくとも75%低価格」と説明。高速性とコスト面での利点が大きいという。Amazon Bedrockと統合されているため、利用者は最適なモデルを選びやすく、またモデルの微調整にも対応する。

加えて、2025年第1四半期にAmazon Nova音声合成モデルを発表予定。自然言語によるストリーミング音声入力を理解し、言語だけでなく、非言語的な合図(トーンや抑揚など)を解釈し、低遅延で人間のような自然な双方向のやりとりを実現。会話型AIアプリケーションなどに活用できるという。