ニュース

拡張思考に対応した「Claude 3.7 Sonnet」 ハイブリッド型の新推論モデル

Anthropicは24日、AIモデル「Claude(クロード)」の最新バージョンとして、推論モードを備えた「Claude 3.7 Sonnet」を提供開始した。Claude.aiとAPIなどで利用可能となっている。

Claude 3.7 Sonnetは、コーディングとフロントエンドのウェブ開発において特に顕著な改善を示しているという。また、新たに「extended thinking mode」(拡張思考モード)を搭載し、複雑な問題を深く考えるための推論モードと通常モードを切り替え可能。APIを利用する開発者は、必要に応じて「thinking budget」(思考予算)を使って推論モードを利用できる。

Claude 3.7 Sonnetは新たな拡張思考モードと、通常の標準思考モードが単一のモデルに共存する「ハイブリッド推論モデル」となる。標準モードでは、Claude 3.7 Sonnetは Claude 3.5 Sonnetのアップグレード版として動作し、推論が必要な作業で、拡張思考モードを選択することで、より多くの時間と労力を費やして回答を得られる形になる。

拡張思考モードは、「今日は何曜日?」といった単純な問だけでなく、難解なクロスワードパズルを解いたり、複雑なコードのデバッグなど、必要に応じて思考のタスクを割り当てて、解決するための機能としている。

Claude 3.7 Sonnet with extended thinking

拡張思考モードでは、Claudeが長時間考えて回答するだけでなく、その思考プロセスを未加工の状態でユーザーが目に見えるようにしている。Claudeの思考過程を観察することで、回答をより理解し、確認しやすくなるほか、モデルの考えを把握し、整合性を確認できるようにする。また、“思考自体”を観察の対象にすることで、研究等に役立てられるという。

ただし、この思考プロセスの可視化は悪用の可能性もあるとして、研究プレビューとしての提供となる。

Claude 3.7 Sonnetの性能も向上しており、コーディングタスクを中心に多くのベンチマークでOpenAI o1やo3-mini、Deep Seek R1、Grok 3 Betaなどのモデルを上回っているという。

Claude 3.7 Sonnetは、無料、Pro、Team、EnterpriseなどすべてのClaudeプランと、Anthropic API、Amazon Bedrock、Google CloudのVertex AI で利用可能。拡張思考モードは、無料のClaudeプラン以外のすべてのプランで利用できる。

Claude 3.7 Sonnetの価格は従来から変更なく、標準思考モードおよび拡張思考モードのいずれも、入力トークン100万個につき3ドル、出力トークン100万個につき15ドル(思考トークンを含む)。

また、Claude 3.7 Sonnetとともに、エージェント型コーディング用のコマンドラインツール「Claude Code」も発表している。

Introducing Claude Code