ニュース

「GPT-4 Turbo」発表 より安価で長文対応、23年4月まで学習

OpenAIは6日(米国時間)、最新の大規模言語モデル「GPT-4Turbo」を発表した。パフォーマンスを大幅に向上し、より高性能かつ安価で、128Kまでのコンテキストウィンドウに対応し、「300ページ」もの長文の回答が可能になる。また、学習データも2023年4月まで対応する。GPT-4 Turboは、近日中に順次提供開始予定。

GPT-4 Turboは長文に対応

GPT-4が大幅にバージョンアップされ、APIでgpt-4-1106-previewを呼び出して、全ての有料開発者が利用可能となる。従来は学習データは2021年9月までだったが、2023年4月のデータまで拡張したことで、最近の事情を理解した応答も可能となった。

Function calling(関数呼び出し)も改善し、ユーザーは、「車の窓を開けて、エアコンを切る」といった複数のアクションを要求するメッセージを1つにして送れるようになる。また、関数の呼び出し精度も向上したという。モデルが有効な「JSON」フォーマットで応答する、「JSONモード」も追加した。

GPT-4 TurboのインプットトークンはGPT-4より3倍安く0.01ドルに、アウトプットトークンは2倍安い0.03ドルとなる。

なお、GPT-3.5 Turboもアップデートし、デフォルトで16Kのコンテキスト・ウィンドウをサポート。JSONモード、並列関数呼び出しなどにも対応する。gpt-3.5-turboの名前を使用しているアプリは、12月11日に自動的に新しいモデルにアップグレードされる。

アプリ上にAIアシスタント「Assistants API」

開発者が自身のアプリにAIアシスタントを搭載可能になる「Assistants API」も発表した。

プラグラムを理解する「Code Interpreter」や「Function calling」などと連携するもので、都度情報を入力しながら、GPT-4が応答するアプリケーションを実現できる。これにより、自然言語入力のデータ分析アプリやコード支援、AIによる休暇の予定調整など様々なアプリを、コードを書くこと無く実現できるという。

画像入力も強化

画像入力の対応を強化した「GPT-4 Turbo with vision」も提供する。画像をGPT-4 Turboに入力すると、画像に対応するキャプションの生成や、画像の詳細分析、図付き文書の読み取りなどを実現可能になる。1,080×1,080ピクセルの画像をGPT-4 Turboに入力した場合の金額は、0.00765ドル。

また、画像生成AIの「DALL-E 3」も利用可能。画像1枚あたり0.04ドルから利用できる。新しいTTSモデルによる「人間品質」という音声合成にも対応する。

DALL-E 3
TTSの音声合成も自然に

著作権シールド(Copyright Shield)も導入。企業向けのChatGPTエンタープライズにおいて、著作権侵害に関する法的請求に直面した場合、OpenAIが介入し顧客を保護し、発生した費用を支払うという。また、音声認識モデルのWhisper v3の次世代バージョンも近日提供予定。

Copyright Shield)
Microsoftとの協力も継続
OpenAI DevDayにはMicrosoftのサティア・ナデラCEOも登壇