ニュース

ChatGPTが“人のように”応答 「高度な音声モード」一部ユーザーから開始

OpenAIは、「ChatGPT」で、応答速度が早く、人のように回答してくれる「高度なVoice Mode(音声モード)」のα版を一部の「ChatGPT Plus」(月額20ドル)ユーザー向けに提供開始した。今秋までに、ChatGPT Plusのすべてのユーザーが利用可能になる。

高度な音声モードは、より自然でリアルタイムな会話が可能になるほか、話し手の“感情”を感知して反応する新機能。トーン、複数の話者、背景のノイズなどを認識しながら、声で応答し、5月の発表時には、あたかも人と対話しているような自然な会話のデモが行なわれた。

AIモデルはGPT-4oを使い、高度な音声機能では45の言語で100人以上の外部チームがテスト。人々のプライバシーを保護するため、モデルが4つのプリセット音声のみで話すようにトレーニングしており、それらの音声と異なる出力はブロックする。また、暴力的な表現や著作権で保護されたコンテンツのリクエストを防ぐ「ガードレール」も実装した。

α版のユーザーには、手順を記載したメールとアプリへのメッセージが届き、順次ユーザーを拡大していく。また、ビデオと画面共有機能は後日リリース予定。