ニュース

OpenAI、高度なボイスモードが“カメラ”情報にも対応

臼田勤哉

2024年12月13日 12:34

OpenAIは12日(米国時間)、ChatGPTのモバイルアプリの「Advanced Voice Mode」においてビデオと画面共有に対応した。これにより、ChatGPTと対話するだけでなく、カメラの情報を使った操作支援などが受けられる。

Advanced Voice Mode(高度なボイスモード)は、声による質問に対して、人のように自然な音声による回答を行なう機能だが、声だけでなくカメラによる画像に対応することで、より適した回答が可能になる。

OpenAIの説明動画の例では、メンバーをカメラで撮影しながら自己紹介し、「トナカイの角を被っていたのは誰?」と尋ねると、「ミシェル」と回答。また、コーヒーメーカーと豆、ケトルを用意して、「いまからコーヒーを入れたい」と伝えると、ChatGPTが言葉だけでなくカメラの情報も見ながら次にやる作業を教えてくれる。

ChatGPTのPro、Plus、Teamユーザー向けに来週から公開される。なお、EnterpriseとEduユーザーは2025年初頭から利用可能になる。

Santa Mode & Video in Advanced Voice—12 Days of OpenAI: Day 6

あわせて、Adovanced Voice Modeの声に「サンタ」を追加。年末までの期間限定でサンタの声で会話できる。また、会話の共有機能も追加される。これらの発表は、OpenAIが12日間(平日)連続発表の6日目のトピックとなる。

Say ho ho ho to Santa in Voice Mode 🎅

Santa is rolling out today to everyone across all ChatGPT platforms and is available until the end of the month…then he will retire back to the North Pole.pic.twitter.com/NVS9bRok4r
— OpenAI (@OpenAI)December 12, 2024