ニュース
OpenAI「Operator」が日本でも開始 人に代わってAIがUberや旅行予約
2025年2月21日 23:05
OpenAIは21日、AIがブラウザを操作し、タスクを実行するAIエージェント「Operator」を日本を含む多くの国と地域の「ChatGPT Pro」(月額200ドル)ユーザー向けに提供開始した。
Operator(オペレーター)は、ユーザーに代わり、AIがWeb上でタスクを実行できるエージェント。独自のブラウザを使用してWebページを閲覧し、入力、クリック、スクロールなどの操作を行なう。Webフォームの入力や食料品の注文など、ブラウザ上で繰り返し行なうタスクの処理をOperatorに依頼すると、Operatorが人間に代わり操作を実行する。
例えば、「渋谷駅近くでクライアントとのランチ/ディナーに最適なレストランを見つける」といった検索に近い依頼だけでなく、ば「明日の午後7時に人気のレストランで4人分のテーブルを予約してください」といった、“予約”という行動を含む指示もOperatorが代行して予約する。ただし、ログインや決定操作などで、ユーザーの確認と実行操作を求める。
Operatorは、スクリーンショットで「確認」し、マウスやキーボードの操作を使用して「対話」することで、ブラウザとやりとりする。カスタムAPIなどを使わずに、Web上でアクションを起せる点が特徴で、課題に直面した場合は、Operatorが推論能力を活用して自己修正する。また、行き詰まった場合は、ユーザーによる操作が必要な場合は、ユーザーにコントロールを引き渡す。
Operatorでピザの注文を(途中まで)試した
21日に日本語環境で試したところ、プロンプトの入力画面のほか、「食事とイベント」「デリバリー」「ローカルサービス」「ショッピング」「旅行」「ニュース」などのカテゴリで、依頼のテンプレートが用意されていた。
例えばローカルサービスでは、「明日の午前6時30分のフライトのために、自宅から成田空港までのUberを予約する」、ショッピングでは楽天市場を参照し、「評価が高く50,000円以下で買えるワイヤレスイヤホンブランドの機能を比較してください」、旅行は楽天トラベルやトリップアドバイザー、一休.comなどを参照し、「東京駅周辺の1万円以下でコスパの良いビジホを教えて」といった依頼例が用意されている。これらをテンプレートとして、自分好みの指示を出せるようになっている。
今回、「大きいチーズピザと2リットルのソーダを注文してください」という指示を選んだところ、Uber EatsがOperator内のブラウザで開かれ、その後配達先の住所の入力をOperatorが求めてきた。ユーザー側で住所を入力すると、ピザの注文に移り、「「クアトロ・フォルマッジ」ピザ(大)を注文に追加しますか?価格は¥2,840です。」と聞かれたので、「はい」と回答した。すると、「2リットルのソーダが見つからなかったので、1.5リットルのコカ・コーラ(¥370)を代わりに注文しますか?」と表示されたので、「はい」と回答。ピザを注文したのとは別のミニストップでコーラを見つけてきた(ピザはどの店で注文するのかはよくわからなかった)。
「お会計に進んで注文を確定しますか?」と出たので進めると、ログインが求められた。Uber Eatsのログイン画面に遷移すると、Operatorがユーザーにブラウザを開くよう要求し、プライバシーの配慮のため、Operatorによるスクリーンショット撮影を停止する旨を案内。ログイン作業を行なう流れとなった。
今回はここまでとし、注文までは行なわなかったが、ブラウザの移動や検索操作などはOperatorが代行し、ユーザー側はログインや意思決定のみに関わるという形となっていた。
この一連の注文の流れで、Operatorによる操作は約12分。現時点では人が頼んだほうが早いが、人が行なう多くの作業をAI(Operator)が代行するというエージェントとして機能していることは確認できた。
Operatorを利用できるのはChatGPT Pro(200ドル/約3.5万円)のユーザーに限定されている。今回、日本のほか、オーストラリア、ブラジル、カナダ、インド、シンガポール、韓国、イギリスなどのChatGPT ProユーザーがOperatorを利用可能となった。今後、EU、スイス、ノルウェー、リヒテンシュタイン、アイスランドなどでの対応を進める。