ニュース

Opera、AIがウェブ操作を代行「Browser Operator」

Operaは、Webブラウザ「Opera」に、AIがブラウザ上でのタスクを代行する「Browser Operator」のプレビュー版を公開した。

Browser Operatorは、ブラウザにネイティブに組み込まれたAIエージェント。ユーザーがWebサイトにログインした状態を維持し、ログイン情報を第三者に送信しないため、安全性と速度を両立する。また、ユーザーの指示とウェブページの関連情報のみを処理し、個人情報の安全性を確保する。ログイン情報やクレジットカード情報などは、Operaのサーバーに送信されない。

ユーザーの自然言語による指示を理解し、ブラウザクライアントのローカルリソースとAI Composer Engineを用いてタスクを完了する。フォームへの入力や注文の確認など、ユーザーの介入が必要な場合は、一時停止し、ユーザーにアクションを求める。また、ユーザーは任意のタイミングでBrowser Operatorの操作を中断し、操作を引き継ぐことも可能。

ホテルの予約をBrowser Operatorに頼む様子

Webページのコンテキストを取得するため、DOMツリーとレイアウトデータを使用して、テキスト形式でページを理解する。スクリーンショットや動画キャプチャ、クラウド上でのブラウザ実行は行なわないため、画面のピクセルを「見る」必要がなく、マウス操作も不要。Webページ全体を一度にアクセスできるため、スクロールの手間も省けるとしている。

Operaは、AIをブラウザに統合する取り組みを推進。2023年には、AI中心のブラウザに再設計し、24年3月からはAI Feature Dropsプログラムを実施。AI搭載機能の統合や、独自のブラウザAI「Aria」の開発、同プログラムなどを通じて、今後もAIによるブラウジングの強化を図る。現在、Browser Operatorは、AI Feature Dropsプログラムの一環として、近日リリース予定。