ニュース

グーグル、自分だけのAI「NotebookLM」に音声番組でまとめてくれる新機能

Googleは11日(米国時間)、自分だけのAIデータベースが作れるサービス「NotebookLM」の新機能として、音声で概要を把握できる「Audio Overview」を開始した。

NotebookLMは、自分が用意したデータを使って、大規模言語モデル(LLM)が回答や要約を行なう仕組み。例えば、洗濯機の取扱説明書のPDFなどのデータをアップロードし、質問すると、説明書の該当部分をハイライトして出典へのリンクとともに紹介してくれる。データは手持ちのものなので、いわゆるハルシネーション(間違えた回答)の発生を抑えられる点が特徴。LLMは、Gemini 1.5 Proを活用する。

新機能のAudio Overviewは、ドキュメントの内容を解釈し、2人のAIホストが、ソースに基づくディスカッションを展開する。ポッドキャストを聞くように、ざっくりの概要を理解できる仕組みだ。音声は英語のみで、ホストは男女の2名。

試しに、警察庁が公開した「マイナ免許証」に関するPDFを5つアップロードして、Audio Overviewを作成してみた。作成は、「ノートブックガイド」で[生成]ボタンを押すだけで、数分かけて音声化され「日本の法律文書だ。ドライバーズライセンスに関するもので、多くの人に関わる重要なものだ」などを英語で説明してくれる。8分46秒とかなり長いコンテンツとなっており、日本の文脈もしっかり抑えているように感じた。