ニュース

グーグル、テキストから動画を生成するAI

米Googleは、AIの進化で大きく発展している言語、クリエイティブツール、公益性の3つの分野について、同社の取り組みを発表した。1,000種類の言語の学習を目指す取り組み、テキストから動画を生成したり音楽を聞いて続きのメロディを生成したりするAI、山火事や洪水の発生・拡大の予測を支援するAIなどについて、取り組みが明らかにされている。

AIを活用し1,000種類の言語サポートを目指す

地球には7,000種類以上の言語があり、オンライン上に存在するのはそのうちのごくわずかで、Web上のテキストから学習させる従来の方法では捉えきれない。Googleは、1,000の言語をサポートするAIモデルを構築するという野心的なプロジェクトに参加。画像、動画、音声といった従来とは異なる手段も対象にしており、400以上の言語で学習させた、ユニバーサルスピーチモデル(USM)を開発した。

世界中のコミュニティと協力して代表的な音声データを収集しており、最近では、入力システム「Gboard」において、9種類のアフリカの言語の音声入力がサポートされている。また南アジアでは地域の関係者と協力し、地域すべての方言・言語から代表的な音声サンプルを収集するという活動を行なっている。

テキストから動画を生成

AIを活用してテキストや画像を生成する仕組みは広く知られるようになっているが、Googleではこうしたモデルを動画に適用、文章を入力すると、それに基づいた動画を生成するという技術を公開した。

Googleが提供している一連のAI生成ツールを試せるスマートフォンアプリ「AI Test Kitchen」のシーズン2では、入力したテキストを基に、テーマ別の街を作る「City Dreamer」や、モンスターキャラクターをデザインできる「Wobble」を利用できるようになる。

また2D画像だけでなく、「DreamFusion」では3DグラフィックデータもAIによる生成が可能。さらに、数秒間の音声を聴くだけで、続きのメロディを音声やピアノ曲として生成する「AudioLM」も用意される。

同社はほかにも、こうしたツールの開発で世界中のクリエイティブ・コミュニティと協力。最先端の対話システム「LaMDA」をベースにした「Wordcraft」を使い、作家と共同で、AIによるテキスト生成の実験を行なっている。

衛星画像の解析で山火事や洪水の発生・拡大予測を支援

地球規模の課題についてもAIの支援を活用する。山火事は頻度や規模が増え影響を受ける人の数も増えているが、衛星画像を活用してAIモデルを訓練し、山火事のリアルタイムでの特定・追跡や、発生・拡大の予測を支援する仕組みを提供している。すでにアメリカ、カナダ、メキシコで提供されており、オーストラリアの一部でも展開。2022年7月以降、発生時に検索や地図で表示してユーザーや消防隊に対して情報提供を行なっている。

洪水予測にもAIを活用。検索や地図サービスを通知で洪水警報通知を発信しており、新たにブラジルとコロンビア、サハラ以南のアフリカ、スリランカにも対象が拡大している。データが少ない地域でも使えるよう、転移学習というAI(機械学習)の手法も用いられている。また洪水の発生を表示する新しいプラットフォーム「Google FloodHub」をグローバルで立ち上げ、検索や地図にもこれらの情報を導入、洪水の状況下での安全な移動を支援する。