ニュース

グーグル、イルカとの交流を目指すAIモデル「DolphinGemma」

Googleは14日(米国時間)、イルカとのコミュニケーションのための大規模言語モデル「DolphinGemma」を発表した。

ジョージア工科大学の研究者や、「Wild Dolphin Project(WDP)」の現地調査とGoogleが協力し、イルカの音声の構造を学習し、イルカのような音声シーケンスを生成するAIモデル「DolphinGemma」の開発を進めている。イルカと人間の種間コミュニケーションを目指す取り組みで、「AIの限界を押し広げ、海洋世界とのつながりの可能性を広げる」としている。

DolphinGemma: How Google AI is helping decode dolphin communication

WDPでは、1985年から水中でのイルカ研究プロジェクトを実施しており、バハマの野生のシロイルカ(Stenella frontalis)の特定のコミュニティを世代を超えて研究。数十年にわたる水中ビデオとオーディオや、個々のイルカの身元や生活、観察された行動などのユニークなデータセットを有している。

水中におけるイルカのコミュニケーションでは、音と特定の行動を直接関連付けられるという。例えば、母親と子どもが再会するために使う独特な鳴き声「シグネチャホイッスル」、戦いの際に聞かれる破裂音「スクーク」、求愛行動やサメを追う際に頻用いられる「ブー」という鳴き声などが挙げられる。DolphinGemmnaでは、こうした鳴き声や個体とラベルづけされたデータセットとAIモデルを組み合わせた、イルカとのコミュニケーションを目指す。

餌を探している間に、母親のイルカが子イルカを見守る。母親は、餌を食べ終わった子イルカを呼び戻すために、口笛を吹く(左)。口笛を視覚化(右)
口笛(左)とバーストパルス(右)

AIモデルの「DolphinGemma」は、Googleのオープンモデルである「Gemna」を元に開発。SoundStreamトークナイザーにより、イルカの音を効率的に表現。約4億パラメータのモデルとなっており、WDPが現場で使用するPixelスマートフォン上で直接実行できる。

DolphinGemmaは、野生のバンドウイルカの音響データベースを幅広く使用してトレーニングされ、音声入力・音声出力モデルとして動作。イルカの自然な音のシーケンスを処理してパターンを識別し、構造を把握し、最終的にそのシーケンスの次の音を予測する。この動作は、人間の言語を対象としたLLMが、文の次の単語やトークンを予測するのと同様の方法としている

WDPは、今シーズンからDolphinGemmaの導入を開始しており、Pixelスマートフォンを活用。水中で活用してイルカの発する音を翻訳し、イルカの声を模倣する「CHATシステム」とよぶデバイスを利用する。これにより、繰り返し現れる音のパターンやクラスター、信頼性の高いシーケンスを特定し、イルカの自然なコミュニケーションに隠された構造や潜在的な意味を解明していくことを目指す。また、イルカとの双方向コミュニケーションのための共通語彙の確立の可能性を探っていく。

Exploring Wild Dolphin Communication with C.H.A.T. (Cetacean Hearing Augmented Telemetry)