ニュース
アーティストはSoraをどう使ったのか 「すごく変」な映像AIの課題と可能性
2024年12月10日 12:05
OpenAIは10日、テキストから動画を生成できるAIサービス「Sora(ソラ)」を一般公開した。最長20秒の動画生成に対応したAIモデルだが、現実と見分けがつかないようなレベルの動画が作れることもあり、2月の先行公開時にはその可能性の評価や期待の声とともに、“怖い”という意見も聞かれた。
そのSoraがついに一般公開。ChatGPT PlusとProのユーザーが利用可能となった。長さは先行公開時の1分から20秒に短縮されているが、動画の品質や生成速度はSora Turboにより向上したという。Soraと類似した動画生成サービスもいくつか出てきてはいるが、現実と見まごうような品質の動画が生成AIで実現可能になることは、人々の認識や社会や生活を変えていくことになるのかもしれない。
2月以降一部のアーティストやデザイナー、映画制作者らにSoraは提供されていたが、10日からは多くのユーザーが利用可能になった。先行して使っていたアーティスト/クリエイターはSoraをどのように使い、どう考えているのだろうか?
Soraを日本で先行して使っていたアーティストの一人がチャールズ・リンゼイ氏。そしてライゾマティクスの真鍋大度氏だ。リンゼイ氏は、12月13日までは、京都 建仁寺 両足院において「Please forget(everything)-チャールズリンゼイ展」を開催。この一部にはOpenAIのSoraが活用されている。9日にはリンゼイ氏と真鍋氏による対談も行なわれた。ここではその模様を紹介する。
禅とAIの関係 「すべて忘れてください」
「Please forget (everything)-チャールズリンゼイ展」は、両足院副住職・伊藤東凌氏とリンゼイ氏の対話を通じて生まれたもので、禅仏教における「初心」の教えに基づき、忘却と許しを通じて柔軟な変化を促すプロセスを活かしているという。
展示では、リンゼイ氏がコロナ禍で“足止め”されたことから長期滞在し、現在も拠点を持つ京都とつながりを持つものが用いられている。
展示作品では、両足院の枯山水の上に、AMANOの駐車場精算機を設置。その中にSoraによる動画が使われている。
リンゼイ氏は、「本を書くわけでは無いのだが、自分は『SF作家』だと思っている。イメージしていたものを具現化する。私が見た”夢”は、『自分の家の隣に設置されている駐車場精算機が、枯山水の上にあった』。時間と空間を販売している駐車場精算機と、意識の海を表す枯山水の庭。その2つを組み合わせたかった」と説明。以前から禅に興味を持っていたというリンゼイ氏だが、両足院副住職・伊藤東凌氏との交流から今回の展示のアイデアがまとまってきたという。
また「禅は現実とは何かを問う思想」とし、AIは感情を持つことはできるのか、意識を持てるのか、悟りを開けるのか、というテーマは自身の作品との関連性が高いと説明する。
幻の2020年東京五輪(実際の五輪開催は2021年となった)の開催を記念した記念ビール缶をパチンコ店のゴミ箱に入れた展示では「訪れなかった未来」と時間の歪みを示したもの。そのゴミ箱の中にもSoraの動画を使っている。
今回の展示の多くにSoraによる動画を組み合わせているほか、リンゼイ氏は本展にあわせて17分の動画作品をSoraを使って制作している。
すべて忘れてください(Please foget Everything)という展示についても禅との関係性を示したほか、日本での生活も影響したという。
例えば、電車のアナウンス「忘れ物しないでください」「白線の内側に入らないでください」などは「全て覚えていてください」というメッセージと感じたという。それらから着想したものが「すべて忘れてください」というタイトルであり、Soraも「自分が書いていないことを書いて作っている。それがおもしろい」と語った。
Soraの柔軟性・制限・可能性 生成AIは「作品」か問題
ライゾマティクスの真鍋氏は、古くから映像と音楽の境界を超えた活動を行なってきたが、AIについてもコロナ禍の2020年には作品を制作。OpenAIのツールもGPT-2の時代から活用しているが、表現力が乏しく、また今のようなガードレール(安全対策)もなく、“危うい”ものだったと振り返る。
真鍋氏自身は、作品にはSoraを活用していないが、Soraを使った様々な実験を行なっている。Soraでは、テキストからキャラクターや動き、被写体や背景等を正確に描写したシーンを作成できるが、例えばプロンプトで柴犬を動かしながら、爆発するなど突拍子もない動画を作成し、紹介した。
Soraでは、ユーザーが入力したテキストプロンプトの命令から、台本(ストーリーボード)を自動で作成。それをもとに、動画を生成できる。ストーリーボードが動画のレシピとして機能するので、ストーリーボードのテキストを書き換えたり、並べ替えたりことで、生成される動画の変更や編集が行なえるようになっている。
Now you can generate entirely new videos from text, bring images to life, or extend, remix, or blend videos you already have. We’ve developed new interfaces to allow easier prompting, creative controls, and community sharing:https://t.co/HMcAKwaCCwpic.twitter.com/gtMiFkT6GB
— OpenAI (@OpenAI)December 9, 2024
真鍋氏も音声入力したプロンプトからストーリーボードを作成、ストーリーボードを並べ替えたり書き換えたりすることで動画を作ったという。このユーザーインターフェイスが優れていると評価する。
一方、Soraにはまだ不得手な部分もある。例えば、真鍋氏が作成した動画や柴犬が宇宙を飛んだり、爆発にあわせて変化するなど、インパクトのあるものだが、デモを作成するにあたって「人間を使うと顔が変わってしまう。柴犬だと安定して柴犬の動画ができる」とのこと。
真鍋氏が評価するのが、Soraの「ブレンド機能」だ。この機能は2つの動画をミックスさせて新たな動画を作り出せる機能だが、「いままでの合成とは全く違うものが出てくる、絶対自分で作らないものが生まれる」と言及。「今までなかったようなマッシュアップや映像と音との関係性が作れるのではないか」と語る。
一方、AIに対する抵抗感がある人は、アーティストに限らず存在する。また、「作品」とするときにAIが作ったものが作品と呼べるのか、という議論もある。
オリジナリティや作品について、リンゼイ氏は、「自分の作品、彫刻やオブジェの中にSoraの要素を取り入れている。作品が存在し、その一部にSoraも使っているということ」と説明。それぞれの作品とともに両足寺というロケーションなどをあわせたものが、オリジナルであると述べる。その上で「Soraは楽しいし、すごく変」と評価する。
一方、真鍋氏はSoraで「作品」は作っていない。「(テスト公開の)1分という尺は自分には短く、特にテキストから生成した『わけがわからないもの』が自分の作品といいにくい。アイデアを作品に持ってくるのは別の作業で、自分の作品にそのまま使うという視点では考えていない。むしろSoraのようなAIに期待しているのは『ポストプロセス』の部分。映像ではプリヴィズ(試作版の映像)を作るが、そこから磨いていく作業が必要になっている。そこにSoraのようなAIを活かせるのではないか」と述べた。