ニュース

OpenAIの動画生成AI「Sora」ついに公開 20秒の自然な動画生成

OpenAIは9日、テキストから最長20秒の現実的な動画を生成できるAIモデル「Sora(ソラ)」を一般公開した。Soraは2月に一部のアーティストやデザイナー、映画制作者らに提供していたが、9日からはChatGPT Plus(月額20ドル)とChatGPT Pro(200ドル)のユーザーが利用可能になる。

Soraは、最長20秒の動画生成に対応し、テキストからビデオの生成のほか、テキストから画像→ビデオ、テキストとビデオ→ビデオの生成などが可能なAIモデル。ChatGPT Plus/Proユーザーは、Sora.comから利用可能で、一般公開にあわせて、新バージョンの「Sora Turbo」に更新している。なお、2月の限定プレビューでは最長1分の動画生成としていたが、今回の一般公開では最長20秒となっている。

対象となるのはChatGPT PlusとProのユーザーで、TeamsとEnterprise版はSoraの対象外。また、18歳未満は利用不可となるほか、英国、スイス、EUでも現時点では利用できない。その他はChatGPTが利用可能な地域であれば利用可能。

Plusアカウントでは追加料金なしで利用可能で、毎月480p解像度で最大50本の動画、または720p解像度でそれ以下(数は非公開)の動画が生成できる。より多くSoraを使う場合は、Pro版を契約すると10倍(500本)の使用量で、画質は最高1080p、より長時間に対応する。またPro版ではウォーターマーク(透かし)を外せる。2025年初頭にはユーザーに合わせた新たな価格設定の提供も行なう予定。

一般公開にあわせて、新たなSoraのインターフェイスを公開。テキストや画像、動画を入力し、ユーザーは、最大1080pの解像度、最大20秒の長さ、ワイドスクリーン、縦長、正方形のアスペクト比で動画を生成できる。

Soraのユーザーインターフェイス

テキストから新しいコンテンツを生成できるほか、「Re-Cut」によりSoraで生成した動画の一部を抜き出して再生成できるほか、自分が持つアセットを追加して「拡張(extend)」や「リミックス」、2つの動画をミックスして1つの動画にする「ブレンド」などの機能を装備。「カードボード」や「フィルムノアール」など動画の「スタイル」を維持して生成できる「Style Presets」などの機能を用意する。

Re-Cut
Style Presets

また、ユーザーによるテキストプロンプトの命令から、台本(ストーリーボード)を自動で作成し、動画を生成。このストーリーボードのテキストを書き換えたり、並べ替えることで、生成される動画の調整を行なえる。

ストーリーボード

2月の発表時点では、Soraがもたらす「リスク」を検証するため、一部のクリエイターに利用を制限していたが、10日からは多くのユーザーがSoraを利用可能となる。

ただし、最新のSora Turboでも2月のプレビュー版より大幅に高速化されたものの、制限は存在し、「現実的な物理現象を生成したり、長時間にわたる複雑なアクションにうまく対応できないことがある」としている。

特に悪質な不正使用は制限しており、例えば児童性的虐待の素材や性的ディープフェイクなどはブロックする。Soraのサービス開始当初は人物のアップロードは制限しており、一部のクリエイターのみに提供。これは、肖像権の不正利用やディープフェイクに対処するためで、人物が写っているアップロードでは厳格な管理基準を設定している。また、ヌードを含むコンテンツはブロックする。今後ディープフェイク対策を強化しながら、人物のアップロードについても開放していく予定としている。

また、Soraで生成されたすべての動画には、C2PAによるメタデータが付与されるため、動画がSoraから生成されたものであることを識別できる。

アーティストのチャールズ・リンゼイ氏によるSoraを使った展示。「Please forget (everything)-チャールズリンゼイ展から