OpenAIの「Sora」はもはや動画生成AIではなく物理世界のシミュレーターである
「Sora」の衝撃
OpenAIが新たに発表した "動画生成AI"「Sora」が凄すぎると話題になっています。
個人的に一番驚いた生成動画は以下で、電車の中から車窓を映しているような映像で、窓の反射具合や、窓が暗くなった時に映り込む女性の像など、今までの動画生成AIとはレベルが数段違う生成結果です。
OpenAIのSoraで生成された動画で一番衝撃的なのはこの動画。
— KAJI | 梶谷健人 / 新刊「生成AI時代を勝ち抜く事業・組織のつくり方」発売! (@kajikent) February 16, 2024
窓の反射具合とか、窓が暗くなった時に映り込む女性の像とか、昨日まででこれ見せられたら自分でも「これはAI生成ではないですねー」って答えてしまっていたと思う。 pic.twitter.com/5yY4ZEyoOU
物理世界のシミュレーター?
そんな中で、OpenAIのTechnical Reportを読んでいると面白い記述を見つけました。
OpenAIとしては、「Soraは物理世界の汎用シミュレーターを構築するための一歩」という位置づけだということです。彼らからするとSoraは「動画生成AI」なんてチャチなもんじゃないということですね。
彼らが見据えている世界が数歩進んでいて、生成動画のクオリティとは別に衝撃を受けます。
NvidiaのシニアサイエンスリサーチャーのJim Fan氏も一連のツイートの中で「Soraは学習素材動画から物理法則を間接的に学習(確率論的に処理)するデータ駆動型の物理エンジンであり、世界モデルを構築している」という趣旨の考察をしています。
If you think OpenAI Sora is a creative toy like DALLE, ... think again. Sora is a data-driven physics engine. It is a simulation of many worlds, real or fantastical. The simulator learns intricate rendering, "intuitive" physics, long-horizon reasoning, and semantic grounding, all… pic.twitter.com/pRuiXhUqYR
— Jim Fan (@DrJimFan) February 15, 2024
以下波の動きを生成している動画を見ると、まだ稚拙なところはあるにしても、物理シミュレーターとしてのAIを志向していることが感覚的にも理解できるかと思います。
「Sora」はテキストからだけでなく、画像+テキストからも動画生成可能。
— KAJI | 梶谷健人 / 新刊「生成AI時代を勝ち抜く事業・組織のつくり方」発売! (@kajikent) February 16, 2024
前半の波が壁に跳ね返るとことかは割とうまく描画されているけど、最後の方はサーファーが宙に浮いてしまっている。とはいえ物理演算の片鱗を、UnityやUEなどすっ飛ばして実現しているのは驚異的。https://t.co/gKVMRUgSHR pic.twitter.com/EoXOUCz7YA
「Sora」の短期的なインパクト
Soraは短期的には映像制作、ゲームづくりの在り方を大きく変えるでしょう。
■ 映像制作の文脈
Soraは下の動画のように2つの異なる動画をつなげて、最初の動画のシーン内に次のシーンの環境やオブジェクトを合成するという見たことのない加工が可能なようなので、これを利用した様々な広告クリエイティブは生まれることだと思います。
ちょっと何言ってるのかよく分からないかと思いますが、「Sora」では2つの動画をシームレスに繋げた動画を生成できるようです。
— KAJI | 梶谷健人 / 新刊「生成AI時代を勝ち抜く事業・組織のつくり方」発売! (@kajikent) February 16, 2024
真ん中の動画が左右の動画を繋いだ動画。… pic.twitter.com/BWHJ6HpraY
■ ゲーム制作の文脈
「Sora」に"Minecraft"という言葉を入れたプロンプトから直で生成された下の動画では、きちんとマイクラのプレイヤーの動きや世界のルールを理解しているような動画になっています。
「Sora」は動画生成AIではなく、むしろ物理演算エンジンだな。
— KAJI | 梶谷健人 / 新刊「生成AI時代を勝ち抜く事業・組織のつくり方」発売! (@kajikent) February 16, 2024
以下は"Minecraft"という言葉を入れたプロンプトから直で生成された動画。
きちんとマイクラのプレイヤーの動きや世界のルールを理解しているような動画を生成している。
ゲーム作り、各種シミュレーションなどがガラッと変わりそう。 pic.twitter.com/l8dD1tVhAD
友人の嶋田氏が指摘するように、ゲーム本体をつくることなくゲーム体験の事前検証が可能になるなど、ワークフローをガラッと変えるポテンシャルを秘めています。
Soraが一般化したらゲーム作る前に売れるかどうか検証、といったことが容易にできそう
— Shima-P | Polyscape CEO (@shimap_sampo) February 16, 2024
いままでは動画つくるだけで数ヶ月かかったのと、結局動画を作るためにゲーム本体を作る必要があって仮説検証にならなかった
「Sora」の長期なインパクト
長期的に、OpenAIの目指す物理世界のシミュレーションが実現すれば都市計画や気候変動の抑制などを、「地球のコピー」を用いたシミュレーションを通して高い精度で実現することが可能になるかもしれません。
個人的に大好きなSFアニメ映画である「HELLO WORLD」はまさに物理世界の高度なシミュレーターが実現した社会を描いた物語なのでオススメです。
また、「セカイをつくる」ことを可能にする本技術の将来的な姿は、「メタバース世界」の実現を大きく後押しするでしょう。
物理世界のシミュレーターのための「デジタルツイン」と、「メタバース」の関係性については過去に以下記事でガッツリ解説と論考を展開しているのでぜひ興味がある方はこちらの記事も読んでみて下さい。
さいごに
『生成AI時代を勝ち抜く事業・組織のつくり方』という書籍を日経BPから2/19に発売いたしました。
10社以上での生成AI領域の企業顧問や、これまでの新規事業づくりサービスづくりの経験を全てつぎ込み、生成AIを活用して強い事業と組織をつくるための方法を実際の事例、オリジナルのフレームワーク、未来予想などてんこ盛りで書き上げた渾身の一冊になっております。
ありがたいことにAmazonのランキングで全ビジネス書中1位も一時取れたり発売前増刷も決まりましたが、まだまだ多くの方に届けたいと思っています。このnoteを読んで、生成AIが形づくる未来や、それを事業・組織の成長につなげる方法に興味を持った方はぜひ以下からご購入頂けますと幸いです。
https://www.amazon.co.jp/dp/4296204262
更新の通知を受け取りましょう
投稿したコメント