みなさんこんにちは、GMOリサーチ&AIでエンジニアとして働いているプジャと申します。
今回のブログでは「AI Sora」について紹介したいと思います。
きっかけは弟との何気ない会話から始まりました。
ある日私たちは、バイラル・ビデオ (Viral Video) について話していました。その動画では、YouTuberが完璧な発音と豊富な語彙で流暢な日本語を話しているように見えたのですが、詳しく調べてみると、その動画は与えられたコンテキストに基づいて生成されたものであることがわかりました。
こちらがその動画です。
https://www.youtube.com/watch?v=PPT-wIEJPX8
この驚異的な発見に興味を惹かれたので、AIが生成したコンテンツの世界に踏み込んでみたところ、「AI Sora」 という魅力的な技術と出会いました。この出会いがOpenAIの面白いところを知るきっかけになるなんて、思ってもみませんでした。この動画はAI Soraによって作られていますが、ここでは別のOpenAIアプリがテキストを音声に変換するために使用されています。正直恐ろしいくらいの技術だなと思いましたが、同時に素晴らしさも感じました。
目次
1.AI Soraとは?
2.AI Soraの使い方
3.AI Soraの特徴
3-1.リアルで忠実度の高いビデオ生成
3-2.教育
3-3.マーケティングや広告
3-4.非営利団体
4.AI Soraの限界
4-1.技術面
4-2.倫理性
5.AI Soraの未来
5-1.将来の機能と計画
5-2.専門家の予測
5-3.AI 分野とその先への影響
6.どこでAI Soraを活用するか?
7.結論
1.AI Soraとは?
Soraは、OpenAIが発表した新しい動画生成AIで、テキストプロンプトを入力するだけで、最大1分間の高品質な動画を生成できるものです。たとえば、「巨大な犬を崇拝している猫の群れ」というプロンプトを入力するだけで、その説明に合った動画が表示されます。
Soraは大々的なアナウンスや広告なしに一気に有名になったため、もしソーシャルメディアや専門のコンピュータフォーラムに常にアクセスしていなければ、Soraの急速な台頭に気づかなかったかもしれません。
OpenAIが公開した複数のサンプル動画の中には、Soraが非常にリアルな動画を制作しているものが多く含まれています。これらの動画では、鏡に映る映像や液体の正確な動き、そして降る雪の粒子までもが再現されています。
https://x.com/OpenAI/status/1758192957386342435?s=20
2.AI Soraの使い方
AI Soraは書かれた指示をリアルなビデオに変換します。これは、テキストから画像を作成するAIに似ていますが、GPTなどの高度な言語モデルを使用しています。
Soraにリクエストを送ると、それを静止画だけでなく、ダイナミックな動画に変更してくれます。この能力は、幅広い種類の動画を含む大規模なトレーニングデータベースから生まれており、その知識を使って、Soraは動きや背景、ビジュアルを理解して、リアルな感覚のビデオを作ることができます。
例えば
プロンプト例: 公園でチェスをしている猿
上記のテキストは AI モデルに変換され、動画が生成されます。
https://x.com/sama/status/1758249750909096142
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
続きはこちらのテックブログからご覧ください。