2024.02.17 17:00

話題を呼ぶOpenAIの動画生成AI「Sora」、追いかけるライバルの動き

Robert Hart | Forbes Staff

著者フォロー

記事を保存

Getty Images

ChatGPTを開発したOpenAIは、米国時間2月15日にテキストから動画を生成するツール「Sora（ソラ）」を発表し、生成AIにおける競争を激化させた。このツールは印象的だが、偽情報の拡散が懸念される中で、急成長しているAI経済における潜在的に危険な一歩であるとも見なされている。

Soraを開発したOpenAIは、テキストや画像を生成するChatGPTやDall-Eの開発にも携わっている。現在Soraは安全性に対するテストが行われている。AIの専門家によれば、これは既存のツールを大きく発展させたものだという。

「いよいよ勝負の始まりです」と応答したのは、数カ月前にAI動画モデルのGen-2アップデートを発表しすでに誰でも使用可能なものにしているAI動画企業Runwayの、共同創業者でCEOのクリストバル・バレンズエラだ。

AI画像生成のもう1つのリーダーであるStability AIは、11月に生成動画モデル「Stable Video Diffusion」を発表したが、これは「研究専用」であり「現段階では実世界や商業的なアプリケーション」向けの準備はできていないと述べている（利用待ちリストも提供されているが、同社はいつリリースされるかは明らかにしていない）。

AI動画の新興で勢いのあるプレイヤーのPika Labsは、11月に生成型AI動画ツールPika 1.0を発表し、12月下旬には「利用待ちは終わりました」と投稿し誰でも利用可能にした。

最近、次世代AIモデルGemini 1.5をリリースしたグーグルは、そのLumiereモデルを用いた研究デモクリップを公開したが、このツールを公に利用可能にする計画の時期は不明であり、バイアスや悪意のあるコンテンツと戦うための堅牢なツールの必要性を指摘し、その技術を安全に展開できるようにする必要があると述べている。

フェイスブック、インスタグラム、WhatsAppなどの定番アプリ群を誇るメタは、2022年に動画生成ツールMake-A-Videoをいち早く発表している。このツールは、明らかに人工的で歪んでおりぼやけたコンテンツを生成したが、当時としては重要な成果だった。

メタは昨年末、新しいテキストから動画へのモデル、Emu Videoについて言及し、それを試用したほぼすべての人が、品質とテキストプロンプトへの忠実さの面でMake-A-Videoよりも優れていると評価したと述べているが、ツールのリリース時期については示していない。しかし、CEOのマーク・ザッカーバーグは、Emuがフェイスブックとインスタグラムに統合されると語っている。

次ページ＞悪用に対する懸念は、生成AI業界に波紋を広げる