OpenAIは米国時間9月30日に最新の動画生成モデル「Sora 2」を公開した。同モデルは生成動画に音声を追加でき、さらにユーザー本人の容姿を取り込めるようになった。これは、OpenAI、xAI、グーグル、Anthropicといった大手がAI覇権を競うなかで、今年生まれた最新の人工知能イノベーションの1つだ。
Sora 2では、モデルが生成した動画クリップに、同期したセリフや効果音を組み込めるようになった。
OpenAIは同時にSoraのiOSアプリも公開し、ユーザー同士が生成物をリミックスできるソーシャル要素を追加した。さらに「Cameos」(カメオ)と呼ばれる機能により、自分や友人の容姿を動画に挿入できる。
ユーザーはSoraアプリで本人確認のための動画・音声による録画を行った後、自分の容姿を動画に挿入できる。
Soraアプリは米国とカナダで既にダウンロード可能であり、ChatGPT ProのユーザーはSoraのウェブサイト上で「実験的で高品質」なSora 2モデルへのアクセスが可能だ。
Sora 2 is here. pic.twitter.com/hy95wDM5nB
— OpenAI (@OpenAI) September 30, 2025
主要AI企業の最新チャットボットは何か?
Anthropicは9月に最新のAIモデル「Claude Sonnet 4.5」を発表し、コーディングやビジネス関連のリクエストへの対応を強化した。オープンエーアイの最新言語モデル「GPT-5」は8月に公開され、応答速度が速くなり、「ハルシネーション」(モデルが誤った結果や誤解を招く結果を出す現象)の発生可能性が低下した。グーグルの最新モデル「Gemini 2.5 Pro」は6月にリリースされ、複雑なユーザーのリクエストを理解しやすくするため、見出し、箇条書き、表の活用など、より整然とした回答を行える。
xAIの最新「Grok」モデルである「Grok 4」は7月に登場し、検索連携と問題解決能力が向上した。メタの「Llama 4」モデルは4月にリリースされ、入出力コストの削減と、長い会話の維持や大規模リクエストの処理に重要なより大きなコンテキストウィンドウをうたっている。
最新のAI動画生成ツールは何か?
メタは9月に、友人やフォロワーとAI動画を共有するためのソーシャルアプリ「Vibes」(バイブス)のプレビューを公開し、同社のAI動画生成の提供を拡大した。メタの動画生成ソフトは「Meta Movie Gen」(メタ・ムービー・ジェン)と呼ばれ、テキスト入力からカスタム動画を作成する。Sora 2と同様に、Meta Movie Genの利用者は自分の写真をアップロードすることで、生成動画に自分の容姿を用いることができる(Sora 2はユーザーの容姿を動画に取り込むためには、動画と音声の録画を要求する)。
VibesとMeta Movie Genはいずれも無料だ。エックスエーアイの動画生成モデルは「Grok Imagine」(グロック・イマジン)と呼ばれ、テキスト入力から音声付きの6秒動画を生成できる。このモデルも無料だが、プレミアムユーザーはより長い動画や高解像度、より高い利用上限にアクセスできる。グーグルの動画生成モデル「Voo 3」は5月にリリースされ、テキストから動画への生成(text-to-video)と画像から動画への生成(image-to-video)に対応する。



