2025.02.07 10:30

中国バイトダンス、1枚の写真からリアルな動画を生成するAI「OmniHuman」を発表

Leslie Katz | Contributor

著者フォロー

記事を保存

Shutterstock.com

TikTokの親会社である中国のバイトダンスは2月2日、1枚の写真から人が話したり、歌ったり、楽器を演奏したりするリアルな動画を生成できる人工知能（AI）システムの「OmniHuman（オムニヒューマン）」を発表した。

「このシステムの生成能力は、既存のメソッドを大きく上回るもので、特に音声などの弱い入力に基づいて、極めてリアルな人間の動画を生成する。画像の入力は、縦長や半身、全身などのあらゆるアスペクト比に対応し、さまざまなシナリオにおいて、従来よりもリアルで高品質な結果を提供する」とバイトダンスは2日に論文投稿サイトarXivで発表した研究論文で述べている。

OmniHuman-1のプロジェクトページでは、このツールの能力を示すサンプル動画が公開されている。その一つのアインシュタインの動画では、著名な理論物理学者の大学の講義を、現代の高画質映像でリアルに再現している。

南カリフォルニア大学（USC）のフレディ・トラン・ネイガー准教授は、このサンプル動画を見た後のインタビューで、「非常に印象的だ。もしも、ハンフリー・ボガートを復活させて映画に出演させようとしたら、どうなるかはわからないが、スマートフォンのような小さな画面で見る分には、これらの映像は非常に精巧だ」と述べている。

バイトダンスとTikTokは、このツールによって人間の映像を最もリアルに見せる生成AIのテクノロジー競争の中で、大きな存在感を示すことになる。こうしたツールは、さまざまな分野で急速に利用が広がっている一方で、ディープフェイクが政治的プロパガンダに使用される懸念を引き起こしている。

ニューヨーク大学の非常勤教授で、新興技術のマーケティングコンサルタント企業PitchFWDの創設者のサマンサ・G・ウルフも、OmniHumanのようなツールには可能性とリスクの両方があると見ている。

「たった1枚の写真から、本当に話しているかのように、リアルに動く映像を作り出す技術は非常に興味深いが、潜在的に深刻な影響をもたらす可能性がある。企業のリーダーや政治家の偽の映像が作られ、誤った発言をしているように見せることで、企業や国に多大な影響を及ぼす可能性がある」と彼女は指摘した。

バイトダンスのチームは、OmniHumanをテキストや音声、体の動きなどの複数の入力を組み合わせたアプローチと、1万8700時間を超える人物の動画データでトレーニングしたと述べている。しかし、同社はその訓練データの詳細についてのコメントに応じていない。

OmniHumanは、1枚の写真から動画を生成する最初のAIツールではないが、ネイガー准教授は、バイトダンスが持つ膨大なデータが、このテクノロジーを競合と一線を画すものにしていると述べている。「もし、あなたがTikTokに動画を投稿したことがあるなら、その映像がバイトダンスのバーチャルヒューマンのデータベースの一部になっている可能性が高い」と彼は指摘した。

（forbes.com 原文）

編集＝上田裕資

2025年4月号発売中

最新号の購入はこちらから定期購読のお申し込み

2025年4月号発売中

最新号の購入はこちらから定期購読のお申し込み

タグ：

Forbes JAPANの最新のニュースをお届けします

無料のメールマガジンに登録

無料登録

丸井グループ×へラルボニー「使うたび、社会を前進させる。」新たなクレジットカードの形

「カーボンマイナス」「地下資源消費ゼロ」への挑戦でセイコーエプソンが描くこころ豊かな社会

後編：キャリア自律で事業成長を加速させるNTT DATAの人財戦略

リピート率90％以上——Groovementのフリーランスコンサルタントマッチングが急成長しているワケ

JINSが挑む異彩とのコラボ異彩へのアシスト

「長期投資」×「厳選銘柄」で資産形成の本質を追求するブラックロック社の投資哲学

身体のリズムを整えて「無駄づくり」に向き合う、藤原麻里菜のクリエイター生活

コレクティブ・インパクトに取り組む組織としての意義——多様な主体による新しい価値創造とは

子どもたちが明日にも、未来にもワクワクしている社会を目指して——組織の壁を超えて挑む新しい協働のかたち

スポーツ観戦施設はエンターテインメントの場へと進化する。三井デザインテックが手がける「クロスオーバーデザイン」とは

エクセルギーが目指す、再エネ活用のためのハイブリッドソリューション

「蛇口からミネラル in ウォーター」の衝撃 LIXILとサントリーが水道水の常識を変える

「生成AIで余白のある社会を」ソフトバンクの最年少本部長平岡拓の挑戦

「社員みんな粒違いでいい」。急拡大の博報堂テクノロジーズ人事が語る、エンジニア文化の解像度

ひらめきをカタチに――松丸亮吾×サンギCEOが語る「宇宙がもたらす新しい価値」

東京都による社会起業家育成のためのスタジオプログラム　採択者の成果報告会を開催

前編：キャリア自律で事業成長を加速させるNTT DATAの人財戦略

「幸せなお金の循環」で起業家を増やす　クロスオーバー投資がつくる「次世代」への架け橋

キャッシュフロー改善と業務効率化で小規模事業者の成長を支えるJCBの「Biz ONE」

テクノロジーで人類の進化を牽引！「DELL STARTUP CHALLENGE」開催

正解のない時代に求められる「意思決定の経験」　起業経験者は失敗も糧に転生せよ

ビジネスパーソンにとって本当に頼れる道具へーーFMVが新作PC『Note U』に込めた想い

QuizKnock ・伊沢拓司は“短期高集中”でひらめく！高2で編み出した独自の集中メソッド

共同創業者のように共に考え、共に手を動かす。スタジオプログラムの伴走型支援とは

AI時代にテクノロジー人材が生み出せる「新たな価値」とは

夜のパビリオンと中堅企業と “ツアープロデューサー”が語る「万博のバイブス」

顧客体験の創り手たち「Braze Torchie Awards」受賞者の挑戦

これからのサステナビリティと人間の「幸せ」とは？　明治安田永島社長×富士通時田社長