AI

2023.01.17

Generative AIで動画制作を革新するイスラエル企業D-ID

D-IDの共同創業者でCEOのギル・ペリー(Photo by Steve Jennings/Getty Images for TechCrunch)

テルアビブに拠点を置く「D-ID」は12月13日、テキスト、画像、アニメーションを1つのインターフェースで組み合わせた、初のマルチモーダルジェネレーティブAIに基づく動画プラットフォームをリリースした。このセルフサービス型動画プラットフォームは、D-ID独自のジェネレーティブAI技術と、オープンAIの「GPT-3」、Stability AIの「Stable Diffusion」を統合したもので、ユーザーが入力したテキストをもとに顔や音声をデジタル合成し、その顔をアニメーションとして動かしながら119の言語でテキストを読み上げるものだ。

「当社のプラットフォームは、クリエイターに大きな変革をもたらすもので、ジェネレーティブAIの最先端だと言える」と、D-IDの共同創業者でCEOのギル・ペリー(Gil Perry)は述べている。D-IDは、先祖の肖像写真をディープラーニング技術でリアルに動かせるテクノロジーの「Deep Nostalgia」などで知られている。筆者の過去のインタビューで、ペリーは「責任ある方法でAIを使った合成メディアを生成し、ビデオエンターテインメント分野の変革をリードしていきたい」と語っていた。

ペリーが今目指しているのは、「デジタルヒューマン」を企業に提供し、「機械とのコミュニケーションのあり方を変革し、人間の能力を高める」ことという。

D-IDは、これまで主に企業の研修部門やマーケティング部門、コミュニケーション部門向けにサービスを販売してきた。企業は、同社のサービスを利用することで、ビデオコンテンツの制作やパーソナライズ、修正に要する時間やコスト、労力を削減しながら、視聴者のエンゲージメントを高めることが可能だ。ペリーによると、9月にリリースしたセルフサービス型プラットフォーム「Creative Reality Studio」の初期バージョンでは、多くのユーザーが「驚くべきもの」を生成し、ソーシャルメディアで広く配信したという。

ベンチャーキャピタルによる投資が低迷する中でも、ジェネレーティブAIの領域には数億ドル規模の資金が流れ込んでおり、この技術がビジネスに及ぼすインパクトは、今後ますます強まることが予想されている。ガートナーは2025年までに大企業によるアウトバウンドメッセージの30%がAIによって合成されたものになり、2026年までにはB2Bバイヤーの50%が購買サイクルにおいてデジタルヒューマンと対話すると予測している。

悪用を防ぐ技術も

オープンAIの「ChatGPT」やAIを用いた写真・動画編集アプリの「Lensa」などの普及は、人々に興奮と不安の両方をもたらしているが、一部の専門家は、この技術の悪用を懸念している。そんな中、D-IDは、プライバシー保護、特に顔の匿名化からAI事業をスタートさせたことから、この取り組みを主導する有力な候補だと言える。

同社は現在、ヘイトや人種差別的な発言に対するフィルタリングや、著作権侵害を防ぐための画像識別、テキストの監視、電子透かしの挿入などの施策を行っている。

また、D-IDは「コンテンツ認証イニシアチブ(Content Authenticity Initiative、CAI)」や、「Partnership on AI」など、ジェネレーティブAIを安全なものにするための業界全体の取り組みにも参加している。

「ジェネレーティブAI技術の可能性は、まだ見え始めたばかりだ」とペリーは語った。

forbes.com 原文

編集=上田裕資

ForbesBrandVoice

人気記事