自動的にカメラ目線に調整する
Captionsは、著作権を侵害しない音声データを使って訓練した独自の音声クローニングツールも提供しており、動画の音声を28の言語に変換したり、AIによる音声化機能を使ってゼロからナレーションを作成することもできる。ミスラによると、ディープフェイクの作成などの悪用を防ぐため、クリエイターは音声の言語変更はできるが、インポートされた動画に新しい音声を挿入したり、新たな音声を作成することはできないという。他の機能には、自動的にズームインとズームアウトを行ったり、フィラー(つなぎ言葉)や不快な言葉を検出して削除したり、バックグラウンドサウンドの音量を調整する機能などが含まれる。Captionsでは、エヌビディアがZoom向けに開発したAI目線修正ツールを使って、自動的にカメラ目線に調整することもできる。
Captionsは、今回調達した資金で人員を補強し、機能の強化を図るという。これらの中には、事前録音した楽器の音を自動的にアレンジしてバックグラウンドミュージックを作成する「AIミュージック」などの機能が含まれる。多くの機能を追加することで、コンテンツクリエイターがさらに容易に動画を作成できるようにし、資金力に勝る競合他社と対等に戦うことが可能になるとミスラはいう。
「我々が目指すのは、これらのテクノロジーを一般の人々にも使えるようにすることだ。競争の半分を占めるのは技術だ」とミスラは語った。
(forbes.com 原文)