AudioCraftはオープンソースで、オーディオ用のジェネレーティブAIをより手軽に広く利用できるようにするためのものという。
フェイスブックのユーザーはAudioCraftをインストールでき、メタは特に研究者や音楽関係者に利用を呼びかけている。
AudioCraftは3つの生成AIモデルから成る。 MusicGenはテキスト入力を受けて音楽を作成し、AudioGenは足音や犬の鳴き声などの音で音楽を作成する。そしてEnCodecの改良バージョンがMusicGenとAudioGenの品質向上を支える。
MusicGenはメタが所有する音楽や特別に使用が許可された2万時間の音楽で、AudioGenは一般公開されている効果音で訓練された。
同社は2022年10月に、品質を落とすことなくオーディオファイルを圧縮・解凍し、すばやく簡単に共有するためのAIツールとして、EnCodecの最初のバージョンを発表。これは音楽だけでなく、すべての音の品質を高めることが目的だった。当時は、特にネットワーク接続が悪いなどの悪条件下での音声通話や音声メッセージを対象としていた。その後、進化しAudioGenやSoundGenとともに、合成音や本物ではない音楽が本物に聞こえるようにするツールとなった。
生成AIツールに関しては、より独創的になるために前向きにとらえているアーティストがいる一方で、著作権侵害だとして批判的なアーティストもいる。人気ラッパーのドレイクとシンガーソングライターのザ・ウィークエンドは、TikTokのバイラルヒット『Heart on My Sleeve』で声を真似されたことに不快感を示した。この曲ではそこそこの「ディープフェイク」を制作するために2人の声を真似たAIバージョンを使用した。
一方で、ポール・マッカートニーはAI生成ツールに熱心なアーティストの1人だ。マッカートニーはこのほど、1969年のビートルズの曲をAIの助けを借りて仕上げると発表した。
(forbes.com 原文)