2023.07.12 11:15

生成AIの著作物の利用は「フェアユース」に該当するか？

サラ・シルバーマン（Photo by Michael Tullberg/Getty Images）

コメディアンで女優のサラ・シルバーマンが、OpenAIとメタの人工知能（AI）チャットボットが彼女の著作権で保護された作品を無断で使用しているとして訴訟を起こした。

彼女は、他の2人の作家とともに、この2社が2010年に出版した自身の著作『The Bedwetter』を無断で使用したとして訴えている。OpenAIのChatGPTとメタの大規模言語モデルであるLLaMAは、この著作を含む何十万冊もの書籍を無断でAIのトレーニングに使用したとシルバーマンは主張している。

「OpenAIとメタが使用したトレーニングデータセットの素材の多くは、原告が執筆した書籍を含む著作権で保護された著作物から得られたもので、この2社は、同意もクレジットも対価もなくそれを使用した」と、3人の作家の弁護士であるジョセフ・サヴェリとマシュー・ブッタリックは述べている。

マサチューセッツ工科大学（MIT）とコーネル大学の研究チームのレポートによると、書籍は、AIのパフォーマンスに最も強いプラスの効果をもたらす学習データの最上位に位置づけられているという。

この訴訟はまた、Torrentのサービスを通じてコピーしたコンテンツを大量に提供する「シャドウ・ライブラリ」についても言及しており、Torrentのトラッカーサイト「Bibliotik」や違法コピーされた書籍のサーチエンジン「Library Genesis」、海賊版電子書籍データベース「Z-Library」などのデータが利用されたと述べている。

「これらの違法きわまりないシャドウ・ライブラリは、AIのトレーニングコミュニティにとって長い間関心の的だった」と訴状に記されている。

3人の指摘によると、ChatGPTはプロンプトを入力すると、その書籍の要約を行うが、皮肉なことに、そこには著作権情報が含まれていないという。原告は著作権侵害を主張し、損害賠償と利益の返還を求めている。

相次ぐ「AIの著作権侵害」の訴え

この動きは、生成AIが使用する学習データに対する懸念の高まりを補強するものと言える。ストックフォト企業のゲッティイメージズは、アート系の生成AIサービスのStable Diffusionのトレーニングに同社の画像が無断使用されたとしてStability AIを提訴した。

GitHubのコードで学習したAIを用いたコード補完サービス「GitHub Copilot」のライセンスに関する問題で、GitHubとその親会社のマイクロソフト、開発に携わったOpenAIの3社に対する集団訴訟も現在進行中だ。

さらに先月は、作家の擁護団体であるAuthors Guildが、同意もクレジットも報酬もなしにAIシステムを訓練するために彼らの作品を悪用しているとして、6つのテック企業を非難する公開書簡を発表した。「ジェネレーティブAIは、私たちの著作を基にマシンが書いた凡庸な本や物語、ジャーナリズムで市場を氾濫させ、私たちの職業に損害を与える恐れがある」と彼らは主張した。

これらの訴えは、フェアユースの観点から判断されることになりそうだ。これまでの裁判で、著作物の利用が変形的（transformative）である場合、つまり原作を何らかのかたちで変形させる場合にフェアユースが適用される可能性が高いとされている。

フォーブスはOpenAIとメタにコメントを求めたが、現時点で回答は得られていない。

（forbes.com 原文）

編集＝上田裕資