Anthropic社の「影の書庫」データ流用訴訟から実感したAI時代の著作権問題

PhotoGranary - stock.adobe.com

PhotoGranary - stock.adobe.com

2024年以降、人工知能(AI)の急速な発展に伴い、モデル訓練のための膨大なテキストデータの利用が進んでいる。しかし、その過程でどのようなデータを用いるべきかという倫理的・法的基準は、未だ発展途上の段階にある。

こうしたなか、2025年にAI企業Anthropic社(AI「Claude」の開発元)に対し、著作権者らが大規模な集団訴訟を提起した。いわゆる「クラスアクション」というものだ。

このほど、その集団訴訟で和解が仮成立したので全米で耳目を集めている。

1作品あたり約3000ドルの補償

本件は、AI開発と著作権法の境界線を明確にするうえで、極めて重要な指標と目されている。

まず、AIモデルに自然言語の文脈や構造を学習させるには膨大な文章データが不可欠だが、その入手元が厳しく問われているのだ。

Anthropic社が集団訴訟において問題視されたのは、いわゆる「影の書庫(shadow libraries)」と呼ばれる以下のような海賊版データセットから大量の書籍をダウンロードした点だった。

まず1つは「Library Genesis(LibGen)」で、 これは世界中の学術書や雑誌を無許可で公開するデータベースだ。数百万点の著作物が権利者の許諾なく共有されており、多くの国で違法とみなされている。

2つ目の違法サイトは「Pirate Library Mirror(PiLiMi)」で、 LibGenを含む複数の海賊版サイトを複製(ミラーリング)し、再配布する仕組みである。

これらのサイトは「情報の自由な共有」を標榜する場合もあるが、実際には権利者の許諾を得ない著作物の温床となっている。今回の訴訟で、原告側はAnthropic社が「影の書庫」から数百万冊規模の書籍データを取得して、自社モデルの訓練に利用したと主張した。

筆者は、2019年に英語で執筆した「The Sea of Japan」という小説を米国の出版社から刊行したが、この本も同サイトに「パクられ」、Anthropic社のAIトレーニングに利用されことがわかっている。

このような経緯から、筆者もこのクラスアクションに関わっていて、訴訟進行の内部事情を裏から見ていたのだ。

本訴訟における主な争点は、以下の2点に集約される。

まず、AI訓練は「フェアユース」に該当するかという点だ。米国著作権法には、一定の条件下で無許可の著作物利用を認める「フェアユース」の概念が存在する。

本件の裁判において、判事は、正規に購入された書籍データによる学習については、その目的が「変容的利用」にあたるとして妥当性を認める一方、海賊版サイトからの大量ダウンロードについてはフェアユースの範囲外であるとの判断を下した。

次に著作権侵害の責任ついてだが、こちらも上記と同じくらいに深刻なポイントとなる。

原告からは海賊版サイト由来のデータは法的な許諾を得ていない違法なコピーであるため、これを利用すること自体が著作権侵害にあたるという主張がなされた。正規のライセンスを経ないデータの利用は、AI開発における「不適切な近道」であると厳しく追及されたのである。

2025年9月、Anthropic社は原告側に対し、総額約15億ドル(約2340億円)という、著作権訴訟としては米国史上最大規模の和解金を支払うことで合意した。合意は、約3カ月かけて文書としてまとまり、クラスアクション関係者の多数の了解が得られたので、今回の仮成立となった。

対象となる書籍は約50万点に及び、1作品あたり約3000ドル(約47万円)の補償が提供される見込みである。

和解案には、(1)海賊版データセットから取得した書籍データの削除および破棄、(2)クレームを提出した著作権所有者への支払い、(3)今後のデータ収集プロセスにおける適正なライセンス取得の徹底が含まれている。

つまり結果として、この和解案は、AI企業に対して合法的なデータ活用の重要性を強く再認識させるものとなった。

今後は、この案を裁判長が合意することが必要となるが、関係者の予測では、裁判長に反対される理由は見当たらず、このまま春から夏にかけて合意が完全に成立することになりそうだ。

担当弁護士の説明によると、この3000ドルは、ここから法務費用を支払ったのち、そのぶん割引となる可能性もあり、多くの場合、そののち出版社と著者で折半されるというのがほとんどのパターンだ(筆者の場合は、出版社が良心的で、すべて著者に賠償金がいくようにと配慮してくれている)。

次ページ > アナログ時代のフェアユース概念

文=長野慶太

advertisement

ForbesBrandVoice

人気記事