Anthropic社の「影の書庫」データ流用訴訟から実感したAI時代の著作権問題

PhotoGranary - stock.adobe.com

アナログ時代のフェアユース概念

今回のクラスアクションは、単なる金銭的解決にとどまらず、AI開発におけるデータ収集のガイドライン形成という側面で大きな意義を持つ。これまで多くのAI企業が、効率化のために大規模なデータセットを慣習的に利用してきたが、著作権を軽視した手法には甚大な法的リスクが伴うことが明確に示されたことになる。

advertisement

それでも……である。著者の1人としては納得しがたい部分も大きい。

そもそも海賊サイトが違法であることは論を俟たない。本件では、海賊版サイトからコンテンツを引っ張ってくることの違法性を、主体がAIであっても違法は違法と追認したわけだが、「ホッとした」ものの、それがなんだというのがそもそものところだ。

次に、著作権法では、フェアユースという「限定的な利用」のみコピペが認められているが、AIが訓練のためにやった行為、つまり本の読み込みそのものは「丸ごとかじってもフェアユース」という判断が裁判所から出されたことは出版界や著者にはダメージが大きい。

advertisement

アナログ時代にできたフェアユースの概念だが、「脳みその限りでしか覚えられない」人間の手つきは限定利用なのに、AIのように「限りなく記憶する」主体ならば全部利用してOKというのは論理として破綻していないかというのが原告側の主張だった。

つまり、海賊サイトから本を持ってきたから米国市場最大の訴訟となったが、買った本ならいいのだという判断だ。

たとえば現在、アマゾンのキンドルで買ったコンテンツを自分の電子メールで自分のパソコンに飛ばすことはできるが、これは1冊当たりの飛ばせる(=コピペできる)文字数が決まっている。

デジタル時代のフェアユースとはこういう考え方だと思ってきた出版業界からすると、AIにいったん溜めてしまうぶんにはなんでもありなのだという指針を示したに近い。

さらに、今回、Anthropic社のデータセットが破棄されても、これをすでにAIが読み込んだのだからやったもの勝ちであることになり、今後も、「やったもん勝ち」運営を呼び込まないか? という疑問もある。

たとえば、AI開発会社が、「自社はちゃんと買った本ばかりを提供します」と主張する会社と契約を交わしてコンテンツの読み込み利用をしたとする。実際はそのデータ会社は違法な海賊サイトで、しかも米国司法が及びにくい、海外に籍を置いた会社でかつ無資産会社だったらどうなるのか?

クラスアクションを起こしても、AI開発会社は契約を盾に、善管注意義務を主張して免責を求めるし、データ会社は無資産なので訴える意味もない。司法共助の提携国でなければ刑事上の責任も追いかけられない。

おそらくこうした話の結末は、ゼロか100かではなく、今回と同様、和解となるのであろうが、しかし1冊2000円の本をコピペしてAIに学習させたことからくる和解額が1冊1000円分になるのであれば、やはりやったもん勝ちである。

本の価値はコンテンツだけにあるわけでなく、文体や発想方法にもある。こうしてAIは50万冊の英知をためこみ、人間なんかには手つきがわからないように生成され、人間を超えるコンテンツを生み出していくだろう。

著者もますます仕事を持っていかれることになるにちがいない。

AIが人類の知を学習し発展し続けるためには、クリエイターの権利を尊重しつつ、いかに透明性の高い方法で高品質な学習データを確保していくかが、今後の最重要課題となるであろう……。

と、このように書いてしめくくりたいところだが、今回の裁判所判断はすでに今後のAIの加速的な圧勝に次ぐ圧勝を予言している。この裁判所判断が出た後、AI投資が爆発的に増えているのは周知の事実だ。

連載:ラスベガス発 U.S.A.スプリット通信
過去記事はこちら>>

文=長野慶太

advertisement

ForbesBrandVoice

人気記事