OpenAIはこういった複数の訴訟の影響で、同社はChatGPTの完全なリセットを余儀なくされる可能性があり、深刻な後退に直面する恐れがある。
ChatGPTの人気はここ数カ月で大きく高まった。ユーザーがChatGPTの機能を試すことで、その多様なアプリケーションに注目が集まっている。しかし、この言語モデルの成功への道のりは、法廷闘争の代償となる可能性がある。
問題の核心は、GPT-3.5やGPT-4といった言語モデルの学習プロセスにある。OpenAIは、サードパーティのプラットフォームからデータを取得し、さらにGPTモデルを強化するため、webサイトから情報を抽出するwebスクレイピングボットを採用している。懸念されているのは、OpenAIが適切な許可を得ることなく、自由に、利用可能で著作権のないコンテンツや著作物を利用していることだ。
Ars Technicaのアシュリー・べランジャー記者によると、New York TimesはOpenAIの提訴を検討しているという。New York Timesは以前、利用規約を更新し、言語モデルのトレーニングのためにAIが記事や画像をスクレイピングすることを禁止した。この訴訟の正確な意図は不明だが、専門家は、OpenAIが著作権で保護されたコンテンツを侵害した場合、1件につき最大15万ドルの罰金を支払う責任を負う可能性があると推測している。
さらに、法的措置によってOpenAIは、既存のChatGPTを一掃し、言語モデルのトレーニングの全プロセスを再開するという、思い切った措置を取らざるを得なくなる可能性もある。OpenAIがこれまでモデルの開発に費やしてきた、多大な進歩と努力は無効になってしまうだろう。OpenAIが法的な問題に直面するのは、この状況が初めてではない。これまでにも、サラ・シルバーマンを含む著名な作家たちが、著作物の保護に関する同様の懸念を理由に、OpenAIに対して集団で訴訟を起こしている。
今回の訴訟の可能性は、この問題の複雑さを浮き彫りにしている。New York Timesとの法廷闘争が前例となって、他の企業やウェブサイトが知的財産を保護するために同様の行動を取るかもしれない。
あるいは、NPRが指摘したように、OpenAIとNew York Timesがライセンス契約を結び、OpenAIがGPTモデルのトレーニングのためにNew York Timesのコンテンツにアクセスできるようになる可能性もある。
New York Timesが訴訟を進め、OpenAIはChatGPTをリセットする必要があるのか、その結果はまだ不明だ。しかし、この状況は言語モデルをめぐる継続的な議論を再燃させ、言語モデルが、他者が作成した既存のコンテンツに大きく依存していることを浮き彫りにしている。この依存は様々な方面から批判を浴び続けており、AIモデルトレーニングの倫理的・法的意味合いに関して、多くの人が抱いている広範な懸念を反映している。
(この記事は、英国のテクノロジー特化メディア「Wonderfulengineering.com」から翻訳転載したものである)