Perplexityは昨年、フォーブスやCNBC、ブルームバーグなどのメディアの有料記事をスクレイピングして再掲載したことで非難を浴びていた。さらに、同社のツールは、低品質なAI生成ブログや、不正確な情報を含むソーシャルメディア投稿を引用した検索結果を提供する場合があることが報じられた。PerplexityのCEOであるアラヴィンド・スリニヴァスは、同社のPerplexity Pagesと呼ばれるツールには、「まだ未完成な部分がある」と認めていた。
フォーブスは、昨年6月に著作権侵害を理由にPerplexityに対し、差し止め要求書を送付した。
「解決策」を模索する動き
昨年10月には、ニューヨーク・ポストとダウ・ジョーンズが、Perplexityが記事を無断で使用し、著作権を侵害したとする訴訟を起こしていた。
さらに今月は、コンデナストとVox、ジ・アトランティックを含むパブリッシャーのグループが、エンタープライズ向けのAIを開発するCohere(コーヒア)を提訴し、同社が4000件の著作権で保護された作品を無断でスクレイピングし、大規模言語モデル(LLM)の訓練に使用したと主張した(フォーブスもこの訴訟に参加している)。
さらに、AIによるスクレイピングの増加は、パブリッシャーの検索トラフィックや収益を損なうだけでなく、企業のサーバーコストを増加させている。TollBitのパニグラヒによると、サイトを訪問してコンテンツを読み取り、スクレイピングするボットの増加は、企業のサーバーコストを数百万ドル規模で押し上げているという。
また、OpenAIやPerplexityのような企業が、数百のウェブサイトを自動で巡回し、詳細なレポートを作成する「リサーチAIエージェント」を導入し始めたことで、この問題はますます深刻化するとみられている。
これらの問題への明確な対策のひとつとしては、パブリッシャーがAI企業と直接ライセンス契約を結ぶことが挙げられる。例えば、AP通信やフィナンシャル・タイムズ、アクセル・シュプリンガーらは、すでにOpenAIとコンテンツ契約を締結している。
一方で、AI時代におけるパブリッシャーの新たな収益モデルを模索する企業も登場している。そのうちの1社に挙げられるTollBitは、パブリッシャーのサイトがスクレイピングされるたびにAI企業に課金する仕組みをタイムやハースト、アドウィークを含む500のパブリッシャーに提供している。
「AIは、人間のようにコンテンツを読むわけではない。人間ならリンクを1つ、2つクリックして読み進めるが、AIは10〜20のリンクを読んで回答を導き出す」とパニグラヒは語った。