AI

2025.07.25 10:30

AI企業の「クローラーのタダ乗り」に壁、Cloudflareの課金制度にウェブが揺れる

Photo illustration by Cheng Xin/Getty Images

AIによる一方的な利用を見直し、クリエイターとの関係性を再設計

Cloudflareの取り組みは、こうした不均衡の是正を目的としている。同社プラットフォーム上で新規顧客が立ち上げたサイトは、明示的に許可しない限りAIクローラーを自動的にブロックする。また既存顧客は、任意でこの設定を有効化できる(オプトイン)。

advertisement

さらに重要なのは、サイトの運営者が「Pay‑Per‑Crawl」の仕組みを通じて、自分のデータを収益化できる点だ。AIボットは下記の対応を求められる。

・暗号技術を用いて自身を識別する(デジタル署名を使って、なりすましを防ぎ、身元を証明する)

・アクセスしたいページを指定する

・ページごとの価格に同意する

・Cloudflare経由で支払いを完了する

このプロセスを経た後に、ボットはコンテンツへのアクセスが可能となる。

advertisement

これは大きな転換点だ。AI企業は今後、ウェブ上のデータの収集にあたって、コンテンツ所有者と正式な経済関係を結ばなければならない。この新モデルは、まるで「デジタルの有料道路」のようなもので、クリエイターのアイデアやコンテンツに価値を与えることになる。

AI企業にとって最も価値のあるコンテンツを、効率よく提供する

Cloudflareの共同創業者兼CEO、マシュー・プリンスは、筆者と話した際に次のように述べた。

「AI企業は、市場がこの方向に進んでいると理解しているが、誰も最初に支払う者になりたがらない。それでもCloudflareは、AI企業にとって最も価値のあるコンテンツ、例えば医療、金融といった専門的なドメインや質の高いコンテンツ、あるいは更新されたばかりの新鮮なコンテンツなどを効率よく見つけ出せるよう支援していく考えだ」。

すでに複数の大手パブリッシャーがこの取り組みに参加している。Neiman Labによれば、そこにはガネット、コンデナスト、ジ・アトランティック、BuzzFeed、タイムなどが含まれている。

Cloudflare以外にも広がる「AIから守る」動き

この動きはCloudflareだけに限った話ではない。他にも複数のスタートアップやプラットフォームが、「同意に基づくデータエコシステム」を支援する取り組みを始めている。

CrowdGenAI

倫理的に調達され、人の手でラベル付けされたデータを収集し、AI開発者が安心してライセンスを取得できる形で提供している。このプラットフォームは、「量よりも質と同意」が重視される次世代のAIトレーニングを見据えて設計されている(注:筆者はCrowdGenAIのアドバイザリーボードに所属)。

Real.Photos

写真がAI生成ではなく実写であることを証明するスマホ用カメラアプリ。撮影場所と時刻を検証し、メタデータとともにハッシュ化して、改ざんできない形で記録する。各写真はBaseブロックチェーン上にNFTとして保存され、グローバルな公開データベースで閲覧できる。撮影者は使用権を販売することで収益を得る(注:Real.Photos創業者は、筆者の勤務先であるUnstoppableの取締役でもある)。

Spawning.ai

アーティストやクリエイターが自分の作品をAIの学習データセットから除外できるツールを提供している。「学習禁止(do not train)」を明示することで、AIによる使用を制御できる。

Tonic.ai

企業が、安全かつカスタマイズ可能なモデル学習のために合成データを生成できるよう支援。ウェブのスクレイピングを不要にするソリューションを提供している。

DataDistil

AIエージェントが高品質なコンテンツに対価を支払う仕組みと、AIが学習・出力する際にどこから得た情報かたどれる出典追跡を組み合わせた、収益化可能なデータ供給インフラを構築している。

これら企業はすべて、同じメッセージを発信している。それは、「あなたのデータには価値がある。どう使われるかはあなたが決めるべきだ」というものだ。

次ページ > Cloudflareによる新方針のメリットとデメリット

編集=上田裕資

タグ:

advertisement

ForbesBrandVoice

人気記事