2026.03.10 16:59

AI検出ツールは偽物を検出できない——しかし真の問題は別にある

Lars Daniel | Contributor

著者フォロー

記事を保存

stock.adobe.com

The New York Timesは最近、偽の画像や動画を見つけるために設計されたAI検出ツールについて、1000回超のテストを実施した。結果は厳しいものだったが、予想どおりでもあった。ツールは偽物の一部を見つけた一方で別の偽物を見逃し、真正なコンテンツを合成だと誤判定するケースも、真剣な調査担当者なら不安になるほど頻繁に起きた。現実の事件で現実の端末上のデジタル証拠を長年検証してきた者にとって、この結果は、私が以前から言い続けてきたことを裏づけるものだった。私たちは、そもそも盤石ではなかった基盤の上に検出戦略を築いている。

AI生成コンテンツをめぐる議論は、同じ問いへと何度も回帰する。偽物を確実に検出できるツールを作れるのか。しかし私の見立てでは、はるかに危険なのは、何が本物なのかについて誰も合意できなくなったとき、本物の証拠がどう扱われるかである。

1月に公表されたRunwayのTuring Reel調査は、その現実に明確な数値を与えた。彼らは1043人に対し、実写の映像と同社のGen-4.5モデルで生成したクリップを混ぜて提示した。90%超が、違いを安定して見分けられなかった。全体の検出精度は57.1%。コイントスをわずかに上回る程度である。動物や建築といったカテゴリでは、参加者の成績は偶然よりも悪く、生成動画を偽物として見抜くよりも、本物だと判断する可能性のほうが高かった。

この数字は、本稿を読むすべての経営者、法務責任者、取締役を警戒させるべきだ。ディープフェイクが「来る」からではない。すでにここにあり、私たちが頼りにしているツールは、法的判断やビジネス上の意思決定を委ねられるほど信頼できないからである。

検出という罠

私は約20年にわたりデジタルフォレンジック（デジタル鑑識）の案件に携わってきた。繰り返し目にするパターンは、組織が検出ツールを「銀の弾丸」扱いすることだ。写真を分類器（classifier）にかけて信頼度スコア（confidence score）を得ると、その数字が決定的な意味を持つかのように振る舞う。しかし検出とは確率的な推測にすぎず、鑑識上の結論ではない。紛争やインシデントの後に証拠を調べるために私が呼ばれるとき、ウェブベースのツールにファイルを通して終わりにはしない。端末、メタデータ、ファイルシステムの痕跡、タイムスタンプ、アプリケーションのデータベース——つまり、何かが本物に見えるかどうかだけでなく、デジタル証拠が実際に本物であるかを示す、フォレンジックの全体像を見る。

この区別は、何が懸かっているかによって意味合いが変わる。AI検出器が87%の信頼度スコアを返すことは、適切な文脈では本当に有用になり得る。保険金請求のトリアージ（優先度判定）、疑わしい提出物のフラグ付け、より深い精査に値するかの判断。完全な鑑識調査のコストが意思決定の価値を上回る場合、確率的ツールはその役割を果たす。そこに異論はない。

だが87%は、必ずしも法廷で通用しない。資格あるデジタル鑑識の専門家なら、その信頼度スコアに異議を唱えられるし、実際にそうするだろう。誰かの自由や生計が懸かっているとき、87%とはいったい何を意味するのか。13%は確信がない、という意味である。

何が本物かをどうしても証明しなければならないなら、特定の端末で特定の時刻に撮影され、整合するメタデータとファイルシステム上の記録を伴うことを示して、画像を特定の端末へと遡及できる鑑識調査が必要になる。

「嘘つきの配当」はすでに支払われている

心理学者には、この状況を指す用語がある。「嘘つきの配当（liar's dividend）」だ。Poynterが報じたように、説得力ある偽物が存在するだけで、誰もが本物の証拠を「捏造だ」と退けるための出来合いの口実を得てしまう。UCバークレー教授のHany Faridによる研究では、人々は本物を偽物と呼ぶのと同じくらいの確率で、偽物を本物と呼び、政治的文脈が絡むと精度はさらに低下することが示されている。

私は、これがいままさに法的手続きの場で起きているのを見ている。弁護士は、何かが改変された形跡がゼロであっても、AIによる操作の可能性を持ち出してデジタル証拠に異議を唱え始めている。事実認定者が真正と合成を自信をもって区別できないため、これが通ってしまうのだ。誰もが不確かになったとき、疑いがデフォルトになる。

NSAは2025年1月、「コンテンツ・クレデンシャル（Content Credentials）」に関するサイバーセキュリティ情報シートを公表し、メディア真正性の多層的アプローチの一部として、C2PAの来歴（provenance）標準を推奨した。これは真の前進である。ただしNSA自身の文書も、コンテンツ・クレデンシャルだけでは問題を解決できないことを認めている。来歴標準はオプトイン方式であり、撮影端末から配信プラットフォームまで、パイプライン全体での採用が必要だ。現在、多くのスマートフォンはC2PAメタデータを埋め込まない。多くのソーシャルメディアプラットフォームはそれを取り除く。私たちは、全参加者が協力するときにしか機能しない認証インフラを構築しているが、まさにそれは、誰かが意図的に欺こうとする局面で最も遭遇しにくいシナリオである。

実際に機能するもの

デジタル証拠の真正性を確立するための実証済みの方法論は、すでに存在する。華やかではない。ワンクリックの分類器も必要ない。端末レベルの鑑識調査であり、NISTのSP 800-86が長年推奨してきたのと同じ規律——デジタル証拠を、構造化され、正当性を説明可能なプロセスで「識別（identify）」「取得（acquire）」「分析（analyze）」「報告（report）」することである。

出所端末上で写真や動画を検証すれば、ファイルシステムのタイムスタンプ、アプリケーションログ、GPSデータ、ネットワーク活動など、主張される来歴を裏づけたり覆したりする独立した痕跡（artifact）と相互に照合できる。AirDropで偽造画像をスマートフォンに入れた場合、鑑識レベルでは、端末の標準カメラで撮影された写真とはまったく異なる様相を示す。それは確率的評価ではない。事実である。

多くの組織には、これを行うための鑑識インフラも、組織としての知見もない。彼らが頼るのはスクリーンショット、エクスポート、そしてAI検出器であり、いずれも法的水準の真正性を確立するために設計されたツールではない。2026年の調査における現実的な前提は、鑑識担当者が触れる前に、デジタル環境が敵対的に操作されている可能性があるということだ。アンチフォレンジック（anti-forensics）は机上の話ではない。成熟した分野であり、AIは他のあらゆるものと同様に、それを高速に、低コストにし、ノートPCさえあれば誰でも使えるものにしてしまった。

誰も埋めていないギャップ

厳然たる真実がある。あなたの組織はほぼ確実に、HR紛争、保険金請求、規制対応、訴訟、社内調査など、何らかの形でデジタル証拠に依存している。そしてあなたの組織はほぼ確実に、それを真正と認証するための、正当性を担保できるプロセスを持っていない。

検出ツールには役割がある。C2PAのような来歴標準にも役割がある。しかしそれらは防御の「層」であって、防御そのものではない。ゴールドスタンダードは、検証済みの方法論にもとづき、有資格の検査者が出所端末上のデジタル証拠を鑑識調査することだ。それ以外はすべて補助にすぎない。

Timesは、入手可能な最良の検出器に対して1000超の画像と動画をテストし、結果は信頼できないと結論づけた。Runwayは、人間でも大して良くならないことを示した。コンテンツを目視で判断したり、分類器にかけたりするだけで「十分」だった時代は終わった。証拠の取り扱いにフォレンジックの準備性（forensic readiness）を組み込まない組織は、最も重要な瞬間に、何が本物かを証明できなくなるだろう。

その瞬間は、多くの企業が考えるより早く訪れる。

（forbes.com 原文）