確率=証拠、ではない
ファイルが合成された可能性が高いことを知らせる検出ツールはすでに存在し、各種AIモデルの「指紋」(固有の特徴)を認識するよう訓練されたAIモデルも実用化されている。こうしたツールではスコアや確率帯を作成する。それらの情報は、流入する大量のファイルを審査可能なキュー(待ち行列)に振り分けることを目的とするファネルの上流では有用だ。しかし、特定のファイルが偽造されたものかどうかの判別はできない。
特定の医療記録が偽造かどうかを証明するのは、別のプロセスだ。証拠はデバイスレベルで存在する。
デジタルフォレンジック(デジタル鑑識)の有資格専門家がファイルに埋め込まれたメタデータを調査し、その詳細をファイルが作成されたとされるスキャナーや施設の情報と照合する。さらに、画像を検査して生成AIモデルが残したアーティファクト(不自然なパターン)がないかをチェックし、病院のシステムの記録を分析して、当該の検査データが作成元とされる機器を通じて実際に取得されたものかどうかを確認する。訴訟対象となる請求や重大な請求の場合、病院の記録やシステムへのアクセスは通常、法的な証拠開示手続きや弁護士への証拠提出命令を通じて行われる。
デジタルフォレンジックの専門家は、提出された資料に基づいて検証作業を行う。こうした分析の連鎖こそが、真実を知る手段なのだ。ここまでやらない場合、それはあくまで確率にすぎない。
ファイル単位のデジタルフォレンジックは処理量に見合わない
すべての医療請求に対してデバイスレベルのフォレンジック分析を行うのは、不可能である。請求件数は多すぎ、有資格専門家の人材プールは少なすぎ、調査コストは高すぎる。フォレンジック証明書が唯一の有効な証拠とみなされる一方で、不正の件数が急増しつつあるならば、フォレンジックのみに依存した防御策では処理能力に見合わない。多層的な対応が必要だ。
3層の防御
ファネルの最上流ではAIを使った自動検出モデルで、受信したファイルが合成データである確率をスコアリングする。ただし、これだけでは不完全である。よくできた偽造は見逃されてしまう。正常なファイルを誤検知することもある。それでも必要不可欠なプロセスだ。なぜなら、処理すべき件数が膨大すぎて、人間による審査だけでは対応できないからだ。
米ニューヨーク州立大学バッファロー校が開発した検出ツールは、比較対照試験においてマシューズ相関係数92~100%の範囲で合成された放射線診断報告書を検出した。こうしたツールを用いてファイルにスコアを付与するのだ。しかし、これは当該ファイルが合成されたことの証明にはならない。


