2026.05.26 12:00

AIの嘘を見抜く方法は？専門家直伝「6つのファクトチェック実践ガイド」

Joe McKendrick | Contributor

著者フォロー

記事を保存

著者フォロー

記事を保存

stock.adobe.com

しばしば、AI（人工知能）は真実の情報源として疑わしいことがある。

残念ながらハルシネーションはかなり頻繁に起き、あらゆる種類の検索に及ぶ。2026年版Stanford HAI AI Indexによれば、26の主要モデルにおけるハルシネーション率は、ベンチマークとユースケースによって22%から94%の範囲に及んだ。

「虚偽の情報が『他者の信念』として提示される場合、モデルはうまく対処できる」と研究者らは指摘する。「しかし、同じ虚偽の情報が『ユーザーの信念』として提示されると、性能は崩壊する」。AIの活用は進むが、AIのファクトチェック技法が明確に必要とされている。

こうした再検証の深さは、問いの性質によって異なる。レシピの材料、映画のあらすじ、靴店の所在地確認といった、よりカジュアルで影響の小さいAIへの問いであれば、厳密なAIファクトチェックはおそらく不要だろう。一方、学術研究のレビュー、医療診断、財務データの確認といった影響の大きい問いには、きわめて包括的な検証が求められる。その場合、AIユーザーはより批判的な視点を持ち、AIから引き出している情報をさらに深く掘り下げる必要がある。

AIは本当のところ、どれほど信頼できるのか

文書の要約、概念の説明、何かの下書きの初稿作成といったシンプルなプロジェクトは、調査の出発点として有効である。ただし、とりわけ影響の大きい問いにおいては、最終的な情報源として全面的に受け入れるべきではない。

一見するとAIは、あらゆるテーマの情報を迅速に探し出して要約する、強化版の検索エンジンのように見える。しかし、従来の検索エンジンとは大きく異なる。ドレクセル大学の助教（教育担当）であるPragati Awasthiは、AIモデルは学習時に得たパターンに基づき、統計的に起こりやすい単語の並びを予測してテキストを生成すると説明する。「つまりAIは、権威があるように聞こえ、流暢に読めて、しかも完全に誤っている回答を同時に生み出し得る」とAwasthiは述べた。

AIが生成する回答の正確性は、多くの変数に左右される未解決の問いである。「人間でさえ、ある判断が正しかったかどうかを見極めるのに苦労することが多い。まさにそれゆえに、私たちは証拠を集め、真実と責任について合意に至るための法制度を持っている」と、スタンフォード大学の准教授でOpenMindのCEOでもあるJan Liphardtは語る。

BBCと欧州放送連合（EBU）が実施した研究では、AIの全回答の少なくとも45%に、重大な問題が1つ以上含まれていた。この調査は22のメディア組織からの入力に基づいており、31%にソーシング（情報源）の問題、すなわち欠落、誤解を招く、または誤った帰属があることも判明した。さらにAI回答の20%には、ハルシネーションによる詳細や古い情報など、重大な正確性の問題が含まれていた。

皮膚科領域初のAIツールをうたうDermGPTの創業者、Fara Kamangar医師は、複雑な専門的問いに対する汎用AIの誤り率の推定値は20%から40%の範囲に入る可能性があると見積もる。サザンメソジスト大学の臨床准教授であるAleshia Hayesは、自身の問いやプロンプトでの経験に照らし、この推定の下限である20%であっても懸念すべきだと述べる。

AIにありがちな誤りとエラー

AIにありがちな誤りとエラーには、誤情報、古い情報、ハルシネーション、重複、情報の欠落、虚偽の引用、真偽が混在した情報などが含まれる。AIの誤出力は、最も綿密な企業でさえ見落としている。ウォール街の大手法律事務所が、AIの利用から生じた捏造の判例引用を含む訴訟書面を裁判所に提出していたと、The New York Timesの報道は伝えている。

AIモデルは学習データに依存しているため、その出力は脆弱性を抱えている。使われるデータが更新されていない場合、ある時点以降の情報は利用できない。また、データが、ユーザーが求める専門知識を代表していない可能性もある。モデルが「そのようなデータは利用できない」と認めることもあるが、リスクが生じるのは、ユーザーがそうした制約を認識できない場合である。

AIが影響力の大きい学術誌や研究論文を参照すると、AIの出力には権威のオーラがまとわりつくことがある。しかしモデルが行っているのは内容の評価ではなく、パターンの合成である。「学術誌や信頼できる情報源の厳密さは、それを引用するAIの要約に移転するわけではない」とKamangar医師は語る。加えて、無関係な事例や発見を不適切に混ぜ合わせる「文脈のブレンド」のリスクもある。

次ページ＞ AIファクトチェックのヒントと技法