2026.06.01 11:30

学術論文の捏造引用が「3年で12倍」、AI幻覚が科学の信頼を揺るがす

Michael T. Nietzel | Contributor

著者フォロー

記事を保存

著者フォロー

記事を保存

stock.adobe.com

「公開済みの研究論文に含まれる捏造引用は急速に増大する問題だ」。そう結論づける査読付きの新たな研究レターが、先週、The Lancetに掲載された。

研究者は、学術誌に投稿する論文の執筆や編集を助けるため、AIに頼ることが増えている。コロンビア大学の研究チームによれば、こうした実務と、大規模言語モデル（LLM）が実在しない文献に対応しないタイトルを「ハルシネーション（幻覚）」が起こるリスクが、増加の主因である可能性が高いという。

筆頭著者で、コロンビア大学看護学部准教授のマキシム・トパズは、自身が執筆中の論文をAIで編集したところ、捏造引用が追加され、のちに編集スタッフから指摘された経験をきっかけに本研究の実施を決めたと述べた。

その出来事に恥ずかしさを覚えたトパズらは、偽の引用という問題がどの程度広がっているのかを調べた。彼らは自動化された引用検証システムを用い、2023年1月から2026年2月に公開され、PubMed Centralのオープンアクセス・データセットに収録された250万本超の論文を監査した。

これらの論文には1億2500万件超の書誌情報（参考文献）が含まれていた。このうち9710万件（77%）はPMIDを有し検証された。残る23%は主としてウェブサイト、書籍、他の研究を参照するもので、分析から除外された。

略語やスペルミスなど、タイトル上の要因で生じ得る偽陽性を識別するため、複数のフィルターが適用された。これら初期フィルターを通過した参考文献は、PubMed、Crossref、OpenAlex、Google Scholarに照合して検証されている。4つのデータベースのいずれにも見当たらない場合、その引用は捏造された参考文献と分類した。

チームが見つけた捏造引用は、2800本の論文の中で合計4000件強だった。数としてはそれほど多くないが、悪いニュースは、ハルシネーションによる引用がわずか3年間で約12倍に増加し、明らかに増加傾向にあることだ。

2023年は、少なくとも1件の捏造参考文献を含む論文は約2828本に1本だった。2025年には458本に1本へと上昇し、2026年の最初の7週間では277本に1本が少なくとも1件の捏造参考文献を含んでいた。

著者によれば、捏造参考文献は「明らかに欠陥があるわけではない」ことが一般的で、検出が難しい。具体的な科学トピックを扱い、書式は正しく、実在の研究者に帰属させ、もっともらしい刊行日を伴っていた。著者は、2024年以降の急増が、LLMが2022年後半から2023年にかけて広く使われ始めた時期の後に想定される出版のタイムラグと一致すると指摘した。

次ページ＞参考文献を含め、報告の正確性に責任を負うのは最終的に著者自身であるべきだ