2026.05.25 18:00

AI生成論文が学術誌を汚染　査読の3割にAI使用の痕跡

John Drake | Contributor

著者フォロー

記事を保存

stock.adobe.com

「AIスロップ（AIによる粗悪コンテンツ）」という言葉は通常、ソーシャルメディアのフィードを埋め尽くす低品質な画像やテキストを指す。それが今、科学的知識として何が認められるかを決定する査読システムにまで到達している。

経営学研究におけるトップジャーナルの1つであるOrganization Scienceへの投稿数は、ChatGPTの登場以降42％増加した。そして文章の質は低下している。

同誌編集チームによる新たな研究によれば、AI生成の原稿は人間が書いたものに比べて読みづらく、専門用語が多く、却下されやすいことが示された。一方で、学術誌が掲載可否の判断に日常的に用いる専門家による査読のうち30％以上に、検出可能なAI使用の痕跡がいまや見られる。編集者は、それらの査読が本質的に情報価値に乏しいと報告している。科学をより生産的にするはずだった技術が、当面のところ、評価を難しくしているのだ。もちろんこれは、移行期にあるシステムのスナップショットであり、研究におけるAIへの恒久的な断罪ではない。だが、そのスナップショットには仔細に見る価値がある。

筆者はこれまで、査読にかかる構造的な圧力、そしてAIツールがアウトプットを加速させる一方で科学的思考の質を低下させうるリスクについて書いてきた。デューク大学のシャリク・ハサンが率いる同誌のAIタスクフォースによる本論文は、単一のジャーナルにおいて、そうした懸念に詳細なデータを付した初の研究である。

チームのシニアエディターで、ウォートン校の教授でもあるクローディン・ガーテンバーグと話したとき、議論はほぼ1時間に及んだ。彼女はAI懐疑派ではない。「私はClaude CodeとCodexを一日中使っている」と彼女は言った。「この1年の研究プログラムのあらゆる側面で」だという。

だが彼女と共著者たちは、机上に届く原稿の中で、名づけがたい質的な変化に気づいていた。「私たちは主張ありきで来たわけではない」と彼女は言う。「ただ、この感覚に事実を与えよう、と言っただけだ」。彼らは2021年1月以降の投稿6957本と査読1万389本を分析し、Pangramを用いて各テキストのAI含有度をスコア化した。Pangramは独立した評価において、現在利用可能なAI検出ツールの中で最も精度が高いとされています。

投稿の急増

2022年後半のChatGPT公開以降、Organization Scienceへの投稿は42％増え、コロナ禍に同誌が経験した増加の約2倍となった。編集者たちは、この増加のほぼすべてをAIに帰している。人間のみが書いたと判定された投稿は、実際には減少した。2026年初頭までには、同誌に投稿される原稿の大半に何らかのAI関与が見られるようになり、最も急増しているカテゴリーはAI含有度が70％以上とスコア化された論文である。

次ページ＞誰が、なぜAIを使うのか？