査読におけるAIの倫理は定まっていない。専門家がAIを使って意見形成を行った場合、その意見はなお専門家自身のものと言えるのか。未公表の原稿は、守秘のもとで査読者に共有される。チャットボットのサーバーにアップロードすることは、たとえ相手が機械であっても、権限のない読者への開示として一般に容認されないと見なされる。だが、その原稿がプレプリントサーバーですでに公開されているなら話は変わるのか。AIが何も保持しないサンドボックス環境で動くならどうか。査読者が、本文を明示的に共有しない問いを投げかけるだけならどうか。こうした区別は重要であり、いずれも結論が出ていない。
最も示唆的な発見は、Organization ScienceにおいてAIによる査読が、編集判断にまったく寄与していないように見えることだ。人間の査読は編集結果と相関する。AIの査読は相関しない。「編集者がそれらをAIの査読だと分かって捨てている、という話ではない」とガーテンバーグは言う。「編集者は読んでいるが、最終的な推奨判断に影響していない」。編集者が自らの判断で代替しており、つまり、科学の品質管理の中核メカニズムである査読が、誰も行動しないテキストを生み出しているのだ。
いまのところ、踏みとどまっている
朗報は、Organization Scienceの編集プロセスが依然として有効にふるい分けている点にある。AI使用が70%以上とスコア化された原稿で「改訂の上、再投稿(revise and resubmit)」に回るのは3.2%にすぎない。AI含有度の低い論文では11.9%である。掲載論文は、依然として圧倒的に人間が生成したものに限られる。編集者は粗悪な仕事を見抜いている。
しかし、かなりの人的コストが発生している。同誌は副編集長を6人から11人へ倍増させ、シニアエディターも約30人から約60人へほぼ倍増させた。これらはすべてボランティア労働であり、無報酬の研究者が科学の品質を維持するために時間を提供している。そうした研究者がAIスロップを選別している間、大学で講義を行ったり、研究を進めたり、専門職への貢献をしたりする時間が失われている。
経済学者のスコット・カニンガムは、科学的アウトプットを2つの投入要素からなる生産関数として捉えている。すなわち、人間の時間と機械の時間である。大量の人間時間に少しの機械時間を組み合わせれば、アウトプットの質は上がる。だが研究者が機械に自分自身の関与を代替させると、カニンガムが言うところの「危険地帯(danger zone)」に入る。そこでは、AIを使わない場合に比べてアウトプットの質が実際に低下する。メカニズムは単純だ。人間時間は単なる労働ではない。注意が蓄積して知識と判断に変わるプロセスである。時間を飛ばせば、学びも飛ぶ。
ガーテンバーグのデータは、その危険地帯が仮説ではないことを示唆する。すでに主要ジャーナルの投稿統計に可視化されている。「人は書きながら考える」と彼女は言った。「だから、書かなければ、それについて深く考えない」。AI含有度が70%以上とスコア化された原稿を投稿する研究者は、カニンガムの枠組みで言えば、その閾値を越えている。思考をアウトプットと引き換えにしたのだ。編集者にはわかる。


