「AI裁判官」はどのように判断するか
シカゴ大による最新研究では、先行実験を再現するにあたり、人間の裁判官の代わりにGPT-4oを使用。先行研究と同じ仮想の裁判を検討材料とした。
徹底的な検証を行うため、被告人に同情を誘う事情がある場合とない場合、下級審の判決が判例に沿っていた場合と判例を破るものだった場合など、考え得るすべての組み合わせを網羅した16の訴訟パターンを作成。また、AIが特定の言い回しに反応しただけではないことを確認するため、事実の提示方法を少しずつ変えながら各シナリオを複数回実行した。
結果は明快だった。
・GPT-4oは、被告人が好感の持てる人物かどうかにかかわらず、訴訟パターンの90%以上で判例に従った。
・人間の裁判官は、判例から逸脱する場合でも、約65%の確率で同情を誘う事情のある被告人に心を動かされた。
・法学部の学生は、約85%の確率で判例に従い、同情的要因の影響は最小限にとどまった。
統計分析により、これらはランダムな差異ではないことが確認された。仮説検定において観測された結果より極端な結果が出る確率を示すP値は0.01未満であり、言い換えれば「これらのパターンはほぼ間違いなく実在し、偶然によるものではない」ことを意味する。
論文は「GPT-4oは判例に強く影響されるが、同情的要因には影響されない」「プロの判事が同情的要因に影響されるのと正反対である」と記している。
形式主義と現実主義の対立
この研究は、法哲学(法理学)の分野で最も長く続いている論争の一つに対して、現実的な証拠を提示している。すなわち「法形式主義」と「法現実主義」である。
「法形式主義」とは、裁判官は判決を下すにあたり、法規や判例を厳格に適用して、個人的な感情を介入させるべきではないという考え方だ。「ルールブックに従えばOK」といえる。
これに対し「法現実主義」は、裁判官が判決を下す際には、感情的な反応、社会的背景、判決が実際にもたらす結果など、法律以外の要素も必然的に考慮することになると主張する。この見解は、裁判官も人間であり、その人間性が判断に影響を及ぼすことを示唆している。
AI裁判官は形式主義的アプローチを体現し、人間の裁判官は法学者が実際の法廷で長年観察してきた現実主義的な傾向を示したのだ。
差異を埋める試み
研究チームは人間とAIの違いを観察するだけにとどまらず、さまざまな方法を通じてAI裁判官により人間の裁判官に近い判断をさせようと試みた。
・被告人に対する同情を考慮するようAIに明確に指示した
・法現実主義の理論についてAIを教育した
・厳格なルールに従うだけではなく、より広範な正義の概念について考えるようAIに促した
こうした努力にもかかわらず、人間の裁判官が自然に行うように感情的要素をAIに取り込ませることはできなかった。これは、司法推論におけるAIと人間の違いは大きく、単純な命令の調整では簡単に克服できない可能性があることを示唆している。