薬剤師兼医療経済学者のアンナ・フォーサイス氏は、リアルタイムの腫瘍学エビデンスプラットフォームOncoscope-AIの創業者兼社長である。
腫瘍学の分野では、発見のスピードが急速に加速している。毎週数百の新しい研究が発表され、時には1日に十数件以上が公開されることもある。患者や医療提供者にとって、この情報の洪水は命を救うブレークスルーにつながる可能性がある—新しいバイオマーカー、革新的な投与スケジュール、生存期間を延長する治療法など。しかし同時にリスクも伴う。欠陥のある試験を誤って解釈したり、逸話的な経験を過信したり、間違った人物を信頼したりすれば、患者は効果のない、あるいは有害な治療の犠牲になりかねない。
そして、このデータの洪水がかつてない速さで私たちを圧倒する中、意思決定が正確で、包括的で、透明性のあるエビデンスに基づいて行われることが不可欠となっている。それはすべて一人の男性から始まった:アーチボルド・レマン・コクラン氏である。
アーチボルド・コクラン:エビデンスの原点となる革新者
アーチボルド・コクランは、第二次世界大戦中に捕虜収容所の医師を務めた英国の医師かつ疫学者だった。実質的に薬がない状況で、彼は患者が苦しむ様子を目の当たりにした。それは医療が証拠よりも習慣に基づいていたからだった。戦後、彼は革命的な原則を提唱する声高な擁護者となった:医療は習慣や専門家の意見ではなく、検証され証明されたエビデンスに基づかなければならないという原則だ。
1972年、彼は『有効性と効率性:医療サービスに関するランダムな考察』を出版し、逸話に依存する医療界を批判して医学界に衝撃を与えた。彼は治療の有効性を判断するためにはランダム化比較試験(RCT)が必要であると主張し、医師と患者に関連するすべてのエビデンスの客観的な要約を提示するよう求めた。
彼のビジョンは1993年に設立されたコクラン共同計画に影響を与え、同組織は現在もシステマティックレビューを作成する世界的リーダーである。コクラン以前は、対照臨床試験の概念は存在しなかった。彼こそが対照臨床試験の使用を確立し、それは現在、新しい治療法を評価するための金字塔となっている。
堅固な基盤の構築
コクランの研究は、信頼性の階層を示すためによく使われるエビデンスのピラミッドを生み出した。
• ピラミッドの底辺には、仮説を生み出すには有用だが実践を導くには不安定すぎる専門家の意見や症例報告がある。
• その上には、関連性は示せるが因果関係は示せない観察研究がある。
• 頂点近くには、バイアスを最小限に抑え、最も強力な個別の洞察を提供するランダム化比較試験がある。
• 最上部には、関連するすべての研究を統合し、その質を評価し、最も信頼性の高い結論を提供するシステマティックレビューとメタアナリシスがある。
ピラミッドを登れば登るほど、生死を分ける決断の基盤はより強固になる。
システマティックレビューが命を救う理由
治療選択肢が日々進化する腫瘍学では、システマティックレビューが不可欠である。単一の研究は、それがポジティブであれネガティブであれ、全体像を語ることはめったにない。しかし、システマティックレビューは、エビデンス全体を考慮し、一貫性、質、ニュアンスを考慮に入れる。
世界保健機関(WHO)からFDAまで、ほぼすべての現代のガイドラインは、臨床推奨の基盤としてシステマティックレビューを必要としている。これらの方法は、人命がかかっているため必要不可欠なのだ。
チャットボットが専門家のふりをするとき
私たちは今、大規模言語モデルとチャットボットが複雑な医学的質問に数秒で流暢な回答を生成できるAI時代に突入した。文献の洪水に直面する忙しい腫瘍専門医にとって、これは救いのように見えるかもしれない。しかし、これらのツールはエビデンスの階層に従っていない。すべての研究を体系的にスキャンしたり、試験の質を評価したり、結論に至った過程を明らかにしたりしない。彼らは時に正確で、時に不完全で、時には完全に捏造されたテキストパターンに基づいて回答を生成する。
先週、私の医師の同僚から聞いた例がある:AIツールが彼が一度も書いたことのない記事の参考文献を彼の名前で作成したのだ。これは、これらのシステムが答えを提供することに必死な熱心な学生のように振る舞い、それが意味するのは答えを捏造することだとしても構わないという完璧な例証だった。チャットボットの「最善の推測」は、患者に不必要な毒性をもたらす治療法を提案したり、さらに悪いことに、生存率を向上させる十分に文書化された新しい試験を見逃したりする可能性がある。
皮肉なことに、私たちのほとんどは、出発地、目的地、時間帯など、すべてを慎重に二重確認せずにチャットボットにフライトの予約を任せることはないだろう。しかし、医療となると、多くの人が不完全または時代遅れのチャットボットの出力を額面通りに受け入れようとする。この矛盾は私たちに立ち止まって考えさせるべきだ。
流暢さは真実ではない
医療におけるAIの最大のリスクの一つは、それが権威的に聞こえることだ。チャットボットは流暢さに優れているが、流暢さは真実と同じではない。現時点では、AIは私たちが課している重みに単純に対応できていない。あまりにも多くの人々がAIができることに魅了されるあまり、科学と医学の最も基本的な原則を忘れている。情報を二重確認しなければならないのだ。この魅了は危険である。それは不完全、誤解を招く、あるいは完全に間違った答えに対する盲目的な信頼を助長する。もし私たちが流暢さを信頼性の仮面として許すなら、医学はコクラン以前の時代に逆戻りするリスクがある。その時代は、確固たるデータよりも逸話と権威が重視されていた。
共により賢く
AIがエビデンスに基づく医学に居場所がないと言っているわけではない。むしろ逆だ。何千もの論文をスキャンし、無限の参考文献をフォーマットし、新しい試験が発表されるたびにレビューを継続的に更新するという、退屈だが不可欠な作業を機械に任せよう。これらは研究者の速度を遅くする反復的な雑用だが、精度を持って行われなければならない。
私はよくこれを家事に例える。AIは掃除機をかけるべきで、人間は意味のある仕事に時間を費やせるようにするべきだ。それがまさに私のチームのアプローチだ。私たちは36の異なるAIシステムを使用し、PhD級の専門家の監督の下で統合されたモデルを構築し、精度を損なうことなくシステマティックレビューを劇的に高速化している。判断を機械に委託してはいけない。人間の専門家に、彼らだけができることをするためのより多くの余裕を与えるべきだ:エビデンスを解釈し、ニュアンスを考慮し、患者のために正しい決断を下すこと。
エビデンスが依然として支配する
コクランは半世紀前、医学の多くが確固たるエビデンスを欠いていると警告した。彼の警告は今日さらに緊急性を増している。AIでは、説得力があるように聞こえるが厳格なエビデンスに基づいていない流暢な機械に対する過信が危険である。
AIはエビデンスに奉仕すべきであり、それに取って代わるべきではない。医療のリーダー、政策立案者、臨床医は、透明性、厳格さ、包括性を絶対的な必要条件として主張する必要がある。
なぜなら、腫瘍学、そして医学一般において、人命がかかっているからだ。そして、技術がどれだけ進歩しようとも、一つのことは常に真実であり続ける:エビデンスが依然として支配するのだ。



