医学では、専門分野は大きく2つのグループに分けられる。
一部の医師は、問題の診断、データの解釈、治療の処方に日々取り組んでいる。これらの認知的分野—プライマリケア、神経学、精神医学を含む—は、臨床的推論に依存して患者を病気から導く。
一方、他の医師はカテーテルの挿入、関節の置換、腫瘍の除去などの処置の実施に焦点を当てている。介入的専門分野(心臓病学、脳神経外科、整形外科、泌尿器科を含む)では、専門知識は技術的スキルと処置の習熟度という形で現れる。
医療の文化の中で、これら2つの派閥は長い間、威信と権力を争ってきた。医療の歴史の大部分において、診断能力は内科を羨望の的とし、専門職のヒエラルキーの頂点に位置づけていた。
しかし、2つの技術的進歩がこの関係を一変させた。まず、CT、MRI、超音波などの画像診断装置(1970年代と1980年代に導入)が診断をより迅速かつ正確にした。次に、人工心肺装置、ステント、内視鏡、低侵襲ツールが治療に革命をもたらし、介入専門医が動脈を開き、弁を交換し、小さな切開を通して臓器を摘出することを可能にした。
新しい機器によって専門医がかつては不可能と思われた処置を実行できるようになるにつれ、介入分野は医療のヒエラルキーの頂点に上り詰めた。今日、これらは最も競争の激しい研修医を引きつけ、プライマリケアの同僚よりもはるかに高い給与を得る専門分野となっている。
現在、もう一つの転換点が現れつつある。生成AIと手術用ロボティクスの融合により、手術の実施方法が根本的に変わり—そして、これら2つの専門分野グループ間の伝統的なヒエラルキーが覆される可能性が高い。
生成AIとロボティクスがどのように手術を行うか
ロボットが自律的に手術を行う(つまり、人間がコントロールを操作せずに手術を完了する)という考えはSF小説のように聞こえる。つい最近まで、それは空想だった。しかし、2022年11月のChatGPTの一般公開以来、生成AIの急速な進化は技術的に可能なことの定義を変えた。
何億人もの人々がChatGPT、Gemini、Claudeなどのツールを使用しているが、ほとんどの人は大規模言語モデルがどのように機能するかについて漠然とした理解しか持っていない。これらの大規模言語モデルは「次の単語を予測する」だけではない。もしそれだけなら、これらの生成AIツールは定期的に支離滅裂な段落や意味不明な説明を生成するだろう。代わりに、それらは一貫して洗練された推論、詳細な計画、専門家レベルの要約を提供している。
生成AIは模倣によってこの良好な結果を達成する。医療に特化すると、これらのモデルはインターネット上で入手可能な医学教科書、科学雑誌、手術ビデオ、臨床会話の膨大な集積物で訓練される。この訓練プロセス—数十億の内部パラメータによってサポートされる—を通じて、システムは人間が問題を解決し、概念を説明し、複雑なタスクを実行する方法を模倣することを学ぶ。アプリケーション開発者がさらに多くの訓練を提供するにつれて、出力はますます正確になり、専門家の人間のパフォーマンスと区別がつかなくなる。
今日の生成AIシステムは胆嚢を摘出するために必要な正確な手順を概説することができる。しかし、その手術を実行するには2つの追加機能が必要だ:(1)実際の手術手順への大規模な露出と(2)その応答を正確な行動に変換する物理的メカニズム。手術用ロボットはその両方を実現する。
現代の手術用ロボティクス:欠けていたリンク
過去20年間、手術用ロボットは医師がより小さな切開で作業し、視覚化の向上、精度の増加、振動のないコントロールを実現することを可能にした。典型的なロボット手術は次のように機能する:
- 外科医はコンソールに座り、手術野の高解像度ビデオフィードを見る。
- ハンドコントロールを使用して、外科医はロボットのアームを操作し、それらは患者の体内でサブミリメートルの精度で動きを実行する。
生成AIが自律的に操作するためには、開発者は実際の手術症例からの情報を提供する必要がある。大規模言語モデルは患者の体内からの手術用カメラからの視覚データを分析し、それに対応して外科医がコンソールで行う正確な手の動きと一致させる。何万もの記録された手術で訓練した後、モデルは専門の外科医が使用するのと同じ刺激-反応パターンを再現することを学ぶ—現在、プロンプトに応じて正確な回答を生成したりビデオを作成したりするのと同じように。
このアプローチは自動運転車の訓練方法と並行している。しかし、都市の道路の混沌(車両、サイクリスト、歩行者が常に予測不可能な方法で動く場所)とは異なり、手術室は制御された空間であり、人間の解剖学は外部環境よりも一貫性があり予測可能である。
さらに、生成AIは自動運転車が縁石から出てくる物体が紙くず、転がるボール、または道路に走り出る子供かを判断する場合よりも、解剖学的構造を区別するのが容易になるだろう。
安全性を確保するために、FDA規制当局はAI主導の手術の結果を医師が行った手術と比較することができるだろう。専門の外科医は、ロボットアームを人間かAIが操作したかを知らずに匿名化された手術ビデオを評価するだろう。生成AIのパフォーマンスが人間の医師と同等であると判断された場合にのみ、承認が与えられるだろう。
その間、ロボティクスの進歩は加速し続けている。イーロン・マスクは最近、テスラの人型ロボットプロジェクトOptimusが「高度な医療処置—おそらく人間にはできないこと」を実行できるようになると予測した。
ロボットのピースを組み合わせる
自律型ロボット手術のための構成要素はすでに存在する。それが5年後に現実になるか10年後になるかは、技術的進歩よりも、病院、外科医、テクノロジー企業がこれらのシステムを訓練するためにどれだけ迅速かつ効果的に協力するかにかかっている。その未来に備えるために、今3つの変化が必要だ。
A. レジデント研修が変わる必要がある
米国はすでに、疾病予防、寿命延長、慢性疾患管理に最も関連する専門分野であるプライマリケア医の深刻な不足に直面している。しかし、レジデンシープログラムは依然としてプライマリケア医を十分に輩出していない。
生成AIとロボティクスが主に外科医を支援するか、最終的に特定の処置を自律的に実行するかにかかわらず、これらの技術は手術効率を向上させるだろう。明日の外科医は、機械工(すべての手順を手動で実行する)というよりも、高度に信頼性のある自律システムを監督するパイロットのような役割を果たすだろう。
予測可能な解剖学と最小限の瘢痕を伴う手術は、AI主導のロボティクスの初期の候補となるだろう。しかし、以前に腹部手術を受けた患者では、癒着が解剖学を予測不可能な方法で歪める可能性がある。これらのバリエーションを安全にナビゲートするには、理想的には卓越した高容量センターで働く経験豊富な外科医の判断と経験が必要となるだろう。
介入的専門分野でレジデントが研修を終えるには5〜7年かかるため、学術プログラムは今すぐにポジションのバランスを取り直し、外科研修医の数を減らし、プライマリケアのレジデンシーの枠を拡大する必要がある。
B. 支払いモデルを更新する必要がある
米国の医療のフィー・フォー・サービス償還システムは、優れた臨床結果ではなく、より高いボリュームに報酬を与える。
病院は手術が長引くとより多くの収益を得る。また、償還が各入院日に結びついている場合、時間外や週末に手術をスケジュールする財政的インセンティブはほとんどない。
バンドル支払い—特定の手術エピソードに関連するすべてのコストをカバーする単一料金—へのシフトは、効率性、安全性、イノベーションを奨励するだろう。この財政的再構築は、より大きな国家的機会と一致している:糖尿病、心不全、高血圧などの慢性疾患のより良いコントロールだ。CDCの予測によると、これらの生涯にわたる健康問題を予防または管理することで、心臓発作、がん、脳卒中、腎不全の最大半分を防ぐことができ、推定1.8兆ドルの節約につながる。
より少ない患者が大きな手術を必要とし、より単純な処置が自律的に実行されるようになるにつれて、医療システムはより少ない処置専門家を必要とするだろう。慢性疾患合併症の減少と介入専門医の必要性の減少からのコスト削減により、残りの専門医の収入を減らすことなく、プライマリケア医の給与を引き上げることができるだろう。
C. 医療文化が進化する必要がある
臨床医は長い間、専門的自律性、判断力、収入を脅かす技術に抵抗してきた。自律型ロボット手術も例外ではないだろう。しかし、医療の手頃な価格の欠如から生じる経済的圧力の高まりと、より安全で一貫した結果の約束が組み合わさり、最終的には採用が促進されるだろう。
十分な専門知識を持たない低所得の農村部や都市部を含む、サービスが行き届いていないコミュニティが、これらのツールを最初に導入する可能性が高い。安全性が証明されれば、他も迅速に追随するだろう。
患者は最初は躊躇するだろう。かつて人間だけが行っていたタスクを引き継ぐ技術は懸念を生み出す。ATMが最初に導入されたとき、多くのアメリカ人は預金が消えてしまうのではないかと心配した。しかし、人々が経験を積み、システムが信頼性を証明するにつれて、信頼が高まり、技術は日常的なものとなった。
生成AI対応の手術用ロボットも同様の軌跡をたどるだろう。そして、医師と患者が認知的タスクと処置的タスクの類似性を認識するにつれて、専門分野間の認識されていた分断は縮まるだろう。



