2026.05.26 10:51

女性向け健康AIの6割が不適切な回答、新たな業界標準で改善へ

Geri Stengel | Contributor

著者フォロー

記事を保存

Adobe Stock

女性が出産する。数週間、産科医に定期的に診てもらう。退院する。その後の診察は小児科医に移る。そして産後6週間で最後の産科診察があり、その後は何もない。骨盤底の回復、産後うつを示唆する気分の変化、誰にも聞けないほどプライベートな疑問について、臨床的なフォローアップはない。その空白の中で、彼女はアプリを開く。

そのアプリは、大規模言語モデル（LLM）AI基盤で動いている。このAIは、彼女を念頭に置いて設計されていないデータで訓練され、彼女の生物学的特性に合わせて構築されていないベンチマークで検証され、そして何の規制も受けていない。2026年5月12日、Willow InnovationsとEma EQを含む企業連合が、この状況を変えることに特化した初の業界団体である女性の健康AIコンソーシアムを発表した。これは、AIの影響力とAIの説明責任の間のギャップがかつてないほど広がっている瞬間に登場した。

AIが埋めることを求められているギャップ

ウェアラブル搾乳器を発明した企業Willowの最高経営責任者（CEO）サラ・オリアリー氏は、産後の現実を婉曲表現なしに説明する。出産後、女性は「産科医にもう一度、それも産後約6週間で診てもらえればいい方で、この多くの場合トラウマ的で非常に激しい癒しと変容の経験を、本当に一人で乗り越えなければならない」。

Ema EQのAIを統合したWillowのアプリを使用する女性たちは、骨盤底の回復、性行為を再開しても安全な時期、なぜ自分らしくないと感じるのかについて質問している。

問題は単一の製品よりも深い。オリアリー氏はWillow自身の歴史から類推する。搾乳器は何十年も前から存在している。それらは「技術的には母乳を抽出する。その点では問題ない。しかし、真の共感や使用者を中心に据えて構築されたことは一度もなかった」と彼女は言う。女性の健康AIは、同じ失敗を繰り返すリスクがある——しかも高速で、大規模に、そしてはるかに重大な決定に対して。「私たちには大きなシステム的ギャップがあり、その上にAIを重ねても解決しない」とオリアリー氏は警告する。

「基準は存在しない。以上」

Ema EQの最高科学責任者でコンソーシアムの共同創設者であるモーガン・ローズ氏は、ガバナンスの状況を和らげない。「基準は存在しない。以上」。自主的なものもない。セクター固有のものもない。この問題に最も近い専門団体であるACOG（米国産科婦人科学会）は、臨床医に焦点を当てたAI企業との提携を始めている。存在しないのは、アプリの向こう側にいる女性に対して、AIが産後の回復、妊娠可能性、悪化する症状について何を伝えるかを規制する枠組みだ。

パフォーマンスデータは、この不在を具体的にする。女性の健康タスクで13の主要AIモデルを評価した研究者たちは、すべてのLLMで約60%の失敗率を発見した。すべてのモデルが最も失敗したのは「緊急性の見逃し」——女性の状況が最も危険な瞬間だった。2026年のフォローアップベンチマークでは、女性の健康の臨床シナリオで75%を超える精度を達成したLLMはなかった。根本原因は構造的だとローズ氏は指摘する。「不十分なデータや研究不足のデータで訓練すれば、悪い出力が得られる」と彼女は説明する。

失敗はモデル以前に始まる。ローズ氏は、コンソーシアムの出発点を、既存のAIの失敗をそのインフラの起源まで遡ることだと説明する。彼女のチームが検討したあるケーススタディでは、ある主要なLLMが女性にケアを求めるよう提案することを減らした一方、別のLLMは比較的偏りの少ない出力を生成した——この違いは、単一の臨床シナリオがテストされる前になされた決定に遡ることができる。

意図的に執行力なし——それでも十分かもしれない理由

コンソーシアムには規制権限がない。企業はその基準を完全に無視できる。オリアリー氏とローズ氏はそれを認識しているだけでなく、それが重要かどうかを慎重に考えている。

オリアリー氏は、B Corp認証やオーガニック食品ラベルとの比較を引き合いに出す。どちらも自主的な基準だが、規制が到来するずっと前に評判上の圧力を生み出した。「待つには緊急すぎる」と彼女は主張する。目標は、業界が最終的に無視できなくなり、最終的には立法措置を促す「B Corpタイプのブランド」と彼女が表現するものを構築することだ。

ローズ氏は異なるが互換性のあるモデルに手を伸ばす。環境ワーキンググループの「ダーティー・ダズン」リストは、単一の規制も通過させることなく、農薬曝露に関する消費者行動を再形成した。現在の連邦政府の姿勢についての彼女の見解は直接的だ。「私たちの政府は、特に今、AIに対してかなり緩く好意的だ」。市場が先に動かなければならない。

自主的な基準も社会的圧力も解決しないのは、AIが害を引き起こしたときに何が起こるかだ。「医療AIが女性に害を与えても、米国では誰も責任を負わない」で報告されているように、責任の空白は構造的だ。開発者は承認要件を指摘し、病院はFDA承認済みのツールを善意で信頼し、医師はツールが形成した決定に対する法的責任を吸収する。米国のいかなる裁判所でも、AIシステムが法的に責任を問われたことはない。ローズ氏のコンソーシアムの目的は、断片化された説明責任が壊滅的な公的失敗を生み出す前に、企業が基準を満たすよう十分な社会的圧力を生み出すことだ。

「人々は誠実に構築する必要がある」とローズ氏は強調する。「基準ができるまで、少なくともこの分野にいるなら、何らかのベンチマークを設定することについて声を上げ、人々がそうするプレッシャーを感じるようにしなければならない」。

圧力はすでに予期しない方向から高まっているかもしれない。この記事の取材中、20代の理学療法インターン——促されることなく、話題を知らずに——女性の健康AIを信頼していないと自発的に述べた。ローズ氏はすぐにその信号を認識した。「私はZ世代の多くの人々と会話をしてきたが、彼らは非常に懐疑的でAIを使用していない。世代的にも、何が許容され何が許容されないかについて、押し引きがあるだろう」。

基準はまだ満たされていない

コンソーシアムの6つのガバナンスコミットメント——倫理基準、バイアス削減、感情的および臨床的品質、縦断的インテリジェンス、倫理的AI構築者のためのメンターシップ、透明な監視——は、文書化された各失敗モードに対処する。そのガバナンス委員会は、臨床医、技術者、倫理学者、法律専門家にまたがる。

Ema EQのCEOアマンダ・ドゥカック氏は、創設の論理を明確に述べる。「基準を偶然に任せるには、リスクが高すぎる。女性は、臨床的に安全で、文化的に配慮され、彼女たちのためだけでなく、彼女たちと共に設計されたAIに値する」。

ローズ氏は、コンソーシアムの野心が、いかなる加盟企業がすでに行っていることをも超えていることを明確にする。「私たちの目標は、これをすでに行ったことに対する承認バッジにすることではない。それは無意味だろう」。コンソーシアムが目指しているベンチマークは、創設者を含むすべての加盟企業を押し上げるべきだ。

オリアリー氏は、より広範な義務を同様に直接的な言葉で表現する。「女性の健康AIは、即座の協調的な説明責任を要求するペースで動いている。このコンソーシアムは、業界に明確で共有された基準を提供する。それは証拠に基づいて構築され、生きた経験を反映し、すべてのツールをそれが奉仕する女性に対して説明責任を負わせるものだ」。

エレベーターの中のインターンは、ベンチマーク研究を必要としなかった。彼女はすでに基準が満たされていないことを知っていた。コンソーシアムの仕事——自主的で、規制されておらず、緊急の——は、彼女が信頼しないツールが彼女が避けられないインフラになる前に、彼女が間違っていることを証明することだ。

（forbes.com 原文）