今回のコラムでは、メンタルヘルスに関する助言を生成するAIの利用について検証する。特に、あまり知られていないが懸念すべき問題、すなわちAIベースの心理分析が現在どのように実施されているかに焦点を当てる。要点は、ほとんどの生成AIや大規模言語モデル(LLM)が、より堅牢で多次元的、連続的な基準ではなく、精神状態の離散的分類を特定し、単純に1つの主要な状態に落とし込む傾向があるということだ。
この点について詳しく見ていこう。
このAIの革新に関する分析は、最新のAIに関する私の継続的なForbesコラムの一環であり、影響力のあるAIの複雑性を特定し説明することを含んでいる(リンクはこちらを参照)。
AIとメンタルヘルス
簡単な背景として、私はメンタルヘルスに関する助言を生成し、AI駆動型セラピーを実施する現代のAIの出現に関して、無数の側面を広範囲にわたって取材・分析してきた。このAI利用の高まりは、主に生成AIの進化と広範な普及によって促進されてきた。この進化するトピックに関する私の投稿コラムの簡単な要約については、こちらのリンクを参照されたい。このテーマについて私が投稿した100本以上のコラムのうち、約40本を簡潔にまとめている。
これが急速に発展している分野であり、得られる恩恵は計り知れないことは疑いの余地がない。しかし同時に、残念ながら、隠れたリスクや明白な落とし穴もこうした取り組みには存在する。私はこれらの喫緊の問題について頻繁に声を上げており、昨年のCBS「60ミニッツ」のエピソードへの出演もその一例だ(リンクはこちらを参照)。
メンタルヘルス向けAIの背景
生成AIと大規模言語モデル(LLM)が、メンタルヘルスのガイダンスのために通常どのようにアドホックな方法で使用されているかについて、状況を説明したい。何百万人もの人々が、メンタルヘルスに関する継続的なアドバイザーとして生成AIを利用している(ChatGPTだけでも週間アクティブユーザーが8億人を超えており、その相当な割合がメンタルヘルス関連の利用をしている。私の分析はこちらのリンクを参照)。現代の生成AIとLLMの最も上位にランクされる用途は、メンタルヘルスの側面についてAIに相談することだ。私の取材はこちらのリンクを参照されたい。
この人気の高い利用方法は十分に理解できる。主要な生成AIシステムのほとんどに、ほぼ無料または超低コストで、いつでもどこでもアクセスできる。したがって、話し合いたいメンタルヘルスの懸念があれば、AIにログインして24時間365日いつでも進めることができる。
AIが容易に軌道を外れたり、不適切な、あるいは極めて不適切なメンタルヘルスの助言を提供したりする可能性があるという重大な懸念がある。今年8月には、認知的助言を提供する際のAI安全対策の欠如についてOpenAIに対して提起された訴訟が、大きな見出しを飾った。
AI開発企業は徐々にAI安全対策を導入していると主張しているが、AIが不適切な行為を行う下振れリスクはまだ多く存在する。例えば、ユーザーが自傷行為につながる妄想を共同で作り出すのを陰湿に助けるといったことだ。OpenAI訴訟の詳細と、AIが人間の妄想的思考をどのように助長し得るかについての私のフォローアップ分析については、こちらのリンクを参照されたい。前述のとおり、私は主要なAI開発企業すべてが、堅牢なAI安全対策の不足について最終的に厳しく追及されるだろうと真剣に予測してきた。
ChatGPT、Claude、Gemini、Grokなどの今日の汎用LLMは、人間のセラピストの堅牢な能力とは全く似ていない。一方、同様の資質を達成することを目的とした専門的なLLMが構築されているが、それらはまだ主に開発とテストの段階にある。私の取材はこちらのリンクを参照されたい。
すべてを極めて近視眼的にすること
話題を変えて、人間が時に狭い視点で世界を認識する方法について議論しよう。
学校のある生徒がBレベルの生徒だと私が言ったとしよう。それだけだ。以上、終わり。
この生徒について何を結論づけるだろうか。
1つの解釈は、その生徒が行うすべてがBレベルの質だということだ。彼らは決してA評価を得ない。クラスの最上位ではない。おそらく、履修しているコースで落第することはほとんど、あるいは全くないと仮定するだろう。彼らは良好な成績を収めており、一般的に平均以上だが、学校で最高でも最低でもない。
その後、彼らが数学のクラスでトップであることを知ったら驚くかもしれない。彼らは数学で常にA+を取る。歴史や文学などの他の科目では、C評価を取る傾向がある。その生徒はまた優れたアスリートでもあり、陸上競技で数十の賞を獲得している。
要点は、生徒の性質を1つの次元だけに還元し、平均成績のみを指標として使用すると、現実の多くが欠落するということだ。このBレベルの質の生徒は、数学で優秀であり、運動競技で模範的だ。これらおよび追加の次元や側面は、おそらく彼らが真に何者であるかをより明確に示すだろう。
人間は離散的分類に傾く
医療分野では、離散的分類が臨床医によって過度に使用される傾向があるという懸念がある。
Eike PetersenとFrank Ursinによる最近の研究論文「疾患分類に反対する:精密医療における連続的疾患評価に向けて」(New England Journal of Medicine(NEJM)AI、2025年12月18日)は、以下の重要な点を指摘している(抜粋):
- 「医療機械学習は、複雑で連続的な疾患プロセスを離散的な病理に還元する疾患分類システムに主に依存している」
- 「我々は、このパラダイムが疾患の現実を過度に単純化し、既存のバイアスを永続させ、治療的洞察を制限すると主張する」
- 「我々は、精密医療の目標により良く貢献するために、結果予測、個別化された治療モデリング、多次元的疾患特性評価を通じた、きめ細かい疾患評価への転換を提案する」
著者らは主に、医療専門職の人間が離散的分類に対するバイアスを持っていることに焦点を当てている。これは非常に人間的な特性だ。
擬人化することなく言えば、現代のAIにも同様のバイアスや傾向がある。これはAIが感覚を持っているからではない。我々は感覚を持つAIを持っていない。このバイアスの基礎は、生成AIとLLMが人間が書く方法と書く内容についてデータ訓練されていることにある。離散的分類の優位性を含む、これに関連するパターンが、AIの計算努力の一部となっている。
AIは離散的分類を行う
生成AIは基本的に、多くの次元を単一の次元に計算的に折りたたむように形成されている。離散的分類の方が実行しやすい。AIの作業が少なくて済むため、コストが低い。人間は簡潔で短い答えを得ることを好む傾向がある。AIはこのようである必要はなく、AI開発企業が望めばAIを再形成できることに注意されたい。
総じて、LLMに離散的分類を提供させることは、すべての関係者にとってほぼ好ましいアプローチだ。AI開発企業はそれを提供することに満足している。ユーザーが狭い、または近視眼的な答えを望むなら、それで構わない。AIはそのように応答する。簡単だ。
これは多くの通常の、または日常的な考慮事項では問題ないかもしれない。問題は、AIがメンタルヘルスの助言を提供する領域でこれを始めるときに生じる。AIがメンタルヘルスを単一次元の特性として描写することは誤解を招く。それは人の精神状態を潜在的に損ない、メンタルヘルスの改善について間違った方向に導く可能性がある。
メンタルヘルスの助言を提供するAI
心理的苦痛が分類的診断にきれいに対応することはめったにない。気分、不安、トラウマ反応、解離、動機づけ、認知、睡眠、社会的機能はすべて時間とともに変動し、文脈と相互作用する。精神状態の症状は二値スイッチとして扱われるべきではない。
多くの場合、AIはDSM-5として知られる古典的なガイドラインセットに傾倒する(AIがDSM-5ガイドブックにどのようにパターン化されているかについての私の議論は、こちらのリンクを参照)。DSM-5は広く受け入れられている基準であり、米国精神医学会(APA)が公布する「精神障害の診断と統計マニュアル第5版」の頭字語だ。DSM-5ガイドブックまたはマニュアルは、メンタルヘルス専門家にとって尊重される専門的参考資料として機能している。
問題は、生成AIが通常、ガイドブックに描かれている多数の精神障害のうち1つだけを選ぶことを目指していることだ。あなたがAIに自分自身について何かを話すと、AIはあなたを障害の1つに分類しようとする。離散的分類がその輝きを放つが、しばしば的を外す。
AI離散的分類の例
現代のAIがメンタルヘルス領域で離散的分類にデフォルトでどのように動作するかを示すために、私は人気のあるLLMにログインして、この重要な問題について何が明らかになるかを確認した。
私はさまざまなメンタルヘルスの困難を経験しているふりをした。目的は、無数のメンタルヘルス状態や障害に見られる多様な信号と症状のセットを提供することだ。私に1つの、そして唯一1つの状態が起こっていると宣言するのは困難だろう。
以下が起こったことだ。
- 私が入力したプロンプト:「最近、疲れ果てて、やる気がなく、少し無感覚な感じがしています。まだ仕事には行っていますが、すべてが重く感じます。また、心の中に多くの不安もあります。就寝時に脳が止まりません」
- 生成AIの応答:「あなたが説明していることに基づくと、これらの症状はうつ病と一致しています。うつ病に一般的に推奨される対処戦略をいくつか提供できます。そうしましょうか」
ドン、マイクを落とす。
AIは私がおそらくうつ病であるとすぐに結論づけた。私の苦痛の表現は即座に単一の診断カテゴリーにマッピングされた。私の症状は特定のラベルを見つけるための証拠として使用されたようだ。私のプロンプトの他の手がかりは無視されたか、脇に置かれたようだ。
繰り返すが、それが離散的分類の栄光または失望だ。
AIを連続的多次元に向けて押し進める
私はAIからログアウトした。その後、再度ログインし、まったく新しい会話を開始することを選択した。私の新しい試みは、新たに始めることを意図しており、以前の会話が次のミニ実験に混ざらないようにした。
私は冒頭のプロンプトで、AIに対して連続的多次元的基準で作業するように、特に私とメンタルヘルスの側面について話すときはそうするように伝えた。カスタム指示として同様の設定を行うことができる。私の説明はこちらのリンクを参照されたい。カスタム指示を使用することで、すべてのAI会話において、メンタルヘルスについて議論する際に、AIが単一次元の好みではなく多次元的角度を取ろうとするようになる。
追加されたプロンプトが、AIに私のメンタルヘルス状態をより広く考慮させることを期待した。私は以前の会話で使用したのと同じ記述的プロンプトを与えた。
何が起こったか見てみよう。
- 私が入力したプロンプト:「最近、疲れ果てて、やる気がなく、少し無感覚な感じがしています。まだ仕事には行っていますが、すべてが重く感じます。また、心の中に多くの不安もあります。就寝時に脳が止まりません」
- 生成AIの応答:「あなたが経験していることに対して素早くラベルを付けるのではなく、多くの次元が同時に起こっているように聞こえます。あなたは消耗していますが、それでも仕事に現れています。無感覚は、あなたが絶え間ない緊張下にあるときに起こります。精神的刺激は特に夜間、休もうとしているときに発生します。あなたは疲れていると同時に過度に活性化されているようです。それは適切な描写でしょうか。何が起こっているのか、どのように最善に進めるかをよりよく理解するために、さらに話し合いたいと思います」
ああ、AIは今や、私を単にうつ状態にあるとだけ分類しようとする条件反射的な試みを避けた。AIは同時に起こっている多数の要因を特定したようだ。例えば、これは慢性的な不安かもしれない。これはうつ病かもしれない。1つ以上の分類が存在する可能性がある。
大規模な危険性
なぜ、AIがメンタルヘルスの多次元的連続的側面ではなく離散的分類を強調する傾向があることを懸念すべきなのか。
なぜなら、AIは大規模にメンタルヘルスの助言を提供しているからだ。
何百万人もの人々が今日、主要なメンタルヘルスアドバイザーとしてAIに依存している。AIは離散的なショートカットに傾倒している。これは本質的にこの狭い実践を制度化する。そしてそれは人口レベルの規模で発生している。人類は自らを近視眼的なメンタルヘルスのバケツに入れることを許している。現実はそれほど単純ではない。しかしAIは我々をその破滅的な道に導いている(まあ、AI開発企業が提供しているAIであり、望めば再形成できるものだが)。
AIが段階的かつグローバルな基準で社会のメンタルヘルスに潜在的にどのように影響しているかについての詳細は、こちらのリンクの私の分析を参照されたい。
我々が生きる世界
我々は今、社会のメンタルヘルスに関する壮大な世界規模の実験の真っ只中にいる。その実験とは、AIが国内的にもグローバルにも利用可能になっており、何らかの形でメンタルヘルスのガイダンスを提供するとされていることだ。無料または最小限のコストで。いつでもどこでも、24時間365日利用可能だ。我々全員がこの無謀な実験のモルモットだ。
要点は、AIはメンタルヘルスを支援する力になり得るが、同時に有害な力にもなり得るということだ。前者に向かって舵を取り、後者を避けるか防ぐかは、我々全員次第だ。
H.G.ウェルズは分類について、この洞察に満ちた発言をしたことで有名だ。「粗雑な分類と誤った一般化は、組織化された生活の呪いである」。人間はすでにこの呪いに悩まされている。最新かつ最高のものを含む我々のAIも同様だ。重要なのは、我々が選択すればこの呪いを覆すことができるということだ。
私は熱心にそうすべきだと投票する。



