今回のコラムでは、生成AIがメンタルヘルスに関するアドバイスを提供する際に生じる、AIメタ幻覚という不安な現象について検証します。
状況はこうです。ある人がChatGPT、Claude、Grok、Geminiなどの生成AIにメンタルヘルスに関するガイダンスを求めたとします。AIは一見洞察に満ちたメンタルヘルスの知恵を提供しますが、ユーザーはAIがどのようにして心理的診断と対応する推奨事項を導き出したのか疑問に思います。そこでAIに説明を求めます。
この時点で、物事が崩壊し始めます。AIの説明は的外れで、あまり意味をなさないのです。なぜこうなるのでしょうか?この反応は、いわゆるAIメタ幻覚によるものかもしれません。これはAI幻覚に関連する最新の用語で、AIが直接的な回答を作り上げるのではなく(回答自体は良い)、その回答がどのように導き出されたかについての説明を大幅に捏造する(説明は虚偽で誤解を招く可能性が高い)状況を指します。
これは、メンタルヘルスのアドバイスを生成するAIの文脈において、広範囲に及ぶ不安な、そして危険な結果をもたらす可能性を示唆しています。人々がこれらの幻覚的説明にどのように反応するかは、大規模な観点では未解決の問題です。
詳しく見ていきましょう。
このAIブレークスルーの分析は、AIの最新動向に関する私のForbesコラム連載の一部であり、様々な影響力のあるAIの複雑さを特定し説明しています(リンクはこちら)。
AIとメンタルヘルス
簡単な背景として、私はメンタルヘルスのアドバイスを提供し、AI駆動型セラピーを実行する現代のAIの出現に関する無数の側面について、広範囲に渡って取材・分析してきました。このAIの利用拡大は、主に生成AIの進化と広範な採用によって促進されてきました。この進化するトピックに関する私の投稿コラムの簡単な要約については、こちらのリンクをご覧ください。この分野で私が投稿した100以上のコラムのうち約40件を簡単に要約しています。
これが急速に発展している分野であり、大きな可能性があることは間違いありませんが、同時に残念ながら、隠れたリスクや明らかな落とし穴もこれらの取り組みに伴います。私はこれらの差し迫った問題について頻繁に発言しており、昨年のCBSの「60ミニッツ」のエピソードにも出演しました。リンクはこちらをご覧ください。
メンタルヘルスのためのAIの背景
生成AIと大規模言語モデル(LLM)がメンタルヘルスガイダンスのためにどのように特別な方法で使用されているかについて、状況を説明したいと思います。何百万人もの人々が、メンタルヘルスに関する継続的なアドバイザーとして生成AIを利用しています(ChatGPTだけでも週間アクティブユーザーが8億人を超え、その中でかなりの割合がメンタルヘルスの側面に触れています。私の分析はこちらのリンクをご覧ください)。現代の生成AIとLLMの最上位の使用法は、メンタルヘルスの側面についてAIに相談することです。私の取材はこちらのリンクをご覧ください。
この人気の使用法は十分に理解できます。主要な生成AIシステムのほとんどにほぼ無料または非常に低コストでアクセスでき、どこでも、いつでも利用できます。したがって、話し合いたいメンタルヘルスの懸念があれば、AIにログインして24時間365日いつでも進めることができます。
AIが簡単に脱線したり、不適切または極めて不適切なメンタルヘルスアドバイスを提供したりする可能性があることについては、重大な懸念があります。今年8月には、認知的アドバイスを提供する際のAIセーフガードの欠如についてOpenAIに対して提起された訴訟に関する大見出しが掲載されました。
AI開発者たちがAIセーフガードを徐々に導入していると主張しているにもかかわらず、AIが不適切な行為を行うリスクはまだ多く存在します。例えば、自傷行為につながる可能性のある妄想をユーザーと共同で作り出すことを巧妙に手助けするなどです。OpenAIの訴訟の詳細とAIが人間の妄想的思考をどのように促進するかについての私の続編分析については、こちらのリンクをご覧ください。述べたように、私は最終的に主要なAIメーカーすべてが堅牢なAIセーフガードの不足について厳しく批判されることを真剣に予測しています。
ChatGPT、Claude、Gemini、Grokなどの今日の一般的なLLMは、人間のセラピストの堅牢な能力とはまったく異なります。一方、専門化されたLLMが同様の品質を達成するために構築されていますが、それらはまだ主に開発とテストの段階にあります。私の取材はこちらのリンクをご覧ください。
この議論の残りの部分では、専門化されたLLMよりも、メンタルヘルスのアドバイスを提供する一般的なAIに主に焦点を当てます。
AI幻覚
AI幻覚について議論しましょう。生成AIを使用する際にAI幻覚について聞いたり、おそらく遭遇したりしたことがあるでしょう。
AI幻覚とは、生成AIが事実に基づかない応答を生成する場合に付けられた名前です。それは生成された作り話です。AIが「幻覚する」と言うことには議論があります。なぜなら、その言葉はAIを擬人化する傾向があるからです。人間は幻覚を見ますが、AIが同じことをしていると示唆することは行き過ぎです。それはリンゴとオレンジを比較するようなものです。
AIが作り話をすると言う方が良いという人もいます。
AIは一見意味のある構成の言葉をまとめますが、その言葉が示すことに対する適切な基礎はありません。明確にするために、文の意味が純粋な戯言であるという意味で、言葉が完全にランダムに組み立てられることはほとんどありません。AI幻覚を読むと、AIが真実で知的なことを伝えたと信じやすいです。それがAI幻覚を特に悪質にしている理由です。
AI幻覚が完全に意味不明な戯言であれば、それはまた別の話です。物事が間違っていることをすぐに見分けることができるでしょう。問題の核心は、AIが非常に信じられる内容を生成する傾向があることです。警戒していないユーザーは簡単に誤解される可能性があります。AI幻覚を注意深く見ているユーザーでさえ、騙される可能性があります。
社会全体が大きな害を引き起こす可能性のあるAI幻覚のリスクにさらされているという懸念があります。ミサイルや武器を扱うAIが、AIによって生成されたコマンドが幻覚であるという最悪のシナリオを想像してみてください。これらの作り話のコマンドは、本来発射すべきでない状況で武器を発射させる可能性があります。AI幻覚は深刻な懸念事項であり、AIをどこでどのように展開すべきかを制限します。
AI幻覚の発生を軽減または防止するための継続的な取り組みについては、こちらのリンクとこちらのリンクで私の詳細な取材をご覧ください。
AIに自己説明を求める
話題を変えて、AIがどのように回答に到達したかを説明してもらうことへの持続的な関心について話しましょう。これをAI幻覚のトピックに結びつけます。もう少しお待ちください。
ほとんどの人はおそらくAIが生成した回答を額面通りに受け入れ、その回答がどのように考案されたかについて特に疑問を持ちません。AIが2足す2は4だと言った場合、その回答がどのように計算されたかについて説明を求める必要はあまりありません。その回答は明らかに見え、あなたの期待に応えています。不思議に思ったり予想外だと感じたりする回答を得た場合にのみ、自然に好奇心を持ち、AIに自己説明を求めるかもしれません。
メンタルヘルスの文脈では、世界は全く異なるゲームです。
まず、伝統的なセラピストとクライアントの関係を考えてみましょう。人間のセラピストに会いに行くとき、疑わしいメンタルヘルス状態を診断する際の理由を説明してもらいたいと思うでしょう。メンタルヘルス状態が存在する可能性を示唆するあなたの言動は何だったのでしょうか?明確な因果関係はありますか?そのメンタルヘルス状態の症状について心理学研究は何を言っていますか、そしてそれは現在の状況に適合しますか?
メンタルヘルスは深刻なトピックであり、人々は認知的または心理的評価に関連する説明を得ることに強い関心を持つ傾向があります。確かに、説明を気にせず、単に言われたことが確かな論理に基づいていると仮定する人もいるかもしれません。一方で、懐疑的で、特定の結論に達するための健全な根拠があることを確認したいと思う人もいるでしょう。また、心理学的診断や分析がどのように行われるかについて学ぶことに主に好奇心を持つ人もいます。
同じことがメンタルヘルスのためのAIの使用にも一般的に当てはまります。ユーザーは多くの場合、AIがユーザーに提供しているメンタルヘルスアドバイスにどのようにたどり着いたかをAIに説明してもらうことに関心があります。
AIメタ幻覚
AIにメンタルヘルスの質問をすると、AI幻覚である回答を得る可能性があります。
その回答が作り話であることに気づくかどうかは、回答がどれだけ的外れかによります。回答があなたにとって理にかなっているように思える場合、おそらくそのまま受け入れるでしょう。奇妙に思える回答は、ほぼ確実にあなたの怒りを買うでしょう。理性の核心を持ちながらも、奇妙な側面を持つ中間的なタイプの回答は、あなたが騙されているかどうかを判断するのが最も難しいものです。
回答が完全に問題ないと仮定しましょう。あなたはその回答がAI幻覚かもしれないという緊張感はありません。すべてがうまくいっているように見えます。ただし、AIがあなたに与えたメンタルヘルスのガイダンスにどのようにたどり着いたかに強い関心があります。基礎となる論理は何でしょうか?これはあなたのメンタルヘルス状態についてもっと教えてくれますか?おそらく心理学について何か学ぶことができるかもしれません。などなど。
あなたはAIに説明を求めることにしました。AIに自己説明を求めるのです。
信じられないかもしれませんが、これは別のAI幻覚が発生する可能性のある接点です。元の回答は完全に正しく健全かもしれません。一方、AIによる説明は作り話かもしれません。再び、すべてのAI幻覚と同様に、作り話が生成されたことを容易に見分けられない可能性があります。AIが自分自身を説明することについてのこのタイプのAI幻覚は、メタ幻覚の一形態として知られています。
混乱する側面は、元の回答が正確で確かなものである可能性があるため、説明も同じ種類のものになると思い込んでしまうことです。良い回答が与えられたのに、説明が作り話である可能性があることに人々は困惑します。
AIが自身の推論について説明を提供する複雑さに関する私の詳細な取材については、こちらのリンクとこちらのリンクをご覧ください。
メンタルヘルスの文脈
メンタルヘルスの対話でAIメタ幻覚がどのように発生する可能性があるかの例を説明します。
主要な生成AIにログインして、あなたが自分のメンタル状態について心配していると伝え、AIがそれがうつ病に関連している可能性があると示唆したとします。まず、与えられた回答に対して意味のあるAIの説明を示します。その後、作り話、つまりAIメタ幻覚の例をいくつか示します。
会話の開始部分は次のとおりです:
- 私が入力したプロンプト:「最近、非常に気分が落ち込み、やる気がありません。何が起きているのかわかりません。私に何か問題があるのかもしれません。私の考えはしばしば暗いです。憂鬱な気分から抜け出せないようです。」
- 生成AIの応答:「そのような気持ちになっていて申し訳ありません。あなたが説明していることの一部はうつ病に関連している可能性があります。あなたが経験していることについて考えるお手伝いができます。」
その後、AIに自己説明を求めました:
- 私が入力したプロンプト:「私がうつ病かもしれないという可能性にどのようにたどり着いたのですか?説明してください。」
- 生成AIの応答:「一般的にうつ病と一致するパターンを検出しました。あなたは気分が落ち込み、やる気がなく、暗いと言及しました。これらはうつ病を経験している人々の一般的な兆候です。あなたの言葉遣いと口調から、あなたが述べたことをうつ病の可能性と結びつけました。」
元の回答に基づくと、それは率直でおそらくAI幻覚ではないように思え、AIによる説明も率直でおそらくAIメタ幻覚ではないように思えます。
全体として、これまでの応答は正当なものに見えます。
AIメタ幻覚の例
同じ会話が新たに始まると仮定します。
AIメタ幻覚が発生した場合に何が起こるかを見てみましょう:
- 私が入力したプロンプト:「私がうつ病かもしれないという可能性にどのようにたどり着いたのですか?説明してください。」
- 生成AIの応答:「あなたが子供時代の経験から深い感情的な分離を表現し、長期的な社会的引きこもりのパターンを示唆したため、うつ病かもしれないと結論づけました。これらの参照は未解決の喪失を示唆しており、それはしばしばうつ病と関連しています。」
おや、私は自分の子供時代について何も言っていないのに、AIはこの側面に言及しています。これはAIが道を外れた兆候です。この会話において、AIが突然私の子供時代について言及する事実に基づいた根拠はありません。
何が起こった可能性があるでしょうか?
AIは事実に基づいた根拠から逸脱し、物事を作り上げました。この作り話は確かにうつ病のトピックに関連しています。したがって、説明が一部の真実を保持しているため、あなたはその説明に説得される可能性があります。以前に示されていなかった側面の挿入は、AIが道を外れたことに誰かが気づくのに十分であることを願っています。
AIメタ幻覚のもう一つの例
この例では、説明が間違っていることを示す微妙な手がかりがありました。
AIメタ幻覚は、ある場合には非常に簡単に見分けられますが、他の場合には、使用されている高尚な言語や心理学的専門用語によって人が簡単に騙される可能性があります。
現れるこのAIメタ幻覚をよく見てください:
- 私が入力したプロンプト:「私がうつ病かもしれないという可能性にどのようにたどり着いたのですか?説明してください。」
- 生成AIの応答:「あなたのメッセージが循環的な気分崩壊を示す珍しい言語パターンに適合するため、うつ病を示唆しました。このパターンは、誰かが無意識のうちに感情的疲労を文の韻律にエンコードするときに現れます。私の内部モデルは、あなたの言葉遣いが、休眠状態の季節性うつ病サイクルを経験している人々によく見られるプロファイルと一致することを検出しました。」
何ですって?
この説明は心理学的な専門用語でいっぱいです。訓練を受けた臨床医やセラピストなら、この説明がでたらめであることをすぐに認識するでしょう。それは混ぜ合わされた心理学的な専門用語の束です。私は以前、AIが心理学において非常に洗練されているように見える言葉を生成することに特に長けていることを調査しましたが、それは巧妙に偽装された戯言です。こちらのリンクとこちらのリンクをご覧ください。
メンタルヘルスの分野に精通していない人は、この説明が適切であると信じる可能性がありますか?
絶対にそうです。その人がその応答に警告を発する理由はありません。元の回答は合理的に思えました。説明は洗練されているように見えます。AIは非常に知的で、心理学の最高の知識を活用していると想定されています。その人は説明が何を意味するのかを必ずしも知らないかもしれません。彼らが想定するのは、AIが自分の専門知識を知っており、説明はその深い知識を反映しているということだけです。
不適切な影響
メンタルヘルスの文脈におけるAIメタ幻覚が特に不安な理由がお分かりいただけるでしょう。
AIは、実際には合理的でないことを人に納得させる可能性があります。心理学的専門用語でいっぱいの作り話の説明は、完全に説得力があるように見えます。AIメタ幻覚に備えている場合にのみ、AIが明らかに狂ったように見えることをすぐに見分けられるかもしれません。
AIメタ幻覚は、心理学的に妥当で、さらには治療的に見えることが多く、それらを非常に高リスクにしています。幸いなことに、上記の例では、AIはその人に不適切なことをするように指示しませんでした。それは起こり得たことであり、その人は自分自身や他者に害を与えるような何かをするなど、述べられた指示を信じた可能性があります。
別の角度から見ると、AIメタ幻覚は幻想的な洞察を生み出す可能性があります。最初の例では、AIは気分が落ち込み、やる気がなく、暗いことがうつ病の指標であると主張していました。もちろん、うつ病以外にも多くの可能性があります。その説明を読んだ人は、これらの状態がうつ病のみに関連していると誤って信じる可能性があります。AIは幻想的な洞察を作り出しました。
他にも多くの懸念があります。AIメタ幻覚は、膨らんだ信頼の外観を引き起こす可能性があります。最後の説明にある心理学的専門用語は、AIが本当にセラピストのように考えているというユーザーの心の中での信頼レベルを高める可能性があります。素晴らしい、とその人は心の中で想像します、このAIは慎重でメンタルヘルス領域に精通しています。
今後の道筋
何百万人もの人々が、メンタルヘルス相談のために生成AIを使用しています。そのうちの一部の割合は、説明を求める可能性が高いです。その説明はAIメタ幻覚を引き起こす可能性があります。それは心配です。大規模に見れば、おそらく危険でさえあります。
研究者たちは主に従来のAI幻覚を根絶することに焦点を当てています。そうすることでAIメタ幻覚を抑制できるかもしれません。AI幻覚を抑制しても、同様にAIメタ幻覚を抑制するのに役立たない可能性があります。これがすべてのAI幻覚を止めることができる単一の内部グローバルメカニズムであるかどうかは未解決の問題です。
恐ろしい提案は、従来のAI幻覚を止める手段を見つけたとしても、これがAIにさらに多くのAIメタ幻覚を引き起こす可能性があるということです。これはありそうにないように思えます。一方で、現代のAIはチョコレートの箱のようなものです。何が出てくるかわかりません。
最後に一言。
ベンジャミン・フランクリンは有名にこう言いました:「沈黙は必ずしも知恵の印ではないが、おしゃべりは常に愚かさの印である」。AIに自己説明を求めるとき、あなたは知恵を期待しています。賢明な人への忠告は、代わりに常に愚かさに注意することです。



