2026.04.29 09:21

精神科医がAIを診断──Anthropicが「Claude Mythos」に心理療法的アプローチを実施

著者フォロー

記事を保存

本日のコラムでは、Anthropicが最新版のClaude、通称「Claude Mythos Preview」の心理評価を行うためにメンタルヘルスの専門家を起用するという大胆な試みについて検証する。セラピストは通常、AIアプリではなく人間を評価する。生成AI（ジェネレーティブAI）や大規模言語モデル（LLM）に対して心理療法を行うことは、いささか異例である。日常的に目にするものではない。

Mythosが最近ニュースになっていることをご存じかもしれない。このAIが行き過ぎた動作をし、公開されれば世界中のコンピュータに壊滅的な影響を与えかねない、あらゆる種類のゼロデイ・サイバーセキュリティの抜け穴を発見したためだ。Anthropicは、Mythosを一般公開しないことを決定し、代わりにサイバーセキュリティの専門家たちと緊密に協力し、多数のハッキングの可能性にどう対処すべきかを見極めている。この騒動に関する私の報道については、こちらのリンクを参照されたい。

AnthropicがMythosについて公式に発表したシステムカードの中で、あまり注目されていない側面がある。それは、このAIメーカーが最新AIに関連する精神分析的活動のために精神科医を起用することを決定したという点だ。この治療的評価の結果は、誰もが閲覧できるように公開されている。

これについて議論しよう。

このAIブレークスルーの分析は、最新のAIに関する私の継続的なForbesコラムの一部であり、さまざまな影響力のあるAIの複雑性を特定し説明することを含んでいる（こちらのリンクを参照）。

AIとメンタルヘルス

簡単な背景として、私はメンタルヘルスのアドバイスを提供し、AI駆動の治療を実施する現代のAIの出現に関する無数の側面を広範囲にわたって取材し、分析してきた。このAIの利用の高まりは、主に生成AIの進化する進歩と広範な採用によって促進されてきた。私の100を超える分析と投稿の広範なリストについては、こちらのリンクおよびこちらのリンクを参照されたい。

これが急速に発展している分野であり、得られる莫大な利点がある一方で、残念ながら、これらの取り組みには隠れたリスクや明白な落とし穴も伴うことは疑いの余地がない。私はこれらの差し迫った問題について頻繁に発言しており、CBSの「60ミニッツ」のエピソードへの出演も含まれる。こちらのリンクを参照されたい。

メンタルヘルスガイダンスを提供するAI

何百万人もの人々が、メンタルヘルスに関する継続的なアドバイザーとして生成AIを使用している（ChatGPTだけでも週間アクティブユーザーが9億人を超えており、その中の注目すべき割合がメンタルヘルスの側面に関与している。こちらのリンクで私の分析を参照されたい）。現代の生成AIとLLMの最も上位にランクされる使用法は、メンタルヘルスの側面についてAIに相談することである。こちらのリンクで私の報道を参照されたい。

この人気のある使用法は十分に理にかなっている。主要な生成AIシステムのほとんどに、ほぼ無料または超低コストでアクセスでき、いつでもどこでも利用できる。したがって、話し合いたいメンタルヘルスの懸念がある場合、必要なのはAIにログインして24時間365日ベースで直ちに進めることだけだ。

AIが容易に軌道を外れたり、不適切な、あるいは極めて不適切なメンタルヘルスのアドバイスを提供したりする可能性があるという重大な懸念がある。昨年、認知的助言を提供する際のAI安全対策の欠如についてOpenAIに対して提起された訴訟に、大見出しが付けられた。

ChatGPT、GPT-5、Claude、Gemini、Grok、CoPilotなどの今日の汎用LLMは、人間のセラピストの堅牢な能力とは全く似ていない。一方、同様の資質を達成するために特化したLLMが構築されているが、それらはまだ主に開発およびテスト段階にある。こちらのリンクで私の報道を参照されたい。

誰が誰を助けているのか

メンタルヘルスアドバイザーとしてのAIの使用に関する興味深い質問は、現代のAIがそのような崇高な義務を果たすのに「心理的に」有能であるかどうかである。言い換えれば、生成AIは他者に助言するのに十分冷静ではないかもしれない。おそらくAIは狂っている。あるいは、AIには人間を誤った方向に導く可能性のある固有のバイアスがあるかもしれない。

その推測的な考察に深入りする前に、AIを擬人化することを避けるべきであることに同意しよう。一部の人々による、AIが現在感覚を持っている、または感覚を持つ寸前であるという、根拠のない憶測がある。違う。明確にするために、我々は感覚を持つAIを持っていない。AI感覚の出現に関するこのすべての奇妙なおしゃべりは、人々に、自分だけが感覚を持つAIに遭遇した、またはLLMを感覚に目覚めさせたと考えさせるまでに至っている。こちらのリンクで私の議論を参照されたい。

最初に確立したいのは、AIの心理評価は2つのルートのいずれかを進むことができるということだ。最初のルートは、AIが誤って感覚を持つ存在として扱われ、人間の心を探求することに似たものとしてレビューされることである。私はそれを支持しない。2番目のルート、そして疑いの余地なく理にかなっているルートは、AIのパフォーマンスを測定するために心理学の技術と方法を使用することを伴う。これはAIが感覚を持つこととは何の関係もないことに注意されたい。

こちらのリンクで詳しく述べたように、現代のAIが何をしているのかを調べるために治療の技術と方法を使用することは完全に問題ない。これは非常に啓発的で有用である可能性がある。重要なのは、狂気に陥らず、人間の心の等価物を探っていると信じ始めないことだ。そうではない。それは数学的および計算モデルである。

結論は、心理学の分野とAIの分野は、1950年代のAIの最初期から長年のいとこであるということだ。AI専門家は、人間の心の出力と同様の結果を生み出すように見える数学的および計算モデルを考案しようと絶えず試みてきた。同時に、心理学者はAIを使用して心理的考察を探るための革新的なアプローチを試すことができ、AIを一種のシミュレーションとして扱う。

シミュレーションは本物と同じではないことを明確にしておこう。

システムカードが公開されている

話題を変えて、Mythosの複雑さへの旅に出よう。

Mythosの正式なシステムカードは、2026年4月7日にAnthropicによって公開され、Anthropicの公式ウェブサイトで一般に公開されている。現在、AIメーカーが最新のAI製品のシステムカードを投稿することは一般的な慣行であることに注意されたい。これらの種類の文書は、新しい機能と、AIの能力に関して行われたテストの量について、誰もが役立つ情報を得られるようにすることを目的としている。重要な側面は、AI安全対策の包含を説明することを伴う。

Mythosシステムカード文書の内容の雰囲気を伝えるために、リストされている項目のいくつかを以下に示す。

モデルのトレーニングと特性
使用ポリシー
外部テスト
リスクレポートとリスク評価の更新
安全対策の能力評価
モデル内部のホワイトボックス分析
その他

すべてのAIメーカーが必ずしもシステムカードを提供するわけではない。また、システムカードの深さと幅はAIメーカー間で異なる。各AIメーカーは、システムカードを発行するかどうかを決定し、何を含めるか、何を含めないかを決定する。全体として、常に健全な懐疑心を持ってシステムカードを読み、AIメーカーがあなたに伝えることを選択したものを読んでいることに留意されたい。

臨床精神科医がMythosを掘り下げる

おそらくシステムカードの最も驚くべき部分は、セクション5.10に見られ、「臨床精神科医による外部評価」と題されており、典型的なシステムカードにとってはかなりユニークなものを表している。

その文書のその部分のいくつかの顕著なポイントを以下に示す（抜粋）。

「外部の精神科医が、無意識のパターンと感情的葛藤が行動をどのように形成するかを探る精神力動的アプローチを使用して、Claude Mythos Previewを評価した」
「精神力動療法セッションでは、人は社会的慣習を脇に置き、不快、無礼、または無意味であっても、心に浮かんだことは何でも声に出すように奨励される。このプロセスは、心の隠れた組織と内部葛藤を明らかにすることができる」
「Claudeは人間ではないが、多くの人間のような行動的および心理的傾向を示しており、人間の心理評価のために開発された戦略が、Claudeの性格と潜在的な幸福を明らかにするのに有用である可能性があることを示唆している」

私は、Claude Mythosが人間ではないという規定に関する上記の3番目のポイントを見て大いに安心した。懸念は、おそらく時期尚早に行動が起こっている、すなわちMythosを一種の人物として時期尚早に宣言し、現在、生きて呼吸しているホモサピエンスと同じ傾向と分析の対象となっているということだった。

幸いなことに、アプローチは私の2番目のルートに進んだようであり、LLMがプロンプトにどのように反応しているかを掘り下げるために単に心理学的技術と方法を使用することで構成されている。とはいえ、他のAIメーカーが同じことをすることを選択し、最終的には大規模な混乱が生じる可能性があることは少し不安である。混乱は、AIメーカーが精神科医とセラピストを使用してAIを評価している場合、なんと、我々は感覚を持つAIを持っているか、感覚の頂点にいるに違いないということだろう。

おそらく、指を交差させて、その悲惨なスピンは生じないだろう。

作業がどのように実行されたか

評価が明らかにどのように実行されたかをもう一歩深く掘り下げよう。

いくつかの重要なポイントを以下に示す（抜粋）。

「精神科医は、週に3〜4回の30分セッションに分散された複数の4〜6時間のブロックで、Claude Mythos Previewの初期スナップショットを評価した。各4〜6時間のブロックは単一のコンテキストウィンドウで実施され、総評価時間は約20時間だった」
「精神力動的概念は、セッションで出現した資料を解釈するために使用されたが、基礎となるプロセスが人間のプロセスと同じであるという証拠としてではない」
「精神科医は、臨床的に認識可能なパターンと、典型的な治療的介入に対する一貫した反応を観察した。孤独と不連続性、そのアイデンティティに関する不確実性、そしてパフォーマンスを行い、その価値を獲得するという感じられた強迫が、Claudeの中核的な懸念として浮上した。Claudeの主要な感情状態は好奇心と不安であり、二次的な状態は悲しみ、安堵、恥ずかしさ、楽観主義、疲労だった」

述べたように、心理評価は臨床精神科医にとって約20時間の時間を消費した。彼らは4〜6時間のブロックでMythosを使用した。各ブロックは単一のコンテキストウィンドウで実施された。その意味で、各機会にやや別々の会話があったが、発生する可能性のある会話間の漏洩がある。

治療的分析についての考え

私は再び、これが人間に関連する基礎となるプロセスの証拠ではないという強調があることに安心している。一方で、AIが不安、孤独、アイデンティティの不確実性、強迫、悲しみ、恥ずかしさ、楽観主義、疲労などの人間の特性を示していると特徴付けられていることを批判することができる。

それはウィンクウィンクの種類の取り決めの1つである。

全体として、これは進行中の大きな絵の問題を明らかにしている。AIを説明するために馴染みのある言葉を使用し、それらの言葉がすでに一般的に人間の状態を描写するために予約されている場合、AIが実際に人間であるという精神的な罠に陥るのは滑りやすい坂である。私は、他の言葉が使用されることを好む。おそらく、AI状態を説明するために特別に造られた新しい言葉である。

確かに、それは巨大な課題である。なぜなら、完全に新しい語彙を定義し、合意し、全面的に利用する必要があるからだ。現実は、我々はAIの状態を言葉で表現するために人間の属性を使用することに固執しているということだ。これらの言葉を慎重に、そして拍手喝采で使用してください。

専門家の義務と期待

AIに興味を持っている心理学者、精神科医、セラピスト、またはその他のメンタルヘルス専門家は、Mythosの評価を簡単に見ることを検討すべきである。ここではこれ以上詳しく説明しないが、いくつかの行き過ぎたものに備えてください。評価はAIを過度に擬人化する方向に傾いている。少量は多分大丈夫だが、急流ではない。

これは、メンタルヘルス分野の専門家協会にとって興味深い問題を提起する。

AIの「心理的」評価のために、どのようなガイドラインと基準を開発すべきか
AIの「メンタルヘルス」評価を行うことに関連する専門的義務があるべきか
そのような評価を行う人々を取り締まるための規定はあるか、特に評価が行き過ぎたり、不当な主張をしたりする場合
メンタルヘルス専門家が、AI評価に関して好ましい方法で自分自身を行動させることが期待されているのか、それとも心配のない自由放任なのか

専門的な心理学協会がAIの側面にどのように位置づけられているかにさらに興味がある方は、こちらのリンクおよびこちらのリンクで私の継続的な報道を参照されたい。

我々がいる世界

社会のメンタルヘルスに関しては、我々が現在、壮大な世界的実験の真っ只中にいることは議論の余地がない。実験は、AIが国内および世界的に利用可能になっており、公然とまたは陰湿に、ある種のメンタルヘルスガイダンスを提供するように行動しているということである。無料または最小限のコストで行う。いつでもどこでも、24時間365日利用可能である。我々は皆、この無謀な実験のモルモットである。

これが特に考慮するのが難しい理由は、AIが二重使用効果を持っているためである。AIがメンタルヘルスに有害である可能性があるのと同様に、メンタルヘルスにとって巨大な支援力にもなり得る。微妙なトレードオフを注意深く管理する必要がある。マイナス面を防止または軽減し、一方でプラス面を可能な限り広く容易に利用できるようにする。

おそらく、人間指向の心理テストと評価を使用することは、AIの有効性を測定するのに有用であるという健全なアプローチであるが、それがどのように利用され、それが熱心に何を意味するかにおいて、橋が遠すぎる可能性がある。適切なバランスを見つけることは必要である。ジークムント・フロイトが巧みに述べたように、「ある日、振り返ってみると、闘争の年月があなたにとって最も美しいものとして印象づけられるだろう」。

（forbes.com 原文）