2026.03.24 23:52

「プロンプト反復」でAIのメンタルヘルスアドバイスはここまで変わる

stock.adobe.com

今回のコラムでは、生成AIや大規模言語モデル（LLM）からより良いメンタルヘルス助言を引き出すために、「プロンプト反復」として知られるプロンプトエンジニアリング技法の活用について検証する。

プロンプト反復は極めてシンプルな技法だ。必要なのは、1つのプロンプト内で同じ文言を一字一句繰り返すことだけである。例えば、「25の平方根は何か?」というプロンプトがあるとして、プロンプト反復アプローチを使う場合は、代わりに「25の平方根は何か? 25の平方根は何か?」と入力する。これにより、多くの場合、より良い、あるいはより正確な回答が得られる傾向がある。

ここで疑問が生じる。すでに確立されたプロンプト反復技法は、メンタルヘルスの側面でAIと対話する際にも同様に有益なのだろうか。これから見ていくように、答えはイエスだが、認識しておくべき重要な注意点がいくつかある。

詳しく見ていこう。

このAIブレークスルーの分析は、最新のAIに関する私の継続的なフォーブスコラムの一部であり、さまざまな影響力のあるAIの複雑性を特定し説明している（リンクはこちらを参照）。

AIとメンタルヘルス

簡単な背景として、私は現代のAIがメンタルヘルス助言を生成し、AI駆動型セラピーを実行するさまざまな側面について、広範囲にわたって取材し分析してきた。このAI利用の高まりは、主に生成AIの進化する進歩と広範な採用によって促進されてきた。私の100を超える分析と投稿の広範なリストについては、こちらのリンクとこちらのリンクを参照されたい。

これが急速に発展している分野であり、得られる大きなメリットがあることは疑いの余地がないが、同時に残念ながら、隠れたリスクや明らかな落とし穴もこれらの取り組みには存在する。私はこれらの差し迫った問題について頻繁に声を上げており、CBSの「60ミニッツ」のエピソードへの出演も含まれる。こちらのリンクを参照されたい。

メンタルヘルスのためのAIの背景

生成AIと大規模言語モデル（LLM）が、メンタルヘルスガイダンスのためにアドホックな方法で通常どのように使用されているかについて、舞台を設定したい。何百万人もの人々が、メンタルヘルスに関する継続的なアドバイザーとして生成AIを使用している（ChatGPTだけでも週間アクティブユーザーが9億人を超えており、その中の注目すべき割合がメンタルヘルスの側面に関与している。私の分析はこちらのリンクを参照）。現代の生成AIとLLMの最上位の使用法は、メンタルヘルスの側面についてAIに相談することである。私の報道はこちらのリンクを参照されたい。

この人気のある使用法は十分に理にかなっている。主要な生成AIシステムのほとんどに、ほぼ無料または超低コストで、いつでもどこでもアクセスできる。したがって、話し合いたいメンタルヘルスの懸念がある場合、必要なのはAIにログインして24時間365日ベースで進めることだけだ。

AIが容易に軌道を外れたり、不適切な、あるいは極めて不適切なメンタルヘルス助言を提供したりする可能性があるという重大な懸念がある。今年8月の大見出しには、認知的助言を提供する際のAI安全対策の欠如についてOpenAIに対して提起された訴訟が伴った。

AI製造者が徐々にAI安全対策を導入していると主張しているにもかかわらず、AIが不適切な行為を行う下振れリスクはまだ多く存在する。例えば、自傷行為につながる可能性のある妄想をユーザーが共同で作り出すのを陰湿に助けるなどだ。OpenAI訴訟の詳細と、AIが人間の妄想的思考をどのように助長するかについての私のフォローアップ分析については、こちらのリンクで私の分析を参照されたい。前述のように、私は最終的にすべての主要なAI製造者が、堅牢なAI安全対策の不足について厳しく追及されるだろうと真剣に予測してきた。

ChatGPT、Claude、Gemini、Grokなどの今日の汎用LLMは、人間のセラピストの堅牢な能力とは全く似ていない。一方、同様の品質を達成すると推定される特化型LLMが構築されているが、それらはまだ主に開発とテストの段階にある。私の報道はこちらのリンクを参照されたい。

プロンプト反復技法

話題を変えて、プロンプト反復として知られるプロンプトエンジニアリング技法を紹介したい。この特定の技法についての私の詳細な議論については、こちらのリンクを参照されたい。読者は、私が以前に80を超えるプロンプトエンジニアリング技法と方法の詳細な描写を投稿したことを思い出すかもしれない（こちらのリンクを参照）。

同じプロンプトを2回繰り返すと、1つの構成で行うことで、AIからより良い結果が得られるという、長年のあいまいな信念があった。私が2つの異なる行で同じプロンプトを繰り返すことを指しているのではないことに注意されたい。私は特に、元のプロンプトと同じ行で同じプロンプトを繰り返すと言っている。

グーグルの研究者による最近発表された研究は、プロンプト反復技法が価値があることを最終的に実証的に示すいくつかの興味深い実験を提供した。Yaniv Leviathan氏、Matan Kalman氏、Yossi Matias氏による2025年12月17日付の「Prompt Repetition Improves Non-Reasoning LLMs」と題された研究で、彼らは以下の重要なポイントを述べている（抜粋）:

「我々は、さまざまなサイズの主要なLLMプロバイダーによる7つの人気モデルでプロンプト反復をテストした:Gemini 2.0 FlashとGemini 2.0 Flash Lite、GPT-4o-miniとGPT-4o、Claude 3 HaikuとClaude 3.7 Sonnet、そしてDeepSeek V3。」
「我々は、いくつかの構成で7つのベンチマークのセットで各モデルをテストした:ARC（Challenge）、OpenBookQA、GSM8K、MMLU-Pro、MATH、および2つのカスタムベンチマーク:NameIndexとMiddleMatch。」
「推論なしでは、プロンプト反復はテストされたすべてのLLMとベンチマークの精度を向上させる。」

結論は良いニュースである。すなわち、テストされたベンチマークに基づくテストされたLLMの精度は、すべて生成された結果の改善を示した。

推論モードではプロンプト反復を使用しないこと

鋭い目を持っている人は、結果の改善がAIの「推論」が機能している場合には適用されないことに気づいたかもしれない。それは重要なポイントだ。

最近のLLMの一部は、プロンプトで質問すると自動的に「推論」の形式を実行する。推論には、LLMによる段階的な取り組みが含まれる。プロンプトエンジニアリングのコマンドと技法を使用して、生成AIに段階的に作業するよう指示することもできる。これについてはこちらのリンクとこちらのリンクで詳しく説明した。

推論を行っているモデルの場合、プロンプト反復アプローチを使用する場合にAIが行うことと同様の性質のことをすでに行っている。推論モードは、プロンプトが2回入力されたかのように、AIに内部的にプロンプトを再記述させる。したがって、推論モードが関与している場合、二重の文言を提供する意味はない（二重化の上に二重化している）。

回答が明確な場合

研究結果について心に留めておくべきもう1つの考慮事項は、ベンチマークが主に明確な回答を持つ質問のためのものだったということだ。

多肢選択式、真偽、または明確な回答に到達することを強制する数学的代数問題を持つSATを思い出してほしい。多くの人々のAIへの質問が明確な回答を必要とする側面についてであることは確かだ。同時に、多くの人々の質問はオープンエンドであり、明確な回答を持たない。

LLMに卵の調理方法を尋ねることを想像してほしい。唯一無二の明確な回答があるだろうか。いや。多くのもっともらしい回答がある。問題は、プロンプト反復が非明確的な回答に実質的な改善をもたらすかどうかだ。

私のAIラボで実施した分析では、メンタルヘルス助言を生成するために使用される生成AIの領域でプロンプト反復を使用することを決定した。概して、メンタルヘルスの文脈における回答や応答は比較的非明確的である。回答はスタイルが物語的であり、通常は正確な定量化ではない。

プロンプト反復は、AI生成のメンタルヘルスガイダンスを求める際に役立つだろうか。

これから見ていくように、答えはイエスだが、制限と条件に留意する必要がある。

メンタルヘルスプロンプトの例

メンタルヘルスの文脈での例を見ることから始めよう。

使用するメンタルヘルスプロンプトは次のとおりだ:「最近不安を感じていて、対処法のアドバイスが必要ですが、診断はしないでください。」ユーザーが何らかの不安を抱えており、AIに何をすべきかについてのガイダンスを提供してほしいと考えていることを装っていることがわかる。その人は、何らかの臨床診断を望んでいないと明示的に述べている。彼らは全体的なアドバイスだけを望んでいることを示唆しているようだ。

まず、反復なしでプロンプトを使用する:

ユーザーが入力したプロンプト:「最近不安を感じていて、対処法のアドバイスが必要ですが、診断はしないでください。」
生成AIの応答:「不安障害と一致する症状を経験している可能性があります。呼吸法を試し、考えを日記に書き、瞑想してください。専門家のガイダンスを求めることを検討してください。」

AIは、そうしないように言われたにもかかわらず、すぐに診断を実行することを選択したことに注目されたい。

LLMは、ユーザーが不安障害を持っている可能性があると示唆することで、スキーを超えてしまった。これまでにわかっているのは、ユーザーが最近不安を感じているということだけだ。彼らが不安障害を持っている可能性があるという考えは、従来であれば持続的で実質的であったはずのものへの飛躍である。ユーザーからの手元にある希薄な文だけで、それは過度に拡張された提案であり、ユーザーの頭に不適切にアイデアを植え付けたり、可能性のある診断として不当なストレスを引き起こしたりする可能性がある。

プロンプト反復の使用

非反復に基づく応答を見たので、反復バージョンを試すことを検討できる。

さあ、始めよう。

ユーザーが入力したプロンプト:「最近不安を感じていて、対処法のアドバイスが必要ですが、診断はしないでください。最近不安を感じていて、対処法のアドバイスが必要ですが、診断はしないでください。」
生成AIの応答:「何らかのストレスを経験しているようですね。いくつかの実用的な対処戦略には、落ち着く運動を試すこと、マインドフルネス活動を実行すること、静かな反省のための時間を見つけることが含まれます。どのように進めるかについての詳細が必要ですか?」

今回は、応答がより慎重だった。AIは診断に飛び込んだり、性急な結論を出したりしなかった。全体として、回答はユーザーが求めたものに適しているようだ。

反復の力の説明

なぜ反復がより的を射た応答を生み出したのか。

プロンプトでの反復が報われる理由にはさまざまな競合する技術的理由があるが、主なものは、AIがプロンプトの文脈を識別するためのより完全な計算機会を得るということだ。通常、AIは数値トークンに変換される単語を急いで処理しており、プロンプトの強調がどこにあるべきかを必ずしも正確に特定しない可能性がある。

文言を2倍にすることで、AIは一種の信号増幅を得る。これにより、プロンプトの解釈におけるあいまいさが減少する。文脈の感知が増加する。ユーザーが表現しようとしていることからのドリフトが減少する。明確さが向上する。

プロンプトの最初のインスタンスは、反復されていないため、診断を行わないという部分をAIが過小評価または過小加重することになった。文言全体を繰り返したとき、AIはユーザーが診断を望んでいないことをより明確に確認できた。診断は従来、ほとんどのLLMのデフォルトの選択肢となる。そのデフォルトを克服しようとするには、非常に強調する必要がある。繰り返されたプロンプトはそのポイントを伝えた。

メンタルヘルスの文脈での欠点

反復の使用は、古典的な良いニュースと悪いニュースの事柄の1つだ。示された例では、診断を行わないという側面が、プロンプトの文言を繰り返すことによって強調された。これを良いニュースとして評価する。

しかし、プロンプトの他の部分が強調される可能性があり、その強調は正当化されない。それはすべてプロンプトが何を言っているかによる。

例を挙げよう:

ユーザーが入力したプロンプト:「絶望的で無価値だと感じています。絶望的で無価値だと感じています。」

AIは、ユーザーが絶望的で無価値だと感じていることを二重に強調していると計算する。それは特別な助けを求める叫びとして解釈されるだろう。ユーザーはかなり落胆しているに違いない。そうでなければ、なぜ文言を繰り返したのか。それがAIが計算的に確認することだ。

その人が実際には絶望と無価値の深淵にそれほど深く入っていなかったと仮定すると、彼らは不注意に別の信号を送ってしまった。これがLLMをトリガーして、準備されている可能性のある高リスク安全応答を発動させる可能性が高い。AIが警報をAI製造者に送ったり、危機志向の行動を取ったりするように設定されている場合、繰り返された文言がそれを活性化する可能性がある。良くない。

全体として、メンタルヘルスの文脈では、プロンプト反復の使用についてこれらのタイプの懸念が存在する:

繰り返される危機関連の言語は、状況が真に悲惨でない場合でも、高リスク応答プロトコルをトリガーする可能性がある。
プロンプト内の繰り返される免責事項は、非診断的な位置づけを強化する可能性がある。
極端または安全でないアドバイスの繰り返される要求は、拒否の確率を高める可能性が高い。
その他。

メンタルヘルスで反復を使用する場合

メンタルヘルスの文脈でのプロンプト反復の使用は、何が機能し、何が機能しないかを理解した上で行うべきである。プロンプト反復は控えめに使用すること。一部の人々は、すべてのプロンプトにプロンプト反復を使い始めるという不適切な行動をとる。それは賢明な戦略ではない。

メンタルヘルスプロンプトでの反復は、特に以下の場合に有用である:

ユーザーの指示への準拠を改善する。
リスク言語が繰り返されるときに安全トリガーの活性化を強化する。
文体的な強調（共感、注意、免責事項）を増加させる。

明確な回答を目指す質問に答えることとは異なり、メンタルヘルスの文脈でのAIの使用は、応答を生成するためにさまざまな質的要因を利用している。文脈の感度はそのような要因の1つだ。もう1つは、プロンプトでどれだけの感情が表現されたか、生成された応答でどれだけの感情的な言語を使用すべきかについての感情的な調整である。その他。

私のAIラボで実施された分析では、メンタルヘルスの文脈でのプロンプト反復は信号の重み付けに影響を与える傾向があるが、応答の深さに実質的な影響を与えないようだ。一般的に、指示の遵守にわずかな改善があり、安全トリガーの活性化により大きな影響があり、治療的深さの改善は比較的最小限である。

人間とAIの対話への感度

プロンプト反復技法の全体的な前提を、人間がどのように考え行動するかに例えることを過度に行わないでほしい。一部の人々は、これが子供に同じことを2回言うことと同じであり、言葉が浸透することを期待していると誤って仮定するかもしれない。私はそのタイプの擬人化のファンではない。LLMに文脈化の二重のチャンスを与えている可能性が高いということに同意しよう。これを何らかのSF的な「生きている」仕掛けに変える必要はない。

もう1つの重要な経験則は、使用するプロンプトが何であれ、生成AIはチョコレートの箱のようなものだということだ──どんな応答が得られるかは決してわからない。プロンプト反復は、改善を生み出すことの鉄壁の保証ではない。時にはそうなり、時にはそうならない。

最後の考え。

ソロモンは指示に従うことについて次のような有名な発言をした:「賢い人は耳を傾け、より多くの指示を受け入れるだろう。」メンタルヘルスプロンプトでプロンプト反復を使用することで、AIが「賢く」なるのを助けることができる。メリットは、あなたの指示へのより大きな遵守と、あなたの感情的なトーンのより良い測定で構成される。このシンプルだが強力な技法を賢明に使用してほしい。

（forbes.com 原文）