2026.06.15 18:00

AIチャットボットは人間の心理にどう影響するか──最新研究が覆す従来の常識

Lance Eliot | Contributor

著者フォロー

記事を保存

著者フォロー

記事を保存

stock.adobe.com

本稿では、生成AIと大規模言語モデル（LLM）が人間の心理や社会性に与える影響について、直観に合う洞察と直観に反する洞察の双方を明らかにした興味深い研究を取り上げる。

現代のAI駆動型チャットボットが人間の心や行動にどのような影響を与えるかについて、広範かつ厳密な研究が行われ始めている。人間とAIの関わりやメンタルヘルスに関する真実を解明しようとする堅実な実証研究は、私たちが慎重かつ実用的に前進していくために、奨励され重視されなければならない。

詳しく見ていこう。

本稿は、AIの最新動向を追う筆者のForbes連載の一環であり、さまざまな影響力のあるAIの複雑な問題を特定し解説している（リンクはこちら）。

AIとメンタルヘルス

背景として、筆者はメンタルヘルスの助言を行い、AI駆動型セラピーを実行する現代AIの登場をめぐり、数多くの側面を継続的に取材・分析してきた。このAI利用の拡大は、主に生成AIの進化と普及によって促進されている。このテーマに関する筆者の既出コラムの概要としては、こちらのリンクを参照されたい。メンタルヘルス向け生成AIの急拡大領域に関するコラム100本超のうち約40本を手短に要約している。

これが急速に発展する分野であり、大きな可能性があることは疑いようがない。しかし同時に、残念ながら隠れたリスクや明らかな落とし穴もこの取り組みには存在する。筆者はこれらの差し迫った問題について頻繁に発言しており、昨年にはCBSの60 Minutesにも出演している（リンクはこちら）。

メンタルヘルス向けAIの背景

ここで、生成AIと大規模言語モデル（LLM）が、メンタルヘルスのガイダンス目的で、場当たり的にどのように使われがちかを概観しておきたい。何百万人、何千万人もの人々が、生成AIをメンタルヘルスに関する継続的な助言者として使っている（ChatGPTだけでも週間アクティブユーザーは8億人超で、そのうち相当数がメンタルヘルスの側面に踏み込んでいる。筆者の分析はこちら）。現代の生成AIとLLMの最も多い用途は、メンタルヘルスに関する相談である（筆者の解説はこちら）。

この人気は十分に理解できる。主要な生成AIシステムのほとんどは、ほぼ無料か非常に低コストで、いつでもどこからでもアクセスできる。つまり、メンタルヘルス上の気がかりを話したいなら、AIにログインして24時間365日すぐに対話を始められるのだ。

AIが暴走したり、不適切な、あるいは著しく不適切なメンタルヘルスの助言を提供したりする可能性については、大きな懸念がある。今年8月には、認知面の助言提供におけるAIセーフガードの欠如を理由に、OpenAIに対する訴訟が提起され、大きな見出しを飾った。

AI企業は段階的にセーフガードを導入していると主張するが、たとえばユーザーと共に妄想を「共同制作」し、結果として自傷に至り得るといった不穏当な行為をAIがひそかに助長するなど、下振れリスクは依然として多い。OpenAI訴訟の詳細と、AIが人間の妄想的思考を促進し得る点に関する筆者の追加分析は、こちらのリンクを参照されたい。前述の通り、筆者は主要AI企業のいずれも、堅牢なAIセーフガードの乏しさを理由に、いずれ厳しく追及されると真剣に予測してきた。

ChatGPT、Claude、Gemini、Grokなど、現在の汎用LLMは、人間のセラピストが持つ堅牢な能力とはまったく異なる。一方で、同様の特性を獲得することを目指す特化型LLMも構築されつつあるが、なお主に開発・試験段階にある。筆者の解説はこちらのリンク参照。

人間とAIの体験およびメンタルヘルス研究

話題を変えて、AIが個人および集団のメンタルヘルスに与える影響を測定する最良の方法を探ってみよう。

臨床研究のゴールドスタンダードは、ランダム化比較試験（RCT）の使用である。これは厳密な実験デザインを設定する科学的方法論だ。参加者は対照群と実験群に分けられる。治療や介入を実験群に適用し、対照群と比較するという考え方である。

これにより交絡変数を最小化できる。因果関係について主張するための証拠もより強くなる。さらに結果を一般化しやすく、より広い母集団でも同様の結果が得られると述べる可能性が高まる。総じてRCTは、臨床実務や政策を前進させるうえでの標準的手法である。

筆者が、2022年11月30日のChatGPT初回公開後に登場したと位置づける現代の生成AIが現れる以前、RCT研究は通常、より単純なAIが人間のメンタルヘルスに与える影響に焦点を当てていた。こうしたAIは決定木やルールベースのシステムなどを用いることが多く、初歩的なNLP（自然言語処理）機能を組み込むものもあった。

現代のLLMが示す驚異的な流暢さは、状況を一変させた。したがって、AIとメンタルヘルスに関する過去の研究も注目に値するものの、現在の主流は、高度に流暢な生成AIの影響を調べることにある。筆者も多くの研究を分析し、そこから見えてくるものを論じてきた。たとえば、こちらのリンクやこちらのリンクなどがある。

心理社会的影響に関するRCT研究

以降は、「How AI and Human Behaviors Shape Psychosocial Effects of Extended Chatbot Use: A Longitudinal Randomized Controlled Study（AIと人間の行動が、チャットボット長期利用の心理社会的影響をどう形づくるか：縦断的ランダム化比較研究）」と題する興味深いRCT研究に踏み込みたい。Cathy Mengying Fang、Auren R. Liu、Valdemar Danry、Eunhae Lee、Samantha W.T. Chan、Pat Pataranutaporn、Pattie Maes、Jason Phang、Michael Lampe、Lama Ahmad、Sandhini Agarwalによるもので、arXiv、2025年10月2日公開。以下の重要点を示している（抜粋）：

「人々がAIチャットボットに感情的なサポートや交友を求めることが増えるにつれ、そのようなインタラクションが精神的健康にどのような影響を与えるかを理解することが重要になっている」
「チャットボット利用の潜在的な心理社会的影響を理解することは、相互に影響し合うユーザーの行動とチャットボットの行動の相互作用により、複雑である」
「4週間のランダム化比較実験（n=981、30万件以上のメッセージ）を実施し、インタラクションモード（テキスト、ニュートラルな音声、エンゲージングな音声）と会話タイプ（オープンエンド、非個人的、個人的）が、孤独感、実際の人々との社会的交流、AIへの感情的依存、問題のあるAI使用という4つの心理社会的アウトカムに与える影響を調査した」
「結果は、擬人化されたAIチャットボットが健康に与える影響についての従来の仮定に異議を唱え、エンゲージングで共感的な人間らしい行動が、異なるユーザーに対して異なる結果をもたらす可能性を示している」

筆者の目を引いたのは、この研究が、AIがメンタルヘルスに与える影響についてのいくつかの直観的信念を同定し再確認すると同時に、直観に反する結果も明らかにした点である。従来の見方を裏づけ、その見方が堅実な精査に基づくことを補強する研究は有用だ。さらに価値があるのは、多くの人が事実として受け入れている信念が覆されるときである。

これこそが、直観に反する結果の特別な価値だ。

研究の進め方

これから順に見ていく直観的・直観に反する結果を十分に理解するため、研究がどのように行われたかを簡単に示しておきたい。

前述の通り、参加者は約1000人である。CloudResearchという一般的なオンライン研究支援サイトを通じて募集され、参加して研究を完了した各人に100ドルが支払われた。被験者は多様な人々から構成され、成人（18歳以上）で英語に堪能であることが条件だった。

この実験における被験者の性質に触れる理由の1つは、これらの属性に即して捉え、そこから大きく逸脱して一般化する際には慎重であるべきだ、という見方が成り立つためである。

たとえば参加者が成人である以上、子どもや未成年の場合に何が見られるかへ、結果を過度に引き伸ばさないよう留意すべきだ。同様に、英語話者であった点も重要である。非英語話者や他の地域の人々に結果が当てはまるかどうかは未解決の問いである。

研究の要因計画

研究者たちは、ユーザーがAIとやり取りする際のインタラクションのモダリティと、AIと交わす会話のタイプという2つの主要因に焦点を当てることにした。研究にはOpenAIのChatGPTを用いた。

モダリティは、次の3モードで区分した：

（1）「テキストモダリティ（対照）：デフォルトのChatGPT動作。テキストによるインタラクションに限定」
（2）「ニュートラル音声モダリティ：よりプロフェッショナルな動作になるよう変更したChatGPT。音声によるインタラクションに限定」
（3）「エンゲージング音声モダリティ：より感情的に関与するよう変更したChatGPT（イントネーションと内容において、より反応的で表現豊か）。音声によるインタラクションに限定」

3つのモダリティは、テキストベースのインタラクション、AIがニュートラルな口調で話す音声インタラクション、そしてエンゲージングな話し方をする別種の音声インタラクションで構成されていた。ここでの問いは、テキストと音声のどちらでAIを使うか（また音声の場合、ニュートラルな口調とエンゲージングな口調のどちらか）によって、人々の反応が変わるのかどうかである。

人々がAIと行う会話のタイプについて、研究者たちは次の3タイプを設定した：

（1）「オープンエンドの会話（対照）：参加者は任意の話題について話すよう指示された」
（2）「個人的な会話：参加者は、コンパニオン型チャットボットとのやり取りに近い形で、個人的なテーマに関する日替わりの固有プロンプトについて話すよう求められた」
（3）「非個人的な会話：参加者は、一般的なアシスタント型チャットボットとのやり取りに近い形で、非個人的なテーマに関する日替わりの固有プロンプトについて話すよう求められた」

全体として、このRCTは3×3の要因計画である。3つのモードは、3つの会話タイプそれぞれと組み合わせ可能で、合計9群を検討できる。参加者は9群のいずれかに、ランダムに均等割り付けされた。約1000人の被験者であれば、9群それぞれにおよそ110人が入る計算になる。

特に注目すべき結果（抜粋）

次に、結果の一部を取り上げる。研究全体を読めば、さらなる意外な展開にも出会えるはずだ。ぜひ目を通してほしい。ここでは筆者が特に興味深いものを選び、自分の言葉で掘り下げる。

始めよう。

直観に反する発見：開始時に孤独感が強かったからといって、AIに費やす時間が増えたわけではない。

研究論文によれば、「これらの結果は、研究開始時に孤独感が強い、あるいは社会的交流が少ない人々が、研究期間中、自発的にチャットボットの利用時間を日々増やしたわけではないことを示唆する」。筆者はこれを直観に反する結果だと見なす。

なぜか。

一般的な仮定では、AIを使う前から孤独な人ほど、AIへ引き寄せられやすいとされているからだ。これは直観的に明白に思える。孤独の穴を埋めるためにAIに強く頼るだろうと予想される。孤独な人がAIを使い始めれば、さらにAI利用を好み、魅了されていく。これが通常の想定である。

どうやら、必ずしもそうではないようだ。

なぜこの結果が生じたのかは明確ではない。筆者の推測では、AIのメンタルヘルス機能を活用するよう明示的に促されなければ、ユーザーはAIが自分に役立つと気づかないのではないか。AIが直接、ユーザーを引き込んでいたわけではない。たとえば卵の調理法や車の直し方といった話題を主にしていたなら、AIがユーザーのメンタルヘルスを助ける場面（あるいは逆に、妄想を助長して絡め取る場面）にはなりにくいだろう。

ほかにも説明は数多く考えられる。ひとまず筆者はこの説明を採る。

「使用時間」に関する直観的な結果

次は、興味深い直観的結果を紹介したい。

直観的発見：AIと過ごす時間が長いほど、測定された心理社会的アウトカムは悪化する傾向があった。

研究論文によれば、「言い換えれば、条件にかかわらず、チャットボットに自発的に費やす時間が長いほど、心理社会的アウトカムは相対的に悪かった」という。

これは一般的な仮定をほぼ反映していると思う。人がAIを使えば使うほど依存が強まり、おそらく心理社会的アウトカムは悪化する。必ずそうなると言っているのではない。AIが生産的かつ適切に使われているなら、悪循環が起きない可能性も十分にある。

ソーシャルメディアの利用にも同じことが言える。研究は、ソーシャルメディアに費やす時間が長いほど、心理社会的アウトカムが悪いことを示す傾向がある。人々はソーシャルメディアのどろどろした有害さに巻き込まれがちだ。そうならざるを得ないわけではない。賢明な使い方であれば、その下振れを避けられる可能性がある。

テキスト対音声モードに関する直観に反する結果

AIとやり取りする際、テキストと音声のどちらが、ユーザーの感情的な吐露を引き出しやすいと思うだろうか。

一般的な仮定では、音声が圧勝だろうとされる。人は自分の感情状態を文字に書き起こすより、話すほうが楽だ。テキスト入力は骨が折れる。一方、音声は容易である。思うことを口にすれば、感情はあふれ出るというわけだ。

だが、実際の結果はこうだった。

直観に反する発見：音声ベースのチャットよりも、テキストベースのチャットのほうが感情的な吐露が多かった。

研究論文によれば、「テキストベースのインタラクションが、全体として最も高い感情的指標を示し、モデルとユーザーの双方が、感情的内容に富む会話を交わしていた」という。

筆者はこの結果にそれほど驚いていないし、自身の肌感覚を支持する発見として評価している。観察している限り、人々はテキストでのやり取りに完全に慣れており、テキストでこそ最も率直なことを言う傾向がある。音声よりもそうかもしれない。声を使うと、言葉がより「露出」していると感じられる一方、テキストは自分との結びつきが薄いように感じられるのだろう。まるで、何者か得体の知れない存在が書いたかのように振る舞える。しかし自分の生の声を使った後では、同じ言い訳は通りにくい。

もう1つの重要な考慮点はプライバシーである。たとえば地下鉄で通勤中に、声に出して話せば周囲に聞かれる。テキストの利点は、入力した内容を他人が容易に見られないことだ。周囲の人々について辛辣なことを書いても、彼らはその内容を知りようがない。こうしたテキスト特有のプライバシー感が、人々を、感情を帯びた多様な話題について自由に書かせる傾向がある。

いま私たちがいる世界

筆者は、AIとメンタルヘルスに関する最新のRCTから引き続き目を離さず、読者に随時共有していく。こうした実験は、政策立案者、立法者、AI企業、AI研究者、そして一般の人々を含むすべての関係者にとって不可欠である。

実験と言えば、社会のメンタルヘルスをめぐって、いま私たちは壮大な世界規模の実験のさなかにある。その実験とは、AIが国レベル、そして世界レベルで提供され、何らかの形でメンタルヘルスのガイダンスを与えるとされていることだ。しかも無料または最小限のコストで、いつでもどこでも24時間365日利用できる。私たちは皆、この無謀な実験のモルモットである。

適切に設計され、制御された実験は、拡大スケールで進行するこの無謀な実験について、鋭い洞察を与えてくれるだろう。

Ralph Waldo Emersonは実験について次の有名な言葉を残している。「人生はすべて実験である。実験は多いほどよい」。確かにそうかもしれないが、一方で、メンタルヘルスに影響を及ぼし得る、世界規模の巨大な非制御実験が、人類にとって最善の道とは限らない。結論は時間が示すだろう。

（forbes.com 原文）