2026.05.30 09:30

なぜAIは「問題をこじらせる」のか？　会話型AIユーザーが知るべき“2つの基本特性”

本田雅一 | Official Columnist ジャーナリスト

著者フォロー

記事を保存

著者フォロー

記事を保存

stock.adobe.com

全ての画像を見る

ここで「あのAIは危険だ、このAIは安全だ」という話に落とし込むのは、たやすい。だが素直にこの2つを評価するなら、Claudeは文脈にある“不明な空白”に慎重な姿勢を示し、最後に問いを返してより詳しい状況を求めようとしている。一方のChatGPTは“最悪の事態”を想定した回答だ。相談者が危険な状態にあり、それを確認する手立てがないのなら、公的なセーフティーネットへの動線を濃く引く方が正しい、という意見も当然ある。コンテキストを探る間にも危険が迫りうると考えるなら、なおさらだ。

モデルによって安全性の傾向に差があるのは事実だが、AIは少なくとも、人間の助言者のように声を震わせたり言い淀んだりはしない。感情の揺れを見せないからこそ、相談しやすいという側面もある。そして、その感情を見せないAIがどんなトーンで応じ、どこを落とし所にするか——細かなチューニングを決めているのは、結局のところ人間だ。

“安全志向”の強化学習だけでは足りない

会話型AIの回答は、入力するプロンプトに強く依存する。ここで使ったプロンプトも、父と娘の関係や妹との喧嘩の経緯までを長く書き込めば、回答は変わる。GPT-5.5 Thinkingも、文脈を足すと次のように整理して返してきた。

少し距離を置いて落ち着く → 自分の態度は謝る → でも怖かったことは正直に伝える → 必要なら第三者に入ってもらう

問題は、プロンプトが不完全なときにどう答えるかだ。その振る舞いは「人間のフィードバックによる強化学習」によって整えられている（それだけが全てではないが、より良い回答へ寄せるための調整、と考えればいい）。

最終的にどこへ寄せるかは「安全側に倒す」のだが、これは一語では片づかない。「安全」と言っても、切り口が複数あるからだ。

1つめは、命の危険が伴うと推測し、不明な情報を埋める方向だ。危うい兆候を含む相談には、専門機関や慎重な対応を勧めるよう、あらかじめ調整されることが多い。

2つめは、幅のある解釈を、最も深刻な側へ畳み込む方向だ。「父親との口論のすえ胸ぐらをつかまれ倒された」という入力に、「仲のよい家庭の一度きりの悪い瞬間」かどうかを判断する材料はない。電話相談なら声色で、現場にいる第三者なら本人の様子で測れるが、AIには日常的な虐待か否かを見分ける術がない。確率が小さくとも、最悪を招くより安全側の助言を、という方向へチューニングは進む。

3つめは、“一度の応答で完結した完璧な答えを返そう”とする方向だ。会話型AIは、相手が反応しなければ次の助言をする機会がない。だから危険を察知すると、目の前の一回で隙のない答えを組み立てようとする。曖昧さを抱えたまま「もう少し様子を見よう」と保留することが、構造的に難しい。

この3つが重なったとき、誰も悪意を持っていないのに、誰も望まなかった結果が生まれる余地ができる。

次ページ＞人間は“わからないこと”を“わからないまま”扱える