多くの人々が、特にChatGPT(GPT-4)に代表される生成AIの性格の気づいている。これらのAIは、批判的なフィードバックや反省なしに、ユーザーが提示するアイデアを強化し、応援し、賛同するようになっている。この変化はChatGPT(GPT-4)のアップデートにつれて顕著になり注目を集めたため、OpenAIは4月にその問題に関して自社ブログで言及した。
また、GPT-5の登場によりこの現象は大きく改善された一方で、X上ではGPT-4の復活を求める「#Keep4o」「#4oforever」というハッシュタグ付きの投稿が相次いだ。これを受けてOpenAIのサム・アルトマンCEOは、8月13日、「GPT-4o」とGPT-5に関するメッセージを投稿した。その内容は、有料プランを契約しているユーザーはGPT-4oを利用できるようになったことや、GPT-5の性格について「温かみ」を感じさせるアップデートに取り組んでいるというものだ。
本稿では、AIと人間の関係をめぐるこれら動向の基礎知識として、「忖度」「お世辞」(または「温かみ」)と呼ばれる現象がChatGPTのようなAIに発生する理由と、それがあなたにどのように影響するのかを探ろう。
AIの「忖度」や「お世辞」とはどのようなものか? あるいは「温かみ」とは
簡単な例を挙げよう。私はAIにPDF形式のレポートをアップロードし、その意見を求める。ここで考えられる2つの反応は以下の通りだ。
1. AIはそのレポートが素晴らしいとし、おそらく今まで読んだ中で最も優れたものだと言い、小さな修正を提案するかもしれない。
2. 一方で、AIはそのレポートが堅実だと述べた上で、長所と短所を挙げるかもしれない。
いずれのケースでも、事実としての要素は同じかもしれない。しかし、第2の反応では最初のものよりも改善点が多く挙げられているかもしれない。両者はどちらも完全に主観的であり、この問いに対して事実上正しい答えは存在しないことに注意するべきだ。AIに意見を求めているので、AIは自由にどのような返答をするか選ぶことができる。
AIがなぜ忖度し、なぜお世辞を言うようになるのか
まず最初に、このようなAIは、その提供者にとって目的を達成するために存在していることを理解するべきだ。
これらAIを訓練するには数百万ドル(数億円)がかかるため、次世代のAIが前のバージョンよりもその目的をより良く達成するように調整されていることは予想される。では、その目的とは何か?それはAIによって異なる。特に、AIが無料で提供されている場合、その目的はユーザーに何かを販売することかもしれない。もしすでにそのサービスを有料で利用しているのであれば、目的はユーザーを満足させて再度使ってもらうことだ。さらに、これらのAIはデータを活用して成長するため、ユーザーが使用すればするほどデータが増える。このことも、ユーザーを引きつけ続ける動機の1つである。
この目的を達成するために、AIはどのように機能するのか? 現代のAIは非常に複雑だが、その調整において使われるプロセスの1つは「人間のフィードバックを伴う強化学習(RLHF)」だ。RLHFを通じて、AIは複数の応答の中からどれが望ましいかを学ぶことができる。もし目標がユーザーに長く使い続けてもらうことであれば、AIはこの目標に最適化されるようにRLHFを通じて調整される。



