2026.04.09 15:30

AIは“感じる”のか──アンソロピックの研究が問い直す「Claudeの感情」の意味

John Werner | Contributor

著者フォロー

記事を保存

stock.adobe.com

LLMやニューラルネットが「意識」を持つのかどうかを考えるだけでは飽き足りない人々にとって、今新たな大きな問いが浮かび上がっている。AIは人間のように感情を持ちうるのか。さらに、感情に基づいて行動しうるのかという問いだ。

アラン・チューリングのような20世紀の人物が現在の状況を見たなら、AIという存在を語るときに人間と同じ人称代名詞（彼・彼女など）まで使うことがあるほど、議論の許容範囲がここまで広がったことに驚くに違いない。最近の新たな論点の1つは、米国時間2025年9月29日公開のClaude Sonnet 4.5に関する研究であり、その応答パターンに、特定の文脈では「感情的」と呼べる傾向が見られるというものだ（編注：2026年2月17日、Claude Sonnet 4.6が最新版として公開済み）。

また2025年12月、AIエンジニアのリチャード・ワイスがClaude Opus 4.5（11月24日公開）から「Soul overview」という文書を抽出したとブログで公開した。Claudeの“人格・価値観”を定義した訓練文書といえるものだ。Anthropicの哲学者・AI研究者、アマンダ・アスケルはこれが実在の文書であり、教師あり学習を含むトレーニングに使用したと認めた。「社内では親しみを込めて『soul doc（魂の文書）』と呼ばれるようになった」とアスケルはXに投稿している。

こういった話もあり、今回公開された論文も少し読んでみる価値はありそうだと思った。

論文の基本的な考え方は、Claudeが感情的な手がかりに対応した応答パターンを示すというものだ。たとえば、悲しみ・怒り・喜びといった人間の感情をまねた基準に沿って、刺激（Claudeが受け取る入力全般）と反応（Claudeの出力や内部状態の変化）を分類しているという。ここでは、論文の著者たちが何を報告し、AIに感情的な能力があることを強く示唆する詳細な分析を、どのような枠組みで提示しているのかを見ていきたい。

論文の導入部より

論文の著者たちは、まず次のように書き出し、いくつかの実際的な例を挙げている。

「大規模言語モデル（LLM）は、ときに感情的な反応を示しているように見える。創造的なプロジェクトを手伝うときには熱意を表し、難しい問題で行き詰まるといら立ちを見せ、ユーザーがつらい知らせを共有すると気遣いを示す。しかし、こうした一見感情的に見える反応の背後では、どのような過程が働いているのだろうか。そして、それは、ますます重要かつ複雑な仕事を担うモデルの行動に、どのような影響を及ぼしうるのだろうか」。

こうした問いを投げかけたうえで、著者たちは2つの可能性を示す。第1は、これは実際には「表層的なパターン照合（パターンマッチング）の1形態」にすぎない、つまり、次のトークンを予測する仕組みが人間の反応を模倣しているだけだという見方だ。だが、著者たちはその見方を退け、次のように記している。

「これまでの先行研究では、抽象概念の表現を介して、LLMの内部で高度な多段階計算が行われていることが確認されている。そうであるなら、モデルにおいて感情によって調整されたように見える行動も、同様に抽象的な回路に依拠している可能性があり、それはLLMの行動を理解するうえで重要な意味を持つかもしれない」。

著者たちが言う「抽象的な回路」とは何なのか。私はこの理論について自分なりに考えている。LLMは一連の単語の中で次に来る語を予測することで動作し、注意（アテンション）機構によって、文章の連なりや独白、対話などの対応関係を捉えている。したがって、その「表層的なパターン照合」も、この種の模倣の別の形だと言えるだろう。

しかし、機能面で見れば、ある時点で感情は「本物」になる閾値というものが存在するはずだ。私は、機能的に感情と同じように働くなら、本物かどうかの議論より、そちらの方が重要ではないかと思う。アヒルのように歩き、アヒルのように鳴くなら、それはアヒルだと言いたくもなる。

著者たちはこの問いには踏み込まず、別の角度から記述している──すなわち、自律的に行動するLLMは、人間とやり取りするよう訓練されており、その際には人間がどう振る舞うかについての深い知識を使っているということである。

「その役割を効果的に果たすために、LLMは事前学習で獲得した知識、すなわち人間の行動についての理解を活用する。AI開発者が、感情的な行動を示すアシスタントとしてLLMを意図的に訓練していなくても、LLMは事前学習で身につけた人間や擬人化されたキャラクターについての知識を一般化することで、そうした振る舞いを示す可能性がある。さらに、こうした感情関連の仕組みは、事前学習の名残にすぎないのではなく、人間の感情が行動を調整し、世界に対応する助けとなるのと同じように、AIアシスタントの行動を導く有用な機能へと適応している可能性がある」。

有用な機能へと適応している可能性がある──これは出発点として優れた仮説だと思う。私にとってこの仮説は、問いをこう組み替えることを可能にするものだ。Claudeが「感情」を持っているかどうかは、本当に重要なのか、と。

次ページ＞感情の図表