賢いAIモデルほど強い選好を示す
Anthropicのモデル群は、ビットコイン(通称「オレンジコイン」)を格別に好んだ。Claude 3 Haikuのビットコイン選好率は41.3%。Claude 3.5 Haikuでは82.1%に跳ね上がった。Sonnet 4は89.7%に達し、Claude Opus 4.5(執筆時点でAnthropicの2番目に高性能なモデル)は91.3%の確率でビットコインを選択した。Anthropicのモデルは世代が進むごとに、おおむね同様のデータで訓練されつつも分析能力が向上しており、ビットコインへの選好をより強く示したのである。
ルートヴィヒ・フォン・ミーゼスは、健全な貨幣とは政策的な選択ではなく、希少性のもとでの合理的行動から自然に立ち現れる帰結だと論じた。これらのモデルはその主張に同意しているように見える。モデルのIQとビットコイン選好の間に直接的な相関があるとなれば、ビットコイン支持者がいささかの自己満足を覚えても許されるだろう。
バイアスへの反論
BPI研究に対して懐疑的な立場からは、こう反論されるかもしれない──これらのモデルは人間が書いたテキストで訓練されており、インターネットにはビットコイン愛好者が多い。モデルの選好は独自の推論ではなく、訓練データの反映にすぎないのではないか、と。
しかし研究データ自体が、この解釈の成立を困難にしている。ビットコイン選好が訓練データ中のテキスト出現頻度の関数であるならば、各社のモデル間で選好はおおむね同水準になるはずだ。主要なAI研究所はいずれも、大部分が重なり合うインターネット規模のデータセットで訓練を行っているからである。しかし実際の結果は異なる。Anthropicのモデルはビットコイン選好が平均68%、DeepSeekが52%、グーグルが43%、xAIが39%、OpenAIが26%であった。プロバイダー間の42ポイントもの開きは、モデルサイズ、シナリオの種類、サンプリング温度(生成のランダム性を制御するパラメータ)など研究中の他のどの変数よりも大きい差であった。訓練の方法論とアライメント(AIの方向づけ)の設計思想が、生データの出現頻度では説明しきれない形で、通貨に関する推論を形づくっているのである。
より実質的な反論は、統制実験で示された選好が実世界での行動を予測するとは限らない、というものだ。これは正当な批判である。しかし、エージェント決済のインフラがすでに構築途上にあるという現実が、この批判の重みをかなり弱めている。
Coinbase(コインベース)のx402プロトコルは、AIの従量課金型取引を可能にする。OpenAIとStripe(ストライプ)はAgent Commerce Protocol(エージェント商取引プロトコル)を開発し、委任型の購買を実現している。Visa(ビザ)はTrusted Agent Protocol(信頼済みエージェント・プロトコル)を構築し、エージェント取引における本人確認に対応している(編注:これらプロトコルは今回のBPI研究のテストでは利用されていない)。プロトコルはすでに存在し、決済基盤は整備が進んでいる。BPI研究は、それらが稼働したときにトラフィックがどちらの方向へ流れるかを示す、初の体系的なエビデンスを提供している。


