AI

2026.06.20 11:23

AIコストの暴走:トークン爆発が企業財務を脅かす理由

stock.adobe.com

stock.adobe.com

Uberは、2026年のAI予算を4月までにすべて使い切った。AT&Tの社内AIシステムは現在、1日に270億トークンを消費している。18カ月前は10億トークンだった。大手医療保険会社では、月間のAIトークン消費量が300万から1年足らずで1億5000万超へと跳ね上がった。グラフの線は緩やかに曲線を描くのではない。垂直に立ち上がる。

これが「トークン爆発」だ。人間の知能を補完するデジタル知能への需要は巨大で、しかも増え続けている。そのため、この現象は地球上のあらゆる企業に及ぶ。

トークンとはAI計算の基本単位であり、モデルが入力を処理したり出力を生成したりするたびに消費される、おおむね「単語の断片」や「データの塊」に相当する。大規模言語モデル(LLM)とのやり取りは、そのたびにトークンを燃やす。自動化エージェントも、バックグラウンドでの推論ループも、複数ステップのワークフローも、さらに多くを消費する。企業がチャット型AIから、複数回の呼び出しを連鎖させ、文書を取得し、データを推論し、自律的に行動する「エージェント型AI」へ移行すると、トークン消費は2倍や3倍では済まない。桁違い、あるいはそれ以上に爆発する。

もはや計算は抽象論ではない。誰も予算化していない四半期ごとの請求書に、その現実が現れている。

3つの力、1つの罠

トークン爆発は、単一の問題であり単一の解決策で片付く話ではない。あらゆるCIOに同時に襲いかかる3つの力が生み出す結果である。

1つ目はイノベーション依存だ。最先端AIのベンダーであるOpenAI、Anthropic、Googleは、社内で追随できない速度で新モデルや新機能を次々に投入している。企業はそれらを必要としている。だが、その必要性が力の非対称を生む。ベンダーが「あなたが離れられない」ことを知っていれば、条件を決めるのは彼らになる。しかも消費が螺旋状に膨らむなかで、その条件は四半期ごとに高くなる。

2つ目はジェボンズのパラドックス(効率化が消費を増やす逆説)の現実化である。トークン当たりのコストは3年で1000分の1に下がったが、トークン爆発がその節約効果を飲み込んだ。企業は支出を減らすどころか、より多くを消費している。提供側も行き先を見ている。Anthropicは、開発者が月額200ドルのプランで計算資源に数千ドル分を費やしていることが判明し、定額のエンタープライズ価格を廃止した。OpenAIも同じ月にCodexをトークン課金へ移行した。主要AIベンダーはこぞって従量課金へ収れんしており、残りも追随する。

3つ目は構造的ロックインだ。従量課金の下では、新たなエージェントを展開するたびに、単価を設定し条件を支配する提供側への依存が深まる。代替策を組み込まない限り、四半期ごとの更新交渉は、片側だけがレバレッジを持つ場になる。

可視化は確実性ではない

コストが予測不能になったとき、最初の反射的な対応は、より良いダッシュボードを作ることだ。AI市場はまさにそれで応えてきた。トークン単位の支出追跡、予算アラート、モデル別・チーム別・APIキー別のリアルタイム費用内訳。財務チームはいま、AIプログラムが何を消費しているかを正確に把握できる。だが、そのどれもが「来月何を消費するか」を教えてはくれない。

レート制限や予算上限はCFOに守るべき数値を与えるが、上限に達した瞬間にAIが止まり、CIOはワークロードを失う。キャッシュやスマートルーティングは、ワークロードが繰り返される場合に請求額を抑えるが、エージェント型のワークロードは繰り返されない。そして単価を決めるのは依然として提供側だ。主要クラウドプロバイダーの予約容量は、一定量のスループットについて単価を固定するが、予測リスクを企業側へ移すだけである。予測不能な請求書の代わりに、予測不能な容量ミスマッチが生まれる。

今日利用できるあらゆるツールは、企業がリスクをより明確に「見る」助けにはなる。しかし、そのリスクを減らすものは1つもない。より良いダッシュボードはCIOにレバレッジを与えない。選択肢のない可視化とは、請求書が届くのを眺めているだけである。

賢いCIOが求めていること

エージェント型AIの時代に勝つ企業は、次の予算サイクルが議論を強制する前に、コストの予見可能性を解決する企業だ。それは、最先端モデルの従量課金という「標準メニュー」を超え、市場により難しい問いを投げかけることを意味する。すなわち、「計画可能な条件でAIを売ってくれるのは誰か?」である。

トークン量のリスクを吸収し、それを予測可能な月額費用へ変換するという提案を軸にしたインフラプロバイダーのカテゴリーが拡大している。仕組みはさまざまだ。トラフィックシェーピング、インテリジェントキャッシュ、モデルルーティング、綿密なキャパシティプランニング。しかし共通するのは、トークン単価のボラティリティが彼らのレイヤーで止まり、あなたのレイヤーには持ち込まれないという構造的コミットメントである。

これはIT調達の周縁的な懸念ではない。AIサプライチェーンにおいて誰がレバレッジを握るのかという戦略的な問いである。推論量(inference volume)のリスクを転嫁せずに吸収する、固定価格または価値ベースのAIインフラプロバイダーを少なくとも1社、調達基盤に加えた企業は、同時に2つを得る。コストの予見可能性と、利用する各最先端プロバイダーとの交渉力学を変える「信頼できる代替案」である。

すべてのAIベンダーと純粋な従量課金関係のまま、トークン単価が消費急増を相殺できるほど速く下がり続けることを願う企業は、相手側がすべての変数を支配するゲームをしている。

UberとAT&Tはトークン爆発を目の当たりにした。次はフォーチュン500の残りだ。問われているのは、あなたの組織がそれを知るのが「計画の時」か、それとも「請求書の時」かという点である。

forbes.com 原文

タグ:

advertisement

ForbesBrandVoice

人気記事