ウーバーは、AIコスト危機に具体的な数字を示した。同社は2026年のコーディング予算全体を4カ月で使い果たした後、エンジニア1人あたりのAIコーディングツール利用を月額1500ドルに制限したと、TechCrunchが報じた。ブルームバーグによると、この制限はAnthropic(アンソロピック)のClaude Code(クロード・コード)やCursor(カーソル)などのエージェント型ツールに適用される。これらは、ウーバーが社内リーダーボードでチームごとの利用状況をランク付けして積極的に推進していたシステムだ。
この方針転換は印象的だ。なぜなら、ウーバーは依然としてAIに全面的に取り組んでいるからだ。CEOのダラ・コスロシャヒ氏は、自律型エージェントがすでに同社のコミット済みコードの約10%を書いていると述べている(ヤフー・ファイナンスによる)。
AIコスト危機を調査する中で、ウーバー、パランティア、そしてより広範な市場がコストについて明らかにする5つのポイントを紹介する。これには、これが危機ではないという最も強力な論拠も含まれる。
1. ウーバーが示す──AIトークンの低価格化でもAI請求額は増大する
そのメカニズムは過酷だ。
ウーバーは2025年後半にClaude CodeとCursorを展開し、約5000人のエンジニアの84%以上が採用し、個人の請求額は月額500ドルから2000ドルに達した。CTOのプラヴィーン・ネッパリ・ナガ氏はThe Informationに対し、予算が蒸発した後、「白紙に戻った」と語った。彼自身、2時間のデモ中に1200ドル分のトークンを消費したことがあるという。
トークン単価は下がり続けていたにもかかわらず、総支出は増加した。これがAIコスト危機の中心にあるパラドックスだ。
2. エージェント型AIは1つの人間のタスクを数千回の呼び出しに変える
請求額が膨らむ理由は構造的なものだ。
ゴールドマン・サックスの推計によると、エージェント型AIは2030年までにトークン消費量を24倍に押し上げる可能性があり、Cloudflare(クラウドフレア)のデータは現在、ボットとエージェントがウェブページリクエストで人間を上回っていることを示している。なぜなら、1つのエージェントが人間なら5回で処理するタスクを完了するために数千のサイトにアクセスする可能性があるからだ。
ガートナーは、2030年までに最も高度なモデルでの推論コストが2025年比で約90%低下すると予測しているが、トークンの低価格化は企業の請求額を安くしない。なぜなら、エージェント型システムはタスクあたりはるかに多くのトークンを消費するからだ。単価が下がる一方で量が倍増すれば、請求額は増加する。
3. パランティアが警告──AIトークン量はビジネス価値ではない
パランティアのCEO、アレックス・カープ氏は、この問題を表す業界用語「トークンマキシング」を取り上げている。これは、より多くのトークンが自動的により多くの結果を意味するという仮定だ。彼の主張は、大量消費はしばしば低品質なアウトプットを膨らませる一方で売上高は横ばいのままであり、トークン量は誰でも水増しできる投入量に過ぎないというものだ。
ウーバーのCOO、アンドリュー・マクドナルド氏は、購入者の立場から同じ指摘をした。あるエンジニアの暴走した請求額に対する反応を「頭が爆発する瞬間」と表現し、トークン支出から出荷された機能への直線を引くのは難しいと認めた。ビジネス成果だけが請求額を正当化する唯一の数字だ。
4. AIコスト危機は誇張されているという見方
反対意見にも耳を傾ける価値がある。
ある分析によると、ウーバーの上限は上限時でエンジニア1人あたり年間約3万6000ドルとなり、ウーバーのエンジニアの報酬パッケージの中央値が約33万ドルであることを考えると、ツールが生産性をわずか数パーセント向上させるだけで元が取れる計算になる。
また、ウーバーは2026年予算を2025年に設定しており、トークンを大量消費するエージェントが大規模に存在する前だったため、予算超過はプラットフォームシフト中の予測ラグを反映しており、このギャップは予算がリセットされれば解消される傾向がある。楽観論者は、効率化の向上、モデルルーティング、キャッシングが十分に速く改善しているため、1ドルあたりの能力が消費量を上回る可能性があると付け加える。
正直な見方は、この危機は今日の財務チームにとって現実であり、ツールが成熟するにつれて緩和される可能性が高いということだ。
5. マイクロソフトとAI FinOpsが危機を規律に変える
ウーバーだけが対応しているわけではない。マイクロソフトは、The Vergeによると、Claude Codeの直接ライセンスのほとんどをキャンセルし始め、エンジニアをGitHub Copilot(ギットハブ・コパイロット)に誘導しているという。同じプレイブックが企業全体に広がっている。利用状況ダッシュボード、支出上限、承認ワークフロー、そして高付加価値業務へのより鋭い焦点だ。このプレイブックには名前がある。クラウド時代はFinOpsを生み出し、AI時代はAI FinOpsを生み出している。
今すぐ行動したいリーダーにとって、4つの行動が規律ある採用者と驚く者を分ける。
1. 初日からトークン使用量を計測する。
2. 展開前にすべてのデプロイメントを成果指標に結びつける。
3. 単純な作業は小規模モデルにルーティングし、プレミアムシステムは本当に難しい問題のために確保する。
4. 破綻後ではなく事前にガードレールを設定する。適切に実行すれば、これはパイロットから本番への飛躍であり、測定可能な価値が支出を正当化し、AIが人間の判断を増幅する。
AIコスト危機は最終的には成熟度のテストであり、組織がテクノロジーに何ができるかを問うのをやめ、それが何の価値があるかを問い始める時点だ。
したがって、すべてのリーダーにとっての真の問いはシンプルだ。あなたの組織はAI支出からビジネス成果への直線を引けるか。ウーバーはできなかった。そして、請求額に上限を設けることよりもはるかに重要なのは、このギャップを埋めることこそが、解決する価値のあるAIコスト危機なのだ。



