AI

2025.12.19 12:33

生成AIのコスト構造を解明する:財務チームのための新しいフレームワーク

stock.adobe.com

stock.adobe.com

Michael Wu氏は、NANDコントローラーとNANDストレージソリューションの大手プロバイダーであるPhison Technology Inc.(米国)のゼネラルマネージャー兼社長である。

企業は生成AI(GenAI)を、これまでのどの技術の波よりも速いペースで取り入れている。マッキンゼーの調査によると、現在、組織の4分の3以上が「少なくとも1つのビジネス機能でAIを使用している」という。しかし、導入が広がるにつれ、課題は実験から経済性へとシフトしている。財務チームは、クラウド契約、GPU、ストレージアレイにまたがるAIのコスト構造を明確にするよう求められている。

同時に、エネルギーは重要な費目となっている。国際エネルギー機関(IEA)の推計によると、データセンターの電力使用量は「2024年に約415テラワット時(TWh)、つまり世界の電力消費量の約1.5%」に達し、その使用量は2030年までに倍増する可能性がある。AIを支える特殊なサーバーは、電力使用量を年間約30%増加させており、これは標準的なサーバーの3倍以上の増加率である。冷却だけでその総使用量の30%以上を占めることがある。拡大するモデル、増大する推論負荷、上昇するエネルギー価格の組み合わせにより、経営幹部は根本的な問いを投げかけざるを得なくなっている:「トークンのコストと、それを生成するインフラの効率性をどのように測定すればよいのか?」

AIの効率性を財務的に把握するためのフレームワーク

従来のコストモデルは、計算能力やストレージ容量の段階で止まっている。GenAIには、エネルギーとデータの流れを捉えるより詳細な、物理的側面を意識した視点が必要だ。実用的なフレームワークは、モデルの経済性を、追跡、監査、比較できるストレージと入出力(I/O)の指標に直接リンクさせる:

• 容量利用率のための$/TB(テラバイト)-月

• I/O効率のための移動したTBあたりのワット時(Wh/TB)

• 推論コストのためのトークンあたりのワット時(Wh/トークン)

• ライフサイクル価値のための耐久性調整済み$/TBW(書き込まれたテラバイト)

これらの指標を合わせると、AI運用のための部品表が形成される。これにより財務リーダーは、ワット時を現地の電力価格($/kWh)に変換することで、モデルのパフォーマンスとコストを同じドル単位で表現できる。これにより、クラウド、オンプレミス、ハイブリッドスタック間で同等の比較が可能になる。

EuroMLSys 2025カンファレンスの最近の研究では、推論のための重要業績評価指標としてトークンあたりのエネルギーが提案されており、これは従来の精度ベンチマークを補完する可能性がある。この研究によると、リアルタイムワークロードでは、トレーニングではなく推論が総エネルギー使用量を支配することが多く、時には1桁以上の差がある。過剰な「推論ステップ」を排除すれば、大きなモデルの方が小さなモデルよりもエネルギー効率が良いことさえある。これらの知見は、電力、パフォーマンス、精度を結びつける標準化されたユニットエコノミクスの必要性を浮き彫りにしている。

ストレージはAIコスト方程式における新たな乗数

ストレージは通常、データセンターの総電力消費量の約5%を占めるに過ぎないが、全体の効率性に対してはるかに大きな影響を与える。データが滞ると、GPUサイクルが無駄になり、アイドル時間、冷却サイクル、推論あたりの総ワット時が延長される可能性がある。逆に、効率的なデータパイプラインによりアクセラレーターを完全に活用でき、無駄なエネルギーを最小限に抑えることができる。

このため、多くの組織がクラウドとエッジにまたがるストレージミックスを再構築し、パフォーマンス、耐久性、密度のバランスを取っている。財務に合わせたフレームワークにより、ワークロードミックスやNAND価格の変化が実際にユニットエコノミクスを向上させるのか、それとも低下させるのかを明らかにすることができる。

すべてのトークンの背後にあるエネルギー

AIの効率性の次の波は可視性にかかっている。クエリあたり、トークンあたり、または移動したテラバイトあたりのキロワット時を通じたワークロードレベルでのエネルギー意識の高いレポートにより、財務チームは現在のAIコストモデルに欠けている透明性を得ることができる。

このような洞察は、業界の異なる予測を調整するのにも役立つ。IDCの調査によると、世界のAIインフラ支出は2028年までに2000億ドルを超え、ストレージ投資は前年比18%増加すると予想されている。ガートナーのアナリストは、2025年末までにGenAI支出が6440億ドルに達し、そのうち約80%がハードウェアに関連すると予測している。しかし、これらの数字は、その支出のうちどれだけが有用な計算に変換され、どれだけが無駄なワットになるのかを明確にすることはほとんどない。

トークンあたりのエネルギーや耐久性調整済み$/TBWなどの指標を定期的な財務報告に統合することで、企業はROIのより真の姿を捉えることができる—エネルギーのコスト、減価償却、利用率を単一の比較可能な指標に組み込んだものだ。

コストを競争優位に変える

財務リーダーにとって、このアプローチはストレージを埋没コストではなく、AIパフォーマンスの制御可能なレバーとして再構築する。現代のサプライチェーンリーダーが出荷単位あたりのコストを追跡するのと同じように、CFOは現在、生成されたトークンあたりのコストを追跡できる。標準化された指標により、チームはモデルのスケーリング、クラウドプロバイダーの切り替え、より高い耐久性を持つSSDへのアップグレードが組織全体のコスト対洞察比率を改善するかどうかを評価できる。

その利点は効率性だけにとどまらない。測定可能でエネルギーを意識したAI経済を採用する組織は、新たなエネルギー効率報告要件や、持続可能なコンピューティングに報いる内部チャージバックモデルにより適した位置に立つことになる。また、ワークロードが機能や地域を超えて増加するにつれてますます重要になる、AIコストをより正確に予測することも可能になる。

最終的に、企業におけるAIの価値はモデルの規模だけで決まるわけではない。それは、すべてのワット、すべてのバイト、そして書き込まれるすべてのテラバイトの効率性にかかっている。この計算をマスターする企業は、AIをより速くスケールするだけでなく、理にかなったバランスシートでそれを実現するだろう。

forbes.com 原文

タグ:

advertisement

ForbesBrandVoice

人気記事