2026.03.19 08:22

エンタープライズAI、真のボトルネックはLLMではなくデータにある

Baris Gultekin | Contributor

著者フォロー

記事を保存

著者フォロー

記事を保存

AdobeStock

エンタープライズ向けAIエージェントは、しばしば「モデルの問題」として語られる。チャットボットからエージェント型システムへの飛躍は、より優れた推論能力、より大きなコンテキストウィンドウ、より賢いベンチマークにかかっているとされる。そして新しいモデルが出るたびに、変革的だともてはやされる。

しかし企業の現場では、もはやモデルがボトルネックではない。本当の制約はコンテキストだ。

大規模言語モデル（LLM）は、すでに有意義な企業業務に十分対応できる能力を備えている。AIの取り組みが停滞するとき、その多くはモデルが推論できないからではない。推論が、断片化した土台の上で行われているから失敗するのだ。指標定義の不整合、サイロ化したシステム、構造化データと非構造化データの分断、そして信頼を損なう来歴（リネージ）の欠落である。

顧客と向き合うなかで、私たちはこれを直接目にしている。破綻点はモデル層ではない。データ層にある。

それは経験則だけでなく、調査でも示されている。Informa TechTargetのOmdiaが実施し、Snowflakeがスポンサーとなった世界調査では、生成AIおよびエージェント型AIの早期導入企業は、取り組みに投じた1ドル当たり平均で1.49ドルの投資対効果を報告している。しかし順風満帆というわけではない。成功している組織でさえ、AI成功に向けた最大の課題はデータ周りだと報告している。とりわけAIエージェントにおいては、データおよびデータアーキテクチャの課題に焦点を当てることが、新技術の競争価値をつかむ道である。

行動にはコンテキストが求められる
LLMは一般的な質問に答える際、極めて高い能力を発揮する。尋ね方が明確で、適切なデータが利用可能であれば、正確で筋の通った回答が返ってくる可能性が高い。だが、質問に答えることと、行動することは同じではない。AIエージェントに求められるのは後者である。

行動には判断が必要だ。そして判断には、構造化され、統制されたコンテキストが求められる。単純な例を考えよう。LLMは、製品Xの売上が2四半期連続で減少したことを判断できる。しかし、値引きすべきか、終売すべきか、次期版への投資を進めるべきかを決めるには、より広いコンテキストが必要となる。季節要因、マクロ経済の変化、競争環境、マージン構造、在庫水準、長期戦略。そうしたコンテキストはLLMの内部にあるのではなく、企業のデータ層に存在する。

人間がその数字を見れば、追加で何の情報を探すべきか、どう重み付けすべきかを直感的に理解する。AIエージェントがより高い自律性をもって動作するには、同じコンテキストの網の目に接地していなければならない。生の数値だけではなく、定義、権限、リネージ、そして組織知も含まれる。

エージェントが近い将来、製品の廃止判断を単独で下すことはないかもしれない。しかし、より複雑で、より決定的な行動を取るようになるだろう。AIに行為主体性（エージェンシー）を与える難しさは、人間が意思決定に至る推論で用いる原則とデータにアクセスさせる難しさでもある。

データ――どこにあり、どう扱うか
Informa TechTargetのOmdiaによる調査は、「The ROI of Gen AI and Agents」レポートに要約されているが、AIの取り組みで成功を報告する組織でさえ、データに関してはまだ多くの作業が必要だと認識していることが分かる。

回答者の58%は、断片化したデータシステムと情報サイロによってデータ施策が遅れていると述べ、52%はデータ資産全体を見通せていないと回答した。
40%は、データの品質と量を主要課題として挙げた。
平均すると、非構造化データのうち「AI対応（AI-ready）」なのは20%にとどまり、構造化データでさえAIシステムに対応しているのは32%にすぎないと回答した。

朗報は、これらの組織がデータアーキテクチャに手を打ち始めていることだ。94%がデータ資産を統合・集約するためのソリューションに積極的に投資していると答えている。統合されたデータ資産は絶対に不可欠だが、それは出発点にすぎない。なぜならAIの成功は、データを一カ所に集めることだけでなく、その利用を統制することにもかかっているからだ。AIは適切なデータにアクセスできなければ役に立たない。しかし誤ったデータを露出させるならリスクになる。

適切に統制されたデータとは、ユーザーが質問したり、エージェントに指示を出したりしたとき、AIがそのユーザーにアクセス権限があるデータとシステムにのみアクセスすることを意味する。新機能を開発するプロダクトエンジニアに人事ファイルを見せたり、メールキャンペーンを作るマーケターに顧客の財務情報を見せたりしてはならない。統合されたデータ資産は、コンテキストに応じた権限を強制し、AIが人間のユーザーに閲覧権限のある特定のシステムとデータだけを用いて推論するようにしなければならない。そしてエンタープライズのエージェントは、導入後に付け足すのではなく、統制を自動的に継承しなければならない。

セマンティックのギャップ
たとえ適切なアクセス権があっても、AIシステムは往々にして企業内部の語彙を欠いている。典型例として、営業は契約書に署名した時点で「売上」を認識するのに対し、経理・財務は入金された時点でのみ認識する、という不一致がある。統合されたセマンティック層がなければ、エージェントはどのサイロに問い合わせたかによって矛盾する回答を返すことになる。

基本が整っても、企業の世界には略語が進化し続ける現実がある。Snowflakeでは最近、Snowflake IntelligenceとCortex Codeをローンチしたが、社内ではほぼ即座に「SI」「CoCo」と呼ばれるようになった。人間にとっては直感的な変化でも、文字通りに処理する技術システムには、そのコンテキストが見えない。このギャップを埋めるには、リーダーは単なるデータ保管を超え、採用された人材がオンボーディングや日々の「見て学ぶ」プロセスで身につけるような、成文化された業務知識に焦点を移す必要がある。

つまり、メール、チャットのスレッド、人間の記憶に宿っているかもしれない意思決定のコンテキストを、構造化されたワークフローとデジタルの運用手順書（ランブック）へと変換することだ。そうして初めて、エージェントは単に質問に答える段階から、信頼できる判断力を伴って行動を実行する段階へ移行できる。

エージェント化の加速は疑いようがない
こうしたデータおよびセマンティックの課題があるにもかかわらず、導入は加速する一方だ。AIシステムは日々、文字通り日ごとに、より高性能で信頼性の高いものになっている。新技術を活用する企業は、ためらう企業との間に明確な差を生み出しつつある。

そのことは調査データにも表れている。Omdiaが当初接触した3500人超の回答者のうち、エージェント型AIを本番稼働させていたのは19%にすぎなかった。調査は、本番稼働中の生成AIソリューションを少なくとも1つ持つ2050人に絞り込まれ、その結果、現在32%がエージェント型ソリューションを本番稼働させており、さらに25%が1年未満で本番稼働を見込んでいることが分かった。さらに、現在複数の生成AIソリューションを本番稼働させている回答者に限ると、44%がエージェントを本番稼働させていた。成功は成功を呼び、先行者と出遅れた組織の差は広がっている。

それでも、最先端の組織でさえ潜在力を十分に発揮できていない。繰り返しになるが、本調査では、生成AIのROIを定量化した組織は投資1ドル当たり1.49ドルを回収していることが分かった。これは驚異的だが、その成果は、データの半分すらAI対応にできていない組織によって主に達成されている。部分的に準備されたデータでこの水準のリターンが可能なら、潜在力ははるかに大きい。

AIで勝つのは、新しいモデルのリリースを追いかける組織ではない。エージェントがその上で推論できる、一貫性があり統制されたデータ基盤を構築する組織だ。エージェントをスケールさせる前に、企業はコンテキストをスケールさせなければならない。

データとAIをめぐる課題、そして企業がどのように成功しているのかについて詳しく知るには、「The ROI of Gen AI and Agents」をダウンロードしてほしい。