2026.02.21 09:46

なぜ多くのAIエージェントは実際の業務フローで失敗するのか

Vaibhav Agrawal | Contributor

著者フォロー

記事を保存

著者フォロー

記事を保存

AdobeStock

Vaibhav Agrawalは、エージェント型AIとシステムエンジニアリングに取り組むBaseFrameの共同創業者兼最高技術責任者（CTO）である。

機械学習と本番システムの交差点で過去数年間構築に携わってきた者として──複雑なプリント基板（PCB）設計のためのAIエージェント開発から、リッチなユーザー編集記述のためのモデル訓練まで──私は繰り返し起こる現象を目撃してきた。AIエージェントは現在、大規模な「デモブーム」を享受している。ステージ上では、これらのエージェントはフライトを予約し、コードを書き、複数ステップのタスクを容易に調整する。外部の観察者にとっては、ついにビジネスオペレーションの重労働を自律的な知性に引き渡しているように見える。

しかし実際には、これらのシステムの多くはサンドボックスを離れた瞬間に崩壊する。ガートナーの最近のレポートは、2027年末までにエージェント型AIプロジェクトの40%が中止されると予測しており、その主な原因はコスト上昇と統合の困難さである。私の経験では、これは基盤となるモデルの問題ではなく、システムの問題である。エージェントを巧妙なプロンプトとして扱うのをやめ、本番グレードのソフトウェアとして扱い始めるまで、デモと現実のギャップは広がる一方だろう。

「チャットボット思考」の問題

経営陣が犯す最も一般的な過ちは、エージェントを拡張チャットセッションとして構築することだ。チャットボットはステートレスで、短命で、寛容であるように設計されている。チャットボットがコンテキストを失っても、単に思い出させればよい。

実際のビジネスワークフローにはそのような余裕はない。リモートエージェントの開発と保守に取り組む中で、私は「会話型」アプローチが長時間実行されるプロセスには不十分であることを学んだ。本番エージェントには永続的な状態と明確なタスク境界が必要である。エージェントが決定論的な入力と出力を通じて、その出力が機能的に正しいことを証明できない場合、それは本質的に高速幻覚エンジンに過ぎない。

実際の業務における「データスロップ」への対処

ほとんどのデモは、クリーンなJSONや完璧にフォーマットされたスプレッドシートに依存している。現実世界では、業務は乱雑なPDF、Slackスレッド、中途半端なメール要件として到着する。フォレスター・リサーチは、2026年にはより多くの企業が「ハードハット」AIを優先し、華やかさよりも機能に焦点を当てると示唆している。

私が観察したところ、エージェントが最も苦戦するのは、重要な制約が明示的ではなく暗黙的である場合だ。エンタープライズ製品向けのマルチモーダルラベリングの拡張に取り組んだ経験から、これらの散在する入力を検証し正規化する堅牢なグラウンディング層がなければ、エージェントはしばしば創造的だが不正確な詳細でギャップを埋めることを学んだ。本番環境では、エージェントにおける「創造性」はしばしばデータ破損の別名に過ぎない。

欠落している検証レイヤー

信頼性を持つためには、エージェントシステムは3つの異なる段階を分離しなければならない。生成、実行、検証である。あまりにも頻繁に、チームはエージェントが計画を生成し実行を試みれば仕事は完了したと想定する。

PCB設計エージェントのハイステークスな世界では、検証はオプションではなく、ワークフローの中核である。私たちは、アクションが実際に成功したことを確認する二次レイヤーがなければ──それが成功したAPIレスポンスであれ、特定のファイル変更であれ──失敗は通常、エンドユーザーに到達するまで気づかれないことを発見した。検証は可能な限り決定論的であるべきだ。システムは、意図した状態変更が実際に発生したことを確認するために環境をチェックしなければならない。

可観測性の危機を解決する

標準的なソフトウェアアプリケーションが失敗した場合、ログを確認する。エージェントが失敗した場合、チームはしばしば推論の「ブラックボックス」を見つめることになる。エージェントが何をしたか、なぜそうしたかを追跡できなければ、デバッグすることも、重要なインフラストラクチャを信頼することもできない。

2025年、私たちはモデルコンテキストプロトコル（MCP）の台頭を目撃した。これはエージェントがツールとどのように相互作用するかを標準化する方法である。レガシーデータ検索サービスの近代化に取り組んだ期間中、可観測性の重要性が明らかになった。成功と失敗の明確な指標がなく、ツール使用の詳細なログがなければ、保守性は通常不可能である。