AI

2026.02.21 09:46

なぜ多くのAIエージェントは実際の業務フローで失敗するのか

AdobeStock

AdobeStock

Vaibhav Agrawalは、エージェント型AIとシステムエンジニアリングに取り組むBaseFrameの共同創業者兼最高技術責任者(CTO)である。

advertisement

機械学習と本番システムの交差点で過去数年間構築に携わってきた者として──複雑なプリント基板(PCB)設計のためのAIエージェント開発から、リッチなユーザー編集記述のためのモデル訓練まで──私は繰り返し起こる現象を目撃してきた。AIエージェントは現在、大規模な「デモブーム」を享受している。ステージ上では、これらのエージェントはフライトを予約し、コードを書き、複数ステップのタスクを容易に調整する。外部の観察者にとっては、ついにビジネスオペレーションの重労働を自律的な知性に引き渡しているように見える。

しかし実際には、これらのシステムの多くはサンドボックスを離れた瞬間に崩壊する。ガートナーの最近のレポートは、2027年末までにエージェント型AIプロジェクトの40%が中止されると予測しており、その主な原因はコスト上昇と統合の困難さである。私の経験では、これは基盤となるモデルの問題ではなく、システムの問題である。エージェントを巧妙なプロンプトとして扱うのをやめ、本番グレードのソフトウェアとして扱い始めるまで、デモと現実のギャップは広がる一方だろう。

「チャットボット思考」の問題

経営陣が犯す最も一般的な過ちは、エージェントを拡張チャットセッションとして構築することだ。チャットボットはステートレスで、短命で、寛容であるように設計されている。チャットボットがコンテキストを失っても、単に思い出させればよい。

advertisement

実際のビジネスワークフローにはそのような余裕はない。リモートエージェントの開発と保守に取り組む中で、私は「会話型」アプローチが長時間実行されるプロセスには不十分であることを学んだ。本番エージェントには永続的な状態と明確なタスク境界が必要である。エージェントが決定論的な入力と出力を通じて、その出力が機能的に正しいことを証明できない場合、それは本質的に高速幻覚エンジンに過ぎない。

実際の業務における「データスロップ」への対処

ほとんどのデモは、クリーンなJSONや完璧にフォーマットされたスプレッドシートに依存している。現実世界では、業務は乱雑なPDF、Slackスレッド、中途半端なメール要件として到着する。フォレスター・リサーチは、2026年にはより多くの企業が「ハードハット」AIを優先し、華やかさよりも機能に焦点を当てると示唆している。

私が観察したところ、エージェントが最も苦戦するのは、重要な制約が明示的ではなく暗黙的である場合だ。エンタープライズ製品向けのマルチモーダルラベリングの拡張に取り組んだ経験から、これらの散在する入力を検証し正規化する堅牢なグラウンディング層がなければ、エージェントはしばしば創造的だが不正確な詳細でギャップを埋めることを学んだ。本番環境では、エージェントにおける「創造性」はしばしばデータ破損の別名に過ぎない。

欠落している検証レイヤー

信頼性を持つためには、エージェントシステムは3つの異なる段階を分離しなければならない。生成、実行、検証である。あまりにも頻繁に、チームはエージェントが計画を生成し実行を試みれば仕事は完了したと想定する。

PCB設計エージェントのハイステークスな世界では、検証はオプションではなく、ワークフローの中核である。私たちは、アクションが実際に成功したことを確認する二次レイヤーがなければ──それが成功したAPIレスポンスであれ、特定のファイル変更であれ──失敗は通常、エンドユーザーに到達するまで気づかれないことを発見した。検証は可能な限り決定論的であるべきだ。システムは、意図した状態変更が実際に発生したことを確認するために環境をチェックしなければならない。

可観測性の危機を解決する

標準的なソフトウェアアプリケーションが失敗した場合、ログを確認する。エージェントが失敗した場合、チームはしばしば推論の「ブラックボックス」を見つめることになる。エージェントが何をしたか、なぜそうしたかを追跡できなければ、デバッグすることも、重要なインフラストラクチャを信頼することもできない。

2025年、私たちはモデルコンテキストプロトコル(MCP)の台頭を目撃した。これはエージェントがツールとどのように相互作用するかを標準化する方法である。レガシーデータ検索サービスの近代化に取り組んだ期間中、可観測性の重要性が明らかになった。成功と失敗の明確な指標がなく、ツール使用の詳細なログがなければ、保守性は通常不可能である。

リーダーのための実行可能な要点

今年エージェントシステムを本番環境に移行する場合、私は戦略における3つのシフトを推奨する。

1. ハード制約を強制する。エージェントを無制限のループで実行させてはならない。リトライ、予算を考慮した実行、タイムアウトに厳格な制限を設定する。

2. 「エージェントネイティブ」インフラストラクチャを構築する。単純なリクエスト・レスポンスアーキテクチャから脱却する。エージェントがリアルタイム信号に応答できるよう、イベント駆動型システムを使用する。

3. 人間へのエスカレーションを計画する。失敗を想定した設計を行う。エージェントが理解できないエッジケースに遭遇した場合、「大きく失敗」し、これまでの作業の完全な要約とともにタスクを人間に引き渡すべきである。

AIにおける競争優位は、もはや優れたプロンプトや大規模モデルからは生まれない。優れたアーキテクチャから生まれるのだ。ソフトウェアエンジニアリングを置き換えるのではなく、AIエージェントは私たちにシステム設計の基礎をこれまで以上に真剣に受け止めることを強いている。

forbes.com 原文

タグ:

advertisement

ForbesBrandVoice

人気記事