2025.12.02 14:46

AIエージェント導入の現実：95%の失敗を乗り越えるための4つの柱

Udith Vaidyanathan | Contributor

著者フォロー

記事を保存

著者フォロー

記事を保存

Adobe Stock

Udith Vaidyanathanは、LogicFlo AIの共同創業者兼CEOである。

現在、取締役会で大きな話題となっているのが、MITの「ビジネスにおけるAIの状況2025」レポートだ。このレポートによると、AIパイロットプロジェクトの95%が失敗し、AIイニシアチブから意味のある価値を引き出せている企業はわずか5%にすぎない。

AIに予算、時間、政治的資本を投じ、さらには社内に「センター・オブ・エクセレンス」を構築した経営者にとって、これは衝撃的な統計である。これは非常に現実的な実行上の問題であり、MITが「生成AI分断」と呼ぶものだ。

2024年、企業のAI投資額は2523億3000万ドルに達した。この数字は2025年には1.5兆ドル、2026年には最大2兆ドルに成長すると予測されている。

私がよく耳にする根本的な疑問はシンプルだ：誰もが「AIに取り組んでいる」のに、なぜ実際に成果を上げている企業がこれほど少ないのか？

この問いに答えるには、AIエージェント、構築対購入のジレンマ、そして洗練されたパイロットから本番デプロイメントに至るために本当に必要なことについて話す必要がある。

チャットボットから実際に仕事をこなすエージェントへ

ほとんどの人はChatGPTのようなモデルを少なくとも試したことがあるだろう。プロンプトを入力すると、テキストが返ってくる。それは便利だが、依然として会話にすぎない。

AIエージェントは次のステップだ。あなたに何をすべきかを伝えるだけでなく、あなたの代わりに行動を起こす。例えば、次のビジネス出張のフライトやホテルを提案するようAIモデルに依頼することもできるが、AIエージェントならあなたの出張予約プラットフォームにログインし、会社のポリシーを適用し、旅程を予約し、何をしたかを報告することができる。

「話す」から「行動する」へのこの飛躍こそが、真の価値がある場所だ。また、ほとんどのパイロットプロジェクトが頓挫する場所でもある。デモでは、質問に答える印象的なアシスタントを見せるのは簡単だ。しかし本番環境では、コンテキストを理解し、ツールと安全にやり取りし、チームが実際に使用するインターフェースにパッケージ化されたエージェントが必要となる。

だからこそ、バイブコーディングや簡易プロトタイプだけでは、もはや十分ではない。AI分断を乗り越える企業は、4つの特定の柱に投資する企業だ。

1. コンテキストエンジニアリングとメモリ

エージェントは孤立して機能することはできない。有用な仕事をするためには、企業、ワークフロー、データに関する適切なコンテキストにアクセスする必要がある。つまり、CRMのような構造化データや、文書、メール、治験報告書などの非構造化データへの安全なアクセスが必要だ。

アクセスを超えて、コンテキストはエンジニアリングされなければならない。エージェントは特定のワークフローに対して適切な情報のスライスを適切なタイミングで見る必要があり、改善できるようにベストプラクティスを記憶する必要がある。

ライフサイエンスにおける医学文書作成を例に取ろう。科学論文や学会ポスターを準備するチームは単に「文章を書いている」わけではない。彼らはPubMedで調査し、社内の治験データを分析し、厳格な医療・法務・規制レビューをナビゲートしている。これらのシステム全体でアクセス、整理、作業を示すことができるエージェントがなければ、最高のモデルでさえ、礼儀正しいチャットボットにすぎない。

2. 実際の企業システムへのツールアクセス

実際のROIは、エージェントが既に仕事が行われているシステム内で行動できるときに現れる。レガシーシステムはAI時代のために構築されていないが、私たちはまだそれらに依存している。

エージェントにCRMに医療コンテンツを登録させたり、安全性データベースを更新させたり、文書管理システムにエントリを作成させたり、MLRレビューの一部をトリガーさせたりしたい場合、明確なプロトコルとAPIを通じてそれらのシステムと通信できる必要がある。

この分野では、既存のシステムへのアクセスを可能にするAnthropicのモデルコンテキストプロトコル（MCP）などの標準に関する興味深い取り組みが行われている。規制セクターのほとんどのレガシーシステムは、APIを通じた相互運用性を可能にするように構築されておらず、MCPのような普遍的なエージェント通信プロトコルへの移行をサポートするようにも構築されていない。つまり、エージェントとレガシーツール間の安全で信頼性の高い統合を構築するという困難な作業を誰かがしなければならない。

3. ガードレールとリアルタイム評価

エージェントに機密データや強力なツールに触れさせると、信頼が中心的な問題となる。リーダーが知りたいのは：エージェントは正確に何をしたのか、どのデータを使用したのか、どこで間違いを犯したのか、そしてそれを早期に発見するにはどうすればよいのか、ということだ。

許容できない行動を防ぐガードレール、品質と関連性の継続的な評価、そして人間のレビュアーが決定を再構築できる完全なトレーサビリティが必要だ。例えば製薬業界では、外部または内部の資料はすべて医療・法務・規制プロセスを経る。そのような資料の生成を支援するAIシステムは、不確実性を生み出すのではなく、明確な証拠で人間のレビュアーをサポートしなければならない。

この評価レイヤーがなければ、ほとんどのパイロットプロジェクトは信頼の欠如により停滞する。

4. 実際の人々が採用するインターフェース

最も過小評価されている柱はインターフェースだ。多くの社内AIチームはモデルとインフラストラクチャに非常に強いが、彼らはプロダクトチームではない。彼らはユーザーにプロンプトエンジニアのように考えることを要求する強力だが未加工のツールを引き渡す。

それは医療業務、マーケティング、臨床業務の平均的な人には機能しない。

幅広い採用を望むなら、エージェントはワークフローや馴染みのあるツール内に現れる必要がある。コンテキスト、ツール、ガードレールの複雑さは抽象化されるべきだ。ユーザーの視点からは、明確な指示を与え、エージェントが何をしたかを確認し、一か所で出力をレビューしているだけだ。

この最後の一マイルが構築されるまで、AIチームは製品を出荷する代わりに、内部のステークホルダーに代わって手動で「サービスとしてのエージェント」を実行することになる。その結果、使用が決してスケールしない。

構築対購入のジレンマ

これらすべての要件により、イノベーションチームはAI製品を出荷し維持する本格的な製品チームになることを余儀なくされる。これはコアコンピテンシーからの大きな飛躍を意味する。

実用的な前進の道は、彼らが所有すべきものと購入すべきものを明確に区分けすることだ。多くの場合、彼らは問題定義、ユースケースの優先順位付け、内部データプラットフォーム、ガバナンス基準を所有すべきだ。その上で、コンテキストレイヤー、ツール統合、ガードレール、ユーザーインターフェースを提供する専門ベンダーと提携できる。

大企業の社内イノベーションチームは、必要以上のものを構築しようとする衝動に抵抗すべきだ。ユーザーと使用状況の指標に焦点を当てよう。ギャップを埋め、価値の臨界質量に達するためにベンダーを雇おう。最先端のツールを構築するスタートアップと競合するエンドツーエンドの製品チームになろうとするのをやめよう。

スタートアップが知っておくべきこと

テーブルの反対側では、企業に販売するスタートアップはこの緊張が存在することを知り、「パイロットへの投資」という甘い汁が永遠に続くわけではないことを理解する必要がある。高価値パイロットの急増は、もはやプロダクト・マーケット・フィットの信頼できる指標ではない。

私が「ブレインドレイン・パイロット」と呼ぶ現象もある。大企業は複数のベンダーを招き、彼らの能力を実証するよう求め、何が機能するかを学び、その後、同様のソリューションを社内で複製しようとする。そのような社内での試みの多くは失敗し、企業は後に戻ってくるが、その最初の収益は決して安定したものではなかった。

AI分断は、AIを実験する企業とそうでない企業の間にあるのではない。コンテキスト、ツール、ガードレール、インターフェースに関する地味な作業をいとわない企業と、プロトタイプで止まる企業の間にある。

95%の失敗率があなたの現実である必要はない。プロトタイプから本番環境への移行に本当に必要なことを理解することで、そのギャップを埋めよう。

（forbes.com 原文）