テジ・ルスラ氏は、Amazon Web Servicesのグローバルデータ&AI責任者であり、AWSの業界セグメントと戦略的アカウントを統括している。
エージェントAIシステムは、知的な推論によって複雑なタスクを自動化し、認知的負担を軽減し、人々が高価値の活動に集中できるよう解放することで、人間の生産性を向上させることを約束している。しかし、この可能性を実現するには、信頼できる自律的な意思決定を可能にする信頼性の高いデータという重要な基盤が不可欠だ。
データガバナンス、データ品質、検索と発見
データ品質保証、情報サイロ、系統追跡を含む従来のデータガバナンスの側面は、信頼できるエージェントシステムを確立する上で障害と機会の両方をもたらす。データ品質の低さは自律運用におけるエラーを増幅する可能性がある一方、堅牢なガバナンスフレームワークはエージェントの信頼性と組織の信頼を大幅に向上させることができる。健全なデータガバナンスシステムは、検索、アクセス、安全なナビゲーションが可能であることを通じて、データの広範な利用を促進できる。
「信頼できるAIには信頼できるデータを」という原則は重要である。推論言語モデルと組み込み型知識ベースの両方が、計画と実行のフェーズを通じてエージェントを導くための高品質な情報を必要とするからだ。ドライバーの安全を優先しながら意味的・状況的文脈を正確に解釈しなければならない自動運転車と同様に、AIエージェントは動作環境を効果的に観察し対応するために、クリーンで文脈に即したデータに依存している。
優位性と差別化要因
信頼性が高く最適化されたデータとAIアーキテクチャは競争優位性をもたらす。中核的な要件には、技術的スキーマとビジネスセマンティクスを橋渡しする統合メタデータ管理が含まれ、自律型エージェントや開発者などの個人を支援するエージェントに包括的なコンテキストを提供する。統合ガバナンスシステムはセキュリティポリシーを適用し、データ系統をエンドツーエンドで追跡し、透明なデータ出所を通じて説明可能なAI運用を可能にする。プロファイリング、クレンジング、正規化、リアルタイムの異常検出を含む自動化された品質パイプラインは、データの正確性と推論準備を確保するのに役立つ。その結果、エンタープライズグレードのコンプライアンスに準拠したデータが、モデル開発を加速し、エージェントの意思決定品質を向上させ、AIワークロードの安全なスケーリングをサポートする。
可変的な計算要件を持つ動的ワークロード
これらのアプリケーションを支えるデータインフラストラクチャは、従来の使用パターンを超えている。最新のエージェントシステムには、動的ワークロードを処理できる高度なストレージと検索メカニズムが必要だ。エージェントはリアルタイムでデータにアクセスする必要がある。これにより、ほとんどの従来のシステムではまずデータを運用データストアに取り込み、その後レポーティングや分析後処理のために開放するというリアルタイムデータ処理のパラダイムが変わる。エージェントはタイムリーな意思決定を行う必要があるため、それを待つことはできない。
マルチモダリティと高速データ処理
エージェントシステムがさまざまなモダリティのデータを処理する必要性もある。これは、エージェントが目の前のタスクを処理するためにデータを読み取るだけでなく、ユーザーやモニタリングシステムに対して一貫した回答を提示するために応答をまとめる必要があるためだ。例えば、自律型セキュリティエージェントは、音声付きのビデオフィードをレビューし、構造化データやキーバリューペアで保存されたデータベースから情報を推測することができる。このデータは、エージェントが素早く取得できるよう、非常に効率的なシステムに保存される必要がある。エージェントがこの情報を処理した後、画像とテキストを含む応答を準備し、アクションを実行する必要がある。これらすべてが、切り離されたステップではなく、リアルタイムで行われる必要がある。
ツール呼び出しとデータアクセス
Model Context Protocolなどのオープン標準は、サイロ化されたシステムに閉じ込められていた以前にはアクセスできなかったデータのロックを解除し、Apache Icebergなどのオープンフォーマットは、トランザクションシステムと不変のデータレイクを橋渡ししている。これらの開発は、現代のエージェントのマルチモーダルデータ要件に対応し、可変的な自律ワークロードに必要なスケーラビリティを提供する。エージェントは短期、長期、手続き的なメモリを維持する必要がある。さらに、レジストリ、エージェント間通信のためのゲートウェイ、高性能なエージェントフレームワークが必要だ。
セマンティックレイヤー
新たに注目されている領域はセマンティック理解だ。従来のデータシステムは通常、技術的メタデータとデータの意味とビジネス上の使用法を説明するビジネス用語集に基づいて構築されている。状況認識と文脈的知識を得るために、エージェントはオントロジーとタクソノミーを通じて、単なる定義を超えてエンティティ間の関係を示すセマンティックレイヤーを活用する必要がある。この関係のトラバーサルは重要である。インテリジェントエージェントは、人間の理解を反映する方法で情報を処理するために、ニュアンスのあるクエリで推論する必要があるからだ。
セキュリティとアイデンティティ管理
セキュリティとアイデンティティ管理は、依然として熱く議論されているトピックだ。通信プロトコル、メモリ管理システム、レジストリ、オーケストレーターなどの新しいエージェント機能が登場しているが、多くはまだ大規模に実戦テストされていない。エージェントはユーザーに代わってアクションを実行するために、ユーザーの信頼できるアイデンティティを引き継ぐ。しかし、マルチエージェントシステムにおけるアイデンティティの伝播(アイデンティティの共有)とエージェントシステムにおけるトークン管理は、プロセスフロー制御だけでなく、説明責任を念頭に置いて設計される必要がある。
推論とドメイン特異性のための微調整されたデータ
エージェントは特定のタスクを実行し、特定の目標を達成する。自律型エージェントは、計画と実行すべきアクションを決定するために推論に依存している。推論エージェントは、情報に基づいた選択を行うため、あるいは「アンドンコード」を引いて人間を介入させたり判断を仰いだりするために、ドメイン特異性を必要とする。この概念は新しいものではないが、エージェントにドメイン固有の関連性のある応答を提供できるよう、推論モデルを高品質なデータで微調整する必要がある。結局のところ、自律型エージェントが高速カーチェイスと高速オーブンを混同することは望ましくない。
成功事例
様々な業界で、エージェントAIはすでに変革的な能力を示している。ヘルスケアでは、エージェントが前臨床試験中に膨大なバリアントデータセットを分析し、創薬のタイムラインを加速している。小規模ビジネスの運営では、AIエージェントが財務調整、見込み客へのアプローチ、サプライヤーとのコミュニケーションを自律的に管理し、小規模ビジネスのオーナーがレストラン経営や顧客サービスなどの中核的なビジネス活動に集中できるようにしている。
結論
データアーキテクチャは成功したエージェントAI実装の基盤として機能するため、組織が信頼性の高い自律型システムを構築する際に実証済みのベストプラクティスを採用することが不可欠だ。現在の課題と新たなソリューションを検討することで、この記事はエージェントAIの可能性を最大限に引き出すために必要なデータ基盤を確立するためのロードマップを提供している。



