Jay Limburn(ジェイ・リンバーン)氏はAtaccamaのチーフ・プロダクト・オフィサーであり、信頼性とビジネスインパクトを提供するAI駆動型データ製品を開発している。
セールスフォースがインフォマティカに80億ドルを支払ったことや、ServiceNowがData.Worldを買収したことから、真のAIレースはより効率的なモデルを求めるものではなく、より良いデータを求めるものであることが明確になった。
経営陣は生成AIへの投資の是非を議論する段階を過ぎている。現在彼らが問うているのは、なぜ多くのパイロットプロジェクトが規模拡大に失敗しているのかということだ。ガートナーは、2025年の生成AIへの世界的支出が6440億ドルに達し、前年から76%増加すると予測している。
しかし、ほとんどの取り組みはつまずき、その原因は(ほぼ)常にデータにある。
多くの組織は、すでに保有しているデータを見つけて理解することにさえ苦労している。長年の合併、クラウド移行、サイロ化された業務により、情報は一貫性のない定義や不明確な所有権を持つ無数のシステムに散在している。アナリストは既に存在するデータを探すこと、あるいはさらに悪いことに再構築することに何時間も無駄にしている。そして、発見できない、または信頼できないデータは、単に価値を生み出すことができないのだ。
インサイダー取引を検知するためのAIモデルに数百万ドルを投資したある世界的銀行の例を考えてみよう。テストでは、モデルは期待通りに機能した。しかし本番環境では、部門間でタイムスタンプのフォーマットが一貫していなかったことが原因で分析が歪み、コンプライアンスチームは何千もの誤検知に埋もれることになった。
これは孤立したケースではない。マッキンゼーによると、AIプロジェクトの約70%がデータ品質と統合の問題により目標を達成できていないという。どんなに高度なモデルでも、それに供給されるデータの品質以上の結果を出すことはできない。
不良データの隠れたコスト
不良データは腐食性がある。IBMの推計によると、組織がミスの修正、サプライチェーンエラーの修復、誤った意思決定の追跡に何百万ドルも費やすことで、米国経済から毎年3兆ドル以上が失われているという。
さらに悪いことに、AIは与えられたものから学習するため、データに欠陥がある場合、それらの欠陥をより速く、より広く拡散させる。データへの信頼こそが、顧客の信頼を獲得し、規制当局の監視を避け、チームの競争力を高めるものなのだ。
データ品質を製品として扱う
信頼性は後付けでは得られない。リーダーはデータ品質を、明確な基準、明確な所有権、ビジネス全体での可視性を持つ製品として扱う必要がある。
ビジネスにとっての「良いデータ」とは何かを定義し—各成果に必要な完全性、一貫性、適時性のレベル—そしてチームにそれらの指標に対する責任を持たせる。そして品質管理を直接パイプラインに組み込み、エラーや重複が手遅れになる前に発生源で捕捉されるようにする。
AIも異常を検出し、大規模なギャップを埋め、そして慎重に使用すれば、プライバシーリスクを増やすことなく疎らなデータセットを豊かにする合成データを生成することで役立つ。
ガバナンスにはバランスが必要だ。ローカルの専門家が自分のデータを所有すべきだが、中央チームはビジネス全体での一貫性を確保するために基準を適用する必要がある。そうすることで、混乱を生み出すことなく、説明責任が適切な場所に留まる。
そして最後に、データの健全性を可視化する。信頼性スコア、エラー率、パイプラインの稼働時間を収益や顧客KPIと並べて報告する。データが取締役会のダッシュボードに表示されると、それに値する注目と投資を獲得できる。
データリーダーへの新たな使命
私たちはすでにその変化を目の当たりにしている。より多くの企業が断片的なツールや場当たり的な修正を捨て、業務のあらゆる層に信頼性を組み込むプラットフォームを採用している。
専門用語は忘れよう。それをファブリック、メッシュ、あるいは単に優れたデータ管理と呼ぼうと、目標は同じだ:意思決定が必要なときに常に高品質で透明性があり一貫したデータが準備されており、AIが誤った前提に躓かない環境を作ることだ。
つまり、以下のようなメカニズムを持つことを意味する:
• 意思決定をその情報源まで遡れるようにし、説明可能にする。
• ガバナンスと柔軟性のバランスを取り、チームが責任を持って革新できるようにする。
• ニーズが進化しても文脈の整合性を保ち、モデルが関連性を維持できるようにする。
• コントロールを自動化し、AIのスケーリングが手作業を増やさないようにする。
信頼性はAI時代の決定的な課題であり続けており、優位性への最も明確な道筋である。これを正しく実現できる組織は、停滞したパイロットプロジェクトを超え、企業規模でAIを提供できるようになる。信頼性が高く、透明で、アクセスしやすいデータにより、AIの可能性を最大限に引き出し、測定可能なビジネスインパクトをもたらすことができるだろう。



