Capital One(キャピタルワン)とForrester Consulting(フォレスターコンサルティング)が150人のデータ管理者を対象に行った調査から、多くの組織がデータのサイロ化、説明可能性、透明性といった問題に直面していることが明らかになった。調査によれば、内部、組織間、外部のデータサイロが、機械学習の導入と稼働を遅らせているという。回答者の過半数(57%)は、データサイエンティストと実務担当者の間のサイロが導入を阻害していると考えており、38%は組織やパートナー間のデータサイロを解消する必要があることに同意している。3分の1以上の36%の人が、大規模で多様、かつ雑多なデータセットを扱うことが課題だと回答している。
データがAIのアキレス腱になるかもしれないというのが業界関係者の共通認識だ。Capgemini Americas(キャップジェミニ・アメリカズ)のプリンシパルで、AI・アナリティクスリードのアジャイ・モハンは、データリテラシーの低さが進歩のペースを遅らせているという。彼は、リテラシーとは「データの価値と、価値を生み出すためのデータの操作・活用方法の理解」のことだと説明する。そして、多くの企業にとっての問題は「ビジネス上の課題と、その課題を解決するためのデータの可能性に目を向ける、データサイエンティスト、データエンジニア、技術志向の問題領域専門家などの適切なリソースが不足していることが多いこと」だと指摘する。
さらには、ビジネス価値やROI(投資利益率)を明確にするための、また別のデータ駆動型の活動に取り組むことも困難だ。「これは、多くのエンドユーザーに欠けているコアコンピタンスでもあるのです」とモハンはいう。これに加えて「真に意味のあるAIアプリケーションを開発するには膨大なコストがかかる可能性のある、異種のレガシーシステムやソースからのデータを活用するという課題」もある。