だがそうした人々を支えるのが、成功に不可欠な第二の要素であるデータだ。顧客が何を求めているのか、ビジネスがどのように運営されているのか、そして何が待ち受けているのか。データはそうしたことを明らかにする。そして今、私たちはデータベースやアプリケーションの中に長い間隠されていたパターンを解き放つ鍵を手にしている。問題は、私たちがこのデータの維持管理に十分なお金を払っているかどうかだ。
「突然プロセスの進みがぐんと速くなる魔法のようなコードの行だと思う人もいるかもしれない」と、ClearML(クリアML)のCEO兼共同創業者のモーゼス・グットマンはいう。「だが実際には人工知能(AI)が顕著な改善を行い、商業的なイノベーションを推進するためには意味のあるデータが必要だ」と指摘する。
データは有限のリソースであるかもしれないことも判明している。英アストン大学のある研究では、生成されるすべてのデータに対するストレージ容量がすぐに足りなくなることが予測されている。さらに、MITテクノロジーレビューのタミー・シューが最近報じたように、一般的な学習データが不足する恐れもある。
しかし、今は企業レベルの話にとどめておこう。企業においてはデータ不足はすでにAIにとって最も厄介な障害であることが判明している。AIを使って成功するには「データの入手とアクセス、そしてビジネス成果を向上させるためにそのデータをどのように特定のユースケースに適用するか理解すること」が必要だとUniphor(ユニフォア)の共同創業者兼CEOのウメシュ・サチデフは話す。
IDCのアナリストであるリツ・ジョティーは2022年初めのレポートで、AIを使いこなすには「データの多様性が必要だ」と指摘している。「同様に、AIの完全な変革のインパクトは幅広い種類のデータを使用することで実現できる。データのレイヤーを追加することで、モデルの精度とアプリケーションの最終的なインパクトを向上させることができる。例えばとある消費者の基本的な人口統計データは、その人の大まかな人物像を提供する。そこに配偶者の有無、学歴、雇用、収入、音楽や食べ物の好みなどより詳細な情報を加えると、より完全な人物像が浮かび上がる。さらに最近の買い物、現在地、生活上の出来事などの知見が加わればその人物像が真に迫るものになる」と話す。
全社にわたってAIを拡張・普及させるためには「関係者はデータ管理の全サイクルを可能にする強固なデータ基盤を確保し、データの未開発の価値を実現するための高度な分析手法を取り入れなければならない」と話すのはTredence(トレデンス)の共同創業者兼CEOのシューブ・ボウミックだ。