「そうした写真の大半は使われず、再び閲覧されることすらないが、そこに存在する。ダークデータも同様で、企業は日々の事業運営の過程で収集した情報を蓄積するものの利用せず、利用する予定もないにもかかわらず、破棄はしない。こうしたデータには、ウェブサイトのログ、訪問者のトラッキングデータ、防犯カメラの映像、元従業員とのメールのやり取りなどがある」
大半の企業には、莫大な量のダークデータが蓄積されている。カーネギーメロン大学ハインツ・カレッジのラフル・テラング教授(情報システム学)によると、その割合は約90%に上る。
ダークデータは多くの場合、利用されることがなく、有用性もないが、だからといって無視して良いものではない。ZLテクノロジーズのコン・レオンCEOは次のように述べている。
「重要な課題のひとつとして、情報ガバナンスにおけるリスクや法的責任を低減させるためのダークデータ管理がある。情報ガバナンスには、規制に対するコンプライアンス、訴訟、記録の保管、プライバシーや記録の管理などが含まれる」
「データ管理者らは分析に力を入れているが、これからは分析とガバナンスに同時に取り組むことが重要になる。例えば、新たなプライバシー関連法では、分析リポジトリ内のデータを含む全データが対象となっている」
しかしダークデータは、規制に関わる問題に対処さえすればよいというわけではない。こうした情報は最終的に、事業運営に有益な判断材料を生む可能性がある。これは既に、RPA(ロボティック・プロセス・オートメーション)など、業務の自動化・効率化を促進するソフトウエアで起きていることだ。
オートメーション・エニウェアのプリンス・コーリ最高技術責任者(CTO)は「答えはコグニティブオートメーションにある」と語る。「コグニティブRPAは、構造化されていないコンテンツを構造化することで、請求書、発注書、住宅ローン申し込みの手続きの自動化を支援する。いずれも、蓄積された書類、画像、電子メールなどのダークデータを必要とする作業だ」
「オートメーション・エニウェアでは、知識労働者は今後5年以内に、構造化されていないコンテンツから必要な情報を抽出する作業から解放されると見ている。そうなれば、意思決定、例外処理、経営目標を達成するための顧客・パートナー・社内対応など、自分が最も力を発揮できる分野に取り組めるようになる」