Adrian Stelmach氏はEXPLITIAの創業者兼CEOである。
データはほぼどこにでも存在している。事実上すべての機械やシステム、さらにはユーザー自身によって生成されている。このデータは組織内部だけでなく、外部環境、ソーシャルメディア、ビジネスパートナーとのコミュニケーションからも生まれる。それはビジネス判断の基盤となる知識の主要な源泉だ。結局のところ、長期戦略を成功させるためには直感だけでは不十分なのである。
にもかかわらず、ほとんどの企業や製造工場は保有するデータの約32%しか活用していない。残りの部分は「ダークデータ」と呼ばれるもので、収集、保存、時には処理されるにもかかわらず、構造化されておらず、見過ごされ、意思決定やビジネス分析などの目的に使用されていない情報だ。この現象は不要なコストを生み出すだけでなく、リスクや損失の可能性も高めている。
なぜデータは未活用のままなのか?
工場が膨大な量のデータを生成していることは否定できない。しかし、それらが循環する代わりに、多くは誰も実際に使用していないアーカイブやデータベースに行き着く。データ駆動型ソリューションが急速に拡大している時代において、これは驚くべき逆説だ。企業はデータに溢れているのに、洞察に飢えているのである。
なぜこのようなことが起こるのか?いくつかの重要な要因が工場の効果的なデータ活用を制限している。
データ収集の自動化の欠如
多くの工場では、データフローの自動化が小規模にしか実装されていないか、まったく実装されていない。これは深刻な制約となる。なぜなら、主要な機械、生産ライン、測定システムから収集されたデータがリアルタイムでアクセスできないままであることが多く、意思決定をより困難にするからだ。手動で入力された情報に依存すると、精度の低下や人為的ミスが発生する可能性があり、情報の流れも遅くなる。自動化の欠如はビッグデータやAIベースのシステムの開発も妨げている。
データ品質の低さとコンテキストの欠如
機械、内部システム、外部API、物流から取得したデータは、形式だけでなく品質も異なることが多い。ノイズ、不安定な構造、不完全な記録は一般的な問題だ。適切な前処理がなければ、そのようなデータは誤った判断や高額なミスにつながる可能性がある。さらに、コンテキストのない生データはほとんど意味をなさない。例えば、50度の温度は、それが何を指しているのかを知らなければ意味をなさない—牛乳の殺菌では低すぎるが、部屋の温度としては極めて高い。
データは、どの製品が製造されていたか、どのオペレーターが関与していたか、どのツールがどのような条件で使用されたかなど、環境のコンテキストを持っていなければならない。そうしてはじめて、分析的洞察の信頼できる源となりうるのだ。
システム統合の欠如
もう一つの大きな問題は、いわゆるデータサイロの存在だ。これはデータがさまざまなシステムに散在している状況を指す。その結果、情報源同士が互いに通信せず、生産現場の一貫した全体像を作り出せない。単一の情報源(シングルソースオブトゥルース)がないため、高度な分析やリアルタイムレポートの実装が不可能になる。その結果、工場は逸脱を自動的に検出し、リソースを効率的に管理し、予測的に計画する能力を失う。
ダークデータ現象を最小化する方法
現時点では、ダークデータを完全に排除することは不可能だ。しかし、一貫したデータ管理戦略を通じて、その規模を大幅に削減することができる。
1. 中央集権的な情報源を作る
工場のさまざまな領域からのデータを統合、整理、標準化するERPシステムの実装は、ダークデータと戦うための鍵だ。これにより、一貫性のある最新のフォーマットに基づく分析が可能になる。さらに、そのようなシステムを下位システム(MES、SCADAなど)と接続することで、さまざまな機械からのデータを構造化し、リアルタイム分析を可能にする。データはコンテキストを獲得し、不要なノイズは排除される。
2. 統合し、重複を避ける
初期段階では、現在のAS-IS状況をマッピングして、どのデータがすでに存在し、どこに保存され、どのように取得されているかを特定することが重要だ。同様に重要なのは、どのデータが欠けているか、不完全であるかを判断することだ。クローズドシステムやコントロールループも調査すべきだ。それらには貴重なデータが含まれている可能性がある。このアプローチは重複を避け、分析の一貫性を確保するのに役立つ。したがって、投資は名目上だけでなく、主に生み出せる価値によって評価されるべきだ。
3. 最新技術を活用する
堅固なデータ基盤と中央集権的な情報源が整ったら、データ収集を改善するだけでなく、そこからより多くの価値を引き出す追加ソリューションを実装することが有益だ。例えば、デジタルツインの統合は、エンジニアリング、運用、保守データを接続して、資産パフォーマンスの包括的な視点を作成する。これらのモデルは将来のシナリオを予測し、潜在的な問題を特定することも可能にする。もう一つの例は、AIを使用した自動知識検索だ。例えば、ある工場でAIベースのチャットシステムを実装した(コスト約1万5000ユーロ)ところ、以前は情報検索に費やしていた時間の80%を回収でき、8か月以内に完全なROIを達成した。
保存されていないデータが深刻な問題になる理由
場合によっては、データが生成されても保存されないことがある。これは多くの場合、現在分析に必要とされていないか、企業の戦略的優先事項と一致していないためだ。しかし、市場環境は急速に変化し、そのようなデータがいつ価値を持つようになるかは誰にもわからない。何年も後に機械やシステムから過去のデータを取得して保存することは、リアルタイムで保存するよりもはるかに高価だ。
この状況はアパートの改装に例えることができる。壁を塗装した後に窓を交換すると、再塗装が必要になり、最初から正しく行うよりもコストがかかる。したがって、最も安価で効果的な解決策は、現時点で有用に思えなくても、すべての種類のデータ(例えば、新しい機械やシステムからのデータ)をすぐに保存することだ。このアプローチは将来の問題を防ぎ、必要なときにデータに即座にアクセスできることを保証する。
最後に
ダークデータの削減は、効果的な管理と情報に基づいたビジネス意思決定のための最も重要な要素の一つとなっている。処理されていない1バイトのデータは、実際の損失であり、プロセスを最適化し、コストを削減し、競争優位性を強化する機会を逃していることを意味する。
情報過多の時代において、成功を収めるのは最も多くのデータを収集する者ではなく、すでに持っているものを活用する方法を知っている者だ。なぜなら、どんなに高度なセンサーでも、それが生成するデータが活用されなければ無用の長物となるからだ。



