エマ・マクグラッタン氏はActianの最高技術責任者(CTO)である。
データは時にシンプルに見えるため誤解しやすいが、真の理解にはグラフやチャートを読めるだけでは不十分だ。データが何を伝えているのか、どう解釈すべきかについての直感を養う必要がある。
この点を説明するために、私は天気予報を例に使うことが多い。アイルランドで育った私にとって、会話は必ず天気から始まる。「雨が降る確率51%」とは、雨が降るかどうかの確率がわずかに高いという意味だと誤解されがちだ。しかし実際には、予報士は雨が降ることを100%確信しているが、予報地域の51%にしか雨が降らないという意味なのだ。これは、直感的に理解できると思っていても、データを誤解することがいかに容易かという教訓である。
この認識と現実のギャップこそ、企業がAI導入を急ぐ際に問題となる点だ。AIはその背後にあるデータの質に左右されるが、ほとんどの組織にはデータリテラシーを真に備えた従業員がいない。ガートナーの予測によると、2026年までにAI対応のデータ実践がない組織では、AIプロジェクトの60%以上がビジネス目標を達成できず放棄されるという。この失敗率は驚異的であり、根本原因はほぼ常に同じである:脆弱なデータ基盤だ。
データリテラシーの真の意味
言語におけるリテラシーとは、読み、理解し、コミュニケーションする能力を指す。データリテラシーも同様で、データを読み解釈し、それを他者が理解できるストーリーとして伝える能力のことだ。
データリテラシーを身につけるために、Pythonスクリプトを書いたり、データサイエンティストやExcelの達人になる必要はない。しかし、データが何を伝えているかを理解し、何かおかしいと感じたら適切な質問をする能力は必要だ。
真にデータリテラシーを備えた組織とは、製品開発、マーケティング支出、採用など、あらゆる意思決定がビジネス直感とデータからの証拠の両方に基づいている組織だ。チームがKPIに慣れ親しみ、それに対する進捗を測定できることを意味する。最も重要なのは、従業員が数字を鵜呑みにするのではなく、疑問を投げかける権限を持っていると感じることだ。
準備よりスピードを優先することは高くつく間違い
多くの経営幹部は、次の大きなブレークスルーを逃すことや競合他社に遅れをとることへの恐怖(FOMO)からAIを推進している。取締役会は経営陣に目に見えるAIの進捗を示すよう圧力をかける。先を行かなければ遅れをとるという感覚が強いからだ。問題は、準備よりもスピードが優先されていることだが、AIに関しては、最初に到達した者ではなく、最初に正しく実現した者が勝利するだろう。
昨年実施した調査では、経営幹部の79%がデータはAIに対応していると答えたが、データエンジニアでそう答えたのはわずか4%だった。この認識の違いは示唆的だ。データに最も近い人々は真実を知っている:乱雑で不完全、あるいは適切に管理されていないデータでは効果的なAIを支えることはできない。しかし多くのリーダーは、AIが何らかの形で不良データを修正してくれると思い込んでいる。
そんなことはない。私が見たあるAIソリューションは、データセット内のすべての日付を生年月日として自動分類しようとした。契約の開始日と終了日はモデルの期待に合わなかったため無効化された。プロジェクトは完全に巻き戻さなければならなかった。これは、乱雑なデータを修正するためにAIを急いで使用すると、さらに多くの問題が生じる典型的な例だ。
AIにおけるデータ非識字のリスク
リーダーや従業員がデータを理解していないと、リスクは急速に増大する:
• ゴミを入れればゴミが出る:欠陥のあるデータがモデルに入力されると、AIがどれほど洗練されていても出力は欠陥を持つ。課題は、AIの幻覚が非常に説得力があるため、疑問を持たずに受け入れてしまいがちなことだ。私はよく言う:信頼するが、検証せよ。
• 評判の損害:2019年にアップルがクレジットカードを発表した際、著名なテック起業家たちは、同等かそれ以上の財務プロファイルを持っていたにもかかわらず、妻たちに大幅に低いクレジット限度額が与えられたと主張した。専門家たちは、モデルが女性に対して偏見を持つ過去のデータで訓練されていたと主張した。反発は素早く、評判への打撃は深刻だった。
• 規制とコンプライアンスの失敗:ライトエイドが店舗で万引き犯を特定するために低品質データで訓練されたAI顔認識技術を導入した際、システムは女性と有色人種を一貫して誤認識した。従業員はエラーの可能性を理解しておらず、誤った一致に基づいて行動し、顧客に公の場での屈辱を与えた。FTCはライトエイドに5年間の顔認識技術使用禁止を命じた。
• 高額な手戻り:AIシステムが何か間違ったことを学習すると、それは子供がF-wordを覚えるようなもので、簡単に忘れさせることはできない。何カ月もの作業を捨てて最初からやり直す必要がある。欠陥のあるデータでモデルを訓練するコストは、時間とお金の無駄な投資となる。
AIへの投資前に経営幹部が問うべき質問
組織がAIに取り組む前に、リーダーは基本的な質問をする必要がある。まず、データ自体がクリーンで完全かつ適切に管理されているかどうかだ—その基盤がなければ、他は何も重要ではない。次に従業員についてだ。従業員はエラーを発見し、結果に疑問を投げかけ、何かがおかしいと感じる時を知るためのデータリテラシーを持っているか?人間がループ内に留まることが期待されるなら、彼らは実際にいつどのように介入すべきかを理解しているだろうか?
同様に重要なのは、組織がデータソースを信頼し、そのデータがどのように収集され、拡張され、変換されてきたかを理解しているかどうかだ。コンプライアンスも後付けであってはならない。プライバシー法や業界規制は最初から考慮されなければならない。そして最後に、おそらく最も見落とされがちな質問:AIで本当に解決しようとしている問題は何か、そしてなぜか?
あまりにも頻繁に、これらの質問に答えることなく実装に飛びつく企業を目にする。それは道路のルールを教えずに10代の若者を車で送り出すようなものだ。結果は同様に深刻になりうる。
データ好奇心の文化を構築する
データリテラシーのギャップを埋めるには、人々が積極的にデータに関わり、それを使用することに自信を持つ文化が必要だ。それは各部門やグループにデータチャンピオンを任命することから始まる—データの解釈に強い直感を示し、同僚を導くことができる個人だ。そのようなチャンピオンが社内に存在しない場合、リーダーは外部から招き入れるべきだ。
共感を呼ぶ方法でデータを提示しよう。生の統計は行動を促さないが、「雨が降る確率51%」が実際に何を意味するかのようなストーリーとして枠組みされると、記憶に残り意味を持つようになる。チームはデータを掘り下げ、結果に疑問を投げかけ、表面的な出力を超えて見ることを奨励されるべきだ。自然言語処理の進歩により、従業員は簡単な質問をして意思決定の背後にあるデータをすぐに探索できるようになり、これが容易になっている。
リーダーシップが基調を設定する。経営幹部が一貫してデータを使用して選択を説明するとき、彼らは証拠が直感と同じくらい重要であることを示す。その信号は組織全体に広がる。データ好奇心の文化はボトムアップでは生まれない—トップからリードされなければならない。
AIはデータの上に構築されている。データリテラシーがなければ、AIによる意思決定はすべて賭けであり、賭け金はあなたのビジネスと評判だ。



