AI

2025.12.07 23:02

データ収集からデータ戦略へ:実際に機能するAIの構築

Adobe Stock

Adobe Stock

ニック・ハート氏、データファウンデーション社長兼CEO。

ホワイトハウスのAIアクションプランは、イノベーション、インフラ、国際的リーダーシップを重視し、アメリカを人工知能(AI)における世界的リーダーにするための野心的な道筋を示している。全国の組織がこのビジョンの実現に向けて動き出す中、まず築かなければならない重要な基盤がある—それは私が最近の引っ越しで身をもって学んだことだ。

3年前、前回の引っ越し以来開けていない箱を前に立ちすくんでいた。中身さえ識別できないアイテムでいっぱいだった。古いケーブル、時代遅れの電子機器、忘れていた仕事の書類—すべてがスペースを占領し、保管にお金がかかり、混乱を生み出すだけだった。私のデータシステムも大差なかった:目的が明確でないファイルがテラバイト単位で存在し、ストレージを消費し、セキュリティリスクを増大させ、本当に重要なものを見つけることを困難にしていた。

AIアクションプランは正しくも、品質基準を備えた「世界クラスの科学データセット」の構築を求めている。しかし、AIの導入を急ぐ多くの組織が見落としているのは次の点だ:より多くのデータが自動的により良いAIを意味するわけではない。それはしばしば、維持するのに高価で効果的に管理することが不可能なデジタルゴミの上に構築された、より劣悪なAIを意味する。

データ貯め込み問題

組織はデータを、ためこみ屋が所有物を扱うように扱っている—より多いほうが良いに違いない、と。彼らは品質に関係なく、アクセス可能なものをすべて性急に収集し、「念のため」に大規模なデータセットを保存したり、どのデータが存在するのか、またはその理由についての文書化なしにレガシーシステムを引き継いだりする。このデジタルな散らかりは、高価なストレージコストを生み出し、セキュリティリスクを増大させ、価値ある洞察を不明瞭にする。

AIアクションプランはアメリカの技術的リーダーシップのための大胆なビジョンを示しており、データファウンデーションはその包括的なアプローチを強く支持している。同プランが世界クラスのデータセット構築と品質基準の確立を重視していることは、次のステップのための完璧な枠組みを提供している:それらのデータセットが包括的であるだけでなく、厳選されていることを確保することだ。

2025年のデータ効率化のための4つの戦略

2025年にデータをより効率的にするための戦略は、ビジネスモデルだけでなく、プライバシーの保護と実際に機能するAIシステムの実現にも不可欠だ。

1. 知識ニーズに関する協力。

データを収集する前に、組織のリーダーは実際に必要な知識を共同で特定しなければならない。政府では、これを学習アジェンダにつながる戦略的計画と呼んでいる—私がエビデンスに基づく政策立案法の基礎を通じて推進を手伝った体系的なアプローチだ。

学習アジェンダでは、リーダーが使命を達成するために回答が必要な優先的な質問を明示的に特定することが求められ、通常4年ごとに更新される。民間部門の組織も同様の慣行を採用すべきであり、経営幹部と現場のリーダーが協力して、意思決定に実際に重要な知識のギャップを定義する必要がある。

2. データリーダーシップの確立。

ガバナンス基準は、データに特化した上級リーダー—理想的には最高データ責任者(CDO)—によって設定されなければならない。組織の従業員が25人以上で、データ業務を明示的に主導する担当者がいない場合は、成長とデータガバナンスのニーズの両方を計画する時期だ。

CDOはデータエコシステムの航空管制官として機能し、収集が無作為に蓄積するのではなく戦略的目的に役立つことを確保する。彼らは最高AI責任者と協力して、データガバナンスフレームワークが適切な保護を維持しながらAIの展開をサポートすることを確保する。2018年、政治的スペクトルを超えた議会のリーダーたちは、連邦政府データのこのような戦略的管理者の必要性をまさに認識し、そのため彼らはトランプ大統領が最初の任期中に署名したOPEN政府データ法という法律を可決した。この法律は各機関に非政治的任命者を最高データ責任者として指定することを義務付けている。

3. データの最大化ではなく最小化を重視する。

目標は可能な限り多くのデータを持つことではなく、目的に適合し、必要なときに利用可能なデータを持つことだ。データの最小化とは、特定された知識ニーズに役立つもののみを収集し、価値を提供する限りにおいてのみ維持し、量よりも質を確保することを意味する。

財務省の「支払い禁止」システムを考えてみよう。このシステムは不適切な支払いを防止するためのリソースを提供している。システムは必要なデータにアクセスできるが、検証に必要な特定のデータにのみアクセスし、プライバシーの保護に役立っている。この的を絞ったアプローチはすでに数億ドルの納税者のお金を節約しており、戦略的なデータ使用が包括的なデータ収集よりも優れていることを証明している。

4. 必要のないものをアーカイブする。

組織は、もはやその目的に役立たないデータを体系的にアーカイブまたは削除しなければならない。これによりストレージコストが削減され、セキュリティリスクが低減され、チームがデジタルゴミのためにクラウドコンピューティングの請求書を支払わないようになる。引っ越しによって不要な所有物に向き合うことを余儀なくされる(そして家族と特定のアイテムが必要かどうかを話し合う)ように、AIの展開は包括的なデータ監査のきっかけとなるべきだ。

前進

国家AIアクションプランは、品質基準を備えた世界クラスのデータセットの構築を正しく強調している。データの最小化を習得した組織は、AIシステムがデータ最大化アプローチに基づいて構築されたものよりも、性能が優れ、運用コストが低く、リスクが少ないことを発見するだろう。

AIの能力と成熟したデータガバナンスの融合は、政府をより効率的に、企業をより競争力のあるものにする前例のない機会を表している。エビデンス法や連邦データ戦略などのフレームワークを通じて基盤は整っている。これらの原則を大規模に実装するための技術も存在する。

未来を構築する前に、まずは整理整頓する時だ。アメリカのAIリーダーシップは、単に最も多くのデータを持つことではなく、明確な目的と強力なガバナンスを持って、責任を持って使用される適切なデータを持つことにかかっている。

forbes.com 原文

タグ:

advertisement

ForbesBrandVoice

人気記事