AI

2025.09.27 09:21

2025年、AIとオープンソースが企業データプラットフォームを再定義する

Shutterstock.com

Shutterstock.com

2025年、企業データプラットフォームは、クラウド、オンプレミス、エッジ環境全体でのデータ運用・管理の中核となっている。これらのプラットフォームは、財務やサプライチェーンから顧客体験や戦略的計画まで、あらゆる業務を支えている。AIが日常業務に組み込まれ、コンプライアンス規制が厳格化する中、企業はクリーンで検索しやすく、即座に使用できるデータを必要としている。企業データベンダーはこれらのニーズに応え、競争力を維持するために急速に適応している。

advertisement

私は今年初めにこの市場の概要を発表したが、この分野は非常に急速に変化しているため、現在起きている最大の変化の方向性に焦点を当てた新たな分析が必要だ。その一つは、Apache IcebergやDelta Lakeなどのオープンフォーマットにより、ベンダーのサイロに閉じ込められることなく、システム間でデータを移動しやすくなっていることだ。また、検索拡張生成(RAG)やベクトル検索などのテクノロジーを活用したAI対応ツールへの需要も高まっており、これらは生データから回答を引き出すことができる—そしてこれはシステムにおけるエージェント型AIの驚異的な急速な普及が始まる前の話だ。さらに、企業は分断されたソリューションを扱う代わりに、オーケストレーション、ガバナンス、メタデータを一箇所に集約した統合プラットフォームへと移行している。プラットフォームとして機能するスケールと機能セットを持つベンダーは、競争力を高めるためにそれらの能力を強化している。

このような状況において、データアーキテクチャは単なる技術的なIT課題ではなく、スピード、知性、競争力を維持するための重要な戦略的考慮事項となっている。では、これらの新たな変化の方向性が企業データ管理市場にどのような違いをもたらしているのかを詳しく見ていこう。

2025年の企業データプラットフォームに重要なこと

企業データプラットフォームは、単一ベンダーのスタックではなく、よりモジュール化され、標準に基づいたシステムへと進化している。まず、Apache IcebergやDelta Lakeなどのオープンテーブルフォーマットが広くサポートされるようになり、クラウド間で機能し、時間とともに適応できるアーキテクチャの構築が容易になった。これにより、データの移動とクエリがプラットフォーム間で容易になり、ベンダーロックインを軽減することができる。また、取り込み、変換、ガバナンスを別々のステップとして扱う代わりに、データプラットフォームはこれらを接続された継続的なプロセスとして扱うようになっている。Snowflake、IBM、Cloudera、InformaticaはIcebergをサポートし、DatabricksはUnity Catalogを通じて両方のフォーマットをサポートしており、Delta Lake UniFormはクロスフォーマットアクセスを可能にする。オープン標準の使用により、組織はデータに対するより多くの制御を持ち、ゼロからやり直すことなくツールを切り替えることが容易になる。

advertisement

今日のデータプラットフォームは、基本的にAIを前提に構築されている。エージェントシステムはメタデータのタグ付けやデータ品質チェックなどのタスクを自律的に処理する。RAGはAIを信頼できる企業データに基づかせ、ベクトル検索や埋め込み管理などのツールが標準となっている。ローコード機能やポリシー自動化も標準になりつつある—これらは効率性だけでなく、データ品質の問題を早期に特定したり、コンプライアンスルールを適用したり、手作業を大幅に減らして監査の準備をするなどの実用的なニーズにも使用される。この時点で、AIはパイロットプロジェクトを超え、コパイロット、エージェント、ドメイン固有の自動化が日常業務に組み込まれ、サプライチェーンの調整の合理化から不正取引のフラグ付けまで、あらゆる業務に活用されている。これにより、技術系・非技術系チームの両方がより迅速で一貫性のある結果を得ることができる。

インフラストラクチャに関しては、ハイブリッドおよびエッジデプロイメントが標準となっている。企業はデータが生成される場所の近くでデータを処理する必要がある。特に医療、製造、金融などの業界では、スピード、プライバシー、制御が重要だ。従来のデータセンター外でのデータ生成が増加するにつれ、シームレスなエッジ統合も必須となっている。Microsoft、IBM、Clouderaなどのベンダーは、この変化に対応するエッジ対応オプションを提供している。

AIワークロードのコスト増加により、財務運用(FinOps)機能がますます重要になっている。ベンダーは現在、複雑な環境全体でこれらのコストの可視性を提供するさまざまなソリューションを提供している。AWSのCost Optimization Hub、Microsoftの強化されたFabricコントロール、IBMのデータスタックへのFinOpsツールの統合は、これらのソリューションの例だ。財務ガバナンスはフルライフサイクル計画へと進化し、使用状況を追跡し、コストを予測し、ワークロード管理に関する情報に基づいた意思決定をチームが行えるようにするツールを提供している。

同時に、政府や企業がプライバシー法や規制上の期待に応えるために、自国のAIシステムを国内または地域内に置きたいと考えることが多くなり、ソブリンAI(国家主権AI)が勢いを増している。特に防衛、医療、政府部門など、信頼性と説明責任が重要な分野での制御への注目が高まり、米国司法省の2025年データセキュリティプログラムのような新しい規制の開発が進んでいる。真の優位性は、ポリシーや地理的条件に柔軟に対応できるプラットフォームから生まれるだろう。モデル監査、境界を意識したデプロイメント、クラウド、オンプレミス、エッジを組み合わせたハイブリッド環境のサポートを考えてみよう。プラットフォームの適応性が高いほど、複雑なルールと高まる期待がある世界でも、迅速に進み続けることが容易になる。

データ面では、強力なガバナンスが現在の標準となっている。系統追跡、ポリシー適用、メタデータタグ付けなどの機能は「あれば良い」ものではなく、期待されるものだ。また、より多くのチームがデータを製品として扱い始めている:再利用可能で、十分に文書化され、最初からガバナンスされているものとして。

これらすべてを総合すると、この時点でベンダーはもはやプラットフォームの可能性だけに焦点を当てることはできない。今日、実際の能力が重要だ。購入者は、スケールでの実世界のパフォーマンス、堅牢なガバナンスと可観測性、そして適応する柔軟性を求めている。これらの期待に応えるプラットフォームが、企業データ戦略の次のフェーズを形作る準備ができている。

企業データベンダーの比較

企業データプラットフォームのベンダーは、それぞれのバックグラウンドと戦略的優先事項に基づいて、異なる道を進み続けている。SnowflakeはCortex AI-SQLを通じてSQL中心のプラットフォームにAIを追加し、ユーザーがクエリに直接AIを組み込むことを可能にした。現在、オープンソースのPolaris Catalogを通じてApache Icebergをサポートし、最近ではOpenFlowを導入して、リアルタイムパイプラインを処理し、イベント駆動型のユースケース向けに構造化データと非構造化データを組み合わせている。CittabaseはCortex AI-SQLを使用して、非構造化の視覚データを構造化テキスト要約に自動変換し、チームが画像から得られた洞察をリレーショナルテーブルと結合して、より豊かな分析を可能にした。

DatabricksはデータサイエンスとAIファーストのワークフローに焦点を当てている。前述のように、Delta LakeとIcebergをサポートし、Unity Catalogは現在、複数のフォーマットとエンジン全体にわたるガバナンスを提供している。Databricksは相互運用性とエージェント駆動型の自動化に力を入れている。これは、組織のデータコンテキストを学習することで自然言語クエリを可能にする知識エンジンLakehouseIQと、AIモデルとエージェントの構築とガバナンスのためのプラットフォームMosaic AIによって支えられている—Iceberg背後のチームであるTabularの買収も見逃せない。DraftKingsはDatabricks上の機械学習を使用してリアルタイム不正検出システムを構築した。また、Coinbaseはブロックチェーントランザクションを監視し、大規模に不審なアクティビティにフラグを立てるためにこのプラットフォームを使用している。これらの例は、リアルタイム処理、ベクトル検索、MLツールにおけるプラットフォームの強みを示している。

Informaticaはメタデータ駆動型ガバナンスでリードし続けている。そのClaire AIエンジンには現在、チャット形式の対話を超えてデータを管理する自律型ツールであるClaire Agentsが含まれている。Icebergをサポートしハイブリッドデプロイメントの柔軟性を提供しており、強力なポリシーコントロールを必要とする企業に魅力的だ。例えば、Holiday Inn Club VacationsはClaireを使用して、分断されたシステムから顧客データを統合し、精度を向上させた。また、Paycorはクラウドツールを使用してパイプラインを近代化し、分析とAIの提供を加速した。(Informaticaの詳細については、Salesforceの項目を参照)。

Clouderaはハイブリッドおよびエッジデプロイメントにおける強みを活かしている。ストリーミング用のNiFiや処理用のSparkなどのオープンソーステクノロジーに依存し、ACIDトランザクションとタイムトラベル—監査、復旧、特定時点の分析のためにデータテーブルの履歴バージョンをクエリする機能—を備えたIcebergをサポートしている。最近のアップデートでは、GPU可観測性、Nvidia H100サポート、AI対応レイクハウスのユースケース向けのHugging Faceモデル統合(Llama 3.2を含む)が追加された。製造業者はエッジで予測メンテナンスに使用し、小売業者や銀行はリアルタイムで顧客データを保護し不正を検出するために使用している—ローカル処理と中央管理のバランスを取りながら。

Teradataは依然として金融や小売などの業界における大規模分析の定番だ。VantageCloud LakeとClearScape Analyticsプラットフォームは現在、生成型およびエージェントベースのAIをサポートし、技術チームとビジネスチームの両方の作業を容易にするためのコスト追跡とワークロード管理のための新しいツールを提供している。銀行や通信企業は、強力なワークロード管理とスケーラビリティを持つTeradataをコンプライアンス、リスクモデリング、監査に使用している。これらの機能は、大量のデータ要求を持つ規制産業に適している。

IBMはwatsonxを拡張し、より複雑で規制の厳しいAIワークロードをカバーしている。2025年6月のアップデートでは、非構造化データのサポート、DataStaxを通じたリアルタイムCassandra統合、Apache Gluonを通じたSpark高速化が導入された。現在、watsonxはIceberg、エッジデプロイメント、強化されたベクトル検索をサポートしており、これには最新のパイプラインツールとFinOps機能が含まれている。Vodafoneはwatsonxを使用して顧客とのやり取りをシミュレーションし、保険会社はフォームや文書から重要な情報を抽出することで請求処理を自動化している—これはwatsonxのハイブリッド、コンプライアンス重視の環境における価値を示している。

SalesforceはInformaticaの80億ドルの買収提案で企業データ戦略を拡大しており、2026年秋に完了する見込みだ。これにより、InformaticaのガバナンスとAI機能がSalesforceのスタック全体—Data Cloud、Tableau、MuleSoftとの統合—に拡張され、SnowflakeやDatabricksなどの競合他社に対してSalesforceの立場を強化する可能性が高い。2025年8月、SalesforceはWaiiの買収も完了した。Waiiはメタデータナレッジグラフを使用して自然言語クエリを最適化されたSQLに変換するスタートアップだ。Waiiのテクノロジーは、Data Cloud、Agentforce、Tableau Nextを強化し、ユーザーとAIエージェントが会話型クエリを通じて企業データとやり取りできるようにすると期待されている。

クラウドサービスプロバイダーからの企業データ管理オファリング

主要クラウドプロバイダーは、AI、インフラストラクチャ、開発者ツールにおける強みに基づいて、独自の企業データプラットフォームを提供するための異なるアプローチを続けている。AWSは、ウェアハウジング用のRedshift、ETL用のGlue、機械学習用のSageMaker、アドホッククエリ用のAthenaなど、幅広いツールキットを提供している。これらのサービスは強力だが、多くの場合、組み合わせる必要がある。これを支援するため、AWSはガバナンス用のDataZoneと財務追跡の改善のためのCost Optimization Hubを導入した。一方、Greengrassは製造、小売、フィールドオペレーションにおけるエッジデプロイメントをサポートしている。

Microsoft Azureは、Microsoft Fabricを通じた統合に焦点を当てており、Synapse、Data Factory、Power BIをOneLake上の1つのSaaSプラットフォームに統合している。(FabricがAIのためのデータ管理をどのように簡素化するかについての詳細は、2024年後半の私の分析を参照)。Fabricは現在、Fortune 500のほとんどを含む17,000以上の顧客を持っている。最近のアップデートでは、Materialized Lake Views、改良されたミラーリング、より緊密なOneLake統合が追加された。Azure Arcは、Azure データサービスをオンプレミスおよびソブリン環境に拡張し、ハイブリッドユースケースをサポートしている。実際のユースケースは多くの業界にまたがっている。例えば、メルボルン空港は運用データを効率的に管理するために統合分析にMicrosoft Fabricを使用している。シャネルはFabricを分析ワークフローに統合し、意思決定支援と強力なガバナンスのバランスを取っている。そしてMicrosoft自身も、複雑で大規模なデータ環境を管理するためにFabricを社内で使用している。

Google CloudはAIとデータの柔軟性を重視している。BigQuery、Vertex AI、Lookerからなるスタックは、IcebergとDelta Lakeをサポートし、オープンでクラウドに依存しないアーキテクチャを可能にしている。Anthosはハイブリッドおよびエッジオーケストレーションを可能にし、Googleの更新されたFinOpsダッシュボードはより良いコスト可視性を提供するように設計されている。このプラットフォームのオープンAIツールは、カスタムワークフローを構築するエンジニアリングチームに魅力的だ。BayerはAlloyDBをBigQueryと併用して、オープンなIcebergフォーマットのデータにリアルタイム分析を展開し、以前のアーキテクチャと比較して応答率の向上とスループットの増加を実現している。

Oracle Cloud Infrastructure(OCI)は、トランザクションおよびアプリケーション統合ワークロードのパフォーマンスに焦点を当てている。Autonomous DatabaseとAI Vector Searchを備えたOCIは、OracleのERPおよびSaaSスタックと緊密に連携している。エッジ機能はまだ成熟段階にあるが、OCIは既にOracleを標準化している企業向けに安定した価格設定と組み込み統合を提供している。顧客利用の一例として、DeweyVisionはOracle Autonomous DatabaseとAI Vector Searchを導入し、多様なデータタイプ全体で高速なAI駆動のセマンティックメディア検索を提供し、発見可能性とユーザーエクスペリエンスを向上させた。

企業データプラットフォームの戦略的展望

企業データプラットフォーム市場は、今後7年間で2倍になると予想されている—2025年の1113億ドルから2032年には2435億ドルに成長し、年間成長率(CAGR)は11.8%。この成長は、データの複雑さの増加、AI採用、規制の厳格化、クラウドの継続的な拡大によって促進されている。

今日の企業は、運用を簡素化し、コストを削減し、AIを有用にするプラットフォームを求めている。カタログフェデレーション、エージェントベースのオーケストレーション、AI対応コストモデリングなどの機能がこれらのニーズを満たし始めている。新しい「認知型」プラットフォームは、AIエージェントを積極的なデータユーザーとして扱い、常に人間の監視なしに行動できる能力を持つ。

ソブリンAIとエッジコンピューティングもプラットフォーム設計に影響を与えている。AIシステムはますます規制されたデータソースの近くに留まる必要があり、一方でエッジ機能は高速なローカル処理をサポートしている。ほとんどのベンダーは両方をサポートするように適応している。持続可能性もますます重要になっている。企業はプラットフォームを評価する際に、データインフラの環境への影響を考慮し始めている。今後、プラットフォームの選択は名前の認知度よりも技術的な適合性に依存するようになるだろう。最も強力な候補は、柔軟なデプロイメント、オープン標準、透明なコスト管理、組み込みガバナンスを提供し、製造、医療、金融、小売などの分野で企業がより迅速に動き、より賢明な決定を下すのを支援する。

forbes.com 原文

タグ:

advertisement

ForbesBrandVoice

人気記事