我々は、AIの専門家がリアルタイム性をより高めるべきか、リアルタイムデータストリーミングの専門家がAIの階層を革新するべきか、あるいは、より上位のデータプラットフォームの専門家や大規模なクラウドのプロバイダーがその役割を担うべきかを考える必要がある。
カリフォルニア州サンタクララに本拠を置くリアルタイムデータ企業「DataStax」は、データプラットフォームがこの課題を解決するべきだと考えている。同社は、オープンソースデータベース「アパッチ カサンドラ(Apache Cassandra)」を基盤とするエンタープライズ向けDBaaS(Database as a Service)のツールと技術を専門とする企業だ。
同社は1月に、MLモデルを訓練するためのタイムベースのデータの管理、保存、アクセスに強みを持つML企業「Kaskada」を買収した。クラウド中心のデータベース企業が、自社プラットフォームでAIとMLを前面に押し出すことにこれほど力を入れるのは普通だと考えるべきだろうか? 我々が日々使用しているテクノロジーサービスの大半において、データベースがバックボーンとなっていることを考えると、さらなるスマートオートメーション化を進めることは理に適っていると言える。
機械学習の問題点
しかし、MLアーキテクチャの大半は、大規模なアプリケーションをサポートするには遅すぎ、高価で、複雑であるため、フル生産に至っていない。このため、エンタープライズ規模のアプリケーションやデータベースのようなサービス向けにMLを構築することには無理がある。DataStaxはこの課題に対処するため、アパッチカサンドラ上に構築されたスケーラブルなDBaaS「Astra DB」を含む独自のクラウドサービスに「Kaskada」と「Astra Streaming」によるイベントストリーミングを追加した。同社は、これによって企業は単一の環境で高度なML/AIモデルを用いたリアルタイムAIを組み込んだアプリケーションを開発できるようになると述べている。同社のサービスは、Netflixやウーバーに利用されている。