2024年には、メタ、ミストラル、そしておそらくは他の新規参入企業の次世代モデルが、APIとして利用可能なプロプライエタリモデルの代替品としてリリースされるだろう。
クラウドネイティブがオンプレミス生成AIの鍵になる
オープンソースのコンテナオーケストレーションシステム「Kubernetes(クバネティス)」はすでに、生成AIモデルのホスティングに適した環境となっている。Hugging Face(ハギング・フェイス)、OpenAI、グーグルなどの主要プレイヤーが、Kubernetesをベースにしたクラウドネイティブインフラを活用し、生成AIプラットフォームを提供することが予想される。ハギング・フェイスの「Text Generation Inference」、AnyScale(エニースケール)の「Ray Serve」「vLLM」などのツールはすでに、コンテナ内でのモデル推論をサポートしている。2024年には、Kubernetes上で動作するフレームワーク、ツール、プラットフォームが成熟し、基盤モデルのライフサイクル全体を管理できるようになるだろう。そしてユーザーは、生成AIモデルの事前訓練、微調整、展開、拡張を効率的に行うことができるようになるだろう。
さらに、クラウドネイティブエコシステムの主要企業が、クラウドネイティブインフラ上で生成AIを実行するためのリファレンスアーキテクチャや、ベストプラクティス、最適化を提供するだろう。そして、LLMOps(大規模言語モデル運用)は、統合されたクラウドネイティブワークフローに対応するよう拡張されるだろう。
2024年の生成AIは、引き続き急速な進化を遂げ、消費者と企業の両方に利益をもたらす、驚くような新機能が登場するはずだ。
(forbes.com 原文)