AI

2025.12.22 00:42

ボトルネックを打破する:ネオクラウドがGPU不足の解決策となる理由

stock.adobe.com

stock.adobe.com

フアン・フォントはCoresite(コアサイト)の社長兼CEOである。

advertisement

AIの新たなエンジンがボンネットの下に登場した。それはネオクラウドと呼ばれている。

現時点では、ネオクラウドはテクノロジー業界外ではほとんど知られていない。この用語を初めて耳にする人のために説明すると、ネオクラウドはAIやその他の高計算ワークロード向けに特別に設計された新しいタイプのクラウドだ。ネオクラウドプロバイダー(一般にネオクラウドと呼ばれる)はGPU-as-a-Serviceを提供し、高性能な計算能力を時間単位でレンタルできるようにする。

Microsoft AzureやAWSなどの幅広いサービスポートフォリオを提供する従来のハイパースケーラーとは異なり、ネオクラウドは集中的なGPUワークロードに対して優れたパフォーマンスを提供することに焦点を当て、多くの場合、より競争力のあるコストで提供する。これらは超高性能コンピューティングのニッチを埋めている。

advertisement

差別化要因として、希少なコンピューティングリソースへの低コストアクセスの重要性は強調しすぎることはできない。ネオクラウドは従来のクラウドプロバイダーよりも大幅に低いレートでGPUアクセスを提供できる—場合によっては、1秒または1分あたりの料金が数倍安いこともある。AIを探求する企業にとって、これは大きな恩恵だ。GPUサーバーを直接購入するのは非常に高価であり、調達が難しく、待機時間は1年以上になることもある。ネオクラウドは柔軟なオンデマンドアクセスを提供することでこれらの課題を解決する。

タイミングの改善も重要な利点だ。AI製品を開発している企業は、ネオクラウド環境でモデルをトレーニングし、CPUとGPUベースのアーキテクチャを組み合わせて本番環境に移行できれば、市場投入までの時間が大幅に短縮される。当社がサポートしている導入事例の一つでは、中堅ネオクラウドプロバイダーがロボティクス企業の市場参入を支援しており、自社でインフラを構築するよりもはるかに速く実現している。

しかしハードウェアを超えて、ネオクラウドは専門知識と接続性ももたらし、開発環境とAIデータを必要な場所に移動するための相互接続を提供する。これが中核的な価値提案だ。

進化するAIパラダイム

AIは新しいものではない。機械学習とディープラーニングは数十年前から存在し、GPUと並列処理が状況を一変させるまでは、従来CPUベースの高性能コンピューティングで実行されていた。一般の人々にとってのブレイクスルーの瞬間は、GPUを活用し、膨大なデータセットと迅速な反復で訓練されたChatGPTのようなモデルの登場だった。

基盤モデルのトレーニングが完了した今、企業は推論と本番環境に焦点を当てている:これらのモデルを使用して複雑な問題を解決し、リアルタイムシミュレーションを実行し、分析を行い、ビジネス成果を提供することだ。ネオクラウドはこのフェーズのために構築されており、単なるモデルトレーニングだけでなく、本番環境向けの高性能ワークロードに対応している。

現在最大のネオクラウドはCoreWeaveという企業だLambdaNebiusも大きな成長を遂げているネオクラウド企業だ。これらはすべて巨大で十分な資本を持ち、希少な計算能力を確保できる。彼らの顧客は主要なクラウドプロバイダーだ。

中堅ネオクラウドプロバイダーは特定の顧客課題の解決に焦点を当てている。彼らはGPU-as-a-Serviceを提供し、企業がインフラを所有することなく開発とワークロードを加速できるよう支援する。GPUやネットワーキング、サポートソフトウェアは世界的に不足しており、ほとんどの企業が必要なものにアクセスすることが困難になっている。ネオクラウドはこのボトルネックを解消する方法を提供する。

エンタープライズレベルのAI導入には、従来のデータセンター顧客の10〜20倍の電力密度が必要になる場合があるため、データセンタープロバイダーはカスタムソリューションを提供する必要があり、多くの場合、液冷が含まれる。

主要なユースケースはシミュレーションとエミュレーションだ。例えば、チップ設計企業は製造に数十億ドルを投資する前に、ネオクラウドを使用して計算負荷の高いテストを実行する。自社のハードウェアを購入する代わりに、まずネオクラウドでパフォーマンスを検証するのだ。

規模が拡大するにつれて、ネオクラウドは独自のネットワークインフラストラクチャとピアリングファブリックを構築している。彼らはクラウドとキャリアエクスチェンジに接続し、従来のクラウドと同様に、顧客がオンデマンドでサービスを利用できるようにしている。今日ネオクラウドとは見なされていない企業(モデルトレーニングに焦点を当てた企業を含む)でさえ、需要が非常に高いため、オンデマンドコンピューティングの提供を開始している。その結果、ネオクラウドは独自の完全なクラウドプラットフォームへと進化している。

あまり知られていない利点

企業のリーダーたちが痛感したように、次世代のGPUや特殊チップを入手するのは非常に困難だ。それらは希少だ。この点で、ネオクラウドは万能薬を提供する—通常、ほとんど初期投資なしで、大規模なGPUプールへの即時アクセスが可能だ。時間単位で支払うため、多額の資本支出は必要ない。これらのプロバイダーはGPU-as-a-Serviceのみに焦点を当てているため、従来のクラウドと比較してオーバーヘッドが少なく、より低いコストでより高いパフォーマンスを得られる。これは市場投入までの時間短縮、入手困難なハードウェアへのアクセス、コスト面での利点をもたらすため、これらのサービスは現在急速に成長している。

しかし、想像するほど急速ではない。Azure、Google Cloud、Oracleなどの従来のクラウドプロバイダーが依然として市場を支配しているため、企業は自然とそれらをデフォルトとして選択する。しかし、ワークロードが高性能AIにシフトするにつれて、これらのクラウドは必ずしもコスト競争力があるわけではなく、可用性のニーズを満たせない場合もある。ネオクラウドはまだ新しいが、クラウドエクスチェンジとより良い接続性を通じてよりアクセスしやすくなっている。非常に特定のギャップを埋めるのに役立つため、その人気は急速に高まっている。

多くの新しいテクノロジーコンセプトと同様に、スタートアップやITサービスプロバイダーは早期にニッチを認識し、それを中心にオファリングを構築している。現在ネオクラウドを使用しているAI企業は、現在および将来の投資家に財務的実行可能性を証明し、高性能AIワークロードが実際の価値をもたらすことを示している。

初期の採用者の中には元暗号資産企業もあった。彼らはすでに高性能コンピューティングの経験があったため、エンタープライズAIへの移行は自然な適合だった。NVIDIAのようなチップメーカーでさえ、ハードウェアへのより広いアクセスを確保するための流通チャネルとして、ネオクラウドに投資している。AIの急速な台頭と、ネオクラウドサービススタックのシンプルさと俊敏性を組み合わせることで、これらのプロバイダーはブランド認知度に支配された市場でも効果的に競争できる。

ネクサスとしてのデータセンター

接続性は極めて重要だ。これらのGPUクラスターは、超高帯域幅ネットワーキングを介してユーザーとリンクし続ける必要があり、データを効率的にトレーニングできるようにする。計算を実行するためにデータを待機しているGPUは、時間単位で支払う場合、アイドル状態にしておくには非常に高価なリソースだ。ここでデータセンターの役割が拡大し、ネオクラウドと計算能力を必要とする企業を接続している。

これらのGPUが物理的に配置される場所も重要だ。リアルタイムAI推論には、データが適用される場所への近接性が必要だ。ネオクラウドをサポートするデータセンターは高い相互接続性を必要とし、AIモデルを地域全体に展開し、ユーザーの近くで実行できるようにすると同時に、データを共有し冗長性を作成する。高密度で相互接続されたデータセンターは、これらの集中的なワークロードの低レイテンシと十分な帯域幅を確保するため、ネオクラウドは繁栄している。これらはオンデマンドでGPUコンピューティングを提供しながら、これらの運用要件を満たしている。

企業はオンプレミスのCPU駆動環境でAIを実行できるだろうか?可能だ。しかし、高密度GPUワークロードには、液冷、入手困難なハードウェア、高電力など、特別な考慮事項が必要だ。ほとんどの企業は単に必要な熱管理システムと電力へのアクセスを持っていない。

継続的な進化と同様に、企業はCPUからGPUへの移行に関して連続体上に存在していることを覚えておくことが重要だ。企業はハイブリッドITモデルを採用しており、一部のワークロードはオンプレミスで、一部はサードパーティのデータセンターで、一部はクラウドで実行されている。これらの高需要GPUワークロードを活用する企業にとって、ネオクラウドは効果的にこれらのユースケースの「簡単ボタン」を提供し、より広範なハイブリッドクラウドの進化に適合する。同時に、これらは従来のクラウドと並んでAIワークロードのための一つの選択肢に過ぎず、従来のクラウドは近い将来なくなることはない。

楽観主義と実用主義の共存

企業がますます高性能な計算プロセスを実装するにつれて、成功するのはプレミアムテクノロジーを導入するだけの組織ではなく、適切なインフラストラクチャを適切なワークロードに合わせながら、ハードウェアの可用性、電力不足、これらの要因が市場投入時間に与える影響について現実的な理解を維持する組織だ。確かに、イノベーションが進歩を促進するだろう。しかし、それはリソース制約に関する実用主義、そしてAI主導の未来の厳しい要求に対応する戦略と俊敏性から切り離すことはできない。

forbes.com 原文

タグ:

advertisement

ForbesBrandVoice

人気記事